Data Mining | Анализ данных🚀 – Telegram
Data Mining | Анализ данных🚀
3.28K subscribers
1.73K photos
10 videos
5 files
1.7K links
• Купить рекламу: t.me/sahib_space
Админ: sahib_space
• Стоимость: https://www.notion.so/sahibspace/69ece414a4af49f2bdbdfe455e553e58?pvs=3&qid=
• Группа в ВК: vk.com/datamining.team
Download Telegram
Статья охватывает тему многоклассовой классификации с использованием softmax-регрессии, рассматривает ее применения, преимущества и недостатки, а также предоставляет практическую реализацию на Python и в PyTorch.

https://spotintelligence.com/2023/08/16/softmax-regression/
❤‍🔥6
📣 Подробное руководство по пониманию и написанию кода для BERT с использованием PyTorch.

📎Охватывает его компоненты и различия с другими языковыми моделями.
Статья включает preprocessing, построени модели, определение функции потерь и оптимизации, а также обучение.

📎Автор объясняет характер BERT, его задачи предварительного обучения (модель языка с маскированными токенами и предсказание следующего предложения) и способность превосходить другие модели в различных задачах.

https://neptune.ai/blog/how-to-code-bert-using-pytorch-tutorial
❤‍🔥3
📣 Подробное руководство по пониманию и написанию кода для BERT с использованием PyTorch.

📎Охватывает его компоненты и различия с другими языковыми моделями.
Статья включает preprocessing, построени модели, определение функции потерь и оптимизации, а также обучение.

📎Автор объясняет характер BERT, его задачи предварительного обучения (модель языка с маскированными токенами и предсказание следующего предложения) и способность превосходить другие модели в различных задачах.

https://neptune.ai/blog/how-to-code-bert-using-pytorch-tutorial
❤‍🔥6🔥43
что, если не жиза?
💯85😁3👍1
🗣Материал вводит в важность и процесс feature engineering с подробным рассмотрением двух подходов: the Checklist Approach и the Domain-based Approach.

🔵Вы углубитесь в численные агрегаци, выборы параметров, преобразования числовых данных, кодирование категориальных переменных, обработку пропущенных значений.

💬Приведен пример по кассовым сборам фильмов.

https://www.learndatasci.com/tutorials/intro-feature-engineering-machine-learning-python/
Please open Telegram to view this post
VIEW IN TELEGRAM
❤‍🔥3🔥2👍1
💬 В блоге рассматривается создание сверточной нейронной сети (CNN) для локализации и классификации объектов. Автор затрагивает темы, такие как архитектура модели для регрессии и классификации, обучение модели и оценка performance metrics,0 таких как  loss, accuracy и среднee пересечение по объединению (IoU).
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6
📎В статье рассматриваются вызовы в области выявления мошенничества, проводится сравнение rule-based и machine learning-based approaches, исследуется анализ данных, техника oversampling, обучение модели и её оценка, с акцентом на важности решения проблемы дисбаланса классов для эффективного выявления мошенничества.

🔖 Кроме того, статья подчеркивает значимость настройки порогов для балансировки ложных срабатываний и пропущенных мошеннических операций.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤‍🔥5
Митап для DS и ML-разработчиков от МТС

4 июля | 18:30
Офлайн в Москве | Онлайн

Что будет в программе:

— Эксперты из RnD расскажут, как как адаптировать Open Source-модели генеративного ИИ, чтобы с минимальными ресурсами получить приемлемое качество дообучения.
— Обсудим, что такое персональные ИИ-решения и как в МТС создавали персональных Аватара и Ассистента.
— Узнаем про LLM от экспертов MTS AI.

Очных участников ждут нетворкинг и ламповый вечер в пространстве летнего кинотеатра в парке «Музеон». Все желающие смогут присоединиться онлайн.

Регистрируйтесь по ссылке.
🔥6
Идеальная карьера: с должности  исполнительного директора в Морган стэнли на позицию фермера, выращивающего гусей.

Вот это я понимаю, правильный карьерный рост🤣🤣🤣
😁8❤‍🔥4🔥2💯1
🔗 В работе представлен подход к сегментации текста (chunking), синтаксической задаче, включающей группировку слов в неиерархическом порядке.

🔗 Авторы предлагают двухслойную иерархическую рекуррентную нейронную сеть (HRNN) для моделирования композиции слов в сегмент и сегмента в предложение, достигая заметного улучшения по сравнению с существующими методами, что поднимает F1-score до 6%.
Please open Telegram to view this post
VIEW IN TELEGRAM
7👍2❤‍🔥1
🔄 Статья о Batch Normalization в нейронных сетях рассматривает две основные теории: стабилизацию распределений активаций и сглаживание ландшафта потерь и градиента.

🗣Описываются преимущества, включая более быструю сходимость и сниженную чувствительность к инициализации весов. Также ограничения, такие как неэффективность при малых размерах пакетов и неприменимость к рекуррентным сетям.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5🔥21
Рубрика поддержи друзей 🌝

Собственно, наш друг занимается торговлей, поэтому просим вас поддержать.

По ссылке детский надувной круг.

Как поддержать?
- купить
- оставить отзыв
- сделать репост

https://ozon.ru/t/7wJRRN2
❤‍🔥5🔥21
🧬 Статья описывает метод ZLaP для классификации в условиях отсутствия размеченных данных. Этот метод использует модели видео-языковых представлений (VLM), которые показывают впечатляющую производительность в нулевой классификации, когда предоставляется только список названий классов.

🔗 ZLaP основан на методе распространения меток (LP) и использует геодезические расстояния для классификации на графах, содержащих как текстовые, так и изображенческие признаки.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6❤‍🔥3
🤩Представление классификаторов минимаксного риска (MRC), минимизирующих потери в худшем случае для общих правил классификации и обеспечивающих точные гарантии производительности.

🍂Показано, как можно надежно оценить внесемпловую производительность MRC в процессе обучения, и что ошибка MRC из-за конечных размеров обучающих выборок определяется точностью оценок математических ожиданий. Кроме того, показано, что MRC являются сильно всесторонне согласованными в ситуациях, аналогичных тем, что соответствуют методам на основе ядра.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥8❤‍🔥1👍1
В данной статье предложены методы subbagging для оценки больших данных с ограничениями по памяти. Исследованы теоретические свойства, показано, что subbagging оценка может достичь √N-состоятельности и асимптотической нормальности при определенных условиях.  Проведены эксперименты симуляции для демонстрации производительности на конечных выборках. 

https://arxiv.org/pdf/2103.00631.pdf
👍4❤‍🔥1🔥1
Автор разбирает подход к обучению нейронок, при котором вместо использования планировщиков скорости обучения предлагается увеличивать размер батча. Автор показывает, что это может привести к более быстрой сходимости и не худшим результатам обучения.

Темы статьи включают общие проблемы нейронных сетей, влияние размера батча на обобщающую способность модели и сравнение методов регулирования скорости обучения и размера батча.
🔥3❤‍🔥11
🌟 Введение в графовый анализ, объясняя структуру графов и их значимость в соц. сетях и электронной коммерции.

Исследуются концепции центральности по:
🟢степени
🟢близости
🟢собственному вектору

📎Каждая тема подкреплена real world примером. Обсуждаются многие вопросы выявления влиятельных узлов, оптимизации передачи.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9🔥33