Data Mining | Анализ данных🚀 – Telegram
Data Mining | Анализ данных🚀
3.28K subscribers
1.73K photos
10 videos
5 files
1.7K links
• Купить рекламу: t.me/sahib_space
Админ: sahib_space
• Стоимость: https://www.notion.so/sahibspace/69ece414a4af49f2bdbdfe455e553e58?pvs=3&qid=
• Группа в ВК: vk.com/datamining.team
Download Telegram
🔝  Работа рассматривает вызовы выравнивания моделей с человеческой обратной связью и подчеркивает успешность использования обучения с подкреплением с переранжировкой ответов. В статье рассматриваются различия в ответах на вопросы о различных группах людей.

🔎 Подчеркиваются перспективы и трудности использования человеческой обратной связи для выравнивания диалоговых агентов по критериям полезности, точности и безопасности.

📌ссылочка
Please open Telegram to view this post
VIEW IN TELEGRAM
5🔥3❤‍🔥1
Статья рассматривает Gated Recurrent Unit (GRU) — специализированный вариант рекуррентных нейронных сетей (RNN), созданный для преодоления проблемы затухающего градиента. В ней подробно разбирается архитектура, математические уравнения и преимущества GRU, предоставляя практическое понимание их роли в различных областях, таких как обработка естественного языка и прогнозирование временных рядов.

https://www.educative.io/answers/what-is-a-gated-recurrent-unit-gru
🔥64❤‍🔥3
Автор представляет структуру под названием Patchscopes и показывает, как ее можно использовать для ответа на широкий спектр вопросов о вычислениях LLM.

https://arxiv.org/abs/2401.06102
👍65❤‍🔥3
В этой статье затронуты десять наиболее распространенных ошибок при обучении распределенных моделей и предложены решения каждой из них.

https://neptune.ai/blog/distributed-training-errors
👍5❤‍🔥2
В этой статье автор рассмотрел широкий спектр визуализаций глубокого обучения и обсудил их применимость. Попутно он поделился множеством практических примеров и указал на библиотеки и подробные руководства по отдельным методам.
👍5❤‍🔥1
➡️В статье автор рассказывает про архитектуру HID и практические аспекты создания драйверов для устройств ввода.

📌 Кроме того, были затронуты вопросы системной разработки и изучения драйверного API для встраиваемых систем реального времени, а также создание драйверов для взаимодействия с HID-устройствами.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤‍🔥4🔥32
👀 ТОП ошибок в анализе конкурентов

🚩Пренебрежение меньшими конкурентами: Ошибочно считать, что более мелкие компании не представляют интереса. Они могут внедрять разрушающие технологии или применять инновационные стратегии.

🚩Игнорирование непрямых конкурентов: В современном бизнесе необходимо учитывать не только прямых конкурентов, но и компании из различных секторов, предлагающие заменяющие продукты или услуги.

🚩Непонимание сильных сторон конкурентов: Часто фокусируемся на изучении слабостей конкурентов. Однако их сильные стороны могут предоставить ценные идеи для разработки собственной стратегии.

🚩Недостаток непрерывного анализа: Рыночные условия постоянно меняются, а следовательно, меняются и стратегии конкурентов. Регулярный анализ необходим для постоянного обновления и актуализации данных.

@dataminingteam
Please open Telegram to view this post
VIEW IN TELEGRAM
5
🔥Основная цель сети объектов машинного обучения — использование функциональных операций для анализа и генерации новых функций на основе векторов признаков, чтобы повысить выразительность модели машинного обучения.

https://arxiv.org/abs/2401.04874
Please open Telegram to view this post
VIEW IN TELEGRAM
❤‍🔥5
Детальный обзор метода экспоненциального сглаживания для прогнозирования временных рядов, включая его типы (простое, двойное, тройное экспоненциальное сглаживание), моделирование уровня, тренда и сезонности, а также примеры прогнозирования в Python с использованием библиотеки statsmodels. Рассматриваются также параметры оптимизации, демпфирование и общие преимущества этих моделей.

https://mlpills.dev/time-series/exponential-smoothing/
❤‍🔥5
💲 ТОП 3 на что смотрят инвесторы, когда выбирают стартап

1️⃣ Команда: Первое, на что обращают внимание инвесторы, — это команда. Идеально, если она способна покрыть все аспекты развития бизнеса. Важность команды постепенно снижается с развитием, но на начальном этапе это ключевой фактор.

2️⃣ Рынок: Инвесторы анализируют, насколько реально стартап может занять долю на рынке. Обязательный вопрос — какой потенциал доходности для инвестора. Общий "минимальный порог" — возможность достижения выручки в 1 млрд рублей для ранних стадий.

3️⃣ Ценностное предложение и соответствие рынку: Неважно, насколько хорош продукт, если он не решает значимую проблему. Инвесторы смотрят на то, насколько хорошо предложение компании соответствует потребностям рынка.

Ваш @dataminingteam👋
Please open Telegram to view this post
VIEW IN TELEGRAM
💯5👍2🔥22
Обширный и визуально понятный обзор тензоров, их декомпозиций и применений в машинном обучении. Авторами освещены базовые концепции тензоров, их декомпозиции, а также важные алгоритмы факторизации. Приведены примеры применения тензорных декомпозиций в машинном обучении и проведено исследование на основе оценки смеси моделей.

https://arxiv.org/pdf/1711.10781.pdf
❤‍🔥5👍4
1️⃣Шпаргалка по теории вероятности
https://vk.com/wall-94208167_7704

2️⃣Многорукие бандиты: полный обзор
https://vk.com/wall-94208167_7709

3️⃣Туториал по визуализации моделей глубокого обучения
https://vk.com/wall-94208167_7715

4️⃣Множественное восполнение пропущенных данных
https://vk.com/wall-94208167_7698

5️⃣Топ-15 библиотек Python для DA и ML
https://vk.com/wall-94208167_7718
Please open Telegram to view this post
VIEW IN TELEGRAM
👍73
Исчерпывающий гайд o Support Vector Machine (SVM), начиная с его базовых принципов и математического обоснования, и до практической реализации в Python. Статья содержит информацию о разных типах алгоритмов SVM, работе с ядрами, выборе гиперпараметров и другом.

В дополнение можно пройтись по данной статье, где SVM рассматривается более визуально.
👍7❤‍🔥2🔥2
Статья охватывает тему многоклассовой классификации с использованием softmax-регрессии, рассматривает ее применения, преимущества и недостатки, а также предоставляет практическую реализацию на Python и в PyTorch.

https://spotintelligence.com/2023/08/16/softmax-regression/
❤‍🔥6
📣 Подробное руководство по пониманию и написанию кода для BERT с использованием PyTorch.

📎Охватывает его компоненты и различия с другими языковыми моделями.
Статья включает preprocessing, построени модели, определение функции потерь и оптимизации, а также обучение.

📎Автор объясняет характер BERT, его задачи предварительного обучения (модель языка с маскированными токенами и предсказание следующего предложения) и способность превосходить другие модели в различных задачах.

https://neptune.ai/blog/how-to-code-bert-using-pytorch-tutorial
❤‍🔥3
📣 Подробное руководство по пониманию и написанию кода для BERT с использованием PyTorch.

📎Охватывает его компоненты и различия с другими языковыми моделями.
Статья включает preprocessing, построени модели, определение функции потерь и оптимизации, а также обучение.

📎Автор объясняет характер BERT, его задачи предварительного обучения (модель языка с маскированными токенами и предсказание следующего предложения) и способность превосходить другие модели в различных задачах.

https://neptune.ai/blog/how-to-code-bert-using-pytorch-tutorial
❤‍🔥6🔥43
что, если не жиза?
💯85😁3👍1
🗣Материал вводит в важность и процесс feature engineering с подробным рассмотрением двух подходов: the Checklist Approach и the Domain-based Approach.

🔵Вы углубитесь в численные агрегаци, выборы параметров, преобразования числовых данных, кодирование категориальных переменных, обработку пропущенных значений.

💬Приведен пример по кассовым сборам фильмов.

https://www.learndatasci.com/tutorials/intro-feature-engineering-machine-learning-python/
Please open Telegram to view this post
VIEW IN TELEGRAM
❤‍🔥3🔥2👍1
💬 В блоге рассматривается создание сверточной нейронной сети (CNN) для локализации и классификации объектов. Автор затрагивает темы, такие как архитектура модели для регрессии и классификации, обучение модели и оценка performance metrics,0 таких как  loss, accuracy и среднee пересечение по объединению (IoU).
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6
📎В статье рассматриваются вызовы в области выявления мошенничества, проводится сравнение rule-based и machine learning-based approaches, исследуется анализ данных, техника oversampling, обучение модели и её оценка, с акцентом на важности решения проблемы дисбаланса классов для эффективного выявления мошенничества.

🔖 Кроме того, статья подчеркивает значимость настройки порогов для балансировки ложных срабатываний и пропущенных мошеннических операций.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤‍🔥5