Data Mining | Анализ данных🚀 – Telegram
Data Mining | Анализ данных🚀
3.28K subscribers
1.73K photos
10 videos
5 files
1.7K links
• Купить рекламу: t.me/sahib_space
Админ: sahib_space
• Стоимость: https://www.notion.so/sahibspace/69ece414a4af49f2bdbdfe455e553e58?pvs=3&qid=
• Группа в ВК: vk.com/datamining.team
Download Telegram
📎Глубокий обзор ARIMA (AutoRegressive Integrated Moving Average) для анализа и прогнозирования временных рядов в Python.

Охватывает ключевые компоненты ARIMA — авторегрессию (AR), интеграцию (I) и скользящее среднее (MA), предоставляя пример кода на примере данных о ценах акций Netflix.

☑️В статье демонстрируется реализация модели ARIMA с оценкой производительности и визуализацией точности прогнозов.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤‍🔥7🔥42
➡️Статья посвящена визуализации данных высокой размерности через метод t-SNE (t-Distributed Stochastic Neighbor Embedding).

🔖Рассматривается сравнение t-SNE с методом PCA, предоставляется код и пояснение для визуализации признаков с использованием TensorBoard. В конце предоставлен краткий обзор метода и его применения.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤‍🔥6🔥2
🟡 Исчерпывающий обзор AutoML, включая его преимущества, ключевые компоненты, методы работы и передовые темы, такие как поиск нейроархитектур и трансферное обучение.

❗️Рассматриваются практические аспекты использования AutoML, включая развертывание, выбор метрик и анализ результатов, с завершающим взглядом на ведущие инструменты.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤‍🔥6🔥2
🔵 В статье рассматривается снижение вычислительных затрат в Neural AutoML с использованием трансферного обучения.

❗️ AutoML упрощает создание алгоритмов машинного обучения, но Neural AutoML, специализированный для глубокого обучения, предполагает значительные вычислительные затраты. Предложенное решение, Transfer Neural AutoML, использует знания предыдущих задач для ускорения проектирования сетей, применяя параллельное обучение на нескольких задачах и передавая стратегию поиска новым задачам.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5❤‍🔥2🍓11
🔵В статье рассматриваются потенциальные области применения, процессы прогнозирования и валидации, шаги по построению и обучению forest-based forecast, выявление выбросов во временных рядах, результаты работы инструмента, оптимальные методы и ограничения.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5🔥3❤‍🔥1
➡️Разбор экспоненциального сглаживания в анализе временных рядов, включая потенциальные применения, прогнозирование и валидацию, построение модели экспоненциального сглаживания, выявление выбросов во временных рядах, инструменты анализа, рекомендации по использованию и ограничения метода.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5🔥3❤‍🔥1
📎В статье автор демонстрирует, что GNN могут применяться для решения задач комбинаторной оптимизации (CO).
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4❤‍🔥2💯1
🔝  Работа рассматривает вызовы выравнивания моделей с человеческой обратной связью и подчеркивает успешность использования обучения с подкреплением с переранжировкой ответов. В статье рассматриваются различия в ответах на вопросы о различных группах людей.

🔎 Подчеркиваются перспективы и трудности использования человеческой обратной связи для выравнивания диалоговых агентов по критериям полезности, точности и безопасности.

📌ссылочка
Please open Telegram to view this post
VIEW IN TELEGRAM
5🔥3❤‍🔥1
Статья рассматривает Gated Recurrent Unit (GRU) — специализированный вариант рекуррентных нейронных сетей (RNN), созданный для преодоления проблемы затухающего градиента. В ней подробно разбирается архитектура, математические уравнения и преимущества GRU, предоставляя практическое понимание их роли в различных областях, таких как обработка естественного языка и прогнозирование временных рядов.

https://www.educative.io/answers/what-is-a-gated-recurrent-unit-gru
🔥64❤‍🔥3
Автор представляет структуру под названием Patchscopes и показывает, как ее можно использовать для ответа на широкий спектр вопросов о вычислениях LLM.

https://arxiv.org/abs/2401.06102
👍65❤‍🔥3
В этой статье затронуты десять наиболее распространенных ошибок при обучении распределенных моделей и предложены решения каждой из них.

https://neptune.ai/blog/distributed-training-errors
👍5❤‍🔥2
В этой статье автор рассмотрел широкий спектр визуализаций глубокого обучения и обсудил их применимость. Попутно он поделился множеством практических примеров и указал на библиотеки и подробные руководства по отдельным методам.
👍5❤‍🔥1
➡️В статье автор рассказывает про архитектуру HID и практические аспекты создания драйверов для устройств ввода.

📌 Кроме того, были затронуты вопросы системной разработки и изучения драйверного API для встраиваемых систем реального времени, а также создание драйверов для взаимодействия с HID-устройствами.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤‍🔥4🔥32
👀 ТОП ошибок в анализе конкурентов

🚩Пренебрежение меньшими конкурентами: Ошибочно считать, что более мелкие компании не представляют интереса. Они могут внедрять разрушающие технологии или применять инновационные стратегии.

🚩Игнорирование непрямых конкурентов: В современном бизнесе необходимо учитывать не только прямых конкурентов, но и компании из различных секторов, предлагающие заменяющие продукты или услуги.

🚩Непонимание сильных сторон конкурентов: Часто фокусируемся на изучении слабостей конкурентов. Однако их сильные стороны могут предоставить ценные идеи для разработки собственной стратегии.

🚩Недостаток непрерывного анализа: Рыночные условия постоянно меняются, а следовательно, меняются и стратегии конкурентов. Регулярный анализ необходим для постоянного обновления и актуализации данных.

@dataminingteam
Please open Telegram to view this post
VIEW IN TELEGRAM
5
🔥Основная цель сети объектов машинного обучения — использование функциональных операций для анализа и генерации новых функций на основе векторов признаков, чтобы повысить выразительность модели машинного обучения.

https://arxiv.org/abs/2401.04874
Please open Telegram to view this post
VIEW IN TELEGRAM
❤‍🔥5
Детальный обзор метода экспоненциального сглаживания для прогнозирования временных рядов, включая его типы (простое, двойное, тройное экспоненциальное сглаживание), моделирование уровня, тренда и сезонности, а также примеры прогнозирования в Python с использованием библиотеки statsmodels. Рассматриваются также параметры оптимизации, демпфирование и общие преимущества этих моделей.

https://mlpills.dev/time-series/exponential-smoothing/
❤‍🔥5
💲 ТОП 3 на что смотрят инвесторы, когда выбирают стартап

1️⃣ Команда: Первое, на что обращают внимание инвесторы, — это команда. Идеально, если она способна покрыть все аспекты развития бизнеса. Важность команды постепенно снижается с развитием, но на начальном этапе это ключевой фактор.

2️⃣ Рынок: Инвесторы анализируют, насколько реально стартап может занять долю на рынке. Обязательный вопрос — какой потенциал доходности для инвестора. Общий "минимальный порог" — возможность достижения выручки в 1 млрд рублей для ранних стадий.

3️⃣ Ценностное предложение и соответствие рынку: Неважно, насколько хорош продукт, если он не решает значимую проблему. Инвесторы смотрят на то, насколько хорошо предложение компании соответствует потребностям рынка.

Ваш @dataminingteam👋
Please open Telegram to view this post
VIEW IN TELEGRAM
💯5👍2🔥22
Обширный и визуально понятный обзор тензоров, их декомпозиций и применений в машинном обучении. Авторами освещены базовые концепции тензоров, их декомпозиции, а также важные алгоритмы факторизации. Приведены примеры применения тензорных декомпозиций в машинном обучении и проведено исследование на основе оценки смеси моделей.

https://arxiv.org/pdf/1711.10781.pdf
❤‍🔥5👍4
1️⃣Шпаргалка по теории вероятности
https://vk.com/wall-94208167_7704

2️⃣Многорукие бандиты: полный обзор
https://vk.com/wall-94208167_7709

3️⃣Туториал по визуализации моделей глубокого обучения
https://vk.com/wall-94208167_7715

4️⃣Множественное восполнение пропущенных данных
https://vk.com/wall-94208167_7698

5️⃣Топ-15 библиотек Python для DA и ML
https://vk.com/wall-94208167_7718
Please open Telegram to view this post
VIEW IN TELEGRAM
👍73
Исчерпывающий гайд o Support Vector Machine (SVM), начиная с его базовых принципов и математического обоснования, и до практической реализации в Python. Статья содержит информацию о разных типах алгоритмов SVM, работе с ядрами, выборе гиперпараметров и другом.

В дополнение можно пройтись по данной статье, где SVM рассматривается более визуально.
👍7❤‍🔥2🔥2
Статья охватывает тему многоклассовой классификации с использованием softmax-регрессии, рассматривает ее применения, преимущества и недостатки, а также предоставляет практическую реализацию на Python и в PyTorch.

https://spotintelligence.com/2023/08/16/softmax-regression/
❤‍🔥6