Data Mining | Анализ данных🚀 – Telegram
Data Mining | Анализ данных🚀
3.28K subscribers
1.73K photos
10 videos
5 files
1.7K links
• Купить рекламу: t.me/sahib_space
Админ: sahib_space
• Стоимость: https://www.notion.so/sahibspace/69ece414a4af49f2bdbdfe455e553e58?pvs=3&qid=
• Группа в ВК: vk.com/datamining.team
Download Telegram
есть кто понял мем?😈
Please open Telegram to view this post
VIEW IN TELEGRAM
😁24💯42
📌Обзор охватывает многоруких бандитов, структуру процесса принятия решений Маркова, роль динамического программирования в известных MDP, а также методы на основе ценности, такие как приближенное Q-обучение.

🖇Автор вводит ключевые концепции, такие как дилемма исследования и использования, политики, траектории и функции ценности.

⌨️ Включен практический обзор  ε-greedy, верхние границы уверенности и вероятностные выборки Томпсона.

📌ссылочка
Please open Telegram to view this post
VIEW IN TELEGRAM
❤‍🔥4
📣 Введение в графовый анализ, объясняя структуру графов и их значимость в соц. сетях и электронной коммерции.

Исследуются концепции центральности по:
🟢степени
🟢близости
🟢собственному вектору

📎Каждая тема подкреплена real world примером. Обсуждаются многие вопросы выявления влиятельных узлов, оптимизации передачи.
Please open Telegram to view this post
VIEW IN TELEGRAM
🐳7❤‍🔥2
📖  Книга охватывает основы и приложения обучения с подкреплением (reinforcement learning).

🖇 Рассматриваются табличные методы, включая многоруких бандитов, конечные марковские процессы и динамическое программирование. Также изучаются приближенные методы, включая аппроксимацию значений действий и политики.

✔️ В завершение обсуждаются конкретные случаи использования в реальных сценариях.

📌сохраняем
Please open Telegram to view this post
VIEW IN TELEGRAM
8❤‍🔥3🔥3
➡️ Статья "Transformer-XL: внимательные языковые модели за пределами контекста фиксированной длины" обсуждает передовые методы языкового моделирования, представляет модель Transformer-XL для улавливания долгосрочных зависимостей.


🤩Исследует механизмы внимания, представляет экспериментальные результаты на различных наборах данных и выделяет способность модели к обобщению и генерации нового контента.

тык на ссылку
Please open Telegram to view this post
VIEW IN TELEGRAM
❤‍🔥5🔥1🐳1
👀 Шпаргалка о численных методах при решении граничных задач ОДУ предоставляет ясное понимание методов численного дифференцирования, прямого метода и метода стрельбы, обеспечивая важный инструментарий для решения граничных задач. Этот материал полезен для тех, кто занимается численными методами в контексте дифференциальных уравнений.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤‍🔥7🔥32
🔠 Статья рассматривает сложности обучения моделей на несбалансированных данных и представляет метод Synthetic Minority Over-sampling Technique (SMOTE) в качестве решения.

*️⃣ Практическая реализация SMOTE на искусственно созданном несбалансированном наборе данных, модификации для категориальных признаков и экспериментальные оценки с использованием классификаторов, таких как C4.5, способствуют полному пониманию проблемы дисбаланса классов.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤‍🔥5🔥4😁1
Обширный гайд о иерархической кластеризации, исследуя ее применения, различные типы и шаги выполнения. Охватывая вычисление матрицы близости, сходство кластеров и методы связи, такие как одиночная, полная, центроидная, средняя и метод Ворда, учебник также предоставляет практическую реализацию с использованием Python с Scipy и Scikit-Learn, демонстрируя применение на реальных данных.

https://www.learndatasci.com/glossary/hierarchical-clustering/
❤‍🔥8🔥32
〰️ В статье рассматриваются три фреймворка для параллельных вычислений — Spark, Dask и Ray. Авторы детально разбирают каждый и дают рекомендации когда и какой использовать.

🔠 Статья также анализирует преимущества и недостатки каждого фреймворка и предоставляет рекомендации по выбору подходящего в зависимости от конкретных задач.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥62
🔠 Статья посвящена интерпретации черных ящиков в ML, с фокусом на кредитном скоринге с использованием нейронных сетей.

🔠Автор разбрает методы: Partial Dependence Plots (PDPs) и Local Interpretable Model-agnostic Explanations (LIME), для облегчения понимания работы моделей и принятия решений.
Please open Telegram to view this post
VIEW IN TELEGRAM
🐳4❤‍🔥32
🔖Разбор внутренних механизмов машин опорных векторов (SVM), с акцентом на линейный классификатор SVM.

📎 Рассматривается вывод линейного SVM, с акцентом на важность максимизации зазора между классами.

Процесс подгонки демонстрируется с использованием квадратичного программирования с пакетом CVXOPT на языке Python.

🟢Статья включает в себя примеры кода, визуализации и сравнение с реализацией SVM в библиотеке scikit-learn для проверки корректности решения.

🫧 Рассматриваются такие темы, как основы SVM, лагранжиан двойственной задачи и практические детали реализации.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤‍🔥5🔥3💯2
📎В статье рассматриваются вызовы в области выявления мошенничества, проводится сравнение rule-based и machine learning-based approaches, исследуется анализ данных, техника oversampling, обучение модели и её оценка, с акцентом на важности решения проблемы дисбаланса классов для эффективного выявления мошенничества.

🔖 Кроме того, статья подчеркивает значимость настройки порогов для балансировки ложных срабатываний и пропущенных мошеннических операций.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤‍🔥6
⚡️В статье рассматриваются вопросы четкого структурирования ноутбуков, стиля и улучшения кода через рефакторинг.

📎 Статья выделяет важность создания читаемого и организованного кода, а также предоставляет рекомендации по тестированию кода и созданию модулей для повторного использования.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤‍🔥4
🔆 Обсуждаются принципы работы кросс валидации, включая использование валидационного набора данных, k-fold кросс-валидацию, Leave-One-Out и Leave-P-Out кросс-валидацию, а также другие подходы и их применение к настройке гиперпараметров моделей.

🔆 Предоставляется обзор различных стратегий кросс-валидации, подчеркивая их важность для создания надежных и эффективных моделей.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥7
🔖 Разъясняется, как модели диффузии используются в создании изображений, описывается двухэтапный процесс диффузии и обратной реконструкции с использованием нейронных сетей.

⚪️Статья также проводит сравнение моделей диффузии с альтернативами, такими как вариационные автокодировщики (VAE), модели на основе потока и генеративно-состязательные сети (GAN), выделяя преимущества и недостатки каждого подхода.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤‍🔥7
📢 Статья представляет концепцию кластеризации k-средних на Python, описывая применение в маркетинге, юридической области и анализе кредитных транзакций.

📎Она включает в себя шаги алгоритма, примеры кода, визуализацию и введение в применение "elbow rule" для определения оптимального количества кластеров.

🟢Темы включают основы k-средних, реализацию на Python, визуализацию и применение в Scikit-learn на примере набора данных Iris.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤‍🔥5
👀Шпаргалка по теории вероятности включает пространство элементарных событий, перестановки, условную вероятность, правило Байеса, независимость, случайные величины, функцию плотности вероятности, кумулятивную функцию распределения, математическое ожидание, моменты и статистические показатели.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥5