Data Mining | Анализ данных🚀 – Telegram
Data Mining | Анализ данных🚀
3.28K subscribers
1.73K photos
10 videos
5 files
1.7K links
• Купить рекламу: t.me/sahib_space
Админ: sahib_space
• Стоимость: https://www.notion.so/sahibspace/69ece414a4af49f2bdbdfe455e553e58?pvs=3&qid=
• Группа в ВК: vk.com/datamining.team
Download Telegram
🔵 Статья обсуждает проблемы в ИИ, сосредотачиваясь на изоляции данных и вопросах конфиденциальности. Авторы предлагают комплексный подход с использованием федеративного обучения, включая горизонтальное, вертикальное и обучение с передачей.

➡️ Рассмотрены ключевые темы, такие как воздействие регулирования (например, GDPR), техники конфиденциальности и потенциальные утечки информации. Также рассматривается категоризация федеративного обучения и его архитектуры.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤‍🔥5
Разбор следующих тем LSTM:
⭕️Введение в модель LSTM нейронной сети для анализа временных рядов.
⭕️Проблемы и сложности реализации LSTM модели через TensorFlow.
⭕️Представление библиотеки scalecast и ее преимущества для упрощения процесса прогнозирования временных рядов.
⭕️Учебник по предобработке данных и исследовательскому анализу данных.
⭕️Прогнозирование с использованием LSTM и библиотеки scalecast.
⭕️Сравнение производительности LSTM с моделью множественной линейной регрессии (MLR) через бенчмаркинг.
⭕️Обсуждение динамичной методики прогнозирования и тестирования в пакете scalecast, предотвращающей утечку данных.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6❤‍🔥2
➡️ Работа обсуждает использование нейронок для снижения размерности данных с помощью Autoencoder.

🔆 Описываются понятия Autoencoder, функция стоимости, основные термины и приводится реализация в TensorFlow. Также обсуждаюся скорость обучения, регуляризация, предоставляется код и набор данных для примеров.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤‍🔥543
🟡Анализ выживаемости с использованием моделей Каплана-Мейера и Нельсона-Аалена, а также внедрение модели пропорциональных рисков Кокса с использованием proc lifetest и proc phreg для обработки данных сердечных заболеваний.

⭕️ Проводится анализ распределения переменных и графическое представление оценок выживаемости.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤‍🔥43
🟡 В статье рассматриваются различные типы автоэнкодеров, включая недокомплектные, регуляризованные, разреженные, конкретные, автоэнкодеры с добавлением шума и вариационные автоэнкодеры, обсуждая их математические основы, плюсы и минусы.

⭕️Руководство завершается практическим учебником по реализации автоэнкодеров с использованием PyTorch.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤‍🔥52🔥1
😑В статье описываются стандартные архитектуры автоэнкодеров: недокомплектные, разреженные, автоэнкодеры с добавлением шума и контрактивные, обсуждая их компромиссы и применение для обеспечения чувствительности к входам и устойчивости к запоминанию.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤‍🔥6🔥2
😱 Как дела с составлением резюме?

1️⃣Первый и наиболее распространенный промах — резюме на 6 страниц, в то время как оптимально 2 страницы. Рекрутеры в среднем уделяют просмотру всего 10 секунд, поэтому информация должна быть ясной и релевантной.

2️⃣Избыток обязанностей и недостаток достижений. Ваша задача — представить себя максимально выигрышно, а бизнес ценит цифры. Не стесняйтесь урезать блок с обязанностями, так как конкретные кейсы подчеркнут вашу область ответственности.

3️⃣Из резюме не ясно, почему именно вы подходите, а это должно быть явным. Поэтому для каждой вакансии стоит адаптировать резюме или иметь несколько готовых для разных должностей и отраслей. Это особенно важно, если вы меняете профессию. В "О себе" расскажите о завершенных курсах, о том, что вас всегда привлекал анализ данных/ML/тестирование, о вашей готовности организовать всех или, наоборот, вдумчиво погрузиться в задачи.

Ваш @dataminingteam❤️
Please open Telegram to view this post
VIEW IN TELEGRAM
❤‍🔥4🔥32
😑В статье рассматриваются темы, такие как исследование шаблонов пропущенных данных, выбор вспомогательных переменных, определение количества восполнений.

😠 Статья отвечает на вопросы о видах механизмов пропущенных данных, шагах множественного восполнения, значимости вспомогательных переменных и соображениях при выборе количества восполнений.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥7
➡️ Обзор multi-agent reinforcement learning (MARL) изучает методы и приложения, выделяя проблемы масштабируемости, нестационарности и надежности.

🤩Статья также указывает на тенденции и перспективы исследований. Авторы разъясняют почему считают, что MARL станет одним из популярных топиков для исследований.
Please open Telegram to view this post
VIEW IN TELEGRAM
💯5❤‍🔥3🔥2
🔵 В обзоре классифицируется онлайн-обучение по трем основным типам: обучение с учителем с полной обратной связью, онлайн-обучение с ограниченной обратной связью и безнадзорное онлайн-обучение без обратной связи.

⭕️В основном фокусируясь на первой категории, статья затрагивает основы двух других. Кроме того, в обзоре обсуждаются открытые вопросы и предлагаются потенциальные направления будущих исследований.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤‍🔥4👍2🔥1
🫧Традиционных глубокие ансамбли часто теряют интерпретируемость при агрегации прогнозов от черных ящиков нейронных сетей.

💡Aвторы предлагают новый подход, который сохраняет интерпретируемость, улучшая при этом точность прогнозов по сравнению с отдельными участниками ансамбля.

📎Показано, как ансамбли трансформаций количественно характеризуют как алеаторные, так и эпистемические неопределенности, обеспечивая минимакс-оптимальные прогнозы при определенных условиях.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3🔥2
Основы и последние достижения в методах глубокого полу-обучения (SSL) с точки зрения проектирования модели и функций потерь без учителя. Представлена таксономия методов, включая методы регуляризации, графовые методы, методы с псевдо-разметкой и гибридные методы, а также подробно рассмотрены 52 представительных метода с визуальным сравнением по типам потерь, вкладам и различиям в архитектуре.

https://arxiv.org/pdf/2103.00550.pdf
❤‍🔥5🔥3
🔍 Исследование сравнивает эффективность методов уменьшения размерности, таких как PCA, autoencoders и вариационные autoencoders, в задачах классификации изображений. Авторы оценивают производительность этих методов на 3-х наборах данных.

📌 Авторы подчеркивают релевантность PCA в контексте задач классификации изображений с ограниченными вычислительными ресурсами.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4❤‍🔥2🔥1
📌В учебнике рассматриваются концепции обучения с подкреплением, Q-обучения и глубокого Q-обучения, а также проводится сравнение их характеристик и применений.

✔️ Подробно описывается алгоритм Q-обучения, его рабочий процесс, и вводится глубокое Q-обучение как метод решения проблем, связанных с обработкой больших пространств состояний, с использованием глубоких нейронок для оценки Q-значений.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥7❤‍🔥1👍1
📌 Статья рассматривает методы максимизации acquisition functions для байесовской оптимизации.

⏩️ Авторы представляют теоретически обоснованные эвристики (функции приобретения), используемые в байесовской оптимизации, и обсуждают сложности при полной максимизации этих функций.

✔️ Основной вклад статьи включает анализ оптимизации градиента функций приобретения с использованием метода Монте-Карло, а также предложение эффективных методов жадной максимизации функций приобретения для оптимизации байесовских стратегий.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7❤‍🔥1🔥1
Статья охватывает различные аспекты классификации текста рассматривая различные типы систем классификации текста.

⭕️В дополнение, представлен процесс предобработки текста, извлечение признаков, а также пример конечного цикла классификации текста на Python.

🔖Заключительные разделы включают ответы на часто задаваемые вопросы.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤‍🔥7👍3🔥3
📎Глубокий обзор ARIMA (AutoRegressive Integrated Moving Average) для анализа и прогнозирования временных рядов в Python.

Охватывает ключевые компоненты ARIMA — авторегрессию (AR), интеграцию (I) и скользящее среднее (MA), предоставляя пример кода на примере данных о ценах акций Netflix.

☑️В статье демонстрируется реализация модели ARIMA с оценкой производительности и визуализацией точности прогнозов.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤‍🔥7🔥42
➡️Статья посвящена визуализации данных высокой размерности через метод t-SNE (t-Distributed Stochastic Neighbor Embedding).

🔖Рассматривается сравнение t-SNE с методом PCA, предоставляется код и пояснение для визуализации признаков с использованием TensorBoard. В конце предоставлен краткий обзор метода и его применения.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤‍🔥6🔥2
🟡 Исчерпывающий обзор AutoML, включая его преимущества, ключевые компоненты, методы работы и передовые темы, такие как поиск нейроархитектур и трансферное обучение.

❗️Рассматриваются практические аспекты использования AutoML, включая развертывание, выбор метрик и анализ результатов, с завершающим взглядом на ведущие инструменты.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤‍🔥6🔥2