Data Mining | Анализ данных🚀 – Telegram
Data Mining | Анализ данных🚀
3.28K subscribers
1.73K photos
10 videos
5 files
1.7K links
• Купить рекламу: t.me/sahib_space
Админ: sahib_space
• Стоимость: https://www.notion.so/sahibspace/69ece414a4af49f2bdbdfe455e553e58?pvs=3&qid=
• Группа в ВК: vk.com/datamining.team
Download Telegram
🟡Анализ выживаемости с использованием моделей Каплана-Мейера и Нельсона-Аалена, а также внедрение модели пропорциональных рисков Кокса с использованием proc lifetest и proc phreg для обработки данных сердечных заболеваний.

⭕️ Проводится анализ распределения переменных и графическое представление оценок выживаемости.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤‍🔥43
🟡 В статье рассматриваются различные типы автоэнкодеров, включая недокомплектные, регуляризованные, разреженные, конкретные, автоэнкодеры с добавлением шума и вариационные автоэнкодеры, обсуждая их математические основы, плюсы и минусы.

⭕️Руководство завершается практическим учебником по реализации автоэнкодеров с использованием PyTorch.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤‍🔥52🔥1
😑В статье описываются стандартные архитектуры автоэнкодеров: недокомплектные, разреженные, автоэнкодеры с добавлением шума и контрактивные, обсуждая их компромиссы и применение для обеспечения чувствительности к входам и устойчивости к запоминанию.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤‍🔥6🔥2
😱 Как дела с составлением резюме?

1️⃣Первый и наиболее распространенный промах — резюме на 6 страниц, в то время как оптимально 2 страницы. Рекрутеры в среднем уделяют просмотру всего 10 секунд, поэтому информация должна быть ясной и релевантной.

2️⃣Избыток обязанностей и недостаток достижений. Ваша задача — представить себя максимально выигрышно, а бизнес ценит цифры. Не стесняйтесь урезать блок с обязанностями, так как конкретные кейсы подчеркнут вашу область ответственности.

3️⃣Из резюме не ясно, почему именно вы подходите, а это должно быть явным. Поэтому для каждой вакансии стоит адаптировать резюме или иметь несколько готовых для разных должностей и отраслей. Это особенно важно, если вы меняете профессию. В "О себе" расскажите о завершенных курсах, о том, что вас всегда привлекал анализ данных/ML/тестирование, о вашей готовности организовать всех или, наоборот, вдумчиво погрузиться в задачи.

Ваш @dataminingteam❤️
Please open Telegram to view this post
VIEW IN TELEGRAM
❤‍🔥4🔥32
😑В статье рассматриваются темы, такие как исследование шаблонов пропущенных данных, выбор вспомогательных переменных, определение количества восполнений.

😠 Статья отвечает на вопросы о видах механизмов пропущенных данных, шагах множественного восполнения, значимости вспомогательных переменных и соображениях при выборе количества восполнений.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥7
➡️ Обзор multi-agent reinforcement learning (MARL) изучает методы и приложения, выделяя проблемы масштабируемости, нестационарности и надежности.

🤩Статья также указывает на тенденции и перспективы исследований. Авторы разъясняют почему считают, что MARL станет одним из популярных топиков для исследований.
Please open Telegram to view this post
VIEW IN TELEGRAM
💯5❤‍🔥3🔥2
🔵 В обзоре классифицируется онлайн-обучение по трем основным типам: обучение с учителем с полной обратной связью, онлайн-обучение с ограниченной обратной связью и безнадзорное онлайн-обучение без обратной связи.

⭕️В основном фокусируясь на первой категории, статья затрагивает основы двух других. Кроме того, в обзоре обсуждаются открытые вопросы и предлагаются потенциальные направления будущих исследований.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤‍🔥4👍2🔥1
🫧Традиционных глубокие ансамбли часто теряют интерпретируемость при агрегации прогнозов от черных ящиков нейронных сетей.

💡Aвторы предлагают новый подход, который сохраняет интерпретируемость, улучшая при этом точность прогнозов по сравнению с отдельными участниками ансамбля.

📎Показано, как ансамбли трансформаций количественно характеризуют как алеаторные, так и эпистемические неопределенности, обеспечивая минимакс-оптимальные прогнозы при определенных условиях.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3🔥2
Основы и последние достижения в методах глубокого полу-обучения (SSL) с точки зрения проектирования модели и функций потерь без учителя. Представлена таксономия методов, включая методы регуляризации, графовые методы, методы с псевдо-разметкой и гибридные методы, а также подробно рассмотрены 52 представительных метода с визуальным сравнением по типам потерь, вкладам и различиям в архитектуре.

https://arxiv.org/pdf/2103.00550.pdf
❤‍🔥5🔥3
🔍 Исследование сравнивает эффективность методов уменьшения размерности, таких как PCA, autoencoders и вариационные autoencoders, в задачах классификации изображений. Авторы оценивают производительность этих методов на 3-х наборах данных.

📌 Авторы подчеркивают релевантность PCA в контексте задач классификации изображений с ограниченными вычислительными ресурсами.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4❤‍🔥2🔥1
📌В учебнике рассматриваются концепции обучения с подкреплением, Q-обучения и глубокого Q-обучения, а также проводится сравнение их характеристик и применений.

✔️ Подробно описывается алгоритм Q-обучения, его рабочий процесс, и вводится глубокое Q-обучение как метод решения проблем, связанных с обработкой больших пространств состояний, с использованием глубоких нейронок для оценки Q-значений.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥7❤‍🔥1👍1
📌 Статья рассматривает методы максимизации acquisition functions для байесовской оптимизации.

⏩️ Авторы представляют теоретически обоснованные эвристики (функции приобретения), используемые в байесовской оптимизации, и обсуждают сложности при полной максимизации этих функций.

✔️ Основной вклад статьи включает анализ оптимизации градиента функций приобретения с использованием метода Монте-Карло, а также предложение эффективных методов жадной максимизации функций приобретения для оптимизации байесовских стратегий.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7❤‍🔥1🔥1
Статья охватывает различные аспекты классификации текста рассматривая различные типы систем классификации текста.

⭕️В дополнение, представлен процесс предобработки текста, извлечение признаков, а также пример конечного цикла классификации текста на Python.

🔖Заключительные разделы включают ответы на часто задаваемые вопросы.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤‍🔥7👍3🔥3
📎Глубокий обзор ARIMA (AutoRegressive Integrated Moving Average) для анализа и прогнозирования временных рядов в Python.

Охватывает ключевые компоненты ARIMA — авторегрессию (AR), интеграцию (I) и скользящее среднее (MA), предоставляя пример кода на примере данных о ценах акций Netflix.

☑️В статье демонстрируется реализация модели ARIMA с оценкой производительности и визуализацией точности прогнозов.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤‍🔥7🔥42
➡️Статья посвящена визуализации данных высокой размерности через метод t-SNE (t-Distributed Stochastic Neighbor Embedding).

🔖Рассматривается сравнение t-SNE с методом PCA, предоставляется код и пояснение для визуализации признаков с использованием TensorBoard. В конце предоставлен краткий обзор метода и его применения.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤‍🔥6🔥2
🟡 Исчерпывающий обзор AutoML, включая его преимущества, ключевые компоненты, методы работы и передовые темы, такие как поиск нейроархитектур и трансферное обучение.

❗️Рассматриваются практические аспекты использования AutoML, включая развертывание, выбор метрик и анализ результатов, с завершающим взглядом на ведущие инструменты.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤‍🔥6🔥2
🔵 В статье рассматривается снижение вычислительных затрат в Neural AutoML с использованием трансферного обучения.

❗️ AutoML упрощает создание алгоритмов машинного обучения, но Neural AutoML, специализированный для глубокого обучения, предполагает значительные вычислительные затраты. Предложенное решение, Transfer Neural AutoML, использует знания предыдущих задач для ускорения проектирования сетей, применяя параллельное обучение на нескольких задачах и передавая стратегию поиска новым задачам.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5❤‍🔥2🍓11
🔵В статье рассматриваются потенциальные области применения, процессы прогнозирования и валидации, шаги по построению и обучению forest-based forecast, выявление выбросов во временных рядах, результаты работы инструмента, оптимальные методы и ограничения.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5🔥3❤‍🔥1
➡️Разбор экспоненциального сглаживания в анализе временных рядов, включая потенциальные применения, прогнозирование и валидацию, построение модели экспоненциального сглаживания, выявление выбросов во временных рядах, инструменты анализа, рекомендации по использованию и ограничения метода.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5🔥3❤‍🔥1