Data Mining | Анализ данных🚀 – Telegram
Data Mining | Анализ данных🚀
3.27K subscribers
1.73K photos
10 videos
5 files
1.7K links
• Купить рекламу: t.me/sahib_space
Админ: sahib_space
• Стоимость: https://www.notion.so/sahibspace/69ece414a4af49f2bdbdfe455e553e58?pvs=3&qid=
• Группа в ВК: vk.com/datamining.team
Download Telegram
RedPajama: open-source датасет для обучения больших языковых моделей

https://bit.ly/44gBX5e
1
Low-code платформа Observable для быстрого создания визуализаций

https://bit.ly/3nwn2n3
1
#top@datamining.team
ТОП 5 постов за апрель

1. Интерактивный тренажер по простейшим запросам SQL для начинающих
https://bit.ly/3HhgNtW

2. Сборник бесплатных курсов по Power BI от Microsoft: подключение к данным и их продвинутая визуализация
https://bit.ly/3LDGyHm

3. Читлист по теории вероятностей и статистике от Стэнфордского университета
https://bit.ly/3GNx7lQ

4. Сборник задач и теории по базовой математике (линейная алгебра, оптимизация, графы) и машинному обучению
https://bit.ly/417npTn

5. Книга по прикладной статистике: статистические показатели, основные вопросы выборочного обследования, проверка статистических гипотез и другое
https://bit.ly/414vBnc
7
Статья, в которой простыми словами рассказывается о законе нормального распределения и его применении в различных сферах

https://bit.ly/3HOHoPb
2🔥1
Большой обзор моделей-трансформеров от BERT до Alpaca: обработка текста, компьютерное зрение, генерация изображений, анализ звука

https://bit.ly/3HQNizl
2
Компактный читлист по работе с Conda: установка модулей, управление средами и другое

https://bit.ly/44Cf0JN
1
Подкаст о будущем профессий, компаний и нейросетей: какие скиллы ИИ автоматизирует первыми, можно ли делегировать ИИ принятие решений и другие актуальные вопросы

https://bit.ly/3NK0f1A
2
Бесплатный курс для тех, кто хочет научиться применять глубокое обучение и машинное обучение для решения практических задач

https://bit.ly/3M3EwRd
3
Как сделать свой код более эффективным? — Прокачать навык проектирования и реализации алгоритмов!

Благодаря алгоритмам вы не только сможете писать более качественный код, но и научитесь находить оптимальные решения многих задач. Улучшить свой скил работы с алгоритмами поможет новый хендбук от Академии Яндекса.

Занимаясь по нему, вы узнаете, как проектировать, оптимизировать, комбинировать и отлаживать алгоритмы — причём без привязки к какому-либо языку программирования. В учебнике собраны практические задания разного уровня сложности, а эффективность алгоритмов проверяется автоматически. Так что вы не только сможете закрепить знания, но и получите быструю обратную связь по решениям.

Все материалы учебника бесплатны! Изучайте алгоритмы в удобном для вас темпе и совершенствуйтесь в написании кода: https://clck.ru/34cCN8
13🔥2
Свежая книга "Random Matrix Methods for Machine Learning" поможет понять, зачем в машинном обучении нужны функции комплексного переменного, интегралы по контуру, спектральная теория, комбинаторика и т.п. Есть следующие разделы
- Random Matrix Theory
- Statistical Inference in Linear Models
- Kernel Methods
- Large Neural Networks
- Large-Dimensional Convex Optimization
- Community Detection on Graphs
- Universality and Real Data
Например, в первом изучается спектр матрицы XX^T, которая много где возникает (в методе главных компонент, теории ядер и т.п.) А в четвёртом есть интересные результаты про т.н. двойной спуск.

Книга для очень подготовленного читателя!
11
Сотрудники ФКН ВШЭ за 10 минут рассказывают о ярких и понятных широкой аудитории результатах, к получению которых они причастны. Очень интересный формат! Некоторые доклады получились зажигательными. Есть интересные темы, например, доклады по алгебре и теории чисел.

https://youtu.be/9DC_6xErq6E
❤‍🔥81
Запущена регистрация на бесплатную программу AI Masters Набор 2023.

AI Masters — вечерняя бесплатная образовательная программа в области наук о данных от Института ИИ МГУ

Программа готовит аналитиков и специалистов по Data Science с гибким набором курсов.
Продолжительность: 2 года,
Время занятий: по будням с 18:00 до 21:00,
Загрузка: в среднем 30 часов в неделю,
Обучение бесплатное.
Сайт программы с подробной информацией: https://aimasters.ru/

Около 30 курсов, в том числе:
- Машинное обучение,
- Computer Vision & Video Processing,
- Вычислительная линейная алгебра,
- Математическая статистика и ее приложения,
- Big Data and Data Engineering,
- Продуктовая аналитика,
- Генеративные модели,
- Natural Language Processing,
- Reinforcement Learning,
- Вероятностные графические модели.

Любые вопросы пишите на почту aimasters.msu@gmail.com или кураторам проекта (их контакты - в соответствующем разделе на сайте).

С подачей заявок поспешите.
5
Machine Learning and Data Mining for Emerging Trend in Cyber Dynamics: Theories and Applications (2021)
7
Несколько книг в свободном доступе по SQL и бизнес-аналитике (половина в процессе написания)

https://dataschool.com/books/
Серия полезных ресурсов от Майкрософт (есть полезные хорошо реализованные методы):

NLP
https://github.com/microsoft/nlp-recipes

Computer vision
https://github.com/microsoft/computervision-recipes

Forecasting
https://github.com/microsoft/forecasting

Recommendation systems
https://github.com/microsoft/recommenders
12🔥3
Введение в логистическую регрессию

📌Как интерпретировать вывод логистической регрессии?

📌Какие предположения использует логистическая регрессия?

https://www.codecamp.ru/blog/logistic-regression/
🔥62
4 примера использования логистической регрессии в реальной жизни

https://www.codecamp.ru/blog/logistic-regression-real-life-examples/
7🔥1
DialogStudio: Towards Richest and Most Diverse Unified Dataset Collection and Instruction-Aware Models for Conversational AI.

Studio: самая большая и разнообразная коллекция диалоговых датасетов, объединенных в единый формат.

🖥 Github: https://github.com/salesforce/DialogStudio

📕 Paper: https://arxiv.org/abs/2307.10172v2

🔥 Dataset: https://paperswithcode.com/dataset/dialogstudio
5