Data Mining | Анализ данных🚀 – Telegram
Data Mining | Анализ данных🚀
3.31K subscribers
1.73K photos
10 videos
5 files
1.7K links
• Купить рекламу: t.me/sahib_space
Админ: sahib_space
• Стоимость: https://www.notion.so/sahibspace/69ece414a4af49f2bdbdfe455e553e58?pvs=3&qid=
• Группа в ВК: vk.com/datamining.team
Download Telegram
Sweetviz 2.0 - новая библиотека на Python для быстрого анализа данных

https://towardsdatascience.com/sweetviz-automated-eda-in-python-a97e4cabacde
Курс по документированию API на русском. Начиная от понятия REST, использования curl и до OpenAPI (Swagger). ​

https://starkovden.github.io/
#top@datamining.team

ТОП 5 постов за март

1) Классный курс по NLP с классным оформлением, объяснениями и ссылками на релевантные работы.
https://lena-voita.github.io/nlp_course.html

2) Google summer of code – программа для студентов + стипендия
https://vk.com/wall-94208167_5079

3) Учебник по статистике от профессоров Стэнфорда https://web.stanford.edu/~hastie/ElemStatLearn/

4) Курс Леонида Жукова «Анализ данных в бизнесе», НИУ ВШЭ (eng)
http://www.leonidzhukov.net/hse/2020/datascience/

5) Очень качественный и читаемый учебник по статистике
https://www.statlearning.com/
Как найти компромисс между доходностью и ценовым восприятием с помощью углубленной аналитики.

https://bit.ly/3d6NZFN
Программирование на C++

Курс вам подойдёт, если у вас есть хотя бы небольшой опыт процедурного программирования на языке со строгой типизацией, например, на Java, Scala или C#. Первая часть курса помогает получить базовое знание языка. Вторая часть позволяет освоить большинство возможностей современного С++: навыка должно хватить для эффективного использования C++ в большинстве проектов, если язык там применим.

Часть 1
https://compscicenter.ru/courses/cpp-1/2018-autumn/classes/
Часть 2
https://compscicenter.ru/courses/cpp-2/2019-spring/classes/
Using PyTorch and NumPy? You're making a mistake
A bug that plagues thousands of open-source ML projects.
6-minute read

https://bit.ly/3wNrz4b
Курс из Гарварда по теории вероятностей.

https://bit.ly/321UkvY
Как машины учатся эмоциональному поведению

https://bit.ly/2QafR2N
Статья о правильной структуре репозитория библиотеки на Python.

https://blog.ionelmc.ro/2014/05/25/python-packaging/#the-structure
Интересный проект от Facebook AI - библиотека для машинного обучения на C++, в приведенном репозитории содержатся примеры для классификации изображений/распознавания речи и другие.

Ссылка : https://bit.ly/3stQQgw
Исследователи из NVIDEA представили GANcraft - фреймворк, который из 3D миров из блоков Minecraft создает фотореалистичное изображение.

https://bit.ly/3sHt68U
Проект backprop.co - обновляемый список моделей, которые достаточно легко начать использовать, с помощью их API. На данный момент их не очень много, но проект только на начальной стадии разработки. Почти все модели показывают sota или около sota перфоманс на популярных датасетах.
В нашем сообществе ВК (https://bit.ly/3et3gQG) больше 10000 участников! Спасибо вам за поддержку и интерес к сфере Data Mining. В связи с этим, мы хотели бы поделиться подборкой из 5 лучших постов за 6 лет нашей работы:

1. Видеозаписи курсов по машинному обучению (https://bit.ly/3xluscD) и байесовским методам (https://bit.ly/2QrG6Cj) от ВШЭ

2. Продвинутый курс по RL от University of California. По ссылке можно найти и другие полезные курсы по ML от университета.

https://bit.ly/3exobCq

3. Полный курс по RL от Stanford.

Сайт курса : https://stanford.io/2Pf4feI
Плейлист на youtube : https://bit.ly/3eq9m4f

4. Репозиторий курса по NLP от Школы Анализа Данных Яндекса

https://bit.ly/3gD5CPE

5. Курс CS 188 : Introduction to Artificial Intelligence от University of California

Плейлист лекций : https://bit.ly/3sMtId6
Материалы : https://bit.ly/2RYQUs5

Надеемся, вы продолжите изучать сферу Data Mining и улучшать свои навыки и расширять знания. Мы же продолжим и дальше делиться интересными материалами и новостями из мира Data Science!

#top@datamining.team
Курсовой проект пользователя reddit rockwilly - предсказание политической позиции комментарии/сабреддита с помощью машинного обучения.

https://bit.ly/32P3xrJ
Некоторым удобнее получать новый материал слушая, а не читая. Как раз для вас предлагаем послушать англоязычный подкаст о машинном обучении под названием Machine Learning Street Talk.

Ссылка на канал : https://bit.ly/3dRrmp5
Думаю все осведомлены о высокой стоимости обучения с нуля современных текстовых моделей по типу BERT, GPT-2/3 и прочее. Мы предлагаем вам ознакомиться со статьей, в которой ценой маленькой просадки по качеству исследователи обучают свой BERT за 24 часа. Они пообещали в скором времени поделиться кодом, пока доступна только статья.

Ссылка : https://bit.ly/3xyuUo0
Свежий взгляд на Глубинное Обучение со стороны геометрии и инвариантов : актуальная книга и блог по ссылке

https://geometricdeeplearning.com
Проходящий раз в 2 недели онлайн-семинар по обучению с подкреплением. Записи доступны по ссылке.

https://bit.ly/3t57qDx