Data Mining | Анализ данных🚀 – Telegram
Data Mining | Анализ данных🚀
3.31K subscribers
1.73K photos
10 videos
5 files
1.7K links
• Купить рекламу: t.me/sahib_space
Админ: sahib_space
• Стоимость: https://www.notion.so/sahibspace/69ece414a4af49f2bdbdfe455e553e58?pvs=3&qid=
• Группа в ВК: vk.com/datamining.team
Download Telegram
Один из самых крутейших ML-блогов. Предлагаем ознакомиться с последним постом.

Controllable Neural Text Generation: https://lilianweng.github.io/lil-log/2021/01/02/controllable-neural-text-generation.html
Подборка ресурсов, которые демонстрируют некоторые DL-методы

https://pikabu.ru/story/21_sayt_gde_mozhno_protestirovat_rabotu_neyrosetey_6697786
Изображения котов, которые не существуют - их сгенерировала нейросеть:

https://thesecatsdonotexist.com/
GPT-3 все ближе к людям

https://bit.ly/3rqcn9b
SberDevices рассказывает про синтез голосов Сбера, Афины и Джой — виртуальных ассистентов семейства Салют.

https://bit.ly/31o3OBr
Финансовые компании обратили внимание на переработки и тяжелые условия своих сотрудников после того, как младшие аналитики Goldman Sachs пожаловались на проблемы со здоровьем из-за 95-часовой рабочей недели.

https://bit.ly/31rvMMI
Good Product Manager/Bad Product Manager by Ben Horowitz

https://bit.ly/3svVN9r
Data-science развивается очень быстро, в том числе благодаря росту объема доступных данных для анализа или построения моделей. Но для создания сложных моделей командам аналитиков нужно работать совместно и эффективно управлять большими датасетами. И вот здесь может помочь, например, DVC — open-source система контроля версий для проектов машинного обучения.

https://bit.ly/31qsyJb
Полное руководство по созданию Docker-образа для обслуживания системы машинного обучения в продакшене

https://bit.ly/2PATZ0a
Библиотека для оценки моделей сжатия данных, созданная исследователями из CompressAI.

https://bit.ly/37pPBrh
BCG GAMMA – это глобальная команда, которая объединяет экспертов из различных областей data science. В своей работе они фокусируются на решении бизнес-задач с использованием технологий ИИ и продвинутой аналитики.

Являясь частью команды BCG GAMMA вы сможете не только поработать на крупнейших проектах в разных индустриях, но и получить международный опыт. Помимо России, клиенты BCG GAMMA находятся в Испании, Франции, Израиле, Нидерландах и других странах.

→ Full-time позиция - https://on.bcg.com/2ZM75KU (при заполнении заявки нужно выбрать Москву в качестве географического приоритета)
→ Летняя стажировка в BCG Gamma для студентов (дедлайн по подачи заявки - 16 апреля!)
http://on.bcg.com/BCGGAMMAInternship

В качестве примера проекта, над которым вы сможете поработать, посмотрите кейса авиакомпании KLM:
https://www.youtube.com/watch?v=6y7CmaGitB4
Sweetviz 2.0 - новая библиотека на Python для быстрого анализа данных

https://towardsdatascience.com/sweetviz-automated-eda-in-python-a97e4cabacde
Курс по документированию API на русском. Начиная от понятия REST, использования curl и до OpenAPI (Swagger). ​

https://starkovden.github.io/
#top@datamining.team

ТОП 5 постов за март

1) Классный курс по NLP с классным оформлением, объяснениями и ссылками на релевантные работы.
https://lena-voita.github.io/nlp_course.html

2) Google summer of code – программа для студентов + стипендия
https://vk.com/wall-94208167_5079

3) Учебник по статистике от профессоров Стэнфорда https://web.stanford.edu/~hastie/ElemStatLearn/

4) Курс Леонида Жукова «Анализ данных в бизнесе», НИУ ВШЭ (eng)
http://www.leonidzhukov.net/hse/2020/datascience/

5) Очень качественный и читаемый учебник по статистике
https://www.statlearning.com/
Как найти компромисс между доходностью и ценовым восприятием с помощью углубленной аналитики.

https://bit.ly/3d6NZFN
Программирование на C++

Курс вам подойдёт, если у вас есть хотя бы небольшой опыт процедурного программирования на языке со строгой типизацией, например, на Java, Scala или C#. Первая часть курса помогает получить базовое знание языка. Вторая часть позволяет освоить большинство возможностей современного С++: навыка должно хватить для эффективного использования C++ в большинстве проектов, если язык там применим.

Часть 1
https://compscicenter.ru/courses/cpp-1/2018-autumn/classes/
Часть 2
https://compscicenter.ru/courses/cpp-2/2019-spring/classes/
Using PyTorch and NumPy? You're making a mistake
A bug that plagues thousands of open-source ML projects.
6-minute read

https://bit.ly/3wNrz4b