Data Mining | Анализ данных🚀 – Telegram
Data Mining | Анализ данных🚀
3.31K subscribers
1.73K photos
10 videos
5 files
1.7K links
• Купить рекламу: t.me/sahib_space
Админ: sahib_space
• Стоимость: https://www.notion.so/sahibspace/69ece414a4af49f2bdbdfe455e553e58?pvs=3&qid=
• Группа в ВК: vk.com/datamining.team
Download Telegram
Подборка 40+ самых интересных статей по Data Science за 2021 год в блоге Алексея Чернобровова

https://bit.ly/3FZ6Sq3
Исторический обзор развития моделей глубокого обучения: от появления нейронных сетей до технологий последнего десятилетия

https://bit.ly/3n2tL4s
Заканчивается отбор на программы УNVRSTY. Успейте отправить эссе до старта занятий - 15 января. Обучение — бесплатное.

Программы УNVRSTY ориентированы на мотивированных людей (старшеклассников, студентов, выпускников), стремящихся существенно повысить свою квалификацию по тематике конкретной программы

Занятия проводят одни из самых сильных образовательных команд в России по количественным финансам, data science, финтех-разработке, риск-менеджменту и финансовой аналитике. Участники команды УNVRSTY работают в ведущих международных и российских компаниях: Google, Goldman Sachs, JP Morgan, Barclays, Morgan Stanley, McKinsey, PwC, EY, KPMG, Deloitte, Яндекс, Озон...

Каждая программа открывается от 200 зачисленных студентов (в случае, если на конкретную программу запишется меньше — можно будет подождать или перезаписаться на другую программу).

Подробнее читайте по ссылке: https://vk.com/wall-42556983_2834
В выходной мы как всегда предлагаем отдохнуть, но не выпадать из темы: например, послушать подкаст от команды Хабра "Agile по жизни: обсуждаем гибкую методологию разработки на бытовых примерах"

Узнать больше, найти таймкоды и послушать: https://bit.ly/31v0c4e
Полноценный туториал по библиотеке Seaborn (с таймкодами): настройки, загрузка данных и множество графиков

https://bit.ly/3F5J42B
Статья об основных современных моделях для генерирующего реферирования и генерации текста в целом (BertSumAbs, GPT и других) и их использовании для русского языка

https://bit.ly/32IEz13
Последние две недели мы экспериментируем с форматом и публикуем посты без картинок.
Обзор терминальных мультиплексоров (определения внутри статьи): tmux и dvtm (первая ссылка)

Читлист на английском языке, резюмирующий материал статьи (вторая ссылка)


https://bit.ly/3qbDPdy
https://bit.ly/3HQdp75
Лекции CS224u Natural Language Understanding 2021 от Стенфорда в открытом доступе: фокус на конкретные задачи NLU (анализ тональности, извлечение реляций, поиск и тд), короткие 15-минутные видео и домашние задания

Подробнее: https://stanford.io/3GhH3lm
Курс по нейронным сетям от Samsung. Рассчитан на слушателей, у которых уже имеются знания в области машинного обучения.

https://bit.ly/3tmAlH4
Четыре личные истории специалистов по ИИ и ML: старт карьеры, обязанности и проблемы сферы

https://bit.ly/3FdMWPl
Большой сборник теоретических задач по машинному обучению, сортированных по тематическим блокам

https://bit.ly/3GmZxB7
"Интеграции бояться - в аналитики не идти". В этой статье автор рассказывает о том, с какой стороны подходить к такой задаче, как проектирование интеграционного взаимодействия между системами, приводит несколько практических кейсов из своего опыта, а также выделяет навыки, которые помогут аналитику решить такие сложные задачи


https://bit.ly/3qjZwZ2
Статья с понятным объяснением того, как работает модель GPT от OpenAI: от токенизации до файнтюнинга

https://bit.ly/3r5SaY5
#top@datamining.team
ТОП-5 постов за декабрь

1. Гайд по самостоятельному изучению Data Science с нуля
https://bit.ly/3EknuIf

2. Курс по машинному обучению от Microsoft, который дополнен тестами, заметками, практическими заданиями, а также идеями для проектов
https://bit.ly/3yLtZBP

3. Сборник курсов по прикладной статистике на Coursera, а также дополнительные материалы в одном репозитории
https://bit.ly/3lqilGY

4. Большая подборка обучающих видео по глубокому обучению
https://bit.ly/3JasEt2

5. Книги по Data Science с аннотациями: программирование на Python, машинное обучение и большие данные
https://bit.ly/3lKCzeZ
Обратный поиск изображений: гайд от детективного агентства Bellingcat

https://bit.ly/31U3BJY
Топ-5 заблуждений в работе аналитика

https://bit.ly/3Fji7so
Интересная статья про уровни зрелости ML-процессов

Подробнее: https://bit.ly/335VoD9
Статья с описанием алгоритма, который способен обучать глубокие сети доверия (DBM) по одному слою за раз

https://bit.ly/34QgXbo
"Как разработать без ТЗ так, чтобы результат был не ХЗ". В этой статье автор рассказывает о способе, который позволяет не требовать у клиентов технического задания и при этом оценить границы бюджета, уложиться в него и даже разработать продукт, который удовлетворит клиента.

https://bit.ly/3Gt3S5R