Data Mining | Анализ данных🚀 – Telegram
Data Mining | Анализ данных🚀
3.31K subscribers
1.73K photos
10 videos
5 files
1.7K links
• Купить рекламу: t.me/sahib_space
Админ: sahib_space
• Стоимость: https://www.notion.so/sahibspace/69ece414a4af49f2bdbdfe455e553e58?pvs=3&qid=
• Группа в ВК: vk.com/datamining.team
Download Telegram
Хотим поделиться большим списком научных статей, связанных с DL, с хорошими комментариями.

Блог : https://bit.ly/3uoxFq9
Реализация операции инволюции на pytorch (автор пока не представил сравнение с официальной, но код явно выглядит лучше)

Репозиторий - https://bit.ly/3f6oh43

Оригинальная статья - https://bit.ly/2QWYGmd
21 апреля прошел PyTorch Ecosystem Day - виртуальное мероприятие, связанное с развитием PyTorch и проектов, связанных с ним. По ссылке вы сможете найти материалы с постер-сессии и доклады.

https://bit.ly/3faZ2NQ
Авторы данной работы пытаются разработать более общую науку "математический анализ глубинного обучения" для решения задач в этой сфере.

https://bit.ly/2RP6zu1
Twitter бот, который публикует популярные на arxiv статьи.

Ссылка : https://bit.ly/3odTrdM
Предлагаем вам ознакомиться с интерактивной игрой: сможете ли вы угадать, какое название на самом деле реальное, а какое сгенерировано моделью GPT-2 обученной на 10 тысячах названий статей с Nature.

https://bit.ly/3hrIuny
Исследователи из Google выяснили, что, используя основанный на преобразовании Фурье FNet вместо слоев Self-Attention, можно добиться точности 92% от предыдущего решения, при этом ускорив работу в 7 раз.

Ссылка на блог : https://bit.ly/3fe57co

Ссылка на статью о FNet : https://bit.ly/3uT6CDz
Большой проект CodeNet от IBM: большой датасет из 14 миллионов примеров различных программ. Подробности в репозитории и в блоге:

Репозиторий: https://bit.ly/3wdEOKq

Блог: https://bit.ly/3bypyQA
Обзор техники для создания регрессионных моделей для работы с несбалансированными выборками Deep Imbalanced Regression.

https://bit.ly/3hyEi5I
DeepMind представляет новый способ обучения self-supervised моделей для некурируемых датасетов.

https://bit.ly/3u4AThD
Появилась реализация метода распознавания речи без размеченного датасета.

Статья от facebook (wav2vec-U) : https://bit.ly/3wpxkEh

Репозиторий с кодом : https://bit.ly/3hOlQGf
Статья о попытках DeepMind добиться высокого уровня автономности, о котором шла речь при присоединении к Google.

Статья Wall Street Journal : https://on.wsj.com/3oBKdbG
LinkedIn выпустил в открытый доступ Greykite - Python библиотека для прогнозирования временных рядов. В конце блога ссылки на оригинальную статью и репозиторий с кодом.

Блог - https://bit.ly/2Ss7H7e
Проект labml - аггрегация интересных статей в твиттере на основе лайков и ретвитов. Позволяет находить самые интересные статьи за день, неделю или месяц.

https://bit.ly/3uiCsbW
Видео-разбор статьи, где авторы задаются вопросом, будет ли предобучение сверточных сетей лучше, чем предобучение трансформеров.

Разбор: https://bit.ly/3hVEXhC
Статья: https://bit.ly/3wBkZNj
25 мая вышла библиотека KotlinDL 0.2 - многофункциональная библиотека для глубинного обучения на языке Kotlin. По ссылке в блоге JetBrains можно ознакомиться с основным функционалом библиотеки.

https://bit.ly/34lkZFf
Интересный гайд для чтения статей по Deep Learning от пользователя floodsung. Репозиторий представляет собой список статей в понятном для изучения порядке вплоть до 2016 года (соответственно, подойдет в основном для начинающих специалистов)

Репозиторий: https://bit.ly/34uBFtM