Data Mining | Анализ данных🚀 – Telegram
Data Mining | Анализ данных🚀
3.31K subscribers
1.73K photos
10 videos
5 files
1.7K links
• Купить рекламу: t.me/sahib_space
Админ: sahib_space
• Стоимость: https://www.notion.so/sahibspace/69ece414a4af49f2bdbdfe455e553e58?pvs=3&qid=
• Группа в ВК: vk.com/datamining.team
Download Telegram
Инференс в продакшене с использованием Rust (по сравнению с Python и scikit-learn) может ускорить производительность в 26 раз, а тренировка K-Means модели на датасете в 1 миллион точек будет быстрее на 30%

https://bit.ly/2TwHxOg
Традиционная рубрика от сообщества Open Data Science "Читаем статьи за вас" за апрель 2020. В подборке вас ждут краткие содержания 8 статей.

https://bit.ly/3cUHvHz
Хорошее описание создания дипфейка по одному кадру.

https://bit.ly/2M0Z8d1
Если вас давно интересовало, какими инструментами пользуются ML-специалисты при реальной разработке, то советуем прочитать этот блог и узнать широкий набор вариантов.

https://bit.ly/2THQ7K7
AutoSweep - фреймворк, который преобразует объекты с фотографий в 3Д модели, которые можно редактировать.  Основная идея основана на том, что большинство объектов, сделанных людьми, представляют из себя комбинации примитивов, из которых и можно построить модели.

Страница проекта : https://bit.ly/2ZR257T
Исследователи обучили нейросеть восстанавливать изображение от перекрывающих объектов: стекло окна, ограда и капли дождя. Модель принимает на вход видеозапись сцены, которую снимали на движущуюся камеру. На выходе модель генерирует изображение сцены без препятствия.

https://bit.ly/3dplelx
В этой статье автор дает несколько советов и хитростей для улучшения производительности модели классификации текста.

https://bit.ly/2ZXb4EQ
Вторая часть рубрики "Читаем статьи за вас" от сообщества Open Data Science. В подборке вас ждет обзор 9 статей связанных с нейронными сетями.

https://bit.ly/306u2ci
Представляем вам познавательный курс по введению в Машинное Обучение и ИИ от DeepMind и Университетского колледжа Лондона. Полный курс будет содержать 12 лекций, на данный момент выпущена только половина. Курс рекомендуется к просмотру.

https://bit.ly/2BvmPrL
Группа исследователей из Китая представила свой подход к генерации реалистичных лиц из набросков. Главной их целью было позволить быть скетчами достаточно простыми, чтобы их легко мог нарисовать человек, далекий от искусства, и модель могла хорошо работать с его наброском.

Краткий обзор (ссылка на статью внутри):
https://bit.ly/2A16U40
На конференции ICLR 2020 в этом году проходило мероприятие, на котором исследователи, связанные с глубинным обучением, рассказывали о лучших библиотеках, с которыми они работают. В статье 8 рассказов о 8 инструментах соответственно:

https://bit.ly/3eO7d11
Нейросеть от NVIDIA сгенерировала работающую версию игры PAC-MAN.

https://bit.ly/377LcaI
The Relationship of Reinforcement Learning with Supervised and Unsupervised Learning.

https://bit.ly/30fgDyt
#top@datamining.team

Команда Data Mining предлагает вам ознакомиться с ТОП-5 постами за май:

1) В открытый доступ были выложены лекции с известного курса по ML от Стэнфорда за 2018 год:

https://vk.com/wall-94208167_4558

2) Инференс в продакшене с использованием Rust (по сравнению с Python и scikit-learn) может ускорить производительность в 26 раз, а тренировка K-Means модели на датасете в 1 миллион точек будет быстрее на 30%:

https://vk.com/wall-94208167_4589

3) Хабр представляет PyCaret: открытую low-code библиотеку машинного обучения на Python:

https://vk.com/wall-94208167_4556

4) Интересный блог для начинающих, демонстрирующий простые для создания проекты, связанные с машинным обучением:

https://vk.com/wall-94208167_4563

5) 6 Python Projects to Improve Your Skills and Kill Some Time:

https://vk.com/wall-94208167_4560
Исследователи из Samsung AI опубликовали схему обучения модели для интерактивной сегментации. Пользователь указывает курсором на объект, а модель выдает предсказания границ объекта. Исходный код и обученные модели доступны в открытом репозитории на GitHub.

Исследование: https://arxiv.org/pdf/2001.10331.pdf
Github: https://github.com/saic-vul/fbrs_interactive_segmentation
В данной статье рассказывается почему все больше и больше программистов начинают изучать Julia. ( Julia — высокоуровневый высокопроизводительный свободный язык программирования с динамической типизацией, созданный для математических вычислений)

https://bit.ly/3hqbNVf
Вышла новая версия библиотеки для анализа временных рядов - STUMPY v1.4.0. Простая в использовании с большим количеством туториалов.

Ссылка: https://bit.ly/3ecJpns
8 Advanced Python List Techniques You Should Know!

https://bit.ly/2Yedlde
GPT для изображений? Звучит странно, но OpenAI считают иначе. По схожей методике, как с языковой моделью, они обучили GPT для изображений и получили достойный результат.

 Блог : https://bit.ly/3dhq4jM
Samsung AI опубликовали схему обучения модели для интерактивной сегментации.

https://bit.ly/3fJHKX2
Статья о 10и сигналах того, почему программирование не твоё.

https://bit.ly/2NfuoW2