Data Mining | Анализ данных🚀 – Telegram
Data Mining | Анализ данных🚀
3.31K subscribers
1.73K photos
10 videos
5 files
1.7K links
• Купить рекламу: t.me/sahib_space
Админ: sahib_space
• Стоимость: https://www.notion.so/sahibspace/69ece414a4af49f2bdbdfe455e553e58?pvs=3&qid=
• Группа в ВК: vk.com/datamining.team
Download Telegram
Исследователи из disney research предложили ряд улучшений для часто используемого Y-shaped автоэнкодера в задаче замены лиц (face swap), которые позволили им работать с изображениями размером 1024x1024, показывая при этом качество лучше, чем у распространенных в этой области подходов (у deepfacelab [DFL] в частности).

https://bit.ly/3dDzk3q
Почему не стоит выбирать Python как первый язык программирования.

https://bit.ly/3jgjD3i
Исследователи из ACL очень громко утверждают, что языковые модели не могут понимать смысл и приводят мысленный эксперимент, который иллюстрирует их идею.

https://bit.ly/35crB8E
Сбер выложил русскоязычную модель GPT-3 Large с 760 миллионами параметров в открытый доступ.

https://bit.ly/3js0sDU
​​Возможно, лучшая визуализация того, как работает трансформер. Во всех примерах визуализировано в том числе и батч-измерение.

https://bit.ly/3dQegqN
«7 смертных грехов» разработчиков Python.

https://bit.ly/3oouzQk
Neural architecture search (NAS) позволяет найти оптимальную архитектуру для выбранной задачи.

https://bit.ly/3jwUMZn
Лучшая книга, чтобы начать разбираться в Data Science

https://bit.ly/3jrPL4k
ALBERT — облегченный BERT для самообучения языковым
Представлениям.

https://bit.ly/3oykhgH
Готовая библиотека для аугментаций в NLP. Как правило завести аугментации текстов сложно и эффект от них слишком малый, чтобы прямо заниматься этим. А теперь можно в пару строчек кода.

Ссылка на статью: https://bit.ly/31NXGmq
Ссылка на документацию: https://bit.ly/31Q9kx6
Ссылка на гитхаб библиотеки: https://bit.ly/3oza8Am
Топ-13 навыков, чтобы стать успешным аналитиком данных

https://bit.ly/3kAng5K
Модель искусственного интеллекта обнаруживает бессимптомные инфекции Covid-19 через записанный на мобильный телефон кашель

https://bit.ly/380XlRq
Автоматизация повседневных задач с помощью Python.

https://bit.ly/3kRhih9
#top@datamining.team

Команда Data Mining предлагает вам ознакомиться с ТОП-5 постами за октябрь:

1)  4 библиотеки Python, которые помогут вам зарабатывать деньги на веб-скрейпинге.

https://vk.com/wall-94208167_4792

2) Сбер выложил русскоязычную модель GPT-3 Large с 760 миллионами параметров в открытый доступ.

https://vk.com/wall-94208167_4822

3) Готовая библиотека для аугментаций в NLP.

https://vk.com/wall-94208167_4837

4) Топ-13 навыков, чтобы стать успешным аналитиком данных.

https://vk.com/wall-94208167_4839

5) ​​Возможно, лучшая визуализация того, как работает трансформер. Во всех примерах визуализировано в том числе и батч-измерение.

https://vk.com/wall-94208167_4823
Мы подобрали для вас несколько курсов, благодаря которым вы можете обучиться Data science:

Coursera - типовые задачи машинного обучения и анализа данных и методы их решения - (https://bit.ly/2GrDNdy)

HarvarDX - создайте основу для R и узнайте, как обрабатывать, анализировать и визуализировать данные (https://bit.ly/3oUip1O)

IBM - этот курс Python представляет собой удобное введение для новичков в Python для науки о данных. (https://bit.ly/3jVja70)

OpenEdu -  В ходе обучения слушатели курса узнают о различных задачах, связанных с анализом текстов, освоят методы предобработки текстовых данных, изучат основные подходы к решению задач на основе классического машинного обучения и глубоких нейронный сетей. (https://bit.ly/2I03IJP)

Stepik - курс знакомит слушателей с основами машинного обучения и рассчитан в первую очередь на тех слушателей, которые только начинают свой путь в Data Science. (https://bit.ly/32aHXxX)

Codebasics (Youtube) - это полный курс по науке о данных, который может пройти любой новичок, чтобы изучить науку о данных. Он охватывает огромное количество тем. (https://bit.ly/3kXanmo)
Текстовый анализ сообщений в социальных сетях показывает, что среди других негативных тенденций растет беспокойство пользователей и уровень суицидального риска.

https://bit.ly/3k5BkmE
Использование Python для анализа ситуации на финансовом рынке.

https://bit.ly/3eF4ND1
Модели на основе остаточной энергии для генерации текста.

Новая интересная статья по генерации текста. Авторы предлагают вместо стандартного авторегрессионного моделирования перейти к моделированию ненормализованной вероятности (энергии) целого предложения.

https://bit.ly/3eHekcE