Data Mining | Анализ данных🚀 – Telegram
Data Mining | Анализ данных🚀
3.31K subscribers
1.73K photos
10 videos
5 files
1.7K links
• Купить рекламу: t.me/sahib_space
Админ: sahib_space
• Стоимость: https://www.notion.so/sahibspace/69ece414a4af49f2bdbdfe455e553e58?pvs=3&qid=
• Группа в ВК: vk.com/datamining.team
Download Telegram
4 библиотеки Python, которые помогут вам зарабатывать деньги на веб-скрейпинге.

https://bit.ly/33FS5jk
7 основных языков программирования для разработки мобильных приложений.

https://bit.ly/2FiNz12
Топ 9 книг для разработчиков.

https://bit.ly/3jMJIZb
Интересная статься, где сравнивают между собой длинные трансформеры (если коротко: используйте Big Bird если не важна скорость и Performer если важна, не используйте Reformer вообще).

https://bit.ly/3nGiBRG
Дата-сайентисты, готовы побороться за 1 млн рублей на хакатоне?

Нужно предложить инструмент для оценки качества работы алгоритмов разметки медицинских изображений.

Разработанный инструмент должен автоматически определять набор метрик, а результаты его работы должны наиболее точно совпадать с мнением экспертов (результатами экспертной оценки).

Подайте заявку до 25 октября на участие по ссылке: https://clck.ru/RLWhH

Это партнерский пост.
В статье учат бота, обусловленного некой мотивацией, заданной описанием персоны, проходить квесты.

https://bit.ly/30Z35GR
10 недооценённых навыков в Python.

https://bit.ly/3j1oeqi
Машинное обучение открывает новые потенциальные противотуберкулезные препараты.

https://bit.ly/3527OJf
Очередная SOTA статья от Google. Они адаптировали мультиязычный BERT для создания эмбеддингов предложений независимых от языка для 109 языков (в том числе для русского)!

https://bit.ly/3j6Aupj
Исследователи из disney research предложили ряд улучшений для часто используемого Y-shaped автоэнкодера в задаче замены лиц (face swap), которые позволили им работать с изображениями размером 1024x1024, показывая при этом качество лучше, чем у распространенных в этой области подходов (у deepfacelab [DFL] в частности).

https://bit.ly/3dDzk3q
Почему не стоит выбирать Python как первый язык программирования.

https://bit.ly/3jgjD3i
Исследователи из ACL очень громко утверждают, что языковые модели не могут понимать смысл и приводят мысленный эксперимент, который иллюстрирует их идею.

https://bit.ly/35crB8E
Сбер выложил русскоязычную модель GPT-3 Large с 760 миллионами параметров в открытый доступ.

https://bit.ly/3js0sDU
​​Возможно, лучшая визуализация того, как работает трансформер. Во всех примерах визуализировано в том числе и батч-измерение.

https://bit.ly/3dQegqN
«7 смертных грехов» разработчиков Python.

https://bit.ly/3oouzQk
Neural architecture search (NAS) позволяет найти оптимальную архитектуру для выбранной задачи.

https://bit.ly/3jwUMZn
Лучшая книга, чтобы начать разбираться в Data Science

https://bit.ly/3jrPL4k
ALBERT — облегченный BERT для самообучения языковым
Представлениям.

https://bit.ly/3oykhgH
Готовая библиотека для аугментаций в NLP. Как правило завести аугментации текстов сложно и эффект от них слишком малый, чтобы прямо заниматься этим. А теперь можно в пару строчек кода.

Ссылка на статью: https://bit.ly/31NXGmq
Ссылка на документацию: https://bit.ly/31Q9kx6
Ссылка на гитхаб библиотеки: https://bit.ly/3oza8Am
Топ-13 навыков, чтобы стать успешным аналитиком данных

https://bit.ly/3kAng5K