Data Mining | Анализ данных🚀 – Telegram
Data Mining | Анализ данных🚀
3.31K subscribers
1.73K photos
10 videos
5 files
1.7K links
• Купить рекламу: t.me/sahib_space
Админ: sahib_space
• Стоимость: https://www.notion.so/sahibspace/69ece414a4af49f2bdbdfe455e553e58?pvs=3&qid=
• Группа в ВК: vk.com/datamining.team
Download Telegram
Мы запускаем два масштабных опроса и просим вас принять в них участие.

На основе результатов будет проводиться анализ и актуализация тем, что, в первую очередь, позволит сделать контент в группе более полезным и актуальным для вас.

Просим тех, кто уже работает в DS, заполнить эту форму: https://forms.gle/3iwhCH9XTc3v1uhf6

Те, кто только планирует и хочет работать в DS, заполните, пожалуйста, следующую форму: https://forms.gle/Sp5tciBJKZALQLdF7

Опрос взят из телеграм канала Дьяконова Александра. Чем больше человек пройдёт, тем адекватнее будут результаты. Потом, возможно, выложим агрегаты. Деанонимизация будет невозможно, хотя и так вопросы подбирались, чтобы её максимально затруднить.
Построение управляемой модели машинного обучения для обнаружения мошенничества с кредитными картами

https://bit.ly/30XM4jh
Полезные рекомендации по глубокому обучению (на русском). Предобработка данных, выбор функции активации, регуляризация и многое другое.

Часть 1: https://goo.gl/NBF2Ua
Часть 2: https://goo.gl/wxWK2w
Идет набор в техническую команду хайер скул оф мемс для разработки нового продукта.

Подробности: https://vk.com/wall-139105204_82438
Ускоренный курс машинного обучения с API TensorFlow от Google

https://bit.ly/3meM4DG
365 курсов по Data Science, которые будут в открытом доступе до 18 ноября

https://bit.ly/3nC1q4N
Полный гайд по созданию чат-бота с NLP на Python

https://bit.ly/3bjPheV
Книга Кристофера Бишопа "Распознавание образов и машинное обучение"

https://bit.ly/3GBbuU3
"Совет для тех, кто хочет стать аналитиком данных в футболе": интервью Дэвида Самптера со специалистами, работающими в спортивных клубах

https://bit.ly/3mtgbaI
Как подключить телеграм бота к гугл таблицам с помощью скриптов

https://bit.ly/31nf44l
12 актуальных идей для портфолио Python: веб-сайты, аналитика данных, автоматизация и парсинг

https://bit.ly/3pZfV5h
Курс "Решение проблем Большого адронного коллайдера с помощью машинного обучения" (на английском языке)

ya.cc/nv3BCJuZtEusn
Топ 6 инструментов машинного обучения, используемых экспертами в 2021 году

https://bit.ly/3BIVRGG
ТОП 5 постов за октябрь:

1. 1000+ готовых шаблонов кода для алгоритмов машинного обучения, сортированных по категориям
https://bit.ly/3BDSi5u

2. 365 курсов по Data Science, которые будут в открытом доступе до 18 ноября
https://bit.ly/3nC1q4N

3. Ускоренный курс машинного обучения с API TensorFlow от Google
https://bit.ly/3meM4DG

4. Полный гайд по созданию чат-бота с NLP на Python
https://bit.ly/3bjPheV

5. Полезные рекомендации по глубокому обучению (на русском). Предобработка данных, выбор функции активации, регуляризация и многое другое.
Часть 1: https://goo.gl/NBF2Ua
Часть 2: https://goo.gl/wxWK2w
Участие в кейс-чемпианатах – это уникальный опыт. Для тех, кто хочет сделать старт карьеры в data science, есть возможность принять участие в GSOM Call 2021. Это всероссийский кейс-чемпионат, который проводится нашими друзьями из Высшей школой менеджмента СПбГУ.

В этом сезоне главный партнером чемпионата стала компания OZON, предлагающая решить задания по направлению аналитика. Главный приз - фаст-трек в главный штаб OZON в Москве.

Если ты студент, тебя привлекает аналитика, разбираешься в Python, SQL или Excel и умеешь при помощи этих инструментов анализировать данные и хочешь прокачать свои soft и hard skills, то переходи на сайт https://bit.ly/3GKQ7zP и регистрируйся! Подать заявку можно до 23:59 7 ноября.

На случай, если у тебя нет команды мечты из 4 человек, организаторы помогут подобрать сокомадников!

Также в рамках кейс-чемпионата вы поучаствуете в Q&A-сессии с представителем компании и получите полезные материалы по решению кейсов.

#старткарьеры@datamining.team
Исчерпывающий гайд по классификации в машинном обучении с использованием дерева решений

https://bit.ly/3bDnfLJ
Книга "Машинное обучение с нуля": введение в основные концепции и методы

https://bit.ly/3wjsiu4
Какие критерии увеличивают вероятность публикации пресс-релиза прессой?

Британский Центробанк построил математическую лингвистическую модель, которая связала пресс-релизы ЦБ и публикации прессы на их основе.

Проанализировали больше трехсот факторов, нашли пять статистически значимых, поднимающих вероятность публикации:

1) Простота. Сложноподчиненные предложения и непонятные слова уменьшают подхват.
2) Личный подход. Использовать "мы/вы/ты" для контакта с читателем.
3) Использовать короткие предложения. Но еще важнее - уменьшать длину цепочки зависимостей, которые должен удержать во внимании читатель, чтобы понять текст. Коммуницировать атомарно, легкоперевариваемыми кусочками. Не требовать большого размера кэша оперативной памяти.
4) Первое предложение документа должно по-максимуму передавать месседж всего документа
5) Использовать факты и цифры

Еще одним фактором оказалась банальная релевантность темы релиза текущей повестке общества.

credits: @aznakai (fb)
https://bit.ly/3BV1L7w
Как оптимизировать анализ данных на Python с помощью таблиц Mito

https://bit.ly/3nZzDes
Лайфхак: как лучше понимать ML модели с помощью TensorBoard

https://bit.ly/3C1y30Y