Data Mining | Анализ данных🚀 – Telegram
Data Mining | Анализ данных🚀
3.31K subscribers
1.73K photos
10 videos
5 files
1.7K links
• Купить рекламу: t.me/sahib_space
Админ: sahib_space
• Стоимость: https://www.notion.so/sahibspace/69ece414a4af49f2bdbdfe455e553e58?pvs=3&qid=
• Группа в ВК: vk.com/datamining.team
Download Telegram
Примеры кода на Pytorch с разъяснением

https://nn.labml.ai/
Библиотека, которая сгенерирует дашборд с объяснениями вашей модели

explainerdashboard is a library for quickly building interactive dashboards for analyzing and explaining the predictions and workings of (scikit-learn compatible) machine learning models, including xgboost, catboost and lightgbm. This makes your model transparant and explainable with just two lines of code.

https://explainerdashboard.readthedocs.io/en/latest/
Интересная статья про попытку обучить алгоритм оценивать «надёжность» человека по его лицу

http://bit.ly/39Sy3Wf
Бесплатный курс - "Анализ Данных просто и доступно".
Доступен на платформах: ютуб или степик

https://www.youtube.com/playlist?list=PLUfHxBkkFMSfvgd_rAzt8iM9foo9sbcFx
Департамент информационных технологий Москвы решил создать за 185 миллионов рублей подробную и персонализированную базу данных о каждом жителе города.

https://mdza.io/sTpZgV9qS3k
Бесплатный, неплохой, короткий курс по динамическому программированию для новичков.

Смотреть на ютубе:
https://www.youtube.com/watch?v=jTjRGe0wRvI&list=PLVrpF4r7WIhTT1hJqZmjP10nxsmrbRvlf
С 2015 года мы публикуем лучшие бесплатные курсы, новости и полезные материалы из мира анализа данных и машинного.

Ниже подборка из 7 не совсем рандомных постов за последние два года существования нашего канала:

1) Вводный курс по машинному обучению от California Institute of Technology. Все те же материалы, что доступны студентам из Caltech: видеолекции, домашние задания и даже экзамен; все совершенно бесплатно.

http://work.caltech.edu/telecourse

2) Бесплатный курс от IBM по SQL специально для Data Science.

https://bit.ly/33whhcC

3) Полезная подборка чит-листов из Стэнфордского CS 230 курса по Глубинному обучению. Содержит иллюстрированные чит-листы для сверточныйх нейронных сетей, рекурретных нейронных сетей и всякие полезные вещи, которые стоит держать в уме при обучении DL-модели. Рекомендуется к ознакомлению!

https://github.com/afshinea/stanford-cs-230-deep-learning

4) Хороший курс по глубинному обучению от ФКН НИУ ВШЭ

http://bit.ly/2NkqRZV

5) Статья с подробным примером настройки интерактивного дашборда с помощью dash

http://bit.ly/3hCzpGQ

6) Stanford продолжает радовать нас материалами своих курсов по машинному обучению. В открытом доступе появились видеозаписи лекций курса CS234: Reinforcement Learning. Также доступны слайды, конспекты, домашние задания с решениями и другие полезные материалы.

Сайт курса: https://goo.gl/5kfKBd.
Плейлист на YouTube: https://goo.gl/CVwEUr.

7) Курс по теории глубокого обучения от МФТИ. Видеолекции, презентации и домашние задания доступны всем интересующимся.

GitHub курса: https://goo.gl/jo8XQb
YouTube плейлист: https://goo.gl/4jDLiv
Список вопросов для подготовки к собеседованию в DS. Много достойных вопросов, к тому же ко многим есть ответы. Список на английском.

https://github.com/alexeygrigorev/data-science-interviews/blob/master/theory.md
Конспект курса ШАД по теории глубинного обучения.

В конспекте рассматриваются следующие темы:
— Инициализация нейронных сетей
(кто-нибудь смотрел, как инициализируются сети в pytorch или tensorflow, и почему именно так?);
— Поверхность функции потерь
(почему градиентный спуск — локальный поиск! — способен сколь угодно снизить ошибку на обучении?);
— Обобщающая способность
(почему сеть обученная на одной выборке, хорошо — или плохо — работает на другой?);
— NTK-теория
(какова связь нейронных сетей с ядровыми методами и что она даёт?).

https://arxiv.org/abs/2012.05760
Обзор новых пакетов для R
на декабрь 2020

https://www.r-bloggers.com/2021/01/dec-2020-top-40-new-cran-packages/
Реальный опыт использования Shiny в качестве корпоративной отчетности. Спойлер: Норм, можно использовать.

https://habr.com/ru/post/513634/
Cheatsheet по машинному обучению. Полезно перед собеседованием пробежаться глазами.

https://github.com/aaronwangy/Data-Science-Cheatsheet/blob/main/Data_Science_Cheatsheet.pdf
Stanford выложил в общий доступ пару видео из нового запуска курса по NLP 2020 года

BERT and Other Pre-trained Language Models, лектор Jacob Devlin, автор BERT
https://youtu.be/knTc-NQSjKA

Low Resource Machine Translation, лектор Marc'Aurelio Ranzato, один из авторов первой статьи по unsupervised MT
https://youtu.be/mp95Z5yM92c
В гостях у «Раблз» директор по разработке X5 Retail Group, Андрей Молчанский (более 2000 человек в подчинении).

Про то, как устроен анализ данных и разработка в крупнейшей ритейл-сети, с какими вызовами сталкивается бизнес, когда AI начинает внедряться в бизнес-процессы, а также как результаты цифровой трансформации соотносятся с современными трендами в ритейле.

https://youtu.be/C-pZyCAxq5E
Свежий и интересный блог про алгоритмическую торговлю. В постах фактически дана инструкция по написанию торгующего бота.

https://conorjohanlon.com
Качественный курс “Введение в анализ данных и машинное обучение”. Подойдет для тех, кто только начинает знакомство с ML.

https://timeseries-ru.github.io/course/README.html