Forwarded from Data Secrets
Про псевдо-лейблинг
Это полезный метод, который может помочь в построении более точной модели на не размеченных данных. Незаменимо в соревнованиях.
😻 #train
Это полезный метод, который может помочь в построении более точной модели на не размеченных данных. Незаменимо в соревнованиях.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤1
Оказывается, у гитлаба есть своя программа сертификации https://levelup.gitlab.com/catalog
Forwarded from Small Data Science for Russian Adventurers
#образование
Запущена регистрация на БЕСПЛАТНУЮ программу AI Masters Набор 2023.
Программа готовит аналитиков и специалистов по Data Science с гибким набором курсов.
Продолжительность: 2 года,
Время занятий: по будням с 18:00 до 21:00,
Загрузка: в среднем 30 часов в неделю,
Обучение бесплатное.
Сайт программы с подробной информацией
Около 30 курсов, в том числе:
- Машинное обучение,
- Computer Vision & Video Processing,
- Вычислительная линейная алгебра,
- Математическая статистика и ее приложения,
- Big Data and Data Engineering,
- Продуктовая аналитика,
- Генеративные модели,
- Natural Language Processing,
- Reinforcement Learning,
- Вероятностные графические модели.
🗓 27 мая (суббота) в 12.00 состоится День открытых дверей в online формате.
👉 Ссылка на подключение
Любые вопросы пишите на почту aimasters.msu@gmail.com или кураторам проекта (их контакты - в соответствующем разделе на сайте).
👉 Подать заявку на поступление
Запущена регистрация на БЕСПЛАТНУЮ программу AI Masters Набор 2023.
Программа готовит аналитиков и специалистов по Data Science с гибким набором курсов.
Продолжительность: 2 года,
Время занятий: по будням с 18:00 до 21:00,
Загрузка: в среднем 30 часов в неделю,
Обучение бесплатное.
Сайт программы с подробной информацией
Около 30 курсов, в том числе:
- Машинное обучение,
- Computer Vision & Video Processing,
- Вычислительная линейная алгебра,
- Математическая статистика и ее приложения,
- Big Data and Data Engineering,
- Продуктовая аналитика,
- Генеративные модели,
- Natural Language Processing,
- Reinforcement Learning,
- Вероятностные графические модели.
🗓 27 мая (суббота) в 12.00 состоится День открытых дверей в online формате.
👉 Ссылка на подключение
Любые вопросы пишите на почту aimasters.msu@gmail.com или кураторам проекта (их контакты - в соответствующем разделе на сайте).
👉 Подать заявку на поступление
Optimizing Your Marketing Budget with Nonlinear Optimization | Towards Data Science
https://towardsdatascience.com/the-art-of-spending-optimizing-your-marketing-budget-with-nonlinear-optimization-6c8a39afb3c2
https://towardsdatascience.com/the-art-of-spending-optimizing-your-marketing-budget-with-nonlinear-optimization-6c8a39afb3c2
Towards Data Science
The Art of Spending: Optimizing Your Marketing Budget with Nonlinear Optimization | Towards Data Science
Introduction to CVXPY to maximize marketing ROI
Forwarded from Aspiring Data Science
#python #hettingner #pep #codegems #refactoring #codewrappers
P vs NP ) And the gorilla in the room.
https://www.youtube.com/watch?v=wf-BqAjZb8M
P vs NP ) And the gorilla in the room.
https://www.youtube.com/watch?v=wf-BqAjZb8M
YouTube
Raymond Hettinger - Beyond PEP 8 -- Best practices for beautiful intelligible code - PyCon 2015
"Speaker: Raymond Hettinger
Distillation of knowledge gained from a decade of Python consulting, Python training, code reviews, and serving as a core developer. Learn to avoid some of the hazards of the PEP 8 style guide and learn what really matters for…
Distillation of knowledge gained from a decade of Python consulting, Python training, code reviews, and serving as a core developer. Learn to avoid some of the hazards of the PEP 8 style guide and learn what really matters for…
👍1
Forwarded from Aspiring Data Science
#ml #ds #rookies
Меня спросили, с чего начинать обучение науке о данных.
Для начала советую
1) прочитать книжку Гвидо/Мюллера, она красиво иллюстрирована и хорошо раскрывает концепции. Также хороша книга Герона, там несколько посложнее и обширнее темы раскрыты. Они обе есть на русском, кажется.
2) лекции А. Дьяконова (МЛ и ПЗАД), если есть желание забуриться в теорию, то и К. Воронцова
3) параллельно этому советую всё же курсы, я знаю 2 хороших источника: ОТУС (там есть 2 начальных, изучите программы) и А. Груздева (у него есть материалы на Бусти и индивидуальное обучение). Только обязательно вовремя прорешивайте задачи и домашние работы, иначе не будет толку.
4) запишитесь в ШАД, это бесплатно и очень круто. но будет требовать много времени, скорее всего.
5) начните участвовать в соревнованиях Кэггл и им подобных российских (организаторами выступают наши бигтехи типа Сбербанк, Роснефть, МТС). Впрочем, на курсах из пункта 3 Вас и так заставят это сделать )
6) подпишитесь на towardsdatascience и подобные ему блоги медиума. контент там варьируется по качеству, но бывает, попадаются жемчужины.
7) есть ещё Хабр
8) начните делать свой пет-проект. если он окажется общественно-полезным и/или коммерчески выгодным, тем круче.
Меня спросили, с чего начинать обучение науке о данных.
Для начала советую
1) прочитать книжку Гвидо/Мюллера, она красиво иллюстрирована и хорошо раскрывает концепции. Также хороша книга Герона, там несколько посложнее и обширнее темы раскрыты. Они обе есть на русском, кажется.
2) лекции А. Дьяконова (МЛ и ПЗАД), если есть желание забуриться в теорию, то и К. Воронцова
3) параллельно этому советую всё же курсы, я знаю 2 хороших источника: ОТУС (там есть 2 начальных, изучите программы) и А. Груздева (у него есть материалы на Бусти и индивидуальное обучение). Только обязательно вовремя прорешивайте задачи и домашние работы, иначе не будет толку.
4) запишитесь в ШАД, это бесплатно и очень круто. но будет требовать много времени, скорее всего.
5) начните участвовать в соревнованиях Кэггл и им подобных российских (организаторами выступают наши бигтехи типа Сбербанк, Роснефть, МТС). Впрочем, на курсах из пункта 3 Вас и так заставят это сделать )
6) подпишитесь на towardsdatascience и подобные ему блоги медиума. контент там варьируется по качеству, но бывает, попадаются жемчужины.
7) есть ещё Хабр
8) начните делать свой пет-проект. если он окажется общественно-полезным и/или коммерчески выгодным, тем круче.
OZON.ru
Книга "Машинное обучение с помощью Python. Руководство для специалистов по работе с данными", Гвидо Сара, Мюллер Андреас - купить…
В наличии книга "Машинное обучение с помощью Python. Руководство для специалистов по работе с данными", Гвидо Сара, Мюллер Андреас, Диалектика-Вильямс в интернет-магазине OZON со скидкой! ✅ Реальные отзывы читателей, фото 🚚
Forwarded from Сиолошная
Смотрите шо у меня есть - двухчасовая лекция по трансформерам, которую я читал (на одном дыхании!) полторы недели назад.
Это детальное погружение во все нюансы, в каких-то аспектах даже глубже, чем спрашивают на собеседованиях!
Однако первая часть, до разбора самого механизма внимания (Self-Attention), будет интересна и нетехнарям - потому что там рассказывается про токенизацию. Это способ предобработки текста, чтобы подать его в трансформер - и в нём куда больше нюансов, чем может показаться на первый взгляд!
Не забывайте ставить лайки - это очень поможет в продвижении видео и знаний в массы - чтобы больше людей посмотрело лекцию!
P.S.: звук постарались улучшить как могли, если у вас есть идеи или нейронки, которые можно применить, чтобы сделать звук качественнее - пишите в личку или в комментарии, будем посмотреть.
Это детальное погружение во все нюансы, в каких-то аспектах даже глубже, чем спрашивают на собеседованиях!
Однако первая часть, до разбора самого механизма внимания (Self-Attention), будет интересна и нетехнарям - потому что там рассказывается про токенизацию. Это способ предобработки текста, чтобы подать его в трансформер - и в нём куда больше нюансов, чем может показаться на первый взгляд!
Не забывайте ставить лайки - это очень поможет в продвижении видео и знаний в массы - чтобы больше людей посмотрело лекцию!
P.S.: звук постарались улучшить как могли, если у вас есть идеи или нейронки, которые можно применить, чтобы сделать звук качественнее - пишите в личку или в комментарии, будем посмотреть.
YouTube
Transformer, explained in detail | Igor Kotenkov | NLP Lecture (in Russian)
Ссылка на презентацию: https://1drv.ms/p/s!AlnN0aqNwShslRdcd7-WsY9oUm50
Мой телеграм канал: https://news.1rj.ru/str/seeallochnaya
Список всех моих образовательных материалов, статей, лекций итд: https://news.1rj.ru/str/seeallochnaya/3
В этой вводной лекции о трансформерах мы…
Мой телеграм канал: https://news.1rj.ru/str/seeallochnaya
Список всех моих образовательных материалов, статей, лекций итд: https://news.1rj.ru/str/seeallochnaya/3
В этой вводной лекции о трансформерах мы…
Не то чтобы по теме, и не то чтобы что-то новое, но все же:
Джедайские техники. Как воспитать свою обезьяну, опустошить инбокс и сберечь мыслетопливо - Максим Дорофеев читать онлайн
https://limbook.net/read/dzhedayskie-tehniki-kak-vospitat-svoyu-obezyanu-opustoshit-inboks-i-sberech-mysletoplivo.html?section=3#3
Джедайские техники. Как воспитать свою обезьяну, опустошить инбокс и сберечь мыслетопливо - Максим Дорофеев читать онлайн
https://limbook.net/read/dzhedayskie-tehniki-kak-vospitat-svoyu-obezyanu-opustoshit-inboks-i-sberech-mysletoplivo.html?section=3#3
The portfolio that got me a Data Scientist job | by Matt Chapman | Mar, 2023 | Towards Data Science
https://towardsdatascience.com/the-portfolio-that-got-me-a-data-scientist-job-513cc821bfe4
https://towardsdatascience.com/the-portfolio-that-got-me-a-data-scientist-job-513cc821bfe4
Towards Data Science
The Portfolio that Got Me a Data Scientist Job | Towards Data Science
Spoiler alert: It was surprisingly easy (and free) to make
Ресурс, хорошо зашедший мне для подготовки к интервью по алгоритмам и структурам данных:
10 Most Important Algorithms For Coding Interviews
https://www.geeksforgeeks.org/algorithms-for-interviews/
10 Most Important Algorithms For Coding Interviews
https://www.geeksforgeeks.org/algorithms-for-interviews/
GeeksforGeeks
10 Most Important Algorithms For Coding Interviews - GeeksforGeeks
Your All-in-One Learning Portal: GeeksforGeeks is a comprehensive educational platform that empowers learners across domains-spanning computer science and programming, school education, upskilling, commerce, software tools, competitive exams, and more.
Forwarded from Aspiring Data Science
#ml #geofeatures #python
Отличная глава о подготовке геофичей
https://geographicdata.science/book/notebooks/12_feature_engineering.html
Отличная глава о подготовке геофичей
https://geographicdata.science/book/notebooks/12_feature_engineering.html
Forwarded from Aspiring Data Science
#ml #featureengineering #geofeatures #advicewanted
Есть задачка на генерацию геофичей. Юзер логинится в приложение в разных точках города, Известны его координаты при логине и метки времени. Какие бы интересные фичи построить из графа его перемещений?
Пока что нашел вот такую прекрасную серию статей
https://towardsdatascience.com/graph-machine-learning-with-python-pt-1-basics-metrics-and-algorithms-cc40972de113
https://towardsdatascience.com/graph-machine-learning-with-python-part-3-unsupervised-learning-aa2854fe0ff2
https://towardsdatascience.com/graph-machine-learning-with-python-part-4-supervised-semi-supervised-learning-d66878161b79
Есть задачка на генерацию геофичей. Юзер логинится в приложение в разных точках города, Известны его координаты при логине и метки времени. Какие бы интересные фичи построить из графа его перемещений?
Пока что нашел вот такую прекрасную серию статей
https://towardsdatascience.com/graph-machine-learning-with-python-pt-1-basics-metrics-and-algorithms-cc40972de113
https://towardsdatascience.com/graph-machine-learning-with-python-part-3-unsupervised-learning-aa2854fe0ff2
https://towardsdatascience.com/graph-machine-learning-with-python-part-4-supervised-semi-supervised-learning-d66878161b79
Towards Data Science
Graph Machine Learning with Python Part 1: Basics, Metrics, and Algorithms | Towards Data Science
An introduction to networks via key metrics and algorithms on a Football dataset
Forwarded from See All
я не том смысле что тут написано про немастера, а что тут нет ссылок вот на это. Вероятно, кому-то здесь будет полезно, кто не видел или просто потерял/забыл:
ML System Design Interviews, с Валерой Бабушкиным: (1) выбор рекламы к показу в ленте соцсети, (2) ценообразование на маркетплейсе, (3) матчинг товаров в онлайн-магазине;
ML System Design Interviews, с Валерой Бабушкиным: (1) выбор рекламы к показу в ленте соцсети, (2) ценообразование на маркетплейсе, (3) матчинг товаров в онлайн-магазине;
Весьма актуальная для реалий 2023 преза для подготовки к DS job interview (автор указан на первом слайде)
https://docs.google.com/presentation/d/16Fe8a87WPPcFbI3bFrwb7ndRugMNw3SxWOC2TbeiXO0/edit?usp=sharing
https://docs.google.com/presentation/d/16Fe8a87WPPcFbI3bFrwb7ndRugMNw3SxWOC2TbeiXO0/edit?usp=sharing
Google Docs
Опыт поиска работы в анализе данных в 2023 году
Опыт поиска работы в анализе данных в 2023 году Ануар Аймолдин
Интерактивное превью для pandas DataFrame. Правда, исходники находятся в read only mode с 2020 года и библиотека с тех пор не обновляется
https://github.com/CermakM/jupyter-datatables
https://github.com/CermakM/jupyter-datatables
GitHub
GitHub - CermakM/jupyter-datatables: Jupyter Notebook extension leveraging pandas DataFrames by integrating DataTables and ChartJS.
Jupyter Notebook extension leveraging pandas DataFrames by integrating DataTables and ChartJS. - CermakM/jupyter-datatables