MLinside - школа ML – Telegram
MLinside - школа ML
3.51K subscribers
202 photos
18 videos
165 links
Предзапись на 4 поток курса "База ML": https://vk.cc/cQ7AkI
Наши курсы: https://taplink.cc/mlinside
Чат коммьюнити: @ml_insidechat
По вопросам: @marinagartm
Download Telegram
Ситуационная задача «Сюрприз в выдаче на проде»

Представьте, вы внедрили модель, которая рекомендует товары для пользователей на сайте. Через три дня после старта А/Б эксперимента вы решили проверить метрики и увидели уже статзначимый профит +7% в конверсии в покупку по сравнению с контрольной группой. В это же время менеджер пишет:
Что-то пошло не так — пользователи видят очень странные товары. Прям вообще не те. Что делать?
🔥6
Разбор ситуационной задачи «Сюрприз в выдаче на проде»

Разбираем варианты:

1️⃣ Быстро залью предыдущую версию модели
Это пожаротушение. 
Может быть оправдано как временная мера, но без диагностики вы не решаете проблему, а прячете её и можете снова наткнуться на эту же проблему.


2️⃣ Перепроверю код постобработки и фичей
Отличный вариант. 
Очень частая причина — прод не похож оффлайн.


3️⃣ Поставлю логгирование входов/выходов модели, сверю с оффлайном
Лучший вариант.
Это зрелый, инженерный подход: логгирование + проверка на несоответствие между тренировкой и продом. Иначе вы не поймёте, что на самом деле сломалось.


Как вариант — скомбинировать ответы, согласовать проблемы с руководством и собрать достаточное количество логов для анализа негативных эффектов. Если нужно сделать логирование, выключить на это время эксперимент. По логам проверять и метрики, и выдачи и все остальные гипотезы — с уже отключенным экспериментом и продом на откатанной версии.
6🔥2
Завтра в 19:00 по МСК проведем уже третий мок-собес с разбором от Александра Дубейковского

С Александром вы, скорее всего, уже знакомы – на прошлой неделе он дважды проводил такие эфиры, и они собрали отличные отзывы. Если пропустили – это отличный шанс наверстать.

На этот раз интервью будет проходить выпускник физфака МГУ, который хочет сменить профессию и применять ML на практике. Это живая симуляция собеседования: реальные вопросы, настоящие ответы, честная обратная связь.

Вы увидите:
▪️ как проходит техническое интервью на ML-специалиста
▪️ что важно для интервьюера и где чаще всего спотыкаются кандидаты
▪️ какие темы точно стоит повторить перед собеседованием

И самое главное – только участники вебинара получат промокод на скидку на курс «База ML», старт которого уже 5 августа. Количество мест ограничено.

Зарегистрируйтесь на вебинар прямо сейчас
8
This media is not supported in your browser
VIEW IN TELEGRAM
👍4🔥31
Курс «База ML» стартует сегодня. Это ваш последний шанс успеть заскочить на курс со скидкой

Курс подойдет тем, кто только думает о смене профессии, и тем, кто уже работает аналитиком, разработчиком или менеджером, но чувствует, что пора на следующий уровень.

Мы знаем, с какими вопросами приходят участники: «Что именно нужно учить, чтобы пройти собес?», «Не слишком ли я слаб в математике?», «А если я не из топового вуза?» и всё это учли в программе.

В начале математика и Python, чтобы вы могли спокойно разобраться в базовых темах. А дальше практика: модели, код и кейсы. Всё, чтобы к осени вы могли уверенно претендовать на Junior-позиции в ML.

Обучение реально пройти даже при работе фултайм:
▪️ 1–2 часа видео в неделю
▪️ онлайн-вебинары
▪️ домашки в Jupyter Notebook
▪️ поддержка в чате

Вводный вебинар для студентов уже сегодня в 19:00 по МСК, вы ещё успеваете зайти на курс и не быть в роли "догоняющих".
Скидка 10% действует только до 5 августа. Для применения скидки используйте промокод: SPECIAL3

Если вы ждали знак, чтобы начать – это он. Успейте заскочить в последний вагон.

Программа, результаты и регистрация по ссылке.
4
Сегодня в 19:00 по МСК проведем вводный вебинар курса «База ML» с Виктором Кантором

Обычно такие встречи только для участников курса, но сегодняшний вебинар мы открываем для всех. Можно прийти, даже если вы не записывались на курс.

Вебинар проведет Виктор Кантор, один из авторов курса и основатель MLinside. Виктор работает с ИИ и большими данными с 2010 года, руководил ML-направлениями в Яндексе, МТС и Mail.Ru. Он автор курсов МФТИ и Яндекса на Coursera (200 000+ студентов), лауреат Forbes «30 до 30» и читает лекции по ML в МФТИ и ВШЭ.

На вебинаре Виктор расскажет подробности о курсе, программе, подходе к обучению и ответит на ваши вопросы.

Если вы думаете, стоит ли идти на курс – приходите на вебинар, чтобы принять окончательное решение.

Подключайтесь в 19:00 по МСК
6
Work-life-study баланс

5 августа у нас стартовал Базовый курс по ML, вы к нему еще можете присоединиться, пока основной поток ушёл не так далеко.

Но сегодня мы хотели поговорить о том, как не сойти с ума, когда и работа, и учёба, и жизнь надо успевать как-то жить.

Work-life баланс, это уже привычный термин. Но как выживать, когда в устоявшийся график добавляется обучение?

Собрали несколько принципов, которые помогут вам не выгорать, ну, или выгорать не так быстро:
▪️ Не пытайтесь «успеть всё» за 1 день. Пессимистичное планирование – основа успеха. Ставьте в план задач только самое приоритетное.
▪️ Используйте небольшие слоты. Не обязательно выкраивать 2 часа подряд на курс. Можно выделить 20 минут, в дороге, на перерыве, перед сном. Главное – регулярность.
▪️ Планируйте отдых. Когда задач много, всегда есть соблазн уменьшить количество отдыха. Это прямой путь к выгоранию. Так что рекомендуем прямо в календаре ставить слоты на отдых.
▪️Используйте ограничители отвлечений в рабочее и учебное время. Подойдёт любой плагин для браузера, например, «StayFocusd», отдельные сайты с «родительским контролем», например trafficwasher.ru или любые подобные.

Советы вроде как простые, да не простые. Берегите свой баланс и поделитесь в комментариях, как вам удается всё успевать.
11
Последний шанс попасть в третий поток курса «База ML»

5 августа группа уже стартовала – студенты прошли вводный вебинар с Виктором Кантором и получили доступ к первым модулям. Но мы оставили окно для тех, кто не успел или пока не решился.

Вы ещё успеваете присоединиться и пройти путь с остальными. После оплаты вы получите:
▪️доступ к уже прошедшему вебинару и материалам
▪️полную программу с практикой на Python и ML-моделях
▪️сможете присоединиться к онлайн-вебинарам с ответами на вопросы от преподавателей каждую неделю
▪️поучаствуете в соревнованиях на платформе Kaggle

Окно закроется 12 августа и следующий набор будет только через несколько месяцев. Если хотите войти в ML и уже к зиме быть готовыми к собеседованиям – это тот самый момент, чтобы это сделать.

Записывайтесь сейчас, чтобы не начать следующий год с сожаления, что упустили шанс.
2
Разбор задач с собеседований

Собеседования по ML-теории, Математической статистике и Python проводятся на всех уровнях вакансий на ML позиции. Данный этап является ключевым для Junior специалистов.

Мы подготовили несколько вопросов и задач, которые могут встретиться на интервью, наши ответы на них мы отправим в ближайшее время.

А сейчас ждём ваших ответов в комментариях!

Вопросы и задачи:
1️⃣ В чём минусы линейной регрессии?
2️⃣ Что такое алгоритмы без учителя в машинном обучении?
3️⃣ TF-IDF - плюсы и минусы использования?

#собеседования_MLinside
👍51
Разбор задач с собеседований

Ответы на вопросы:
1️⃣ В чём минусы линейной регрессии?
Основная проблема линейной регрессии — ограниченная способность моделировать сложные нелинейные зависимости. Она чувствительна к выбросам, мультиколлинеарности и требует нормальных распределений ошибок. Без правильной регуляризации и выбора признаков легко переобучается или недообучается.


2️⃣ Что такое алгоритмы без учителя в машинном обучении?
Алгоритмы без учителя — методы машинного обучения, которые выявляют структуру или закономерности в данных без меток (целевых значений). Основные задачи — кластеризация, понижение размерности и обнаружение аномалий. Помогают понять данные и подготовить признаки для последующего обучения.


3️⃣ TF-IDF - плюсы и минусы использования?
TF-IDF:
- Плюсы: учитывает важность слова относительно корпуса — снижает вес частых общих слов. Лучше выделяет информативные термины. Часто повышает качество моделей по сравнению с BoW
- Минусы: более сложен в вычислении. Всё ещё игнорирует порядок слов и контекст. Может плохо работать при очень малом объёме данных

#собеседования_MLinside
18
«Я понял, что в ML важно не просто учиться, а учиться в правильной среде»

Виктор Пономарев, выпускник первого потока курса «База ML»:
«Когда я работал аналитиком данных, попал на воркшоп по PySpark, где, в том числе, был модуль по ML – я мало что понял. Но именно это зацепило. Я начал разбираться сам: вспоминал математику, смотрел лекции, читал статьи.

Самообучение шло, но я заметил две проблемы:
Ты учишься в вакууме – не с кем обсудить, сравнить понимание, задать вопросы.
Большое количество времени уходит на поиск материалов, и они, не редко, могут оказаться неподходящими.

Когда я увидел, что MLinside запускает курс, решил попробовать. Ключевым фактором стало доверие к команде: я знал, кто будет преподавать, и понимал их опыт.

Что дал курс:
Среда и поддержка – можно сравнить себя с другими, понять, что действительно нужно подтянуть.
Экономия времени – ты не тратишь недели на изучение ненужных тем.
Практика – особенно запомнилась домашка по A/B-тестам, где нужно было самому спроектировать всё с нуля.

Учебная нагрузка оказалась комфортной: от 2 до 10 часов в неделю. Удалось совмещать и с работой, и с личной жизнью.

ML – это большая, живая сфера, где всегда есть куда расти и я доволен своим выбором»


Сегодня последний день, когда можно зайти на курс «База ML». Если готовы, вот ссылка для записи.
3
«А если я никогда не учился в техническом вузе, реально ли разобраться в ML?»

Реально, но чтобы уверенно развиваться в машинном обучении, нужен фундамент. И это не диплом технического вуза и не набор формул, а конкретные навыки.

В базу ML входят:
▪️ Математика – школьный и базовый университетский уровень: алгебра, математическая статистика, теория вероятности. Эти разделы помогут понимать, как работают алгоритмы и почему они дают именно такой результат.
▪️ Python – умение писать и читать код, использовать популярные библиотеки (NumPy, Pandas, Matplotlib).
▪️ Работа с данными – навыки загрузки, очистки, анализа и подготовки данных к обучению моделей.

Где можно изучать эти основы самостоятельно:
Математика: курсы на Stepik, Khan Academy, YouTube-каналы.
Python: курсы на Stepik, официальная документация Python.
Работа с данными: туториалы по Pandas и NumPy на Kaggle, документация библиотек, практические задания на Datacamp.

Важно не просто изучать теорию, но и сразу применять её в небольших проектах: анализировать датасеты с Kaggle, повторять чужие ноутбуки, пробовать решать простые задачи классификации или регрессии.

Такой подход позволяет за несколько месяцев пройти путь от нулевых знаний до уровня, с которого можно пробовать силы в реальных проектах или стажировках.
12🔥6👍2
Разбор задач с собеседований

Собеседования по ML-теории, Математической статистике и Python проводятся на всех уровнях вакансий на ML позиции, данный этап является ключевым для Junior специалистов.

Мы подготовили несколько вопросов и задач, которые могут встретиться на интервью, наши ответы на них мы отправим в ближайшее время.

А сейчас ждём ваших ответов в комментариях!

Вопросы и задачи:
1️⃣ Что вы чаще всего использовали для проверки качества моделей из Scikit-Learn?
2️⃣ Какие бывают усреднения метрик?
3️⃣ Bag of words – плюсы и минусы использования?

#собеседования_MLinside
5
Разбор задач с собеседований

Ответы на вопросы:
1️⃣ Что вы чаще всего использовали для проверки качества моделей из Scikit-Learn?
Чаще всего в Scikit-Learn для оценки качества моделей используют:
- cross_val_score — кросс-валидация с метриками (accuracy, F1, R² и др.)
- train_test_split — разделение на тренировочную и тестовую выборки для простой оценки
- Метрики из модуля metrics (accuracy_score, precision, recall, roc_auc, mean_squared_error и др.) для измерения качества на тесте


2️⃣ Какие бывают усреднения метрик?
Основные виды усреднения метрик (особенно для многоклассовых задач):
- micro — считает метрику по всем объектам сразу (агрегирует TP, FP, FN), подходит при несбалансированных классах.
- macro — усредняет метрики по классам одинаково, без учёта их размера, подчеркивает производительность на редких классах.
- weighted — усредняет по классам с весами, пропорциональными количеству объектов в каждом классе, баланс между micro и macro.


3️⃣ Bag of words – плюсы и минусы использования?
Bag of Words (BoW):
- Плюсы: простая, быстрая, интерпретируемая. Хорошо работает на коротких текстах.
- Минусы: игнорирует важность слов и контекст. Зависит от частоты, может переоценивать часто встречающиеся, но малоинформативные слова. Высокая размерность и разреженность

#собеседования_Mlinside
12👍2👎2🔥2
Как сделать так, чтобы AI удвоил доход проекта, а вам прибавили зарплату

Вы можете работать в два раза быстрее, приносить компании ощутимый рост, а себе – бонусы и повышение. Вопрос только в том, используете ли вы и ваша компания AI на максимум.

Во многих отделах до сих пор день уходит на одно и то же: подготовить презентацию или отчет, перерыть документы в поисках данных, разослать письма клиентам, отобрать кандидатов из сотен откликов, протестировать код или сверить техзадания. AI уже есть, но работает точечно: в одной команде ChatGPT стал полноценным помощником, а в другой о нем только слышали.

У нас есть корпоративный курс по AI, который уже прошли сотрудники компаний в разных сферах – от HR до разработки. И главная фишка курса в том, что мы не даем «универсальные советы», а сначала разбираем ваши процессы и подбираем сценарии под корпоративные стандарты. В результате уже через неделю вы видите, как рутинные задачи уходят, а эффективность и прибыль растут.

Примеры внедрения ИИ в работу:
▪️Разработка – автотесты и документация генерируются из кода сразу, а не через 2–3 дня, типовые запросы решаются за минуты.
▪️HR – сортировка 1000 резюме за пару минут вместо нескольких дней, автоматическая подготовка вакансий в корпоративном стиле, готовые письма кандидатам.
▪️Продажи – коммерческое предложение на 3 страницы за 5 минут, прогноз сделок с точностью 80%+, автоматический анализ базы клиентов.

Результаты клиентов: у разработчиков в банке ручная работа сократилась на 10%, аналитики в ритейле ускорили обработку данных в 3 раза, а маркетинг в FMCG освободил десятки часов в месяц на стратегические задачи.

Получите программу обучения и покажите руководителю, как показатели вашего отдела могут вырасти уже в этом квартале
👍6👀3
Можете ли вы стать Data Scientist-ом?

У вас есть ощущение, что вы что-то упускаете? Кажется, что аналитики поголовно переходят в ML, менеджеры учат алгоритмы, а разработчики обсуждают нейросети на каждом митинге. И наверняка вы задавали себе вопрос из заголовка этого поста.

Давайте разбираться. Этот пост – не про «заманить на обучение» и не про напугать количеством требуемых навыков. Мы хотим рассказать, чем занимается Data Scientist, какой порог входа, какие есть направления и кому подойдёт эта профессия. Всё для того, чтобы у вас было достаточно информации, чтобы ответить себе на вопрос «Можете ли вы стать Data Scientist-ом?»

Что делает Data Scientist?
Эта профессия на стыке сразу нескольких миров: аналитики, разработки, бизнеса и исследований. В ней есть рутина, например, чистка датасетов, обучение моделей снова и снова. Но есть и аналитика, код, разбор бизнес-задач и ресерч. В конечном счёте, вы помогаете компаниям точнее принимать решения и становиться эффективнее.

Какие требования?
В вакансиях можно найти громадное количество требований – нужно и в коде разбираться, и математику помнить, и бизнес понимать. Но никто не ждет, что вы будете экспертом во всем. Важно лишь начать с базы и постепенно расширять круг навыков. Здесь ценится не всезнание, а готовность учиться и расти. Плюс, у каждого Data Scientist-а есть свой перекос: кто-то сильнее в статистике, кто-то в коде, кто-то в аналитике. И это нормально, ведь команды собираются так, чтобы эти навыки дополняли друг друга.

Кому подойдет эта профессия?
Тем, кому интересно разбираться «почему так», кто любит находить инсайты в данных, шаг за шагом улучшать процессы и хочет понимать, как работают современные алгоритмы – от LLM до рекомендательных систем.

Какие направления есть внутри Data Science?
▪️ Data Analyst, этот человек ближе к бизнесу и метрикам;
▪️ Data Engineer, тут вы будете ближе к инфраструктуре и данным;
▪️ ML Engineer, это если вам нравится заниматься обучением моделей и продакшном.

Люди переходят сюда из бэкэнда, аналитики, даже из менеджмента. Возраст и стартовый путь не важны. Главное, это любопытство и системная работа. Data Science, это профессия для тех, кто хочет учиться и открывать новое. А остальное приходит с практикой.
👏65
Как выбрать направление в ML

Когда начинаешь интересоваться ML, кажется, что это бесконечный лабиринт: модели, алгоритмы, направления. Каждое направление звучит по-своему перспективно, но с чего начать? Классика, компьютерное зрение, NLP, рекомендательные системы или LLM?

Давайте разберёмся, чем они отличаются и куда лучше двигаться на старте.

Вот основные треки в ML:
▪️Классический ML
Это про задачи прогнозирования и классификации. Применяется в банках, ритейле, маркетинге. Используются библиотеки вроде Pandas, NumPy, Scikit-learn. Плюсы: вакансий много, задачи понятные. Минусы: высокая конкуренция.

▪️NLP и LLM
Это работа с текстами и языком. Сюда относятся чат-боты, анализ текстов, генеративные модели вроде ChatGPT. Востребованное и высокооплачиваемое направление, но специалистов мало, поэтому вакансий открывается всё больше.

▪️Компьютерное зрение
Это про задачи с изображениями и видео: от распознавания лиц до беспилотников. Минусы: нужны большие данные и ресурсы. Плюсы: яркие, наглядные проекты и интересные задачи.

▪️Рекомендательные системы
Это про подбор фильмов, товаров или контента. Если хотите работать в Яндекс.Маркете, Ozon или Netflix, вам сюда. Здесь ML внедряется особенно активно: вакансий много, задач тоже. Основной минус, это большая конкуренция и высокий порог входа для новичков.

Каждое направление по-своему интересно. Классический ML и рекомендации ближе к бизнесу: здесь важна польза и внедрение, а не исследование. NLP и CV больше про ресерч и работу с алгоритмами, где важна новизна решений. LLM больше похоже на стартап: много экспериментов, меньше устоявшихся процессов, но зато максимальный хайп и высокая оплата.

Но в любом случае помните, что выбор направления не навсегда. Навыки в ML легко переносятся из одной области в другую. Начав с классики, можно уйти в NLP, а опыт в рекомендациях пригодится в CV. Если вы только присматриваетесь к ML, попробуйте разобраться, какой тип задач вам ближе: бизнесовые метрики, работа с текстами, изображениями или новые генеративные модели. От этого и стоит отталкиваться.
🔥1584👍1
🔖Детерменируем вашу вербальную аддитивность – принесли ML-словарик. Читайте и сохраняйте, что-то из этого наверяка вам пригодится на собеседованиях.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
116👍7👀3