MLinside - школа ML – Telegram
MLinside - школа ML
3.51K subscribers
202 photos
18 videos
165 links
Предзапись на 4 поток курса "База ML": https://vk.cc/cQ7AkI
Наши курсы: https://taplink.cc/mlinside
Чат коммьюнити: @ml_insidechat
По вопросам: @marinagartm
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
75
Мы начинаем mock-собеседование!
У тех, кто не успел зарегистрироваться, есть возможность подключиться прямо сейчас
4
Хватит теории!
Уже завтра в 19:00 (МСК) Александр Дубейковский проведет практический мастер-класс «Поймай обманщика с помощью ML».

Если устали просто читать про машинное обучение, пора включаться в работу с реальными данными.
На вебинаре вы научитесь:
▪️находить аномалии и фродовые транзакции
▪️использовать базовые ML-инструменты шаг за шагом
▪️писать код и сразу видеть результат в Google Colab

Этот вебинар подойдет, даже если вы только начинаете осваивать ML. Все объясним, покажем, разложим по полочкам.

Если еще не зарегистрировались, сделайте это здесь и сейчас
12
This media is not supported in your browser
VIEW IN TELEGRAM
🔥8🤝2
Мы начинаем практический вебинар!
На всякий случай пришлем ссылку на подключение и в этот канал. Подключиться можно здесь по ссылке
🙏1
Ситуационная задача «Сюрприз в выдаче на проде»

Представьте, вы внедрили модель, которая рекомендует товары для пользователей на сайте. Через три дня после старта А/Б эксперимента вы решили проверить метрики и увидели уже статзначимый профит +7% в конверсии в покупку по сравнению с контрольной группой. В это же время менеджер пишет:
Что-то пошло не так — пользователи видят очень странные товары. Прям вообще не те. Что делать?
🔥6
Разбор ситуационной задачи «Сюрприз в выдаче на проде»

Разбираем варианты:

1️⃣ Быстро залью предыдущую версию модели
Это пожаротушение. 
Может быть оправдано как временная мера, но без диагностики вы не решаете проблему, а прячете её и можете снова наткнуться на эту же проблему.


2️⃣ Перепроверю код постобработки и фичей
Отличный вариант. 
Очень частая причина — прод не похож оффлайн.


3️⃣ Поставлю логгирование входов/выходов модели, сверю с оффлайном
Лучший вариант.
Это зрелый, инженерный подход: логгирование + проверка на несоответствие между тренировкой и продом. Иначе вы не поймёте, что на самом деле сломалось.


Как вариант — скомбинировать ответы, согласовать проблемы с руководством и собрать достаточное количество логов для анализа негативных эффектов. Если нужно сделать логирование, выключить на это время эксперимент. По логам проверять и метрики, и выдачи и все остальные гипотезы — с уже отключенным экспериментом и продом на откатанной версии.
6🔥2
Завтра в 19:00 по МСК проведем уже третий мок-собес с разбором от Александра Дубейковского

С Александром вы, скорее всего, уже знакомы – на прошлой неделе он дважды проводил такие эфиры, и они собрали отличные отзывы. Если пропустили – это отличный шанс наверстать.

На этот раз интервью будет проходить выпускник физфака МГУ, который хочет сменить профессию и применять ML на практике. Это живая симуляция собеседования: реальные вопросы, настоящие ответы, честная обратная связь.

Вы увидите:
▪️ как проходит техническое интервью на ML-специалиста
▪️ что важно для интервьюера и где чаще всего спотыкаются кандидаты
▪️ какие темы точно стоит повторить перед собеседованием

И самое главное – только участники вебинара получат промокод на скидку на курс «База ML», старт которого уже 5 августа. Количество мест ограничено.

Зарегистрируйтесь на вебинар прямо сейчас
8
This media is not supported in your browser
VIEW IN TELEGRAM
👍4🔥31
Курс «База ML» стартует сегодня. Это ваш последний шанс успеть заскочить на курс со скидкой

Курс подойдет тем, кто только думает о смене профессии, и тем, кто уже работает аналитиком, разработчиком или менеджером, но чувствует, что пора на следующий уровень.

Мы знаем, с какими вопросами приходят участники: «Что именно нужно учить, чтобы пройти собес?», «Не слишком ли я слаб в математике?», «А если я не из топового вуза?» и всё это учли в программе.

В начале математика и Python, чтобы вы могли спокойно разобраться в базовых темах. А дальше практика: модели, код и кейсы. Всё, чтобы к осени вы могли уверенно претендовать на Junior-позиции в ML.

Обучение реально пройти даже при работе фултайм:
▪️ 1–2 часа видео в неделю
▪️ онлайн-вебинары
▪️ домашки в Jupyter Notebook
▪️ поддержка в чате

Вводный вебинар для студентов уже сегодня в 19:00 по МСК, вы ещё успеваете зайти на курс и не быть в роли "догоняющих".
Скидка 10% действует только до 5 августа. Для применения скидки используйте промокод: SPECIAL3

Если вы ждали знак, чтобы начать – это он. Успейте заскочить в последний вагон.

Программа, результаты и регистрация по ссылке.
4
Сегодня в 19:00 по МСК проведем вводный вебинар курса «База ML» с Виктором Кантором

Обычно такие встречи только для участников курса, но сегодняшний вебинар мы открываем для всех. Можно прийти, даже если вы не записывались на курс.

Вебинар проведет Виктор Кантор, один из авторов курса и основатель MLinside. Виктор работает с ИИ и большими данными с 2010 года, руководил ML-направлениями в Яндексе, МТС и Mail.Ru. Он автор курсов МФТИ и Яндекса на Coursera (200 000+ студентов), лауреат Forbes «30 до 30» и читает лекции по ML в МФТИ и ВШЭ.

На вебинаре Виктор расскажет подробности о курсе, программе, подходе к обучению и ответит на ваши вопросы.

Если вы думаете, стоит ли идти на курс – приходите на вебинар, чтобы принять окончательное решение.

Подключайтесь в 19:00 по МСК
6
Work-life-study баланс

5 августа у нас стартовал Базовый курс по ML, вы к нему еще можете присоединиться, пока основной поток ушёл не так далеко.

Но сегодня мы хотели поговорить о том, как не сойти с ума, когда и работа, и учёба, и жизнь надо успевать как-то жить.

Work-life баланс, это уже привычный термин. Но как выживать, когда в устоявшийся график добавляется обучение?

Собрали несколько принципов, которые помогут вам не выгорать, ну, или выгорать не так быстро:
▪️ Не пытайтесь «успеть всё» за 1 день. Пессимистичное планирование – основа успеха. Ставьте в план задач только самое приоритетное.
▪️ Используйте небольшие слоты. Не обязательно выкраивать 2 часа подряд на курс. Можно выделить 20 минут, в дороге, на перерыве, перед сном. Главное – регулярность.
▪️ Планируйте отдых. Когда задач много, всегда есть соблазн уменьшить количество отдыха. Это прямой путь к выгоранию. Так что рекомендуем прямо в календаре ставить слоты на отдых.
▪️Используйте ограничители отвлечений в рабочее и учебное время. Подойдёт любой плагин для браузера, например, «StayFocusd», отдельные сайты с «родительским контролем», например trafficwasher.ru или любые подобные.

Советы вроде как простые, да не простые. Берегите свой баланс и поделитесь в комментариях, как вам удается всё успевать.
11
Последний шанс попасть в третий поток курса «База ML»

5 августа группа уже стартовала – студенты прошли вводный вебинар с Виктором Кантором и получили доступ к первым модулям. Но мы оставили окно для тех, кто не успел или пока не решился.

Вы ещё успеваете присоединиться и пройти путь с остальными. После оплаты вы получите:
▪️доступ к уже прошедшему вебинару и материалам
▪️полную программу с практикой на Python и ML-моделях
▪️сможете присоединиться к онлайн-вебинарам с ответами на вопросы от преподавателей каждую неделю
▪️поучаствуете в соревнованиях на платформе Kaggle

Окно закроется 12 августа и следующий набор будет только через несколько месяцев. Если хотите войти в ML и уже к зиме быть готовыми к собеседованиям – это тот самый момент, чтобы это сделать.

Записывайтесь сейчас, чтобы не начать следующий год с сожаления, что упустили шанс.
2
Разбор задач с собеседований

Собеседования по ML-теории, Математической статистике и Python проводятся на всех уровнях вакансий на ML позиции. Данный этап является ключевым для Junior специалистов.

Мы подготовили несколько вопросов и задач, которые могут встретиться на интервью, наши ответы на них мы отправим в ближайшее время.

А сейчас ждём ваших ответов в комментариях!

Вопросы и задачи:
1️⃣ В чём минусы линейной регрессии?
2️⃣ Что такое алгоритмы без учителя в машинном обучении?
3️⃣ TF-IDF - плюсы и минусы использования?

#собеседования_MLinside
👍51
Разбор задач с собеседований

Ответы на вопросы:
1️⃣ В чём минусы линейной регрессии?
Основная проблема линейной регрессии — ограниченная способность моделировать сложные нелинейные зависимости. Она чувствительна к выбросам, мультиколлинеарности и требует нормальных распределений ошибок. Без правильной регуляризации и выбора признаков легко переобучается или недообучается.


2️⃣ Что такое алгоритмы без учителя в машинном обучении?
Алгоритмы без учителя — методы машинного обучения, которые выявляют структуру или закономерности в данных без меток (целевых значений). Основные задачи — кластеризация, понижение размерности и обнаружение аномалий. Помогают понять данные и подготовить признаки для последующего обучения.


3️⃣ TF-IDF - плюсы и минусы использования?
TF-IDF:
- Плюсы: учитывает важность слова относительно корпуса — снижает вес частых общих слов. Лучше выделяет информативные термины. Часто повышает качество моделей по сравнению с BoW
- Минусы: более сложен в вычислении. Всё ещё игнорирует порядок слов и контекст. Может плохо работать при очень малом объёме данных

#собеседования_MLinside
18
«Я понял, что в ML важно не просто учиться, а учиться в правильной среде»

Виктор Пономарев, выпускник первого потока курса «База ML»:
«Когда я работал аналитиком данных, попал на воркшоп по PySpark, где, в том числе, был модуль по ML – я мало что понял. Но именно это зацепило. Я начал разбираться сам: вспоминал математику, смотрел лекции, читал статьи.

Самообучение шло, но я заметил две проблемы:
Ты учишься в вакууме – не с кем обсудить, сравнить понимание, задать вопросы.
Большое количество времени уходит на поиск материалов, и они, не редко, могут оказаться неподходящими.

Когда я увидел, что MLinside запускает курс, решил попробовать. Ключевым фактором стало доверие к команде: я знал, кто будет преподавать, и понимал их опыт.

Что дал курс:
Среда и поддержка – можно сравнить себя с другими, понять, что действительно нужно подтянуть.
Экономия времени – ты не тратишь недели на изучение ненужных тем.
Практика – особенно запомнилась домашка по A/B-тестам, где нужно было самому спроектировать всё с нуля.

Учебная нагрузка оказалась комфортной: от 2 до 10 часов в неделю. Удалось совмещать и с работой, и с личной жизнью.

ML – это большая, живая сфера, где всегда есть куда расти и я доволен своим выбором»


Сегодня последний день, когда можно зайти на курс «База ML». Если готовы, вот ссылка для записи.
3
«А если я никогда не учился в техническом вузе, реально ли разобраться в ML?»

Реально, но чтобы уверенно развиваться в машинном обучении, нужен фундамент. И это не диплом технического вуза и не набор формул, а конкретные навыки.

В базу ML входят:
▪️ Математика – школьный и базовый университетский уровень: алгебра, математическая статистика, теория вероятности. Эти разделы помогут понимать, как работают алгоритмы и почему они дают именно такой результат.
▪️ Python – умение писать и читать код, использовать популярные библиотеки (NumPy, Pandas, Matplotlib).
▪️ Работа с данными – навыки загрузки, очистки, анализа и подготовки данных к обучению моделей.

Где можно изучать эти основы самостоятельно:
Математика: курсы на Stepik, Khan Academy, YouTube-каналы.
Python: курсы на Stepik, официальная документация Python.
Работа с данными: туториалы по Pandas и NumPy на Kaggle, документация библиотек, практические задания на Datacamp.

Важно не просто изучать теорию, но и сразу применять её в небольших проектах: анализировать датасеты с Kaggle, повторять чужие ноутбуки, пробовать решать простые задачи классификации или регрессии.

Такой подход позволяет за несколько месяцев пройти путь от нулевых знаний до уровня, с которого можно пробовать силы в реальных проектах или стажировках.
12🔥6👍2
Разбор задач с собеседований

Собеседования по ML-теории, Математической статистике и Python проводятся на всех уровнях вакансий на ML позиции, данный этап является ключевым для Junior специалистов.

Мы подготовили несколько вопросов и задач, которые могут встретиться на интервью, наши ответы на них мы отправим в ближайшее время.

А сейчас ждём ваших ответов в комментариях!

Вопросы и задачи:
1️⃣ Что вы чаще всего использовали для проверки качества моделей из Scikit-Learn?
2️⃣ Какие бывают усреднения метрик?
3️⃣ Bag of words – плюсы и минусы использования?

#собеседования_MLinside
5
Разбор задач с собеседований

Ответы на вопросы:
1️⃣ Что вы чаще всего использовали для проверки качества моделей из Scikit-Learn?
Чаще всего в Scikit-Learn для оценки качества моделей используют:
- cross_val_score — кросс-валидация с метриками (accuracy, F1, R² и др.)
- train_test_split — разделение на тренировочную и тестовую выборки для простой оценки
- Метрики из модуля metrics (accuracy_score, precision, recall, roc_auc, mean_squared_error и др.) для измерения качества на тесте


2️⃣ Какие бывают усреднения метрик?
Основные виды усреднения метрик (особенно для многоклассовых задач):
- micro — считает метрику по всем объектам сразу (агрегирует TP, FP, FN), подходит при несбалансированных классах.
- macro — усредняет метрики по классам одинаково, без учёта их размера, подчеркивает производительность на редких классах.
- weighted — усредняет по классам с весами, пропорциональными количеству объектов в каждом классе, баланс между micro и macro.


3️⃣ Bag of words – плюсы и минусы использования?
Bag of Words (BoW):
- Плюсы: простая, быстрая, интерпретируемая. Хорошо работает на коротких текстах.
- Минусы: игнорирует важность слов и контекст. Зависит от частоты, может переоценивать часто встречающиеся, но малоинформативные слова. Высокая размерность и разреженность

#собеседования_Mlinside
12👍2👎2🔥2