MLinside - школа ML – Telegram
MLinside - школа ML
3.5K subscribers
202 photos
18 videos
165 links
Предзапись на 4 поток курса "База ML": https://vk.cc/cQ7AkI
Наши курсы: https://taplink.cc/mlinside
Чат коммьюнити: @ml_insidechat
По вопросам: @marinagartm
Download Telegram
Зачем разработчику знакомиться с ML 👨‍💻

Вот вы разработчик и разрабатываете, например, популярное приложение — сервис заказа такси. И вот вы знаете, как код писать грамотно, как проектировать высоконагруженные сервисы. Но возникает творческая задачка: показать пользователю подсказки места назначения. То есть, до того как он начал вводить адрес, нужно угадать и сразу предложить несколько вариантов.

Люди, вызывавшие такси ночью зимой с 1% заряда аккумулятора, точно оценят такую фичу 🙂

Задача, как я уже заметил, творческая, и вы радостно потираете руки. Первое ваше решение - всегда показывать топ 3 популярных мест пользователя. Но, конечно, оно вас не очень радует: программист вы в конце-концов или нет? Сразу рождается второе решение: а давайте, если в место человек ездил примерно в эти часы за последнюю неделю, будем добавлять варианту +1 балл. Ну и популярность мест тоже как-то пересчитаем в баллы. Хорошо, это мы время учли, а есть же еще день недели. На работу мы ездим в будни, а куда-то еще - в выходные. Отлично, тогда добавляем +2 балла, если мы ездим сюда, например по будням, а сегодня как раз будний день. А еще такие же баллы за регулярные поездки по каждому дню недели. А еще есть места, в которые мы ездим даже издалека (например, опять же, на работу), а есть места, в которые мы ездим, когда они рядом - например, в бар рядом с работой едем с работы, а в бар рядом с домом едем из дома. О, еще одно наблюдение! Важно, ОТКУДА мы едем. Там тоже можно сделать разбалловку. В итоге через пару недель наших творческих фантазий в продакшене уже куча правил, по которым мы считаем баллы каждого места, куда часто ездит пользователь, и места с самыми большими баллами мы выводим в приложении как подсказки.

И вот, прошло 6 месяцев. У вас есть в коде прекрасный алгоритм из 100 правил, учитывающих разные ситуации, и иногда конфликтующих друг с другом. Он ваш, родной, сами все баллы подбирали, но стоит добавить новое правило и уже все ломается, заново надо что-то тюнить. И вот за 6 месяцев вам уже поднадоело этой ерундой заниматься.

У меня для вас хорошие новости - можно не заниматься. Берете какую-нибудь популярную ML библиотеку (например XGBoost, LightGBM или CatBoost), собираете выборку с поездками пользователей (из логов) в разные места, обучаете модель классифицировать пары (пользователь, место) на 2 класса - 0, если не поедет туда, 1 - если поедет. И весь ваш алгоритм заменяете классификатором. Либо добавляете прогноз старого алгоритма как один из признаков, и больше уже не страдаете его модификацией и улучшением.

Плюсы: ML-модель учится на данных, самостоятельно формирует правила (и их может быть тысячи). Вам не нужно лезть внутрь, просто использовать готовое решение.

Минусы: Теперь придется учиться проверять качество модели. Если раньше хватало проверки на нескольких примерах, то для ML потребуется валидационная выборка. Важно хотя бы в теории понимать, как это работает.

Но по сути вопрос свелся к тому, что лучше: практически готовое решение или свой велосипед. Большинство разработчиков знает, что свой велосипед это часто весело и задорно в начале. Но вот через полгода-год (а иногда и через месяц) его поддержка уже не вызывает былого энтузиазма.

А еще говорят, что хороший тон для разработчика писать код так, будто тот, кто потом будет его после вас править и поддерживать, знает, где вы живете :) Вот для того, чтобы сразу решать подобные задачи стандартными моделями и библиотеками, с которыми все умеют работать, и нужно разработчику знакомиться с ML.

Есть конечно и другие причины. Это и более широкий спектр решаемых задач, когда вы знаете ML, и то, что алгоритмы машинного обучения это в целом очень интересно и красиво, и популярность сферы, и множество новых карьерных возможностей.

〰️〰️〰️〰️〰️〰️〰️
Автор поста: Основатель и эксперт школы MLinside, Виктор Кантор

🎓А кто из
разработчиков уже готов знакомиться с ML — ждём вас на нашем курсе «База ML», старт 9 декабря!
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
7💯3🔥2👍1
🔔Напоминаем: Вебинар «Как ML меняет карьеру?» и презентация второго потока курса «База ML»— уже завтра! 

🗓️ Когда: 30 ноября (суббота) , 17:00 (МСК)

🎙 Спикер: Виктор Кантор — основатель MLinside, эксперт по ML, AI и большим данным

Что вас ждёт 👇

🟣Зачем аналитикам, разработчикам и менеджерам двигаться в сторону ML?
🟣Как сделать первые шаги в машинном обучении и превратить это в карьерное преимущество?

💥 Презентация второго потока курса «База ML»: получите информацию о программе, преподавателях и полезных обновлениях! Старт — 9 декабря!

🎁 Приятные подарки для всех участников вебинара!

‼️ Присоединяйтесь прямо сейчас!

🔜Регистрируйтесь здесь
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥32👍1
Через 15 минут начинаем вебинар «Зачем и как войти в ML» с Виктором Кантором, основателем MLinside, Ex Chief Data Officer МТС, преподавателем ML в МФТИ и ВШЭ

Переходите на вебинар по ссылке
5🔥4
Часть нашего курса теперь на Stepik‼️

Если вы давно задумывались о старте в ML, но всё ещё сомневаетесь, подойдёт ли вам обучение, у нас отличная новость: теперь вы можете заглянуть внутрь нашего курса «База ML»!

Мы подготовили для вас демо-курс на Stepik! Это отличная возможность:
🔹 Погрузиться в процесс обучения: узнайте, как наши преподаватели объясняют сложные темы простым и понятным языком.
🔹 Оценить подачу материала: почувствуйте, как легко и увлекательно можно получать новые знания.

👨‍💻 Мы открыты, потому что уверены в качестве наших курсов. Хотите попробовать, прежде чем погружаться полностью? Это ваш шанс!

➡️ Смотрите курс здесь

👨‍🎓 Примерьте на себя роль студента MLinside и сделайте первый шаг к новым знаниям уже сегодня!
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥12👍53
Курс «База ML»: Поддержка на каждом шаге вашего пути в машинное обучение! 🚀

Мы знаем, что изучение машинного обучения — это не просто видеоуроки и чтение материалов. Это путь, где важно не только усваивать информацию, но и получать поддержку и обратную связь от профессионалов. Поэтому наш курс «База ML» предлагает уникальные возможности для общения с экспертами и преподавателями.

💫Что вас ждёт?

🔘Еженедельные онлайн-встречи: Каждую неделю у вас будет возможность в реальном времени задать вопросы, обсудить темы курса и проработать сложные моменты с экспертами и преподавателями. Это онлайн-сессии, где вы можете не просто слушать, а активно участвовать в обсуждениях, делиться своими мыслями и решать задачи вместе с наставниками.
🔘Чат с преподавателями и экспертами: Мы всегда на связи! В специальном чате курса вы сможете общаться не только с однокурсниками, но и с преподавателями и экспертами. Возник вопрос — пишите, и вам обязательно ответят, поддержат и дадут рекомендации.

🔥 Почему это важно?

🔘Обратная связь: в отличие от самостоятельного обучения, на курсе вы получаете непрерывную поддержку, не теряя времени на поиски решения или интерпретацию информации.
🔘Обсуждение задач и кейсов: Совместное решение задач помогает лучше понять материал и быстрее освоить алгоритмы и методы машинного обучения.
🔘Рефлексия и развитие: Вы не только учитесь, но и рефлексируете, делитесь множеством идей с коллегами и преподавателями — это помогает углубить понимание темы.

🧑‍🏫 Максимальная поддержка на каждом этапе — от понимания теории до практических навыков и подготовки к собеседованиям!

💡Мы уверены, что с таким уровнем сопровождения и поддержки вы сможете не только усвоить материал, но и уверенно развиваться в сфере ML!

⚡️Старт второго потока курса «База ML» — 9 декабря! Присоединяйтесь уже сейчас!
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥61👍1👎1
🚀 Готовьтесь! Скоро стартует наш новый курс — «ML в бизнесе»!

Ты освоил базу машинного обучения, но не хватает коммерческого опыта или навыков решения бизнес-задач? Готов углубиться в реальные кейсы и узнать, как приносить бизнесу пользу с помощью ML? Тогда этот курс для тебя!

💡 Что мы разберём?

На курсе ты узнаешь, как бизнес зарабатывает с помощью Data Science. Мы расскажем, как решаются реальные задачи в таких областях как:
🔵Ценообразование и динамическое ценообразование
🔵Рекомендательные системы
🔵Кредитный скоринг
🔵Антифрод и поиск аномалий
🔵Оптимизация бюджетов на основе прогнозных моделей
🔵ML в HR tech и задачах автоматизации с помощью LLM

Также ты научишься работать с интерпретируемостью моделей, освоишь подходы вроде ICE, PDP, LIME, SHAP, и даже изучишь RAG — вопросно-ответные системы на базе знаний.

 Когда старт?
Курс начнётся с вводного вебинара в конце декабря, а полноценное обучение стартует уже в январе.

👉 Следите за обновлениями в канале, чтобы не пропустить анонс вебинара и подробности курса. Скоро поделимся датой старта и ссылкой на сайт для записи!
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
12🔥7👍5
🤔 Почему джунов не берут в Data Science?

На первый взгляд, мир Data Science кажется открытым для всех, кто знает Python, библиотеки и алгоритмы. Но, столкнувшись с реальностью, многие джуны не понимают, почему их резюме остаются без ответа.

Ответ прост: 60–70% успеха в DS — это доменная экспертиза.

На практике от специалиста ждут гораздо большего: понимания бизнеса и умения внедрять решения, которые приносят пользу компании.

Как развиваться и быть востребованным?👇

🔹Решайте кейсы из открытых данных. Например, попробуйте построить модель на данных из Kaggle, но сформулируйте задачу так, как это сделает бизнес.
Пример: у вас есть данные о клиентах, их покупках и рекламных предпочтениях. Поставьте цель: увеличить конверсию для определенной группы.

🔹Учитесь объяснять модели. Постройте не просто модель, а интерпретируемую. Используйте инструменты, такие как SHAP или LIME, чтобы объяснить, как модель принимает решения.

🔹 Прокачивайте soft skills. Умение объяснить сложные технические аспекты доступным языком — важный навык. Попробуйте представить свои проекты как готовые кейсы для бизнеса.

🧠Пример кейса для тренировки:

Условия:
Компания имеет данные о покупателях (возраст, пол, доход, история покупок). Нужно понять, кто с большей вероятностью купит новый продукт.

Как действовать:
1. Проведите анализ данных (EDA): какие факторы влияют на покупки?
2. Создайте сегменты клиентов: найдите группы с похожими характеристиками.
3. Постройте модель для прогнозирования вероятности покупки.
4. Проанализируйте результат: какие группы клиентов приносят наибольшую прибыль?

💡 Постоянно учитесь ставить задачи так, как это делает реальный мир, и представлять результаты как решения, а не просто наборы данных или алгоритмов.

🌟 Развивайтесь, работайте над реальными кейсами и всегда стремитесь увидеть за цифрами реальную пользу для компании!
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍11🔥95🤯1
Media is too big
VIEW IN TELEGRAM
▪️Какие знания действительно необходимы для джунов, чтобы найти работу в ML, и почему одних технических навыков бывает недостаточно?
▪️Чем важны алгоритмы для Data Science и где проходят границы их применения?
▪️Можно ли освоить Data Science самостоятельно, и почему менторы играют ключевую роль?
▪️Нужна ли математика для DS и ML и что особенно важно знать?

🗣️ Об этом и многом другом рассказывает Алексей Толстиков, руководитель Школы Анализа Данных Яндекса, в новом интервью на YouTube-канале MLinside.

Мы обсудили его путь от участника международных соревнований по программированию до руководителя одной из самых престижных образовательных программ в области анализа данных и машинного обучения. Алексей поделился, как устроено обучение в ШАД, какие навыки получают студенты и как эти знания применяются в реальной работе.

Ролик выйдет сегодня в 18:00 по мск на YouTube-канале MLinside. Не пропустите! 📱

А пока немного заинтригуем вас и поделимся тизером! ⬆️
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥145👍1