«Кажется, я уперся в потолок»
Это ощущение знакомо многим разработчикам.
Когда все уже умеешь: и фичи клепаешь быстро, и баги ловишь с полпинка, но при этом скучно. Зарплата растет медленно, задачи одни и те же, а перспективы не вдохновляют.
ML часто приходит как естественное продолжение. Не как «смена профессии», а как способ оживить работу: взять что-то сложнее, внедрить чуть больше интеллекта в продукт, не просто "работать", а "создавать".
Если начать с базовых задач, становится понятно, как применять ML там, где раньше даже не задумывались. Например, приоритизировать фичи по пользовательским данным, автоматически искать аномалии в логах, или даже ускорить продуктовые A/B-тесты.
Некоторые из наших студентов так и делают — остаются разработчиками, но с ML-экспертизой становятся незаменимыми в команде. Как раз для этого мы и сделали курс, который помогает специалистам с разным опытом встроить ML в свою текущую профессию. А если в какой-то момент захочется большего, с этой базой можно спокойно идти на собеседование в ML-команду.
Через две недели начинаем обучение на курсе "База ML". Пока места еще есть, но только для тех, что хочет добавить в свою карьеру то, что реально ценится — ML. С программой курса можно ознакомиться на нашем сайте. А если возникли вопросы, пишите нашему менеджеру: @ml_inside_manager
Это ощущение знакомо многим разработчикам.
Когда все уже умеешь: и фичи клепаешь быстро, и баги ловишь с полпинка, но при этом скучно. Зарплата растет медленно, задачи одни и те же, а перспективы не вдохновляют.
ML часто приходит как естественное продолжение. Не как «смена профессии», а как способ оживить работу: взять что-то сложнее, внедрить чуть больше интеллекта в продукт, не просто "работать", а "создавать".
Если начать с базовых задач, становится понятно, как применять ML там, где раньше даже не задумывались. Например, приоритизировать фичи по пользовательским данным, автоматически искать аномалии в логах, или даже ускорить продуктовые A/B-тесты.
Некоторые из наших студентов так и делают — остаются разработчиками, но с ML-экспертизой становятся незаменимыми в команде. Как раз для этого мы и сделали курс, который помогает специалистам с разным опытом встроить ML в свою текущую профессию. А если в какой-то момент захочется большего, с этой базой можно спокойно идти на собеседование в ML-команду.
Через две недели начинаем обучение на курсе "База ML". Пока места еще есть, но только для тех, что хочет добавить в свою карьеру то, что реально ценится — ML. С программой курса можно ознакомиться на нашем сайте. А если возникли вопросы, пишите нашему менеджеру: @ml_inside_manager
mlinside.ru
Курс "База ML"
Курс по основам машинного обучения для подготовки к ML-секции собеседования
❤6👍1
Три вебинара, которые помогут вам вырасти в ML
Боитесь собеседований? Не уверены, как применить ML на практике? Хочется понять, насколько вы вообще готовы? У нас скоро пройдут три вебинара, которые закроют все эти вопросы. Вебинары проведет Александр Дубейковский, Middle+ ML-Engineer Авито, ex-Yandex.
📌 29.07 в 19:00 (мск) — Mock-собеседование с Ильей Коченовым
Проходить собеседование будет наш подписчик Илья — студент МГТУ им. Баумана, ищет работу в DS и планирует поступать в магистратуру ВШЭ.
Зарегистрироваться на вебинар
📌 31.07 в 19:00 (мск) — Практический мастер-класс: «Поймай обманщика с помощью ML»
Научитесь находить фродовые транзакции и аномалии в поведении пользователей. Практика, Google Colab, простые ML-инструменты.
Зарегистрироваться на вебинар
📌 4.08 в 19:00 (мск) — Mock-собеседование с Александром Колчиным
Тренироваться в роли кандидата будет наш подписчик Александр — выпускник физического факультета МГУ им. М.В. Ломоносова, занимается рамановской спектроскопией и машинным обучением в задачах хемоинформатики и готовится к смене профессии, чтобы больше времени уделять прикладному применению навыков в области машинного обучения.
Зарегистрироваться на вебинар
Каждое из событий — возможность посмотреть на реальные карьерные истории и потренироваться вместе с экспертами.
Боитесь собеседований? Не уверены, как применить ML на практике? Хочется понять, насколько вы вообще готовы? У нас скоро пройдут три вебинара, которые закроют все эти вопросы. Вебинары проведет Александр Дубейковский, Middle+ ML-Engineer Авито, ex-Yandex.
📌 29.07 в 19:00 (мск) — Mock-собеседование с Ильей Коченовым
Проходить собеседование будет наш подписчик Илья — студент МГТУ им. Баумана, ищет работу в DS и планирует поступать в магистратуру ВШЭ.
Зарегистрироваться на вебинар
📌 31.07 в 19:00 (мск) — Практический мастер-класс: «Поймай обманщика с помощью ML»
Научитесь находить фродовые транзакции и аномалии в поведении пользователей. Практика, Google Colab, простые ML-инструменты.
Зарегистрироваться на вебинар
📌 4.08 в 19:00 (мск) — Mock-собеседование с Александром Колчиным
Тренироваться в роли кандидата будет наш подписчик Александр — выпускник физического факультета МГУ им. М.В. Ломоносова, занимается рамановской спектроскопией и машинным обучением в задачах хемоинформатики и готовится к смене профессии, чтобы больше времени уделять прикладному применению навыков в области машинного обучения.
Зарегистрироваться на вебинар
Каждое из событий — возможность посмотреть на реальные карьерные истории и потренироваться вместе с экспертами.
❤9
Как подготовиться к собеседованию, если вы только начали учиться
Самое частое заблуждение — ждать момента, когда вы «достаточно готовы». Как будто есть некий рубеж, после которого на собеседовании не страшно и не стыдно. На самом деле, подготовку к собеседованиям стоит начинать параллельно с обучением. Чем раньше вы начнете к ним готовиться, тем быстрее поймете, в чем именно ваши пробелы.
1️⃣ Первый шаг — разобраться, какие темы спрашивают на позициях для новичков. Почти всегда это базовая математика, принципы машинного обучения и основы Python. Этого достаточно, чтобы понимать суть вопросов и не теряться.
2️⃣ Второй шаг — научиться рассказывать о себе. Коротко, по делу, с фокусом на то, что уже успели изучить и попробовать. Плюсом в рассказе о себе будет собственный pet-проект и/или участие в соревнованиях на Kaggle.
3️⃣ Хорошо работает участие в mock-собеседованиях. Это снимает страх и показывает реальные ожидания работодателей. Вы сразу видите, что нужно подтянуть, и перестаете тратить время на ненужное. Но даже если вы просто наблюдаете за чужим интервью, это уже помогает как минимум понять как проходит собеседование, какие вопросы задают и как на них отвечать. Кстати, скоро мы проведем два открытых мок-собеседования — приходите!
Не стоит надеяться, что пройдете весь путь в теории и только потом пойдете на собеседование. Это путь в никуда. Гораздо продуктивнее пробовать заранее: проходить пробные собесы, участвовать в разборах, разбирать свои и чужие ошибки. Так появляется уверенность, исчезает страх и формируется опыт, который потом вырастает в оффер.
Если вы как раз на этом этапе, напишите, с чем сейчас сложнее всего. Поможем разобрать.
#собеседования_MLinside
Самое частое заблуждение — ждать момента, когда вы «достаточно готовы». Как будто есть некий рубеж, после которого на собеседовании не страшно и не стыдно. На самом деле, подготовку к собеседованиям стоит начинать параллельно с обучением. Чем раньше вы начнете к ним готовиться, тем быстрее поймете, в чем именно ваши пробелы.
1️⃣ Первый шаг — разобраться, какие темы спрашивают на позициях для новичков. Почти всегда это базовая математика, принципы машинного обучения и основы Python. Этого достаточно, чтобы понимать суть вопросов и не теряться.
2️⃣ Второй шаг — научиться рассказывать о себе. Коротко, по делу, с фокусом на то, что уже успели изучить и попробовать. Плюсом в рассказе о себе будет собственный pet-проект и/или участие в соревнованиях на Kaggle.
3️⃣ Хорошо работает участие в mock-собеседованиях. Это снимает страх и показывает реальные ожидания работодателей. Вы сразу видите, что нужно подтянуть, и перестаете тратить время на ненужное. Но даже если вы просто наблюдаете за чужим интервью, это уже помогает как минимум понять как проходит собеседование, какие вопросы задают и как на них отвечать. Кстати, скоро мы проведем два открытых мок-собеседования — приходите!
Не стоит надеяться, что пройдете весь путь в теории и только потом пойдете на собеседование. Это путь в никуда. Гораздо продуктивнее пробовать заранее: проходить пробные собесы, участвовать в разборах, разбирать свои и чужие ошибки. Так появляется уверенность, исчезает страх и формируется опыт, который потом вырастает в оффер.
Если вы как раз на этом этапе, напишите, с чем сейчас сложнее всего. Поможем разобрать.
#собеседования_MLinside
❤5👍4
В преддверии мок-собеседований с нашими подписчиками мы подготовили небольшой челлендж.
Собеседования по ML-теории, математической статистике и Python проходят практически на все позиции, и именно этот этап становится решающим для тех, кто идет на junior-уровень. Часто именно здесь решается: пройдет кандидат дальше или нет.
Мы собрали несколько базовых вопросов и задач, которые могут встретиться на интервью.
Вопросы и задачи:
1️⃣ Как устроен dict в Python?
2️⃣ Как кросс-валидация помогает в борьбе с переобучением?
3️⃣ Как работать с пропущенными данными?
В это воскресенье разберем их в отдельном посте, а пока ждем ваши версии в комментариях!
#собеседования_MLinside
Собеседования по ML-теории, математической статистике и Python проходят практически на все позиции, и именно этот этап становится решающим для тех, кто идет на junior-уровень. Часто именно здесь решается: пройдет кандидат дальше или нет.
Мы собрали несколько базовых вопросов и задач, которые могут встретиться на интервью.
Вопросы и задачи:
1️⃣ Как устроен dict в Python?
2️⃣ Как кросс-валидация помогает в борьбе с переобучением?
3️⃣ Как работать с пропущенными данными?
В это воскресенье разберем их в отдельном посте, а пока ждем ваши версии в комментариях!
#собеседования_MLinside
❤14
Готовим Вас к нашим предстоящим mock-собеседованиям и делимся ответами на вопросы с собеседований:
1️⃣ Как устроен dict в Python?
2️⃣ Как кросс-валидация помогает в борьбе с переобучением?
3️⃣ Как работать с пропущенными данными?
#собеседования_MLinside
1️⃣ Как устроен dict в Python?
dict в Python — это хеш-таблица с открытой адресацией. Пары (ключ, значение) хранятся в массивах, размер которых увеличивается при заполнении ~2/3. Ключ хешируется через hash(), индекс определяется по хешу. С Python 3.6+ ключи и значения хранятся раздельно (split table) для экономии памяти.
Коллизии решаются квадратичным пробингом: при совпадении ячеек ищется следующая свободная по формуле (hash + perturb) & mask, где perturb уменьшается на каждом шаге. Это помогает избежать кластеризации и сохранять эффективность.
2️⃣ Как кросс-валидация помогает в борьбе с переобучением?
Кросс-валидация — это способ оценки обобщающей способности модели: данные делятся на K частей, модель обучается на K−1 и проверяется на оставшейся, повторяя процесс K раз. Это позволяет:
- выявить переобучение (если валидационные ошибки выше тренировочных);
- получить более стабильную метрику качества;
- подобрать устойчивые гиперпараметры;
- использовать данные эффективнее (вся выборка участвует в обучении и проверке).
3️⃣ Как работать с пропущенными данными?
Как работать с пропущенными данными (по частоте использования):
1. Удаление — строки или столбцы, если пропусков мало или колонка бесполезна соответсвенно.
2. Простая статистика по признакам — среднее, медиана, мода, константа и другие.
3. Маскирование — добавить `is_missing` признак, пропуски заменить фикс-значением.
4. Иммутация по другим фичам — KNN, деревья, SMOTE. Точнее, но дольше и сложнее.
5. Модели с поддержкой NaN — CatBoost, XGBoost и др. умеют обрабатывать NaN сами.
6. Генеративные методы — VAE, GAN, редко и сложно, для особых задач.
#собеседования_MLinside
❤16
Завтра мы проводим вебинар, который может изменить ваш подход к подготовке к собеседованиям
Если вы готовитесь к собеседованиям или просто хотите понять, как они устроены в ML — приходите на завтрашний эфир. Это возможность прокачаться даже без прямого участия.
Завтра в 19:00 по МСК мы проведем mock-собеседование в прямом эфире. И вот почему вам стоит на него прийти:
▪️ Можно тренироваться вместе с кандидатом: попробуйте ответить на те же вопросы, что и он. А потом сравните, как бы вы прошли этот этап.
▪️ Вы увидите, как вообще проходят собесы: какие темы поднимают, сколько дают времени, насколько строгий подход у интервьюера.
▪️ Вы услышите разбор от эксперта — что кандидат сделал хорошо, а над чем стоит поработать. Такая обратная связь бесценна, когда вы готовитесь к своему собесу.
▪️ И, конечно, записывайте вопросы. Это не просто собеседование — это живой чек-лист того, что стоит повторить перед интервью.
Собеседование проведет Александр Дубейковский, Middle+ ML Engineer Авито, ex-Yandex, эксперт MLinside. А проходить собеседование будет наш подписчик Илья, студент МГТУ им. Баумана, ищет работу в DS и планирует поступать в магистратуру ВШЭ.
Если откладываете подготовку, потому что «пока не готовы», приходите и посмотрите, что на самом деле вас ждет. Страх уходит, когда вы знаете, к чему готовиться.
👉 Зарегистрироваться на вебинар
#собеседования_MLinside
Если вы готовитесь к собеседованиям или просто хотите понять, как они устроены в ML — приходите на завтрашний эфир. Это возможность прокачаться даже без прямого участия.
Завтра в 19:00 по МСК мы проведем mock-собеседование в прямом эфире. И вот почему вам стоит на него прийти:
▪️ Можно тренироваться вместе с кандидатом: попробуйте ответить на те же вопросы, что и он. А потом сравните, как бы вы прошли этот этап.
▪️ Вы увидите, как вообще проходят собесы: какие темы поднимают, сколько дают времени, насколько строгий подход у интервьюера.
▪️ Вы услышите разбор от эксперта — что кандидат сделал хорошо, а над чем стоит поработать. Такая обратная связь бесценна, когда вы готовитесь к своему собесу.
▪️ И, конечно, записывайте вопросы. Это не просто собеседование — это живой чек-лист того, что стоит повторить перед интервью.
Собеседование проведет Александр Дубейковский, Middle+ ML Engineer Авито, ex-Yandex, эксперт MLinside. А проходить собеседование будет наш подписчик Илья, студент МГТУ им. Баумана, ищет работу в DS и планирует поступать в магистратуру ВШЭ.
Если откладываете подготовку, потому что «пока не готовы», приходите и посмотрите, что на самом деле вас ждет. Страх уходит, когда вы знаете, к чему готовиться.
👉 Зарегистрироваться на вебинар
#собеседования_MLinside
❤9
❗️Важное сообщение
Менеджерский аккаунт @ml_inside_manager временно заморозили, мы решаем этот вопрос с поддержкой.
Пока по любым вопросам можете обращаться к нашему менеджеру Марине: @marinagartm
Как только все восстановим, сообщим в этом канале.
Менеджерский аккаунт @ml_inside_manager временно заморозили, мы решаем этот вопрос с поддержкой.
Пока по любым вопросам можете обращаться к нашему менеджеру Марине: @marinagartm
Как только все восстановим, сообщим в этом канале.
❤4😱2
Мы начинаем mock-собеседование!
У тех, кто не успел зарегистрироваться, есть возможность подключиться прямо сейчас
У тех, кто не успел зарегистрироваться, есть возможность подключиться прямо сейчас
❤4
Хватит теории!
Уже завтра в 19:00 (МСК) Александр Дубейковский проведет практический мастер-класс «Поймай обманщика с помощью ML».
Если устали просто читать про машинное обучение, пора включаться в работу с реальными данными.
На вебинаре вы научитесь:
▪️находить аномалии и фродовые транзакции
▪️использовать базовые ML-инструменты шаг за шагом
▪️писать код и сразу видеть результат в Google Colab
Этот вебинар подойдет, даже если вы только начинаете осваивать ML. Все объясним, покажем, разложим по полочкам.
Если еще не зарегистрировались, сделайте это здесь и сейчас
Уже завтра в 19:00 (МСК) Александр Дубейковский проведет практический мастер-класс «Поймай обманщика с помощью ML».
Если устали просто читать про машинное обучение, пора включаться в работу с реальными данными.
На вебинаре вы научитесь:
▪️находить аномалии и фродовые транзакции
▪️использовать базовые ML-инструменты шаг за шагом
▪️писать код и сразу видеть результат в Google Colab
Этот вебинар подойдет, даже если вы только начинаете осваивать ML. Все объясним, покажем, разложим по полочкам.
Если еще не зарегистрировались, сделайте это здесь и сейчас
❤12
Мы начинаем практический вебинар!
На всякий случай пришлем ссылку на подключение и в этот канал. Подключиться можно здесь по ссылке
На всякий случай пришлем ссылку на подключение и в этот канал. Подключиться можно здесь по ссылке
🙏1
Ситуационная задача «Сюрприз в выдаче на проде»
Представьте, вы внедрили модель, которая рекомендует товары для пользователей на сайте. Через три дня после старта А/Б эксперимента вы решили проверить метрики и увидели уже статзначимый профит +7% в конверсии в покупку по сравнению с контрольной группой. В это же время менеджер пишет:
Представьте, вы внедрили модель, которая рекомендует товары для пользователей на сайте. Через три дня после старта А/Б эксперимента вы решили проверить метрики и увидели уже статзначимый профит +7% в конверсии в покупку по сравнению с контрольной группой. В это же время менеджер пишет:
Что-то пошло не так — пользователи видят очень странные товары. Прям вообще не те. Что делать?
🔥6
Что вы сделаете?
Anonymous Poll
12%
1. Быстро залью предыдущую версию модели, пока не поздно. Надо спасать метрики
18%
2. Перепроверю код постобработки и фичей — возможно, в проде что-то не так передаётся в модель
70%
3. Поставлю логирование входов и выходов модели, сверю с выдачей offline. Проверю прод/тест mismatch
Разбор ситуационной задачи «Сюрприз в выдаче на проде»
Разбираем варианты:
1️⃣ Быстро залью предыдущую версию модели
2️⃣ Перепроверю код постобработки и фичей
3️⃣ Поставлю логгирование входов/выходов модели, сверю с оффлайном
Как вариант — скомбинировать ответы, согласовать проблемы с руководством и собрать достаточное количество логов для анализа негативных эффектов. Если нужно сделать логирование, выключить на это время эксперимент. По логам проверять и метрики, и выдачи и все остальные гипотезы — с уже отключенным экспериментом и продом на откатанной версии.
Разбираем варианты:
1️⃣ Быстро залью предыдущую версию модели
Это пожаротушение.
Может быть оправдано как временная мера, но без диагностики вы не решаете проблему, а прячете её и можете снова наткнуться на эту же проблему.
2️⃣ Перепроверю код постобработки и фичей
Отличный вариант.
Очень частая причина — прод не похож оффлайн.
3️⃣ Поставлю логгирование входов/выходов модели, сверю с оффлайном
Лучший вариант.
Это зрелый, инженерный подход: логгирование + проверка на несоответствие между тренировкой и продом. Иначе вы не поймёте, что на самом деле сломалось.
Как вариант — скомбинировать ответы, согласовать проблемы с руководством и собрать достаточное количество логов для анализа негативных эффектов. Если нужно сделать логирование, выключить на это время эксперимент. По логам проверять и метрики, и выдачи и все остальные гипотезы — с уже отключенным экспериментом и продом на откатанной версии.
❤6🔥2
Завтра в 19:00 по МСК проведем уже третий мок-собес с разбором от Александра Дубейковского
С Александром вы, скорее всего, уже знакомы – на прошлой неделе он дважды проводил такие эфиры, и они собрали отличные отзывы. Если пропустили – это отличный шанс наверстать.
На этот раз интервью будет проходить выпускник физфака МГУ, который хочет сменить профессию и применять ML на практике. Это живая симуляция собеседования: реальные вопросы, настоящие ответы, честная обратная связь.
Вы увидите:
▪️ как проходит техническое интервью на ML-специалиста
▪️ что важно для интервьюера и где чаще всего спотыкаются кандидаты
▪️ какие темы точно стоит повторить перед собеседованием
И самое главное – только участники вебинара получат промокод на скидку на курс «База ML», старт которого уже 5 августа. Количество мест ограничено.
Зарегистрируйтесь на вебинар прямо сейчас
С Александром вы, скорее всего, уже знакомы – на прошлой неделе он дважды проводил такие эфиры, и они собрали отличные отзывы. Если пропустили – это отличный шанс наверстать.
На этот раз интервью будет проходить выпускник физфака МГУ, который хочет сменить профессию и применять ML на практике. Это живая симуляция собеседования: реальные вопросы, настоящие ответы, честная обратная связь.
Вы увидите:
▪️ как проходит техническое интервью на ML-специалиста
▪️ что важно для интервьюера и где чаще всего спотыкаются кандидаты
▪️ какие темы точно стоит повторить перед собеседованием
И самое главное – только участники вебинара получат промокод на скидку на курс «База ML», старт которого уже 5 августа. Количество мест ограничено.
Зарегистрируйтесь на вебинар прямо сейчас
❤8