MLinside - школа ML – Telegram
MLinside - школа ML
3.5K subscribers
202 photos
18 videos
165 links
Предзапись на 4 поток курса "База ML": https://vk.cc/cQ7AkI
Наши курсы: https://taplink.cc/mlinside
Чат коммьюнити: @ml_insidechat
По вопросам: @marinagartm
Download Telegram
Как начать изучать машинное обучение с нуля в 2025 году? 🤔

Изучение ML не начинается с абсолютного нуля. Если вы не знакомы с математическим анализом, линейной алгеброй, теорией вероятностей или не работали с Python, вам будет крайне сложно освоить основы. Но если у вас уже есть знания в этих областях, даже если они слегка «заржавели», вы сможете их освежить и уверенно двигаться дальше.

💡 С чего начать?

Мы рекомендуем начинать с подготовки. Например, в нашем курсе «База ML» есть подготовительный модуль, который длится месяц. В нём вы сможете:
▪️Освежить знания по Python.
▪️Вспомнить основы математического анализа: производные, интегралы.
▪️Разобраться с линейной алгеброй: векторы, матрицы и их роль в работе с данными.
▪️Понять теорию вероятностей — без неё не обойтись при работе с моделями.

Этот модуль отлично подойдёт тем, кто изучал эти темы раньше, но подзабыл. Если вы никогда с ними не сталкивались, вероятно, стоит попробовать разобраться с нуля в необходимой для старта базе, чтобы заложить фундамент для дальнейшего обучения.

🔍 Почему эти знания важны?

Машинное обучение работает с большими массивами данных, которые представлены в виде матриц признаков. Понимание математических процессов (например, как минимизируется ошибка модели) требует уверенности в производных и интегралах. Без линейной алгебры сложно представить себе обработку данных, а многомерный анализ нужен для работы с моделями, которые учитывают сотни или тысячи признаков.
🔥65👍5
⚠️ Внимание, стартует квиз!

Мы решили добавить немного интерактива в наш канал и предлагаем вам попробовать новый формат — квизы! Это отличный способ освежить знания или узнать что-то новое.

Сегодня у нас три вопроса, которые помогут вам проверить себя. 😉

Если вам понравится сегодняшний квиз, такой формат превратится в частую рубрику на нашем канале! 🚀

Готовы? Начинаем! 🎉
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥15🎉3
Представьте, что ваша модель показывает отличные результаты на обучающих данных, но на тестовых данных ее точность резко падает. В чем проблема?
Anonymous Quiz
5%
Модель недообучена
91%
Модель переобучена, поэтому не может хорошо обобщать данные
3%
С моделью все в порядке, так и должно быть
1%
Это просто случайность, и нужно протестировать еще раз
Вы обучаете модель и хотите проверить ее стабильность. Какой метод поможет оценить ее производительность на нескольких наборах данных?
Anonymous Quiz
3%
Сравнение моделей
1%
Подбор гиперпараметров
66%
Кросс-валидация
13%
Разделение данных на обучающую и тестовую выборку
18%
Все указанные методы
Какие навыки необходимы для успеха в ML в 2025 году?🌟

1️⃣Программирование
Любой проект в ML должен кто-то закодить, так что программирование это базовый скилл для ML. Python остаётся лидером благодаря обширному набору библиотек (sklearn, scipy, pytorch, pyspark и так далее). Однако, для статистических расчётов иногда еще может использоваться R. Также нужно быть предельно внимательным к инструментам написания кода с помощью LLMок. Уже сейчас все чаще появляются примеры того, как люди, не занимающиеся программированием профессионально, справляются с написанием простых приложений. Возможно та же участь ждет ML, но иметь возможность проверить работу нейросетки все-таки лучше, чем не иметь, поэтому программирование в этом списке точно остается.

2️⃣Мастерство в работе с фреймворками
SciPy, scikit-learn, PyTorch — эти и другие питоновские фреймворки значительно ускоряют процесс разработки. Знание популярных фреймворков позволяет специалистам фокусироваться на создании более качественных и эффективных решений.

3️⃣Навыки работы с данными (data wrangling)
Это то, что помогает превратить сырые данные в качественную информацию. Использование инструментов, таких как Pandas, Polars, PySpark, для обработки данных — обязательное условие. А если еще знаете их возможности и умете пользоваться эффективно, будете делать все гораздо быстрее. Также SQL будет необходим для работы с базами данных, извлечения и фильтрации информации. К счастью, весь SQL помещается на одностраничный cheat sheet, но не пренебрегайте практикой, освоить что-то в ночь перед собеседованием всегда сложнее, чем своевременно.

4️⃣ Работа с большими языковыми моделями (LLM)
Сейчас все чаще LLM используется для ускорения написания кода, для обучения, для повышения эффективности рабочих коммуникаций и многого другого. Не используя в работе решения на базе LLM, уже в 2025 году можно сильно отстать от рынка. Отдельная важная тема - построение своих приложений на базе LLM.

5️⃣ Софт-скиллы: часто недооцененные, но крайне важные
Технические знания — это еще не всё. В 2025 году специалисты, которые смогут объяснить сложные концепции понятным языком, будут особенно востребованы. Умение работать в команде и эффективно коммуницировать с коллегами из разных областей — это то, что поможет вам не просто делать задачу за задачей, но и развивать свою карьеру дальше, получая более интересные и масштабные задачи.

🤔 Какие ещё навыки станут необходимыми для успеха в ML в 2025 году? Поделитесь мнением в комментариях!
Please open Telegram to view this post
VIEW IN TELEGRAM
13🔥6👎1
Суббота – отличный повод не только для отдыха, но и для небольшой тренировки мозга! 🧠 Подготовили для вас пару интересных вопросов в формате квиз 🤓
6🔥1
Ваш набор данных для бинарной классификации имеет сильный дисбаланс классов. Какой метод поможет улучшить предсказания модели?
Anonymous Quiz
8%
Только уменьшение размера преобладающего класса (under-sampling)
9%
Только увеличение размера менее представленного класса (over-sampling)
84%
Один из этих методов или их комбинация
Вы построили регрессионный алгоритм для прогнозирования продаж продукта. После тщательной оценки оказывается, что алгоритм демонстрирует значительную степень смещения. Какое действие вы бы предприняли для улучшения предсказательной точности модели?
Anonymous Quiz
29%
Использовать бэггинг над моделью
20%
Рассмотреть упрощение алгоритма, чтобы сосредоточиться на основных характеристиках данных
37%
Расширить обучающий набор данных, чтобы предоставить алгоритму больше примеров для обучения
14%
Перейти к альтернативной метрике для оценки, чтобы лучше понять производительность модели
Как составить резюме джуна в ML, чтобы вас заметили? 📝

Конкуренция в сфере машинного обучения огромна, а порог входа – высокий. Что написать в резюме, если у вас пока нет опыта? Разбираемся, на что обращают внимание рекрутеры и как выделиться среди сотен кандидатов.

1️⃣ Образование – профильность важнее престижности
Да, топовый вуз – это плюс, но ключевое значение имеет профильное образование. Работодатели отдают предпочтение кандидатам с бэкграундом в математике, программировании и смежных дисциплинах. Если ваш диплом связан с ML или IT – обязательно укажите это в резюме.

📌 Что делать, если профильного образования нет?

Укажите курсы коммерческих школ или онлайн-платформ, связанных с машинным обучением.
Опишите, почему решили перейти в ML и как связаны ваши прошлые занятия с новой областью. Например, опыт работы аналитиком или разработчиком может сыграть на руку.

2️⃣ Проекты и участие в соревнованиях
Проекты – ваш главный инструмент для демонстрации навыков. Даже если они простые, важно указать ссылки на GitHub или GitLab, чтобы показать, что вы умеете применять полученные знания на практике.
Участие в соревнованиях (например, на Kaggle) – огромный плюс. Призовые места и активность говорят о вашем интересе и практическом опыте работы с реальными данными.

3️⃣ Преподавание и помощь другим
Не стоит недооценивать преподавательский опыт. Если вы обучали других (например, были ассистентом, проводили семинары или помогали новичкам), это демонстрирует вашу глубокую проработку темы. Преподавание учит формулировать мысли, анализировать ошибки и дает опыт взаимодействия с людьми – всё это ценится работодателями.

4️⃣ Подстройка резюме под вакансию
Каждая компания ищет специалистов под свои задачи. Поэтому не стоит отправлять одно и то же резюме на все вакансии. Подчёркивайте именно те навыки и проекты, которые наиболее релевантны требованиям работодателя. Используйте ключевые слова из описания вакансии, чтобы ваше резюме привлекло внимание.

5️⃣ Технические и софт-скиллы
Работодатели смотрят не только на знание инструментов, но и на способность решать задачи, работать в команде и критически мыслить. Подчеркните в резюме, как вы использовали навыки на практике, будь то проекты, курсы или работа в другой сфере.
Please open Telegram to view this post
VIEW IN TELEGRAM
11👍3😁2
Как проходит собеседование на Junior ML-специалиста? 🔍

Если вы готовитесь к интервью на позицию Junior ML-специалиста, важно понимать структуру процесса. Разбираем основные этапы, чтобы вы знали, чего ожидать.

📞 Телефонный скрининг (10–30 минут)
Первый этап — короткий звонок с HR, где обсуждаются организационные моменты: ваш опыт, мотивация, условия работы. Иногда задают простые технические вопросы вроде «Какие библиотеки вы используете?» или «Какой у вас опыт работы с Python?».

💻 Тестовое задание (редко, но бывает)
Если тестовое задание предусмотрено, на его выполнение обычно дается один вечер. Чаще всего вам дают датасет с пропусками и категориальными признаками, а ваша задача — очистить данные, построить простую модель (например, бинарную классификацию) и оценить её качество. Важно продемонстрировать базовые навыки работы с данными и моделями. Минус — придется потратить время, но плюс в том, что это отличная возможность увидеть типичные задачи команды и получить практический опыт.

🛠 Техническое интервью (1–3 секции, 30–90 минут)
Самая важная часть! Может состоять из одной длинной или нескольких коротких встреч. Основные темы:
ML: алгоритмы, метрики качества, переобучение и способы борьбы с ним.
Python и алгоритмы: кодинг, работа с данными.
Теория вероятностей и статистика: особенно важен теорвер.
SQL: запросы и работа с базами данных.

Вопросы по ML зависят от специализации: классические модели (бустинг, деревья, линейные), CV, LLM, рекомендательные системы и т. д.

👥 Финал — знакомство с командой
Последний этап, где вы можете понять, с кем предстоит работать, и задать вопросы о проектах.

🧐 Хотите углубиться в тему?
Смотрите запись вебинара «Как подготовиться к собеседованию на Junior ML-специалиста» с Анастасией Перцевой на нашем YouTube-канале. Мы разбираем реальные задачи с технических интервью, обсуждаем ключевые вопросы и даем советы по подготовке.

Готовитесь к собеседованию? Делитесь в комментариях, какие вопросы вызывают у вас наибольшие затруднения!👇
13👍1
⚠️ Внимание, стартует новый квиз!

Мы продолжаем добавлять интерактив в наш канал, и сегодня вас ждут три вопроса уровня "Легкий"!

Начинаем! 🚀
Please open Telegram to view this post
VIEW IN TELEGRAM
6
Ошибки новичков в ML: что тормозит карьеру? 🛑

Машинное обучение — перспективная сфера, но многие новички совершают ошибки, которые замедляют их рост. Разберем некоторые из них, чтобы вы могли их избежать.

▪️Учить ML без базовых знаний
Хотите сразу строить нейросети? Звучит круто, но без основ математики, статистики и алгоритмов далеко не уйти. Теория вероятностей, матанализ, линейная алгебра и Python — ваш фундамент.

▪️Недостаточно практики
Чтение статей и курсов полезно, но без работы с реальными данными прогресса не будет. Качайте скиллы на Kaggle, решайте задачи с реальных собеседований, участвуйте в pet-проектах и соревнованиях.

▪️Непонимание, как работают модели
Использовать готовые библиотеки — это здорово. Но если вы не знаете, почему Random Forest работает лучше логистической регрессии на ваших данных, на собеседовании могут быть проблемы.

▪️Пренебрежение чисткой данных
Модель – это хорошо, но без качественных данных даже лучший алгоритм бесполезен. Учитесь работать с пропусками, выбросами и категориальными признаками.

▪️Нет опыта работы с SQL
Вас могут не спросить про нейросети, но точно проверят, умеете ли вы писать SQL-запросы. Не игнорируйте базы данных!

▪️Отсутствие знаний в предметной области (доменной экспертизы)
ML — это инструмент, а не волшебная кнопка «решить все». Алгоритмы сами по себе ничего не значат без понимания контекста. Хотите работать в финтехе, медицине или маркетинге? Разбирайтесь в специфике данных и задач в этой сфере.
17
Мы в Дзене! 🎉

Теперь наши статьи и видео можно найти на Яндекс Дзене! Там мы будем регулярно разбирать ключевые темы из мира машинного обучения, ИИ и Data Science, делиться полезной информацией и рассказывать о самых важных событиях в индустрии.

🔥 В новой статье мы собрали главные события 2024 года в области искусственного интеллекта — Какие разработки стали самыми громкими и что нас ждет дальше? Узнайте здесь.

📌 Подписывайтесь на наш канал в Дзене, чтобы не пропустить новые материалы!
8🔥2
Очередной квиз в нашем канале!

Несколько простых вопросов, чтобы немного отвлечься и провести время с пользой.

Готовы к испытанию? Начинаем! 🚀
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥542
Какая из следующих метрик качества модели используется для задач классификации?
Anonymous Quiz
7%
MSE (Mean Squared Error)
88%
Accuracy
4%
RMSE (Root Mean Squared Error)
1%
MAE (Mean Absolute Error)
Что из перечисленного является примером категориальной переменной?
Anonymous Quiz
2%
Рост человека
2%
Вес упаковки товара
93%
Цвет автомобиля
3%
Количество сотрудников в компании