Start Career in DS – Telegram
Start Career in DS
11.9K subscribers
93 photos
1 video
10 files
317 links
Тут публикуются материалы для прокачки скиллов в DS и подготовки к собеседованиям.

Пишем про технические тулзы, визуализацию данных, бизнесовые задачи, разбираем ML-алгоритмы и обсуждаем смежные темы :)

Автор: @RAVasiliev

№ 5141779667
Download Telegram
📑 Большая подборка курсов по статистике

На посте с курсами по статистике от Филиппа набралось много огонёчков, а это значит, что мы, как и обещали, делимся списком классных курсов по статистике:

1. Основы статистики от Анатолия Карпова – легендарный курс, который закладывает хорошую базу. Если вы ещё не соприкасались со статистикой – вам сюда.
«Рассматриваются подходы к описанию получаемых в исследованиях данных, основные методы и принципы статистического анализа, интерпретация и визуализация получаемых результатов. Слушатели познакомятся с такими методами статистического анализа как дисперсионный, регрессионный и кластерный анализ…»
2. Линейка курсов от Филиппа Ульянкина – про неё мы писали вот в этом посте. Она состоит из трёх курсов:
1)«Сбор и анализ данных в Python»
2)«Математическая статистика и AB-тестирование»
3)«Статистические методы анализа данных»

3. Вероятность и статистика с Глебом Михайловым – позволяет прочуствовать статистику, для начинающих самое то. Глеб показывает на практике в ноутбуке, как работает метод Монте-Карло, ЗБЧ, ЦПТ, что такое p-value и как проводятся A/B тесты
4. Введение в математическую статистику и математическая статистика от Computer Science Club – тут уже нужно знать тервер, матан и линал в объёмах стандартного вузовского курса, если вы новичок, будет сложновато. Но лекции классные, CSC плохого не сделает)

1) Введение в математическую статистику - хоть в описании курса сказано, что он более прикладной, всё равно теории тут тоже немало.
2) Математическая статистика - логическое продолжение вышеупомянутого курса. В описании сказано, что первый курс проходить необязательно, но, конечно, будет проще, если пройти

5. Курс от CSC на Stepic - сложный, но классный курс, нужно знать тервер, матан и Python/R. Научит визуализировать данные; строить оценки неизвестных параметров распределения; проверять гипотезы о законе распределения и параметрах распределения; сравнивать параметры распределений и т. д.
6. Лекции по статистике от МФТИ – классический академический курс статистики от Райгородского

+ Можно поискать курсы от лекторов МГУ
+ Обязательно стоит посмотреть этот очень красивый курс, часто, благодаря визуализациям, полностью осознаёшь, как работает та или иная теорема
+ Если не напрягает английский, гляньте легендарный канал StatQuest

Пишите в комментариях, какие еще курсы стоит включить в эту подборку, и давайте наберём 200 огоньков🔥 под этим постом?)
🔥976👍6
📏 Продуктовые метрики, ч. 3

В первой части мы рассмотрели несколько самых важных метрик продукта на примере Tinder, во второй части поговорили о том, что такое метрика Полярной звезды. Сегодня рассмотрим один из популярных фреймворков метрик.

Фреймворки – это, по сути, готовые наборы метрик, которые подходят проектам разных типов. Можно использовать их, либо выдумать свои (в конце концов, фреймворки тоже кто-то когда-то разработал).

1. Фреймворк Pirate Metrics (AARRR)
Этот фреймворк основан на маркетинговой воронке основных этапов взаимодействия клиента с продуктом. Она нужна, чтобы разделить работу с пользователем на этапы и отслеживать показатели на каждом из них.

Acquisition – привлечение, клиенту стало интересно, и он оставил свои контакты.
📏 Одна из метрик на этом этапе - процент регистрации посетителей на пробную версию
🧮оличество подписок / количество посетителей на странице регистрации) *100

Activation – активация, пользователь осознал ценность продукта и начал им пользоваться
📏 Пример метрики - коэффициент активации
🧮(Количество активированных пользователей / общее количество новых пользователей за период )*100

Retention – удержание, клиент постоянно пользуется продуктом.
📏 Метрика - Churn rate (коэффициент оттока)
🧮 (Кол-во отвалившихся пользователей) / (кол-во пользователей, которые были активны в выбранный день)

Referral – желание рекомендовать.
📏 Пример: NPS индекс потребительской лояльности
🧮 %«сторонников» - %«критиков»

Revenue – выручка.
📏 Пример: LTV прибыль от клиента за всё время работы с ним
🧮 (Средняя прибыль от клиента за определенный период) * (Средняя продолжительность сотрудничества)

2. HEART
Этот фреймворк создан в Google, он позволяет отслеживать опыт пользователя (UX, User Experience) по определенным категориям.

Happiness – счастье, отношение пользователя к продукту.
📏 Пример метрики: лёгкость использования продукта

Engagement
– вовлечённость, уровень заинтересованности в продукте.
📏 Пример: частота визитов пользователя

Adoption
– принятие, использование продукта становится привычкой.
📏 Пример: количество новых подписок

Retention
– удержание, пользователь возвращается к продукту.
📏 Пример: количество повторных покупок

Task Success
– успех ключевых задач.
📏 Пример: успешный поиск информации

Читайте предыдущие посты на тему метрик (раз и два) и ставьте огонёк под этим постом – сможем набрать 150? 🔥
🔥42👍73
​​📋 Подборка задачек на теорию вероятностей для подготовки к собеседованию

Обычно на собеседованиях задают не особо сложные задачки на идею, в которых скорее всего не будет объёмных вычислений. Вот подборка из материалов, в которых можно такие задачки найти:

1. Теория вероятностей: культурный код - сборник очень интересных задачек, на большую часть имеются ответы

2. 50 занимательных вероятностных задач с решениями - название говорит само за себя 🙂

3. Листочки с семинаров исследовательского потока факультета экономики ВШЭ, к собеседованиям стоит порешать задачки из начала. Если повезет, то к задаче найдете и решение

4. Книжка для экономистов - для подготовки к собесу стоит порешать задачи из первых глав, а так вся книжка очень годная

5. Севастьянов, сборник задач по теории вероятностей – аналогично, решаем задачи из первых глав, предварительно посмотрев примеры решений

Оставляйте в комментариях свои любимые материалы и ставьте огонёчки на этот пост – давайте наберём 250 🔥 для следующей подборки по терверу?)
🔥748👍6
🏭 Прокачай своё продуктовое мышление

Часто в требованиях к кандидату-аналитику указывают наличие продуктового мышления. Действительно, чтобы сделать хороший продукт, им должны обладать не только менеджеры продуктов, но и вся команда.

В каких направления нужно развиваться, чтобы прокачать продуктовое мышление?
Бизнес. Понимать, как работает рынок и ваш бизнес, какая миссия у компании.
Продукт. Управлять продуктом, понимать особенности/ограничения вашего рынка, изучать потребителей, управлять командой.
Дизайн. Быть эмпатичным, внедрять дизайн с фокусом на пользователя.
Технологии. Отслеживать технологические тренды, находить компромисс между дизайном и технологиями.
Коммуникации. Освоить сторителлинг, уметь презентовать и слушать.

Это всё можно найти в суперских лекциях от Школы менеджеров Яндекса.
Вот некоторые из лучших:
Behavioral Engineering
Принятие решений на основе данных
Аналитика
Продуктовая аналитика
Как создавать полезные продукты

Ставьте огоньки 🔥 на этот пост (давайте наберём 150 😁) и обязательно гляньте лекции, они смотрятся на одном дыхании
🔥582👍2
📝 День стажёра в Яндексе

Недавно Яндекс проводил летний день стажёра, на котором все желающие могли послушать лекции, познакомиться с действующими стажёрами и работниками компании 🙂

А ещё проходила ярмарка вакансий, где можно было подойти к стендам с представителями различных команд, чтобы пообщаться с ними, порешать задачки и выиграть мерч (а где-то даже ускоренный проход)

Подготовили для вас подборку задачек для аналитиков оттуда. Если хотите подготовиться к собеседованию на должность стажёра, обязательно стоит порешать их 😊

P.S. Если кто-то еще не слышал, у Яндекса открылся набор на осеннюю стажировку, так что если вы давно хотели податься - сейчас самое время))

Пишите свои решения в комментариях, там же задавайте вопросы и кидайте любимые задачки. А ещё, если вам нравятся такие посты, натыкайте тут 150 огоньков 🔥 – может быть, они будут выходить почаще 🙂
🔥95👍2❤‍🔥1
🤱 Известная задача про роддомы
Одна из задач, которые частенько задают на собеседованиях на аналитика, звучит так: «В городе два роддома — большой и маленький. В определенный день в одном из этих роддомов среди новорожденных оказывается 60% мальчиков. В каком роддоме это скорее всего могло бы произойти?»

Правильный ответ на эту задачу такой: в маленьком, поскольку в маленьких выборках более вероятны отклонения от среднего.

А вот в этой статье легендарный Александр Дьяконов смотрит на эту задачу с разных сторон, вникая в каждое слово из её условия. Так, он задается вопросами: «Что такое большой роддом, а что такое маленький», «Сколько в роддомах обычно рождается детей». В статье даже рассматривается статистика рождаемости в Англии и в Уэльсе 🙂

В общем, если хотите посмотреть, как профи деконструирует задачу - обязательно читайте статью.
И ставьте палец вверх 👍 под этим постом, если статья вам зашла (а если ещё не читали, то ставьте авансом 🙃)
👍757
​​🐈‍⬛ Бесплатный курс для начинающих - введение в Git

У нас уже были посты про Git:
Интерактивный туториал (если вы уже немного понимаете в Git)
Курс для тех, кто вообще не работал с гитом
Что делать, если накосячил при работе с гитом

Есть ещё один интересный бесплатный курс от Hexlet, по отзывам, вполне годный. Если вкратце:
– видеоуроки
– лекции
– упражнения в тренажере
– без сертификата
– доступ после регистрации

В описании сказано, что, чтобы учиться было проще, стоит заранее изучить основы командной строки, а так курс подходит для тех, кто вообще не имел опыта работы с Git

Если проходили его, обязательно оставляйте под этим постом комментарий с впечатлениями от курса. И оставляйте огонёк 🔥 под этим постом, если было полезно!
🔥36👍64
📹 А вот и видео про линейную классификацию и логистическую регрессию подъехало ;)

Логистическая регрессия - одна из тем, которые часто спрашивают на собеседовании. Мы достаточно долго делали этот видос и постарались максимально наглядно объяснить линейную классификацию и логистическую регрессию 😊

Давайте накидаем комментариев и лайков, чтобы алгоритмы ютуба поняли, что видео получилось и правда классное?)

И пишите в комментариях под этим постом, какие темы вы бы хотели увидеть в следующих видосах👇

https://youtu.be/8sp5aqyH6Oc?si=HkyQzzpCfciUQo18
🔥47❤‍🔥6👍3
​​✏️ Разбор задач контеста на аналитику в Яндекс

Нет, к сожалению, не за 2023 год, а за 2020. В этой статье автор решает все 6 задачек яндексовского контеста, если вы собираетесь подаваться на стажировку - определенно стоит посмотреть🙂
А еще стоит посмотреть комментарий, в котором лежат задания на текущий контест.

Но даже если вы не собираетесь на стажировку, все равно гляньте задачки из статьи выше, обычно у Яндекса они интересные. Вот парочка:

1. Дедлайн
Начинающий аналитик пытается решить задачу. Если задачу решить не удалось, то он теряет мотивацию, и вероятность успеха на следующей попытке падает. На одну попытку требуется день, а дедлайн по задаче — 90 дней. Вероятность, что аналитик решит задачу с i-ой попытки, составляет:
1. 1 / (i + 1)
2.1 / (i + 1)^2
С какой вероятностью аналитик успеет решить задачу до дедлайна?

2. Судьба хомяка
Чтобы выжить зимой, жадный голодный хомяк решил ограбить ореховый заводик, находящийся в 1000 м от его норы. На заводике осталось 3000 орехов. В щеки хомяка помещается максимум 1000 орехов. Куда и с чем бы ни шел хомяк, каждый метр ему необходимо подкрепляться 1 орехом. Хомяк уже на заводике и опасен. Какое максимальное число орехов он сможет запасти? Ответ необходимо округлить до целого числа.

Решайте, пишите свои решения в комментариях и сверяйтесь с решениями автора публикации)
🔥1611👍6
​​🎒 Всё еще можно зарегистрироваться на бесплатный курс по дизайну систем машинного обучения от ODS!

Классный курс от международного Data Science сообщества уже был прочитан в прошлом году. Сейчас его переработали более, чем наполовину, и этой осенью читают снова, онлайн 🙂

Запланированные темы:
1. Машинное обучение на практике
2. Основы проектирования ML-систем
3. Обучающие данные
4. Подготовка и отбор признаков
5. Выбор и обучение ML-модели
6. Улучшение модели через данные
7. Оценка качества модели
8. Развертывание
9. Диагностика ошибок и отказов
10. Жизненный цикл модели
11. Потоковые данные
12. Языковые модели в продуктовом окружении
13. Временные ряды и графы.
14. Безопасность, этика и восстание машин
15. Интеграция в бизнес-процессы.


Формат курса:
– видеолекции, выкладываются на ютуб в открытый доступ в начале каждой недели
– семинары по четвергам в 14:00 мск раз в неделю, в spatialchat, не выкладываются в открытый доступ
– консультации в чате курса
– проект, делается командой от 2 до 5 человек на протяжении всего курса, оценивается еженедельно
– ML дизайн документ для проекта - пишется на протяжении всего курса, оценивается еженедельно
– работа на семинарах и в чате оценивается еженедельно
– лабораторные работы (количество пока уточняется)
– публичный лидерборд, обновляется еженедельно

Регистрация открыта для всех 😊
👍24
🐳 Docker - для чего нужен и как им пользоваться?

Допустим, вы сделали классную ML-модель, которая хорошо работает в тестовом варианте. Теперь вам нужно её развернуть, чтобы поделиться с другими – не оставаться же ей только на вашем компьютере 🙂

Один из важных инструментов для развертывания модели – Docker. Если коротко, то это платформа, которая может решать проблемы совместимости между различными операционными системами и версиями библиотек при отправке кода машинного обучения инженерным группам.

Вот небольшая подборка материалов по Docker:
– Во-первых, официальное руководство
Введение в Docker, читается достаточно легко
Статья про оcновы Docker
Ютуб плейлист с туториалами для начинающих
– Первый модуль курса на степике для начинающих
Курс от ODS для более продвинутых

Если пост показался полезным, тыкайте огонёк под ним) 🔥
И пишите в комментариях, посты на какие темы вы хотите увидеть ещё 🙂
🔥64👍32
​​🍃 Классные статьи от аналитиков X5 Tech

У нас уже были посты про A/B тесты от аналитиков Авито (часть 1 и часть 2), и вот недавно мы наткнулись на серию из классных статей по А/B тестированию от аналитиков X5 Tech. Конечно, восприниматься будет лучше, если у вас уже есть некоторые знания матстатистики, питона и A/B экспериментов, но даже если вы совсем новичок, как минимум, пища для размышления вам обеспечена.

А/Б тесты с метрикой отношения. Дельта-метод
Стратификация. Как разбиение выборки повышает чувствительность A/B теста
Бутстреп и А/Б тестирование
Проверка корректности А/Б тестов

А ещё, если вы хотите зашарить в А/В тестах, стоит почитать классную книжку, которой мы делились в одном из постов 😊

Читайте, ставьте огонёчки 🔥, если вам зашли статьи, и 🤩 если они не особо понятные, но очень интересные)
🔥29👍53
🚀 Получи оффер в Яндекс за два дня!

Мы запускаем Fast Track для аналитиков в команду Фудтеха! Если вы хотите вместе с нами решать сложные, но супер интересные задачи и двигать Еду и Лавку вперед, обязательно участвуйте!😉
За два дня вы сможете пройти все этапы интервью и получить оффер!
📌 Даты мероприятия: 7-8 октября
📌 Подробнее про ивент: https://yandex.ru/project/events/ft-foodtech-data-analyst-0923

Мы ищем аналитиков/DS на разные направления и готовы смотреть кандидатов уровня от Middle до Lead, поэтому вы точно найдете себе задачи по душе)
А если у вас остались вопросы - пишите @polinapanshina
🔥15😁4❤‍🔥2🤩2
​​😱 Что делать, если собеседование через неделю?

1. Узнайте, какие ценности у компании, в которую вы подаётесь, и чем занимается команда, в которую у вас будет собеседование. Подумайте, какие задачи есть у этой команды. Можете почитать в статьях про то как работают в разных индустриях:
Яндекс.Маркет
Яндекс Такси
Алгоритмы назначения на заказы

2. Узнайте, какая структура у собеседования. Часто рекрутеры присылают материалы для подготовки к интервью, не надо игнорировать их! Поищите в интернете, как проходит отбор туда, куда вы хотите. Вот здесь, например, я рассказывал про то, как происходит найм в Фудтехе Яндекса

3. Поищите задачки, которые обычно встречаются на собесах на вашу позицию, в интернете - например, тут. И посмотрите, например, на LeetCode, какие задачки дают на интервью конкретно в вашу компанию.

4. Узнайте, что спрашивают на собесе, у знакомых, которые уже проходили его на эту позицию. А если никто из знакомых не проходил собес, поспрашивайте в доменных чатиках.

5. Подготовьте рассказ о себе. Четко, структурно, без мычаний. С рассказом о вашей роли и о ценности, которую вы принесли. Чтобы не было этих вот «нуууу», «эээээ». Подумайте, как можно за 3 минуты «продать себя» команде.

6. Все пункты выше лучше потренировать на пробном интервью, если у вас есть такая возможность.
Программа минимум: попросить друга поспрашивать вас об опыте и погонять по задачкам.
Программа максимум: найти профи, который сможет вас помокать (обычно это стоит не больших денек относительно будущей зп)

Ставьте огонёчек 🔥, если советы правда полезные, и чувака в странных очках 🤩, если база)
🔥39🤩95😁4👍2