Start Career in DS – Telegram
Start Career in DS
11.8K subscribers
93 photos
1 video
10 files
317 links
Тут публикуются материалы для прокачки скиллов в DS и подготовки к собеседованиям.

Пишем про технические тулзы, визуализацию данных, бизнесовые задачи, разбираем ML-алгоритмы и обсуждаем смежные темы :)

Автор: @RAVasiliev

№ 5141779667
Download Telegram
🖋 Решение задач со дня стажёра Яндекса, часть 1

Давайте наберём 120 огоньков 🔥, и мы сделаем вторую часть решения задач с этого поста
🔥189😁2
​​ Шпаргалка для технического собеседования

Классная статья с Хабра, с помощью которой можно освежить в голове самую базу по:
Основам структур данных (массивам, связным спискам, хэш-таблицам, двоичным деревьям)
Поиску (в ширину и в глубину)
Сортировке (сортировка слиянием, быстрая сортировка, пузырьковая сортировка)
Основным типам алгоритмов (рекурсивные, итеративные, жадные)

Обязательно стоит посмотреть комментарии к статье, чтобы вас не запутали некоторые моменты в ней
И ставьте огонёчки 🔥 и лайки 👍, а если у вас премиум, то можно и сразу обе реакции на этот пост)
🔥56👍6❤‍🔥5🤩1
👔 Как подготовиться к мок-интервью

В посте «Что делать, если собеседование через неделю» последним пунктом мы указали, что перед реальным собеседованием стоит провести мок-интервью. Конечно, лучше проводить тестовое собеседование со специалистом, у которого уже есть большой опыт в этом. Но, допустим, у вас нет возможности, и вы попросили друга прособеседовать вас.
Небольшая инструкция, чтобы интервью прошло успешно:

1. Притворитесь, что вы совсем не знаете друг друга и встретились в первый раз. Включите все свои актерские навыки 🙂

2. Вот примеры общих вопросов, которые ваш друг может задать вам:
– Расскажи мне о себе и своем опыте работы
– Расскажи о твоем самом сложном проекте
– Какие твои сильные и слабые стороны?
– Почему ты хочешь работать в нашей компании?

3. Несколько сайтов, с которых друг может взять вопросы по Data Science:
120+ Data Science Questions
100+ Data Science Interview Questions
20 типичных вопросов

4. Пара советов, которые сделают мок эффективнее:
– Делайте заметки во время тестового интервью
– Записывайте мок-интервью, чтобы на записи увидеть свои ошибки

Ставьте огонёк 🔥, если вы уже были на тестовом интервью, и сердечко ❤️, если еще не были, но хотите побывать))
🔥199👍9
🅰️🅱️Увеличение чувствительности в A/B с помощью CUPED

Замечательный доклад от Валеры Бабушкина про технику А/Б экспериментов CUPED (Controlled-experiment Using Pre-Experiment Data), которая позволяет увеличить чувствительность метрик за счёт использования данных, полученных ранее. Чем больше чувствительность, тем более слабые изменения можно замечать и учитывать в эксперименте.

В своем выступлении Валерий Бабушкин объяснил, в чём заключается смысл CUPED и каких результатов можно достичь с помощью него, перед этим разобрав метод стратификации, который тоже помогает улучшить чувствительность.

Запись доклада можно посмотреть здесь, а текстовую версию со слайдами тут.

Ставь 🔥, если скучал по постам с Валерой)
🔥30👍53❤‍🔥1😁1
🖥 Что могут спросить на собеседовании на Data Scientist’a

Глобально, есть всего несколько типов вопросов, которые могут встретиться вам на собеседовании. И если хорошо заботать каждый пункт, то с очень большой вероятностью вы сможете пройти в любую компанию.
Какие же бывают типы вопросов на собеседовании?

Алгоритмы
– Конечно, в большинстве компаний отсутствуют алгоритмические секции. Но, так как в крупные IT-компании по типу Гугла, Яндекса рвутся все, им надо было придумать какой-то дополнительные критерий отбора. Поэтому, если вы хотите двигаться в эту сторону, то алгоритмы необходимы. Хороший структурированный материал по ним есть тут

Технические вопросы
– Это есть везде. Задачи на статистику, теорию вероятностей, вопросы на знание библиотек для анализа данных и машинного обучения и т. д.

Анализ реальных бизнес кейсов
– Вас могут попросить решить реальную бизнес задачу. Например, могут дать текст, по которому генерилась картинка через нейросеть. Какие-то картинки с очевидной лажей, а какие-то нет. И нужно придумать схему, чтобы выбирать из нескольких картинок более хорошую.
И здесь нет правильного ответа - нужно мыслить вне рамок задачи и предлагать как можно больше вариантов решения. Чтобы прокачать такой подход, возможно, стоит посмотреть лекции Школы менеджеров Яндекса

Решение прикладных задач (тестовое задание)
– Иногда либо на собесе, либо на дом могут дать задание, схожее с теми, которые вам нужно будет делать на работе. Чтобы подготовиться к этому, можно поделать пет-проекты, которые заодно можно будет включить в резюме. Идеи для них можно поискать на Kaggle, либо поспрашивать ChatGPT 🙂

Все эти сферы вопросов очень обширны, поэтому для начала стоит определиться с компанией, в которую вы хотите попасть, и узнать, какие типы вопросов встречаются там.

А еще лучше побывать на собеседовании в эту компанию, чтобы точно знать, к чему готовиться в следующий раз. Но, к сожалению, во многих компаниях действует фриз после неудачного собеседования. И чтобы подготовиться и не словить фриз, можно попробовать сходить на тестовое интервью 🙂

Ставьте огонёчки 🔥 на этот пост, если он был полезен, и включайте уведомления, чтобы читать наши посты первыми))
🔥41👍4❤‍🔥1
🖋 Решение задач со дня стажёра Яндекса, часть 2

Давайте наберём 160 огоньков 🔥, и мы сделаем третью часть решения задач с этого поста
P.S. Спасибо за внимательность телезрителю из Москвы))
🔥1595
🏆 Тренировки по ML и Yandex Cup!

Этой осенью Яндекс запускает 2 классных движа, в которых стоит поучаствовать:

1. Тренировки по Machine Learning
Помимо классических тренировок по алгоритмам, в этом году запускается новое направление тренировок по ML, созданное совместно с ШАДом.
Начало 30-го октября, успевайте зарегистрироваться!

2. Yandex Cup
В этом чемпионате стоит поучаствовать как продвинутым data scientist’ам, так и новичкам, чтобы прокачать свои навыки (а возможно и выиграть приз). Всего есть 6 направлений, в которые входят Аналитика и Машинное обучение. Соревнование делится на 3 этапа:
1) 23-29 октября - Квалификация
2) 4 ноября - Полуфинал
3) 2-3 декабря - Финал

Примеры задач на аналитику: *тык*
Аннотации к ML задачам: *тык*
Регистрация открыта до 23:00 29 октября по МСК!

Ставьте:
❤️ – если записались на тренировки
🔥– если зарегались на Yandex Cup
❤️‍🔥 – если зарегистрировались и туда, и туда
26❤‍🔥14👍6🔥3
Про ML-секции в Яндексе

Нашлось старое, но вполне ещё актуальное видео про то, как проходить ML-секции в Я.
На примере кейса (система подсказка географических объектов) разбирается то, какие вопросы задавать и на что обращать внимание.

Короткий план решения:
1. Стоит уточнить постановку задачи и узнать, где решение будет использовать реализованы ли уже какие-то элементы решения
2. Метрики: бизнес-метрики и технические метрики
3. Что делать на старте? Нужно ли здесь вообще машинное обучение?
4. Если всё-таки хотим обучать модель: данные для обучения, разбиение на train-test, какую модель стоит обучать, как её принимать


Видео тут

Если хотите больше историй про прохождение собеседований - накидайте 🔥 этому посту!)
🔥578👍6❤‍🔥1