Forwarded from Стать специалистом по машинному обучению
Огромный насыщенный плейлист по анализу данных от ФКН ВШЭ. Много полезного для себя узнаю.
https://www.youtube.com/watch?v=77fwOymbP2Y&list=PLEwK9wdS5g0pja3STykphSiuXzNEx5Gkw
https://www.youtube.com/watch?v=77fwOymbP2Y&list=PLEwK9wdS5g0pja3STykphSiuXzNEx5Gkw
YouTube
Введение в анализ данных, лекция 1 — основные понятия
Курс "Введение в анализ данных", майнор "Интеллектуальный анализ данных", НИУ ВШЭ
Лектор — Евгений Соколов
Страничка курса: http://wiki.cs.hse.ru/Введение_в_анализ_данных
Все видео курса: https://www.youtube.com/playlist?list=PLEwK9wdS5g0pja3STykphSiuXzNEx5Gkw
Лектор — Евгений Соколов
Страничка курса: http://wiki.cs.hse.ru/Введение_в_анализ_данных
Все видео курса: https://www.youtube.com/playlist?list=PLEwK9wdS5g0pja3STykphSiuXzNEx5Gkw
#interview #systemdesign
Видео по system design
https://m.youtube.com/channel/UC9vLsnF6QPYuH51njmIooCQ
Видео по system design
https://m.youtube.com/channel/UC9vLsnF6QPYuH51njmIooCQ
#interview #story #tricks
Чувак рассказывает о том, как прошёл собес
https://habr.com/ru/post/684698/
Немного советов с поста.
На этап фонскрина подготовьте рассказ о себе на 2-3 минуты. Ничего лишнего, просто обозначьте свой опыт этим рассказом. Четко обсудите на какую позицию претендуете, чтобы не было сюрпризов в дальнейшем. Рекрутер вам вышлет материалы по подготовке, используйте их: они соответствуют критериям оценки интервью.
Чеклист для алгоритмического интервью:
• Задать уточняющие вопросы по задаче и входным данным: соотношение входных данных, дубликаты, отсортированность и т.д.
• Обратить внимание на ключевые слова типа “maximize”, “minimize”, “count”. Эти слова помогут распознать задачу на динамическое программирование.
• Думать вслух. Обсудить и предложить несколько решений задачи.
• В оценке сложности учесть все входные данные и их соотношение.
• Уточнить у интервьюера, нормально ли использовать рекурсию. Объяснить trade offs: память, stack overflow и т.д.
• Выделять функции, не усложнять вложенность. Писать максимально понятный и аккуратный код, насколько позволяет опыт.
• Обязательно отдебажить в конце на примерах. Продумать граничные случаи. Довести задачу до корректного решения, найти и исправить баги самостоятельно.
Чеклист для system design:
• Уточнить функциональные требования, фичи.
• Уточнить нефункциональные требования: Scalability, Availability, Performance, Consistency, Durability, Cost etc.
• Если задача того требует, то уделить внимание расчетам. Не в каждой задаче это нужно, надо смотреть на условие.
• Дизайн API, дизайн БД. Тоже оцените условие, иногда у вас уже может быть API, а хранение в БД может быть не так интересно в рамках 45 минутной сессии.
• Нарисовать высокоуровневый дизайн.
• Распознать основные компоненты, распознать bottlenecks, распознать потенциальные trade offs и детально обсудить эти моменты.
• Убедиться, что ни одно из требований не упущено.
• Драйвить разговор, быть ведущим в процессе собеседования. Именно это и показывает опыт.
Общая рекомендация на этап Behavioral: подготовить ответы на популярные вопросы по методу STAR, именно в таком формате оценивают большинство компаний.
В процессе подготовки узнал об англоязычном понятии “oversharing”, когда рассказываешь больше, чем от тебя ожидают. Не совершайте такой ошибки, будьте честны, но не выходите за границы вопроса. Не рассказывайте личные вещи, не обобщайте, не давайте оценку если не просят, излагайте факты как есть
Как правильно заметили - если хотите выше должность, то обращайте особое внимание на scope & complexity ваших примеров поведенческого этапа. Это ключевой дифференциатор зачастую, почему кандидаты получают downgrade по результатам собеса.
Чувак рассказывает о том, как прошёл собес
https://habr.com/ru/post/684698/
Немного советов с поста.
На этап фонскрина подготовьте рассказ о себе на 2-3 минуты. Ничего лишнего, просто обозначьте свой опыт этим рассказом. Четко обсудите на какую позицию претендуете, чтобы не было сюрпризов в дальнейшем. Рекрутер вам вышлет материалы по подготовке, используйте их: они соответствуют критериям оценки интервью.
Чеклист для алгоритмического интервью:
• Задать уточняющие вопросы по задаче и входным данным: соотношение входных данных, дубликаты, отсортированность и т.д.
• Обратить внимание на ключевые слова типа “maximize”, “minimize”, “count”. Эти слова помогут распознать задачу на динамическое программирование.
• Думать вслух. Обсудить и предложить несколько решений задачи.
• В оценке сложности учесть все входные данные и их соотношение.
• Уточнить у интервьюера, нормально ли использовать рекурсию. Объяснить trade offs: память, stack overflow и т.д.
• Выделять функции, не усложнять вложенность. Писать максимально понятный и аккуратный код, насколько позволяет опыт.
• Обязательно отдебажить в конце на примерах. Продумать граничные случаи. Довести задачу до корректного решения, найти и исправить баги самостоятельно.
Чеклист для system design:
• Уточнить функциональные требования, фичи.
• Уточнить нефункциональные требования: Scalability, Availability, Performance, Consistency, Durability, Cost etc.
• Если задача того требует, то уделить внимание расчетам. Не в каждой задаче это нужно, надо смотреть на условие.
• Дизайн API, дизайн БД. Тоже оцените условие, иногда у вас уже может быть API, а хранение в БД может быть не так интересно в рамках 45 минутной сессии.
• Нарисовать высокоуровневый дизайн.
• Распознать основные компоненты, распознать bottlenecks, распознать потенциальные trade offs и детально обсудить эти моменты.
• Убедиться, что ни одно из требований не упущено.
• Драйвить разговор, быть ведущим в процессе собеседования. Именно это и показывает опыт.
Общая рекомендация на этап Behavioral: подготовить ответы на популярные вопросы по методу STAR, именно в таком формате оценивают большинство компаний.
В процессе подготовки узнал об англоязычном понятии “oversharing”, когда рассказываешь больше, чем от тебя ожидают. Не совершайте такой ошибки, будьте честны, но не выходите за границы вопроса. Не рассказывайте личные вещи, не обобщайте, не давайте оценку если не просят, излагайте факты как есть
Как правильно заметили - если хотите выше должность, то обращайте особое внимание на scope & complexity ваших примеров поведенческого этапа. Это ключевой дифференциатор зачастую, почему кандидаты получают downgrade по результатам собеса.
Хабр
Без одной faangи или как я проходил собеседования
Привет, Хабр! Меня зовут Рустам, работаю программистом 9 лет. 7 лет работал в Контуре и около 2 лет в Яндексе. В этой статье расскажу про свой опыт подготовки и прохождения собеседований в большие...
Forwarded from NoML Digest (Pavel Snurnitsyn)
База по А/Б. Лайт версия
В честь Дня Знаний (и для тех, кто сегодня пошёл в первый класс😀) подборка с базовыми статьями по А/Б тестам:
📌 How Not To Run an A/B Test (2010) - хорошая старая статья про проблему подглядывания.
📌 Five ways to reduce variance in A/B testing (2021) - в блоге Marton Trencseni короткие интересные заметки. В основном они не про А/Б, например, прикидка на коленке с питоном правдива ли фраза "Over 70% of all Porsche vehicles ever built are still on the road today" (спойлер: да, похоже на правду).
📌 Множественные эксперименты: теория и практика (2019) - короткая и простая статья от Яндекса о том, как работают поправки с примерами кода.
В честь Дня Знаний (и для тех, кто сегодня пошёл в первый класс😀) подборка с базовыми статьями по А/Б тестам:
📌 How Not To Run an A/B Test (2010) - хорошая старая статья про проблему подглядывания.
📌 Five ways to reduce variance in A/B testing (2021) - в блоге Marton Trencseni короткие интересные заметки. В основном они не про А/Б, например, прикидка на коленке с питоном правдива ли фраза "Over 70% of all Porsche vehicles ever built are still on the road today" (спойлер: да, похоже на правду).
📌 Множественные эксперименты: теория и практика (2019) - короткая и простая статья от Яндекса о том, как работают поправки с примерами кода.
Forwarded from Data-comics
Небольшая шпаргалка по разработке дашбордов от Maven analytics - поделилась Lourde Mary T. в линкедин (впн):
https://www.linkedin.com/posts/lourdemary_dashboard-design-process-ugcPost-6970644107970969600-e5CK
Всё по классике:
1. Определить цель.
2. Выбрать верные метрики.
3. Отобразить данные эффективно.
4. Убрать шум и мусор.
5. Выделить важное.
6. Рассказать историю.
В общем, сделайте все хорошо и правильно - и будет вам счастье!
😁👌
Как вам?
https://www.linkedin.com/posts/lourdemary_dashboard-design-process-ugcPost-6970644107970969600-e5CK
Всё по классике:
1. Определить цель.
2. Выбрать верные метрики.
3. Отобразить данные эффективно.
4. Убрать шум и мусор.
5. Выделить важное.
6. Рассказать историю.
В общем, сделайте все хорошо и правильно - и будет вам счастье!
😁👌
Как вам?
#ml #career #courses
ML-engineer roadmap
https://github.com/chris-chris/ml-engineer-roadmap
https://whimsical.com/machine-learning-roadmap-2020-CA7f3ykvXpnJ9Az32vYXva
ML-engineer roadmap
https://github.com/chris-chris/ml-engineer-roadmap
https://whimsical.com/machine-learning-roadmap-2020-CA7f3ykvXpnJ9Az32vYXva
GitHub
GitHub - chris-chris/ml-engineer-roadmap: WIP: Roadmap to becoming a machine learning engineer in 2020
WIP: Roadmap to becoming a machine learning engineer in 2020 - chris-chris/ml-engineer-roadmap
Forwarded from DevFM
Брокер сообщений Apache Kafka
Начать изучение рекомендуем со статьи Apache Kafka: основы технологии от ребят из slurm, в которой покрыты:
— отличия кафки от остальных сервисов очередей
— базовые компоненты kafka
— основные принципы работы
Для опытных пользователей будет полезна статья Apache Kafka: the Complicated Simplicity (открывать с vpn) о неочевидных проблемах, с которыми можно столкнуться. Но наибольшую ценность представляют предложенные решения.
Нам эта статья помогла разобраться, почему не удаляются записи месячной давности при явно заданном в настройках правиле "удалять записи старше одного месяца". Дело в том, что кафка хранит данные в сегментах (segments). Запись осуществляется в один активный сегмент, который при достижении определенного размера становится неактивным. Оказалось, что удалять можно только данные из неактивных сегментов. И правило на удаление не сработает, если данные в этот момент находятся в активном сегменте.
Начать изучение рекомендуем со статьи Apache Kafka: основы технологии от ребят из slurm, в которой покрыты:
— отличия кафки от остальных сервисов очередей
— базовые компоненты kafka
— основные принципы работы
Для опытных пользователей будет полезна статья Apache Kafka: the Complicated Simplicity (открывать с vpn) о неочевидных проблемах, с которыми можно столкнуться. Но наибольшую ценность представляют предложенные решения.
Нам эта статья помогла разобраться, почему не удаляются записи месячной давности при явно заданном в настройках правиле "удалять записи старше одного месяца". Дело в том, что кафка хранит данные в сегментах (segments). Запись осуществляется в один активный сегмент, который при достижении определенного размера становится неактивным. Оказалось, что удалять можно только данные из неактивных сегментов. И правило на удаление не сработает, если данные в этот момент находятся в активном сегменте.
Слёрм
Как работает Apache Kafka. Producer, consumer и отличия от RabbitMQ | Блог slurm.io
Разбираемся в механизмах работы Apache Kafka | Блог slurm.io