Data notes – Telegram
Data notes
45 subscribers
59 photos
5 videos
2 files
122 links
My data science notes
Download Telegram
Рубрика “Чем занимаются Principal ребята в больших американских компаниях”

Во время работы контрактором в одной из Tier-2 компаний США имел честь довольно плотно общаться с несколькими Principal Data Scientists. Поделюсь своим видением того, чем же именно они занимаются в компаниях подобного уровня:

- Создание и поддержание культуры и стандартов работы с данными. Реальные примеры здесь: как наполнять таблицами в DWH, как создавать пайплайны, как вести документацию. Участие в написании и записи обучающе-просветительских материалов (презентации, воркшопы)
- Курирование довольно крупных проектов, таких как создание отдельных больших слоев в DWH (например, feature storage) с организацией документации, тестов и прочих сопутствующих ритуалов + отслеживание их выполнения. При этом написанием кода они тоже занимаются, поскольку роль по-прежнему инженерная, а не менеджерская - обычно это какие-то сложные кейсы, когда нужно, например, есть жесткие ограничения по времени работы ETL джобы и нужно выжать максимум эффективности при минимуме ресурсов. Так что hands on experience там что надо :)
- Код ревью, куда же без него. Обычно они являются owners какой-нибудь репы, вмерджиться в которую без их одобрения нельзя.
- Дежурство в чатах поддержки, например, есть условный канал #help-with-data с парой сотен коллег, которые задают либо технические вопросы, либо “а где лежат такие-то данные”. У принципалов есть обязательство выделять временные слоты, когда они мониторят эти чаты и помогают коллегам. Очень классная фича, когда любой коллега может “дотянуться” до топовой экспертизы, лично мне это очень помогло разрулить множество больших и маленьких проблем.
- Аналогичное обязательство есть по участию в тех собеседованиях: кто будет собесить Staff кандидата? Формально, нужен человек минимум одним грейдом выше :)

Так что хоть роль и техническая, разумеется, она уже больше про организацию и управление проектами и командами, но управление это как бы техническое, архитекторское.

Напоследок внесу свою лепту в разрушение стереотипа о том, что на таких позициях работают снобы, которых ”все достали своими однотипными вопросами”, наоборот, готовность помочь и чувство юмора у них на высоте. Так что гипотеза о том, что без софтов вы далеко не уедете (особенно в эпоху AI), подтверждается вновь и вновь
🔥4👍3
Продвинутые е-коммерсы уже расставляют ловушки для ваших AI-агентов😁
😁3
А вот что действительно важно, хотя почти не видно , так это то, что в последнем релизе Python 3.14 добавлена возможность отключить GIL и получить настоящий мультитрединг. Пока не все так гладко (нужна отдельная компиляция, не все даже стандартные либы поддерживаются), да и в 3.13 она уже была экспериментальной, но шаг значительный. Верим, что работы в этом направлении продолжатся
👍2
😁6
Coursera to Combine with Udemy to Empower the Global Workforce with Skills for the AI Era

https://investor.coursera.com/news/news-details/2025/Coursera-to-Combine-with-Udemy-to-Empower-the-Global-Workforce-with-Skills-for-the-AI-Era/default.aspx

Внезапно появилось объявление о слиянии Coursera и Udemy, общая оценка 2.5 млрд долларов. Монополии грядут прям везде.

Coursera - весьма хорошая платформа. Udemy, по ощущениям, выезжала чисто на маркетинге.

Интересно, как будет развиваться новая компания
👍1
Forwarded from Denis Sexy IT 🤖
Тут легенда ML-индустрии, ученый Эндрю Нг, сходил в Стэнфорд и поделился своим мнением про АИ и карьеру инженеров – видео длинное и я советую смотреть его, но вот топ-10 советов оттуда:

1. Держите рабочие AI-инструменты “свежими”: отставание быстро превращается в потерю продуктивности.
Сейчас выбор среды/ассистента для кода реально влияет на скорость и качество. Если вы используете инструменты на поколение старее, вы часто просто делаете ту же работу дольше и тяжелее

2. Код стал дешевле - дороже стало “решить, что строить” и “описать это четко”.
Когда написать код проще, узкое место смещается в постановку задачи: сформулировать цель, ограничения, критерии успеха, сценарии использования. То есть не “как закодить”, а “что именно нужно получить и как проверить, что получилось”

3. Умение разговаривать с пользователями - это ускоритель разработки, а не “софт-скилл ради галочки”.
Те, кто умеют сами собрать обратную связь, понять боль пользователя и быстро уточнить требования, двигаются быстрее, потому что меньше зависят от “переводчиков” между инженерами и рынком

4. Выбирайте работу по команде и людям, а не по “громкости бренда”. И требуйте ясности по команде заранее.
Если компания не готова сказать, в какую команду вы попадёте и что будете делать (или просит “сначала подпиши, потом разберёмся”), это риск: можно оказаться на задачах, которые не развивают вас в AI-направлении

5. Сделайте портфолио так, чтобы оно “рулило” интервью: пусть вас спрашивают про ваш проект, а не про случайные загадки.
Сильная тактика: собрать проект(ы), максимально похожие на будущую работу, и описать решения, компромиссы, метрики. Тогда интервью превращается в обсуждение реальной инженерии, где вы сильнее

6. Интервью - это проверка “командности под стрессом”, а не только IQ и алгоритмов.
Совет из истории: “стой на своём” можно, но без агрессии. Когда вам указывают на баг/угол, правильная реакция - совместно улучшать решение, а не защищаться как в споре

7. Код, сгенерированный AI, почти всегда приносит “долг по обслуживанию”: думайте как финансист.

Смысл простой: любой код потом надо сопровождать

Хороший “долг” - быстрый прототип, который приносит проверенную пользу/знания и окупает поддержку

Плохой “долг” - нагенерили “что-то крутое”, но никто не понимает, зачем, как работает и как чинить.
Важная мысль: выкинуть прототип - нормально, поддерживать непонятную кашу - дорого

8. Сейчас ценится не “сделал модель”, а “довёл до боевого использования”.
То есть: качество, надёжность, мониторинг, задержки, стоимость, безопасность, удобство для пользователя. На рынке сильный сигнал - умение доводить до работающего продукта, а не до демо

9. Станьте человеком, который переводит хайп в реальность: начните с вопроса “зачем?”.
Соцсети поощряют вовлечённость, а не точность. Поэтому трендовые слова (“агенты”, “всё заменим AI”) легко уводят в сторону. Практичный подход: сначала “зачем бизнесу?”, “какой показатель улучшаем?”, “что будет считаться успехом?” - и уже потом выбирать технологию

10. Готовьтесь к двум параллельным траекториям: большие облачные модели и небольшие локальные модели “у себя”.
В одних задачах будут доминировать мощные модели “как сервис”. В других (где важны приватность, IP, контроль, стоимость) - модели, которые разворачивают внутри компании. Полезные навыки на стыке: настройка под задачу (fine-tuning/адаптация), развёртывание, ограничения по данным, безопасность и эксплуатация.

Ну, база, что скажешь еще
👍5
Forwarded from max.sh
Год подходит к концу, поэтому самое время подводить итоги.

В этом посте разбираю одну из центральных тем блога в этом году: собеседования на ML/Research роли.

⚫️В первой половине года я много собеседовал и понял, что хочется делиться тем, что может помочь соискателям. Так появились эти тексты. Они разные по формату и теме, все субъективные и основаны на личном опыте. А теплые сообщения в личку о пользе текстов только мотивируют стараться

Типы вопросов на собеседованиях про Трансформеры
Подборка ресурсов для изучения RL в контексте LLM
Лонгрид ML Breadth Interview Deep Dive

Как готовиться к Coding Interview
Как готовиться к ML Design Interview
Как готовиться к ML Depth Interview

Рисерч стажировки в биг техе. Часть 1. Как попасть на собеседование
Рисерч стажировки в биг техе. Часть 2. Структура Интервью

⚫️Потом я оказался по другую сторону и начал собеседоваться сам. Собесы – это во многом рандом, поэтому любая информация помогает хоть немного увеличить шансы в этой лотерее. А реальные отзывы других людей так тем более. Я начал собирать истории подписчиков канала и делиться ими здесь. В итоге получилась солидная коллекция интервью-историй за 2025 год.

Все отзывы можно найти по тегу #интервью. А здесь оставлю ссылки на истории в зарубежные компании:

🌐Research Engineer в Google DeepMind
🍏Senior ML Engineer в Apple Music
💻Performance Engineer в Nvidia, Munich
💻OpenAI, Solutions Architect, Generative AI Deployment, London
Ⓜ️ Senior ML Engineer в Meta
🖥 Research Fellowship в Anthropic
🛒Applied Scientist, Amazon
🎧 Senior DL Engineer в Spotify, Personalization, London

Senior ML Engineer в Waymo, Perception Team, California
Solutions Architect в ByteDance, Дубай.
VP of AI ML в J.P. Morgan Chase, London
AI Engineer в Mistral.AI

🔥 Буду рад если поддержите пост репостами или поделитесь с друзьями. И забирайте себе в коллекцию, если готовитесь к новому приключению в следующем году!
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥4
Recap 2025

В профессиональном плане никаких достижений отметить не могу, по-прежнему работаю на разные страны, США, Африка, Россия (что внезапно оказывается довольно выгодно при текущем курсе рубля). До последнего откладывал погружение в AI, не люблю хайповые темы, предпочитаю занять выжидательную позицию с целью понять, стоит ли погружаться в тему или нет. Поняв, что всё-таки стоит, начал с небольшого проекта по разработке чат бота для техподдержки и сдачи очередного экзамена по AWS , а именно,  AI Practitioner, на этот раз в оффлайн режиме в тест центре.

А вот на личном было поинтереснее. Впервые в жизни всерьез занялся здоровьем по всем фронтам, понял, что если придерживаться жесточайшей дисциплины и выдержки, можно и здесь достичь потрясающих результатов. Например, полный отказ от мучного, сладкого и алкоголя на 4 месяца сделал больший вклад, чем посещение врачей в течение нескольких лет. Как пример результата - ни разу не заболел простудой в этом году, хотя раньше это случалось со мной раз в пару месяцев. Полностью избавился от необходимости приема успокоительных, снотворных и других ненужных здоровому организму препаратов впервые за 15 лет. И это только пара примеров. Ну и кажется, что попутно прохожу тот самый кризис среднего возраста, впервые задумался и смене индустрии, прорабатываю планы своих проектов и заработков вне найма, особенно на фоне криков о том, что кто-то кого-то там заменит. В любом случае, индустрия изменится необратимо и значительно, и быть готовым к этому нужно как минимум финансово.

Дочке скоро исполняется 3 года, она родилась в Аргентине, является гражданкой этой страны и, разумеется, в ее окружении говорят в основном на испанском. Мы наблюдаем здесь за нашей "когортой" детей,  тех детей русских мигрантов, которые тоже родились здесь три года назад, и понимаем, насколько сложно сохранить родную нам культуру для детей в другой стране. Здесь очень хорошо видно, насколько русский язык сложнее испанского, потому что дети, которыми не занимаются и отдают на воспитание няням, уже в три года не понимают своих русскоговорящих родителей. Наша дочь прекрасно говорит на обеих языках, и я считаю это одним из главных достижений уходящего года.
👍1
🔥1