Data Secrets | Карьера – Telegram
Data Secrets | Карьера
6.61K subscribers
1.14K photos
53 videos
1 file
1.28K links
Вакансии Data Science | Machine Learning | Big Data | Deep Learning | Neural Networks

Прислать вакансию/сотрудничество: @veron_28

https://telega.in/c/data_secrets_career
Download Telegram
Стажер Data Scientist в МТС
Офис в Москве

Предстоит: Заниматься построением ML моделей; Создавать новые features для моделей; Проводить А/В тесты моделей... Узнать подробнее 🔵
Please open Telegram to view this post
VIEW IN TELEGRAM
4
Нетворкинг как ключ к успеху

Многие недооценивают нетворкинг, считая, что это просто повод поболтать ни о чём. Однако именно так упускают главное — знакомства являются кладезем знаний и возможностей для карьерного роста. Не зря компании устраивают кофе-брейки и дни нетворкинга: это помогает генерировать новые идеи и привлекать ценные кадры. Ведь зачастую новых сотрудников нанимают именно по рекомендациям.

Давайте разберём структурно, зачем нетворкинг специалисту в Data Science:
Получение новых возможностей для трудоустройства;
Быть в курсе трендов;
Получение нового опыта и советов;
Установление связей для создания собственных проектов.

С пользой разобрались. Но как найти единомышленников?

Самое простое, что можно сделать — обратиться за помощью в интернет: LinkedIn, GitHub, Kaggle или наш чат.

Еще можно посещать различные конференции и митапы. Там можно не только обменяться опытом, но и познакомиться с лидами и рекрутерами (которые как раз приходят туда за новыми талантами).

Еще можно найти опытного наставника (как это сделал Илья Суцкевер). Им может стать университетский преподаватель или старший коллега.

А еще сделайте себя заметнее! Участвуйте в хакатонах, публикуйте свои проекты, выступайте с докладами. Так у вас появится возможность самому притягивать к себе нужные связи.

Помните: вы работаете не только с данными и моделями, но и с людьми. Поэтому развивать нетворкинг не менее важно.
Please open Telegram to view this post
VIEW IN TELEGRAM
16
Middle Data Scientist в Мегафон
Гибрид / Офис в Москве

Предстоит: Разрабатывать, тестировать и улучшать алгоритмы и модели NLP в задачах обработки, понимания и генерации естественного языка; Внедрять передовые методы в области NLP и их интеграция в существующие системы... Узнать подробнее 🔵
Please open Telegram to view this post
VIEW IN TELEGRAM
4
20 вопросов с собеседований о RAG

Тема RAG стала маст-хэв для любого ML-инженера, работающего с языковыми моделями или в сфере робототехники. На собеседованиях всё чаще звучат не просто вопросы «что это?», а глубокие и каверзные, проверяющие понимание.

Для тех, кто сейчас готовится к собеседованию или просто изучает RAG, рекомендуем ознакомиться со следующим материалом. Здесь собраны 20 вопросов по RAG с возможными ответами.

Советуем сначала самим подумать над ответом, а потом уже заглядывать в документ 🤓
Please open Telegram to view this post
VIEW IN TELEGRAM
20
Data Scientist в Сбер
От 160.000₽
Офис в Санкт-Петербурге

Предстоит: проведение аудиторских проверок статистических, ML моделей, автоматизированных алгоритмов; диагностирование и поиск проблем в банковских процессах, автоматизированных решениях (моделях, алгоритмах)…. Узнать подробнее 🔵
Please open Telegram to view this post
VIEW IN TELEGRAM
4
Team lead ML RecSys
Удаленно / Офис / Гибрид в Москве, в Санкт-Петербурге

Предстоит: Работа над сбором данных для экспериментов, обучение моделей, создание сервисов на их основе с дальнейшей поддержкой и совершенствованием; Управление командой, развитие компетенции сотрудников, управление беклогом команды…. Узнать подробнее 🔵
Please open Telegram to view this post
VIEW IN TELEGRAM
4
Cобеседование на должность Data Analyst

Собеседование на должность Data Analyst практически ничем не отличается от других собеседований, как правило это телефонный скрининг, созвон с рекрутером, тех.собес и поведенческое интервью. Немного подробнее про каждый из этапов:

1️⃣этап — телефонный скрининг
Обычно это неформальный звонок, но не теряйте бдительности — могут возникнуть технические вопросы. Будьте готовы к тому, что вас спросят о знании SQL или даже зададут быстрый концептуальный вопрос, например, о разнице между RANK() и DENSE_RANK().

Совет: на всякий случай приготовьтесь рассказать о своем техническом инструментарии.

2️⃣ этап — интервью с рекрутером Обычно это видеозвонок на 30-40 минут, в котором рекрутеры сосредотачиваются на гибких навыках и умении работать в команде. Иногда они сразу переходят к решению реальных бизнес-задач или написанию SQL-запросов. Вас могут попросить проанализировать причины падения доходов или разобрать набор данных на месте.

Совет: Всегда заранее спрашивайте рекрутера, чего ожидать от этого раунда, чтобы адаптировать подготовку.

3️⃣ этап — техническое собеседование Обычно вам дают задание по SQL, которое вы решаете в присутствии рекрутера: либо самостоятельно с последующим обсуждением, либо сразу вместе с ним. Чаще всего проверяют умение составлять запросы с JOIN, оконными функциями и CTE, но также встречаются кейсы по обработке данных на Python.

Некоторые компании, например Uber, любят проверять навыки в режиме реального времени, чтобы увидеть, как вы работаете в стрессовой ситуации.

4️⃣ этап — решение бизнес-кейса
Это либо живое интервью, либо домашнее задание. В обоих случаях цель — оценить ваше бизнес-мышление, умение расставлять приоритеты и коммуникативные навыки.

Если вам дали домашнее задание, полезно знать критерии оценки:
- Аналитическая строгость
- Структурированное мышление
- Рекомендации на основе данных
- Коммуникация и визуальное повествование

Совет: Подготовьте презентацию или дашборд с четкими выводами, предусмотрите дополнительные вопросы и сделайте слайды информативными и наглядными.

5️⃣ этап — поведенческое интервью Здесь всё как у всех: проверяют вашу способность работать в условиях неопределенности, сотрудничать с коллегами и разделять ценности компании.

Совет: используйте шаблоны STAR или PACE, чтобы составлять краткие, но впечатляющие истории, которые демонстрируют гибкие навыки и деловую хватку.
Please open Telegram to view this post
VIEW IN TELEGRAM
7
Junior ML-разработчик в Яндекс
Офис в Москве

Предстоит: анализировать текущее качество модели, генерировать гипотезы дальнейшего улучшения, проводить A/B-эксперименты; подготавливать данные, проводить Feature Engineering, обучать и валидировать модель, внедрять модель в продакшн…. Узнать подробнее 🔵
Please open Telegram to view this post
VIEW IN TELEGRAM
7
Middle/Senior Data Analyst в VK Team
Гибрид / Офис в Москве

Предстоит: коммуникации с контрагентами из бизнес-юнитов для сбора требований к таблицам, витринам, процессам или data-продуктам разрабатываемой платформы;
анализ, поиск аномалий, фильтрация таблиц в разнородном Data Lake;
предобработка и нормализация данных…. Узнать подробнее 🔵
Please open Telegram to view this post
VIEW IN TELEGRAM
5
ИИ-инженер с 10-ти летним опытом поделился, как в его компании внедряют код написанный ИИ.

По его словам с внедрением ИИ скорость разработки увеличилась на 30%.

Как наша команда использует ИИ для написания продакшн-кода:

1 Мы всегда начинаем с технического задания. Именно на этом этапе выполняется основная часть работы. Это включает в себя полную архитектуру, интеграцию с другими командами и т. д.

2 Проверка дизайна перед началом разработки. На этом этапе старшие инженеры полностью перерабатывают проектную документацию команды. Это позволяет избежать проблем в будущем.

3 Если вы прошли проверку, то можно приступать к разработке. Первые несколько недель уходят на документирование каждой подсистемы, которая будет создаваться отдельными командами разработчиков.

4 Разработка бэклога и планирование спринтов. На этом этапе разработчики вместе с менеджерами по продукту и техническому продакт-менеджеру определяют отдельные задачи, над которыми будут работать отдельные разработчики, и их порядок.

5 Разработка ПО. Наконец-то мы можем взяться за клавиатуру и приступить к выполнению задач. Именно здесь ИИ становится мощным инструментом. Мы используем разработку через тестирование, поэтому я прошу агента ИИ сначала написать тесты для функции, которую я собираюсь реализовать. Только после этого я начинаю использовать агента для реализации функции.

6 Проверка кода перед отправкой. Прежде чем код будет объединён с основной веткой, его должны одобрить два разработчика. ИИ также показывает большие перспективы в помощи при проверке.

7 Тестируем на промежуточной версии. Если промежуточная версия работает, мы переносим её в рабочую.

В целом мы наблюдаем увеличение скорости примерно на 30 % с момента подачи заявки на функцию до её запуска в продакшене. Это очень важно для нас.
12
Кажется, Google готовится объединить SQL, Python и Spark в рамках Colab Enterprise

По слухам, поисковый гигант намерен создать единую среду для специалистов по машинному обучению, объединив SQL, Python и Apache Spark в одном месте.

Ясмин Ахмад, управляющий директор Google Cloud по обработке данных, отметил, что главным препятствием для эффективности в ML является необходимость переключаться между средами: получать данные с помощью SQL в базах данных и хранилищах, затем экспортировать их, загружать в блокнот и настраивать отдельный кластер Spark.

Как вы понимаете, это крайне неудобно. Поэтому Google представляет ряд улучшений для своих блокнотов Colab Enterprise в BigQuery и на платформе Vertex AI.

Кроме того, компания анонсировала следующие преимущества для разработчиков в блокнотах Colab Enterprise:
Предварительный просмотр собственных ячеек SQL.
Интеграцию собственного Data Science Agent, призванного помогать в анализе и разработке моделей.
Please open Telegram to view this post
VIEW IN TELEGRAM
30
Когда пытаешься блеснуть знаниями на собеседовании:
55
Подборка открытых вакансий 🔵

Data Scientist в Авито
Удаленно / Офис / Гибрид в Москве

Senior ML Engineer в Wildberries
Офис / Гибрид в Москве

Data Engineer в Мегафон
Удаленно


Data Scientist в Яндекс
Офис / Гибрид в Москве

Middle/Senior DS/ML инженер в Ozon
Офис / Гибрид в Москве


Senior Data Engineer в Yadro
Удаленно / Офис / Гибрид в Москве, Санкт-Петербурге, Минске, Нижнем Новгороде
Please open Telegram to view this post
VIEW IN TELEGRAM
5
Влияние ИИ на разработку кода

За последние годы ИИ-помощники для разработчиков, вроде GitHub Copilot и Cursor, стали настоящим трендом. Но большинство данных об их эффективности взяты из контролируемых лабораторных тестов. Поэтому группа исследователей задалась вопросом: Что же происходит, когда ИИ встраивается в рабочие процессы в реальной компании? Для этого разработчики провели годовое исследование внедрения собственной ИИ-платформы DeputyDev с участием 300 инженеров.

Результаты показали, что ускорение ревью составило 31.8%, то есть сократилось время код-ревью
Наиболее активные пользователи достигли увеличения объема кода, попадающего в продакшен, на 61%. В целом, платформа отвечала за 28% рост объема выпускаемого кода.
85% удовлетворенности функциями код-ревью.
Пиковый уровень вовлеченности достиг 83% к 6-му месяцу и стабилизировался на отметке 60%, что говорит об устойчивой интеграции в рабочие процессы.
Объем сгенерированного кода вырос с 3,000 до 2.2 миллионов строк без потери качества (стабильный процент принятия кода 35-38%).
Основные сценарии использования: UI/Frontend (25.2%), исправления багов (21.8%) и Бэкенд-разработки (21.1%).


Полное исследование
Please open Telegram to view this post
VIEW IN TELEGRAM
9
Администратор баз данных в НМГ
Офис в Москве

Предстоит: Установка, настройка и поддержка высоконагруженных кластеров ClickHouse; Оптимизация производительности ClickHouse: настройка таблиц, индексов, шардирования, репликации и партиционирования…. Узнать подробнее 🔵
Please open Telegram to view this post
VIEW IN TELEGRAM
4
Забавная история стажировки одного разработчика

Все мы, когда были неопытными хотели отличиться и попасть в штат, также думал и главный герой этой истории, но в итоге он слишком перестарался:

«В эпоху мейнфреймов и перфокарт я стажировался в бигтехе. Желая проявить себя, я решил улучшить наш пакетный редактор. Изучив документацию IBM, я написал набор «умных» команд. Но..

Я не знал, что старшие коллеги уже доработали редактор своими недокументированными изменениями. В итоге, мои правки привели к массовому перезаписыванию файлов.

Меня немедленно отстранили от работы с редактором, а потом и от других задач, сочтя слишком рискованным сотрудником. Но компания продолжала платить мне, а на итоговом собеседовании менеджер отметил, что я выполнил больше задач, чем ожидалось. Но главное — эта история не отбила у меня вкус к экспериментальному программированию.»


Инициативность это хорошо, но главное не перестараться и уточнять у коллег 🤭
Please open Telegram to view this post
VIEW IN TELEGRAM
23
Data Scientist в ИТМО
От 120.000₽
Офис в Санкт-Петербурге

Предстоит: разработка и имплементация новых ML/DL-архитектур для задач химии материалов, drug-дизайна и кристаллохимии (GNN, трансформеры, диффузионные модели); построение и ведение исследовательских пайплайнов: подготовка датасетов, воспроизводимое обучение/валидация, оптимизация гипер-параметров, интерпретация моделей…. Узнать подробнее 🔵
Please open Telegram to view this post
VIEW IN TELEGRAM
9
Подготовка к собеседованиям для MLE

Наткнулись на блог Андрея Лукьяненко — ML-инженера, проработавшего на этой должности 6 лет. Совсем недавно он поделился тем, как готовился к собеседованиям в разные компании.

Андрей выделил основные типы собеседований: Leetcode, ML System Design, вопросы по теории ML и статистике и поведенческое интервью.

➡️ Leetcode — один из самых популярных этапов собеседований. Хоть многие его и не любят, этот этап может продемонстрировать вашу подготовку: либо вы из тех, кто целенаправленно нарешивал задачи, либо из тех, кто просто способен быстро их решать, а может и вовсе не тот и не другой, но тогда ваши шансы на получение офера снижаются.

Задачи делятся по уровню сложности: легкие, средние и сложные. Если с легкими все проще: в них нужно знать базовые структуры данных, то на среднем и сложном уровнях необходимо знать подходы к решению определенных проблем или уметь применять сразу несколько методов.

Просто решить задачу по программированию — полдела, ведь нужно решить ее эффективно, оптимизировав время и память, а для этого как раз и нужны знания структур данных и алгоритмов.

К такому собеседованию Андрей готовился так: давал себе время на решение задачи (например, 15 минут), если решить ее не получалось, то изучал решение, воспроизводил его, а потом нарешивал похожие задачи.

Еще здорово, когда вы знаете, в какой компании проходите собеседование — тогда можно посмотреть, какие вопросы часто задают на интервью.

Несколько советов:
Потратьте на размышления не больше минуты-двух, а затем озвучьте свои мысли.
Задавайте уточняющие вопросы об ограничениях и крайних случаях.
Сначала представьте решение методом перебора, объясните его сложность, а затем предложите варианты оптимизации.
Объясняйте, что вы делаете, когда пишете код. Не молчите.
Внимательно прислушивайтесь к подсказкам интервьюера: скорее всего, они намекают на ошибку.
Рассмотрите пример входных данных и объясните, как ваш код будет их обрабатывать.


➡️ Теория по статистике и ML
Считается, что это самый непредсказуемый этап, так как никогда не знаешь заранее, какие вопросы зададут. Можно лишь догадываться, исходя из компании или команды.

Самое неприятное, что интервьюеры сильно различаются по глубине своих ожиданий. Некоторым достаточно общих объяснений, другим нужны формулы. Некоторые могут спросить о чём-то, что они прочитали накануне.

Помнить абсолютно все практически невозможно. Поэтому перед собеседованиями Андрей просто освежал в памяти теорию. Но такой подход дает сбой, когда забываешь то, чем не пользуешься регулярно, поэтому он старается делать заметки по теории. Кстати, они открыты для всех желающих.

Совет:
Если вы не применяете какие-то знания на практике, вы их забудете. Поэтому либо применяйте их, либо документируйте, либо хотя бы добавляйте в закладки необходимые материалы для повторения перед собеседованиями.
Please open Telegram to view this post
VIEW IN TELEGRAM
21
Research Engineer in Google DeepMind
From 166,000$ + bonus + benefits
Office in California


What To Do: ou’ll be applying the most promising models and research to high-impact real world problems, by rapid-prototyping initial concepts, and designing and running experiments to evaluate the opportunity..... find out more 🔵
Please open Telegram to view this post
VIEW IN TELEGRAM
11
Media is too big
VIEW IN TELEGRAM
Сэм Альтман о замене человека ИИ и навыках 💬

Сейчас многие студенты переживают по поводу поиска работы, так как ИИ активно внедряют на позиции джуна, да и эффективность образования в эпоху ИИ многие ставят под сомнение. На недавнем интервью Альтману задали о том, какие навыки нужны человеку, чтоб оставаться востребованным.
Мета-навык — учиться тому, как учиться, учиться адаптироваться, учиться быть устойчивым к постоянным изменениям. Я упоминал об этом ранее: умение понимать, чего хотят люди, как создавать для них полезные продукты и услуги, как взаимодействовать с миром. Я абсолютно уверен, что люди по-прежнему будут оставаться в центре повествования друг для друга. И всё, что будет в этом мире, я считаю, будет прекрасным.


Также Сэм немного успокаивает студентов, упоминаю о том, что технологический прогресс никогда не стоял на месте.
Я легко могу представить себе мир, в котором 40% задач, выполняемых сегодня в экономике, в недалёком будущем будут выполняться искусственным интеллектом.. Примерно каждые 75 лет половина рабочих мест в обществе меняется, и это даже без учета ИИ. Возможно, это произойдет, но я ожидаю, что теперь это будет происходить быстрее.
Please open Telegram to view this post
VIEW IN TELEGRAM
12
Подборка открытых вакансий 🔵

Data Scientist в Авито
Удаленно / Гибрид / Офис в Москве

Data Analyst в Авиасейлс
Удаленно


Middle Data Engineer в МТС
Офис в Москве

Middle Data Scientist в Lamoda
Офис в Москве

Team Lead Data Scientist в Bia Technologies
Удаленно / Гибрид / Офис в СПб, Москве, Омске, Владимире

Senior Data Engineer в VK Team
Офис в Москве
Please open Telegram to view this post
VIEW IN TELEGRAM
5