Yandex for Analytics – Telegram
Yandex for Analytics
7.2K subscribers
358 photos
22 videos
133 links
Канал для аналитиков от Яндекса. Рассказываем о событиях, обсуждаем кейсы, знакомимся с командами и внимательно смотрим на данные.

Чат: t.me/YandexDataDriven
Вопросы: @Ekaterina_Lyagina

Все каналы Яндекса по стекам: https://news.1rj.ru/str/addlist/Hrq31w2p1vUyOGZi
Download Telegram
💫 Data Driven 2025: как это было

20 сентября прошла масштабная ежегодная конференция от бизнес-группы Поиска и Рекламных технологий Яндекса, на которой аналитики обсудили data-driven-подход и то, как он помогает влиять на бизнес, находить новые точки роста и определять цифровое будущее мира.

Вышло очень круто! Спасибо, что были с нами офлайн и онлайн 💠

А вот ивент в цифрах:

🔵 357 гостей — в 3 раза больше, чем в прошлом году
🔵 Рекордные 150 участников на офлайн-воркшопе по созданию агента для работы с данными
🔵 126 встреч Random Coffee с экспертами и рекрутерами бизнес-группы Поиска и Рекламных технологий
🔵 250 ребят, которые решали кейсы по 5 направлениям аналитики в квесте по экспозоне

📺 Кстати, уже выложили записи докладов по трекам:

🔵 Трек «Data to Artifacts» смотрите на ютубе или в VK Видео
🔵 Трек «Data to Insights» смотрите на ютубе или в VK Видео

Темы были самые разные: интегральные метрики качества и эффективности в Яндекс Картах, роль аналитики в рободоставке, end-to-end-качество Алисы и многое другое.

📷 А ещё ищите себя на фото по ссылке. Если хотите поделиться обратной связью, заполняйте форму.

Подписывайтесь:
💬 @Yandex4Analytics
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥157👍5👏1
🔍 Кейс Яндекс Практикума: от хаоса к чётким метрикам для каждой команды

Всем привет! Это Илья Карасёв, руководитель группы развития BI Практикума.В этой серии карточек поделюсь нашим кейсом придумывания метрик под конкретную задачу: как сделать управление выручкой на уровне компании более прозрачным

Управление выручкой в бизнесе с длинным циклом оказания услуги — это всегда вызов. Деньги поступают сразу, а признавать их в отчётности нужно месяцами, при этом клиенты могут уйти в любой момент, и часть дохода просто испарится. А если план не выполнен, кто будет нести ответственность: те, кто привлекает клиентов, или те, кто их сопровождает?

🥤 Так мы в Яндекс Практикуме придумали новые метрики, которые позволяют оценить вклад каждого подразделения в выручку компании.

👳 Читайте все подробности в карточках!

Подписывайтесь:
💬 @Yandex4Analytics
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
23👍11🔥11❤‍🔥1🤣1🤓1
🥤 Как данные меняют жизнь и продукт

Тем временем у подкаста «Потом доделаю» вышел новый выпуск! Его гостем стал Роман Халкечев, руководитель аналитики Яндекс Поиска и Рекламы. Получился очень живой и интересный разговор со множеством инсайтов: кое-какими делимся ниже.

🈂️ Data-driven-подход — это не только про числа

Классный аналитик знает, как презентовать выводы, которые у него получились. Не нужно заставлять дизайнеров или разработчиков продираться сквозь горы данных: нужно правильно донести смысл, который кроется за этими цифрами, и выдать конкретные action items на основе ваших общих целей.

В Яндексе мы стараемся принимать все решения на основе data-driven-подхода. У нас в компании всем понятна ценность аналитики, это важный драйвер бизнеса.

🈂️ Данных (почти) всегда недостаточно

Аналитик постоянно находится в ситуации, когда времени и информации не хватает, но решение принять нужно. И если у него никак не получается это сделать, начинается аналитический паралич: давайте посчитаем ещё вот это, проведём дополнительный эксперимент, дадим пользователям новую кнопку…

Одна из главных задач аналитика — увидеть этот момент, взять на себя риски и принять решение.

🈂️ Самый сложный собеседник для аналитика — это бывший аналитик, который стал продактом

Часто такие ребята просят не выводы, а «просто числа», чтобы проанализировать их самостоятельно. В этот момент теряется ценность аналитика как профессионала и искажается суть его работы. Мы ведь не просто интерфейс к данным. В противном случае зачем это всё?

📺 Также в выпуске: нетипичное поведение пользователей, влияние AI на рабочие условия и советы по развитию в новом контексте. Смотрите на платформах:

🔵 VK Видео
🔵 Ютуб
🔵 Рутуб
🔵 Mave

Подписывайтесь:
💬 @Yandex4Analytics
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1712🔥9
✉️ Приглашаем на дружеский митап аналитиков

Если вы работаете с данными, владеете Python и у вас от 3 лет опыта — приходите в штаб-квартиру Яндекса 25 октября! Ребята из Yandex Crowd и команды информационной безопасности расскажут, над чем сейчас работают и в чём состоит специфика их профессий.

В программе шесть выступлений:

🔵 Андрей Молотов, руководитель аналитики и данных Yandex Crowd, раскроет внутреннее устройство и принципы работы аналитической команды

🔵 Екатерина Нешатаева, руководитель службы аналитики Yandex Crowd. Покажет, с какими задачами сталкивается команда

🔵 Дарья Шатько, руководитель службы Yandex Crowd ML. Объяснит, как ребята автоматизируют краудсорс

🔵 Андрей Будилов, руководитель Антифрода. Покажет, как защищать сервисы и пользователей от мошенничества, накруток и спама

🔵 Ислам Умаров, руководитель группы универсального антифрода. Расскажет, как построить ML‑детекцию фрода в UGC

🔵 Григорий Сафьянов, ведущий аналитик-разработчик. Прочитает доклад про Антиробота и особенности задач онлайн-классификации

🗳 После докладов проведём диагностику навыков аналитики и математической статистики. Если пройдёте успешно, то в ближайшие два года засчитаем ваш результат как техническую секцию при собесе в Яндекс 😎

Регистрируйтесь по ссылке

Подписывайтесь:
💬 @Yandex4Analytics
Please open Telegram to view this post
VIEW IN TELEGRAM
7💅3🔥1
🧑‍💻 Как мы прокачали контроль качества поддержки с помощью LLM

Меня зовут Дарья Шатько, я руководитель ML-группы в Yandex Crowd. Сегодня я расскажу, как мы с моим коллегой Антоном Удаловым внедряли большие языковые модели в контроль качества клиентской поддержки.

Нашей задачей было автоматизировать проверку 4,5 миллиона диалогов поддержки в месяц. Ручной контроль покрывал лишь 3% из них. При такой выборке редкие, но критические ошибки могли попадаться всего пару раз за несколько месяцев. И системно работать над ними было невозможно.

🈂️ Что мы пробовали до внедрения AI

Мы начинали с использования регулярных выражений. Они помогали нам отлавливать по-настоящему грубые ошибки, но всё, что сложнее стоп-слов и категорий, становилось для них непосильной задачей.

На следующем этапе мы протестировали иерархические модели и классификаторы на основе архитектуры BERT. Однако ключевым ограничением стало недостаточное количество данных для редких классов ошибок. Это не позволило нам достичь на тестах значения macro-F1 выше 65%.

🈂️ Какие сложности нас поджидали в начале работы с LLM

Мы собрали один комплексный промпт, который включал полный текст диалога и список из 20 критериев оценки модели. А для повышения точности мы дополнили его few-shot-примерами. Но… упёрлись в лимит контекста, а система породила волну ложных срабатываний.

В итоге LLM потеряла способность к обобщению и начала классифицировать только те ошибки, которые точно соответствовали предоставленным шаблонам.

🈂️ Что нам помогло сделать всё правильно

🔵 Golden-датасет с ручной проверкой и трёхбалльной оценкой работы модели

🔵 Отказ от монструозного промпта в пользу многоступенчатого LLM-flow

🔵 Версионирование промптов и превращение обычного текста в тестируемый артефакт

🔵 LLM-as-a-judge для ускорения оценки гипотез с порогом уверенности 85%

Сейчас наш пайплайн закрывает ≈50% проверок в почтовом и чатовом каналах клиентской поддержки, а у руководителей появилось больше информации, где и у каких операторов возникают трудности. Это позволяет дорабатывать обучения и инструкции по работе с продуктами.

А полную статью с архитектурой, промптами и выводами читайте на Хабре.

Подписывайтесь:
💬 @Yandex4Analytics
Please open Telegram to view this post
VIEW IN TELEGRAM
6👍6🔥4🤓1
This media is not supported in your browser
VIEW IN TELEGRAM
🏆 Yandex Cup: увидимся в Стамбуле

Хотите посмотреть на Босфор, прогуляться по узким улочкам Стамбула и погладить котиков? Тогда оставляйте заявку на Yandex Cup до 29 октября. Финал пройдёт в декабре — организаторы запланировали не только соревнование, но и культурную программу: экскурсии, прогулки по городу и закаты над проливом.

🈂️ О соревновании

Yandex Cup — это соревнование для разработчиков с призовым фондом 12 миллионов рублей. Участники выбирают одно из шести направлений: «Бэкенд», «Алгоритм», «Мобильная разработка», «Фронтенд», «Аналитика» или «Машинное обучение».

Задачи требуют уверенного владения Python и SQL, понимания теории вероятностей и статистики. Участникам предстоит формулировать гипотезы и проверять их статистически, конструировать метрики, разрабатывать и реализовывать алгоритмы анализа данных, писать код на Python и SQL, а там, где это оправдано, подключать элементы машинного обучения.

Аналитик работает как огранщик. Из необработанного массива данных делает точный инструмент для решения задачи: убирает лишнее, формулирует гипотезы, проверяет их и получает выводы, на которые можно опереться.

🈂️ Как попасть в финал

Нужно зарегистрироваться до 29 октября и пройти 2 ноября обязательный онлайн-этап — квалификацию.

🈂️ Финал

Пройдёт 5–7 декабря в тематике Codecraft. Участники будут решать задачи, вдохновлённые турецким крафтом — от каллиграфии до ювелирного дела.

Регистрируйтесь и встретимся в Стамбуле.

Подписывайтесь:
💬 @Yandex4Analytics
Please open Telegram to view this post
VIEW IN TELEGRAM
5
🗺️ Atlas для Яндекса: анализируем ураганы и концерты «Руки вверх»

Привет! Меня зовут Анна Крючкова, я руковожу службой аналитических платформ в Яндекс Go. Сегодня расскажу вам про одну из наших ключевых систем — SaaS-платформу Atlas. Она помогает нашим аналитикам визуализировать данные, находить и проверять гипотезы и оперативно делиться инсайтами.

Что умеет Atlas

🔵 Раскрашивать метрики на карте по их интенсивности в конкретной геолокации, работать с показателями в реальном времени, создавать интерактивные дашборды и мониторить ход тестов.

🔵 А ещё выделять нужные зоны на карте для детального изучения, сравнивать периоды и накладывать метрики друг на друга.

🔢 В общем, это настоящий аналитический комбайн.

🧑‍💻 За время работы вокруг системы накопилось много интересных кейсов. На платформе мы наблюдали за ураганом «Орхан» в Москве, сигналили водителям о концертах и смотрели, какой тариф чаще всего выбирают на Патриках.

Про эти и другие истории читайте в полной статье на Хабре. Внутри собрали наглядные примеры работы Atlas.

💡 К слову, платформа может пригодиться и вам: в логистике, финтехе, телекоме, ретейле, где важна гео- и реалтайм-визуализация.

Подписывайтесь:
💬 @Yandex4Analytics
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥117👍6
5 билетов, 4 часа, 3 задачи…

В преддверии Матемаркетинга мы устроили соревнование, в котором аналитики решали задачки на время. Пришло время узнать имена тех, кто справился с этим на отлично и получил от нас билет на конференцию в подарок.

🧑‍💻 Первые пять аналитиков, которые решили задачки быстрее всех:

🔵 Владимир Солоха, ФТИ им. А.Ф. Иоффе
🔵 Сергей Лукьянов
🔵 Любовь Шувалова, Газпромбанк
🔵 Анна Першина, Avito Tech
🔵 Елена Филатова, МТС

Поздравляем победителей! И будем рады познакомиться вживую уже 20 и 21 ноября! Проверяйте почту, награда ждёт вас там 🎁

А ещё скоро поделимся с вами, что мы готовим для гостей на конференции. Stay tuned!

💠 Увидимся на Матемаркетинге

Подписывайтесь:
💬 @Yandex4Analytics
Please open Telegram to view this post
VIEW IN TELEGRAM
10❤‍🔥5🥰4👏42
Скорость или стоимость? Вот в чём вопрос

Рободоставка — это не только про крутое железо и искусственный интеллект. На деле это сложная система, где технологии, метрики и операции должны работать как часы.

Меня зовут Влад Немиро, я руководитель аналитики рободоставки Яндекса. И на конференции Data Driven 2025 я рассказывал, как мы управляем этим сложным сервисом и считаем, что выгодно бизнесу: сделать доставку быстрее или дешевле.

🤖 Три кита рободоставки

🔵 Технологии

Комплекс сенсоров, моторов, систем AI для навигации и планирования маршрутов. Одна из метрик данного направления — точность предсказания времени прибытия.

🔵 Продукт

Это опыт пользователя. Мы смотрим, как часто люди выбирают робота вместо курьера и требуется ли им помощь службы поддержки.

🔵 Операции

В эту часть входят удалённые операторы, которые помогают роботу в сложных ситуациях, логистика и ремонт.

Все эти компоненты связаны. И мы должны управлять ими как единой системой.

📖 Дерево метрик и искусство размена

Не бывает так, чтобы всё стало одновременно и лучше, и дешевле. Вся суть управления — в поиске баланса.

Мы можем сделать доставку быстрее, выбрав более короткий, но сложный маршрут. Но на этом маршруте робот будет чаще звать на помощь оператора. В итоге:

Скорость вырастет, пользователи будут довольны

Увеличится нагрузка на операторов, а значит, стоимость доставки станет выше


Именно поэтому мы построили дерево метрик, которое связывает наши бизнес-показатели (например, себестоимость заказа) с метриками каждого маленького компонента. Это помогает нам принимать решения. Например, сегодня бизнесу выгоднее вложиться в скорость и привлечь больше клиентов, а завтра — в экономию и снизить операционные издержки.

Чтобы принять то или иное решение, мы задаём себе вопросы:

🔵 Что мешает бизнесу расти больше всего? Если не хватает пользователей — фокусируемся на продуктовых метриках (точность ETA, удобство). Если бизнес упирается в высокую стоимость — оптимизируем операции и технологии

🔵 Достаточно ли мы уже улучшили? Не нужно делать идеальный алгоритм, если дальнейшие улучшения незначительно влияют на общий рост. Мы ищем точку, где 20% усилий дают 80% результата, и идём дальше

📺 А все подробности ищите в записи моего доклада на ютубе или в VK Видео на Data Driven 2025

🗳 Кстати, мы уже планируем программу конференции Data Driven на следующий год. Если вы хотите стать участником — подпишитесь на новости. И мы отправим вам письмо, когда откроется регистрация.

Подписывайтесь:
💬 @Yandex4Analytics
Please open Telegram to view this post
VIEW IN TELEGRAM
17🔥7❤‍🔥6
🐚 Как сделать дашборд лучшим местом для общения

BI-аналитику мало собрать идеальную панель. Нужно ещё сделать так, чтобы дашборд оставался живым и актуальным, даже если автор уже давно пересел за новые проекты. А ещё нужно обеспечить понятные и простые механизмы фидбэка для новых пользователей.

👳 Как вдохнуть жизнь в дашборд и превратить его в удобное пространство для коммуникации, рассказал в докладе на Data Driven Владимир Дмитриев, руководитель команды Core BI. А самое главное из его выступления мы перенесли в карточки

📺 Полный доклад Владимира смотрите на ютубе или в VK Видео. Материал будет полезен BI-аналитикам, дата-инженерам, а также руководителям аналитических отделов и тимлидам.

🔢 Другие выступления с трека Data to Artifacts конференции Data Driven тоже можно найти на ютубе или в VK Видео.

Подписывайтесь:
💬 @Yandex4Analytics
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍16🔥86🐳2