Рассказывает Анжелика Кольцова, аналитик из Яндекс Лавки. За последний год команда автоматизировала три больших процесса:
Подписывайтесь:
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤16🔥11👍7❤🔥2🥰1
Привет! На связи Диля Хакимова. Я из команды экспериментальной платформы Laba в Яндекс Go: помогаю руководителям и аналитикам быстро получать нужную им информацию с помощью A/B-тестирования.
В статистическом анализе легко запутаться. Мифы о нëм регулярно всплывают в разговорах с руководителями, на собеседованиях и даже среди коллег-аналитиков. Иногда заблуждения кажутся безобидными, но на деле могут привести к серьёзным ошибкам, неверным решениям и упущенным возможностям.
Подписывайтесь:
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥9❤4👍4🤓2
Речь о self-service-решении для сегментации пользователей. Бот помогает продактам и другим заинтересованным лицам быстро и без лишнего труда узнать размер той части пользователей, которая их интересует. И уберегает аналитиков от лишней операционки.
Подписывайтесь:
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥23❤7⚡4🌚1
Привет, это Лёша Гожев, руководитель аналитики Яндекс Путешествий. Знаете, все воспринимают лень как что-то плохое. Ещё в детстве родители говорили нам: «Хватит лениться! Сделай то, сделай это». А я убеждён, что лень может и должна приносить пользу.
В этом посте я постараюсь показать, почему настоящая аналитическая лень — не про прокрастинацию, а про разумную экономию ресурсов. Погнали!
Не делайте работу просто так. Перед любой задачей нужно задать себе два важных вопроса:
Это важно, потому что:
Расскажу про типичный кейс из практики. Ручной сбор данных для партнёров ежедневно занимает у менеджера 1–2 часа. Если мы потратим 10 часов на автоматизацию, то сэкономим команде больше 3 рабочих дней в месяц. Вроде бы звучит не очень масштабно, но теперь вспомните, что это не единственный отчёт и менеджер тоже не один 😉
Поэтому помните о хорошем правиле: если действие повторяется больше 3 раз, автоматизируйте его!
Для этого все средства хороши. Используйте:
В каких ситуациях достаточно приблизительных данных:
Например, нам нужно спрогнозировать эффект от новой функции:
Заведите себе базу знаний, обновляйте её после каждого нового кейса и храните там даже неудачные попытки. Один мой скрипт 2019 года с хитрым хаком неожиданно пригодился мне аж в 2024-м!
Что ещё стоит туда добавить:
P. S. А настоящий подвиг — репостнуть этот текст в свой канал или рабочий чат, чтобы другие аналитики тоже могли качественно полениться 😌
Подписывайтесь:
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥63❤26👍9🌚3
Делимся списком годных открытых ресурсов от ребят из Школы анализа данных. Подборка пригодится тем, кто только вкатывается в ML или хочет самостоятельно прокачаться в соседней области. Скидывайте пост вашим знакомым джунам — пусть учатся!
Вот ссылки:
А ещё интенсивы:
Из курсов на GitHub посоветуем один про алгоритмы, потому что они вечные и никогда не устареют:
И интересную подборку не от ШАД:
Подписывайтесь:
Please open Telegram to view this post
VIEW IN TELEGRAM
❤16🔥14❤🔥5🤓2✍1🆒1
Она понадобится для решения сегодняшней задачи — продолжаем вспоминать базовую теорию на простых примерах. Предыдущую задачу разбирали вот тут. А вот и новая.
В одной компании захотели проверить, знают ли стажёры SQL. 30% стажёров оказались готовы к тесту, остальные — нет. С тестом справились 90% подготовленных стажёров и только 20% неподготовленных.
Если стажёр успешно прошёл тест, какова вероятность, что он был готов к нему?
#задачи_для_аналитиков
Подписывайтесь:
Please open Telegram to view this post
VIEW IN TELEGRAM
❤10👀3🔥2🦄2🐳1
А вот и ответ: проверьте себя!
Разобраться, что известно, а что надо найти, — уже половина решения. Введём обозначения:
• P(Готов) = 0,3 — вероятность того, что стажёр был готов к тесту.
• P(Сдал|Готов) = 0,9 — вероятность того, что стажёр справился с тестом и был к нему готов.
• P(Сдал|НеГотов) = 0,2 — вероятность того, что стажёру повезло пройти тест без подготовки.
• P(НеГотов) = 0,7 — вероятность того, что нерадивый стажёр получил заслуженный неуд.
P(Сдал) = 0,3 × 0,9 + 0,7 × 0,2 = 0,27 + 0,14 = 0,41
P(Готов|Сдал) = [P(Сдал|Готов) × P(Готов)] / P(Сдал) = (0,9 × 0,3) / 0,41 ≈ 0,6585 ≈ 65,9%
Подписывайтесь:
Please open Telegram to view this post
VIEW IN TELEGRAM
❤53🔥14❤🔥4🎉2
Это AI Dev Day — первый митап Яндекса на эту тему. Мы обсудим, как ИИ-агенты ускоряют процессы, помогают разработчикам работать с кодом и автоматизировать рутинные задачи.
27 июля ждём аналитиков и разработчиков, которые ищут способы побороть рутину и повысить свою эффективность.
Для этого мы подготовили 2 формата обмена опытом:
Подписывайтесь:
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥4❤2
Соскучились по интенсивам? Мы — да. Поэтому предлагаем вам с головой погрузиться в А/В-тестирование вместе с экспертом Школы анализа данных. Здесь вы отточите свои знания статистики, поймёте, как проводят А/В-тесты в Яндексе, и получите набор инструментов на Python, которые сразу сможете применить в работе.
Аналитик-разработчик и эксперт Яндекса Диля Хакимова расскажет:
Внимание: спойлеры к интенсиву 🤫
Математические расчёты можно применять уже на этапе планирования для оценки длительности эксперимента. Симуляции же подбирают тот статистический критерий, который подходит именно под вашу бизнес-задачу. В итоге благодаря грамотным статистическим методам банальное «стало лучше/хуже» превращается в глубокий бизнес-анализ и подробную оценку рисков.
Кому пригодится интенсив?
Чему научатся участники?
Подписывайтесь:
Please open Telegram to view this post
VIEW IN TELEGRAM
❤30👍4🔥2🦄2
В Яндекс Доставке мы возим очень разные вещи: от горячих бургеров до новых айфонов. Задача сервиса в том, чтобы быстро найти на каждую посылку подходящего курьера. Но если мы хотим доставлять эффективно, заказы приходится объединять, чтобы можно было отвезти несколько товаров за один присест. А для этого нужна сложная система, которая не допустит, чтобы бургер остыл, пока курьер ездил за айфоном.
Подписывайтесь:
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥10❤6👍3⚡1
Что удивительно: это не помешало выдерживать рантайм-нагрузку и привело к результату лучше всех ожиданий. Подробности рассказывает Марк Нарусов, ML-разработчик группы рекомендательных сервисов в Лавке.
Зачем вообще нужна кандидатогенерация? Когда речь идёт о миллионах или миллиардах объектов
Подписывайтесь:
Please open Telegram to view this post
VIEW IN TELEGRAM
❤2👍2🔥2⚡1🤔1
Привет, это Александр Исаков, руководитель группы прогноза в Яндекс Лавке. Я считаю, что в резюме кандидата должны быть личные проекты: иногда они показывают ваши навыки и умения даже лучше, чем рабочие задачи.
Смело кидайте ссылочку на репозиторий потенциальному работодателю! А если подходящих пет-проектов у вас пока нет, вот несколько занятных идей:
Данные: PubMed MultiLabel Text Classification Dataset MeSH
Бейзлайн: логистическая регрессия
Что делаем:
Как улучшить:
Данные: MovieLens Dataset
Бейзлайн: матричные разложения (Matrix Factorization). Пример кода есть вот тут
Что делаем:
Как улучшить:
разложение, нейросетевые методы работы с рекомендациями.
Данные: CIFAR-10 Dataset (или любой другой с кагглов)
Бейзлайн: любая (желательно самописная) CNN-сеточка
Что делаем:
Как улучшить:
Подписывайтесь:
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥18❤6⚡2🥴2👾2👍1🆒1
Вот и прошёл наш первый митап в Санкт-Петербурге — получилось очень душевно. Вы правда крутые, и мы были рады затусить вместе. Надеемся, что вам тоже всё понравилось.
Не получилось прийти на митап? Не беда — специально для вас выложили записи докладов:
Подписывайтесь:
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥26❤13👍5🦄2🌚1