Как считать retention: от базовых формул до продвинутых метрик
Привет! На связи Илья Ковалев, ментор курса «Аналитик данных» 👋🏻
Retention или возвращаемость — одна из ключевых метрик в аналитике продукта. Она позволяет ответить на вопрос: сколько пользователей, зарегистрировавшихся в определенный день, вернулись на N-й день?
Привлечь нового пользователя гораздо дороже, чем удержать существующего, поэтому важно следить за этой метрикой. Если retention низкий — пользователи оттекают быстрее, чем успевают принести прибыль компании, и вы просто сжигаете бюджет на привлечение.
Например, 1000 пользователей зарегистрировались 1 января. 300 из них вернулись 8 января (Day 7). Retention Day 7 = 300/1000 = 30%.
Очевидно, что каждый раз считать возвращаемость вручную — задача не для дата-аналитика, поэтому смоделируем запрос в SQL.
Допустим, у нас есть таблица events с событиями пользователей формата
Тогда, чтобы посчитать retention, нам необходимо:
1. Найти дату первой активности каждого пользователя (
2. Для каждой активности пользователя посчитать, на какой день после регистрации она произошла;
3. Посчитать, сколько уникальных пользователей было активно на каждый
4. Поделить на размер когорты.
SQL-запрос будет выглядеть так:
Какие окна retention смотреть, зависит от типа продукта и от частотности сервиса. Для частотных сервисов обычно смотрят на:
🟠 Retention Day 1 — критичный показатель для всех продуктов. Показывает качество онбординга. Если пользователь не вернулся на следующий день, он скорее всего не вернётся вообще.
🟠 Retention Day 7. Показывает, прошёл ли пользователь период «знакомства» с продуктом.
🟠 Retention Day 30 — долгосрочное удержание. Если пользователь активен через месяц, он с большой вероятностью останется надолго.
Для низкочастотных (B2B-сервисов, фудтеха) окно возвращаемости может быть выше.
Retention — базовая метрика для любого продукта. Научитесь считать её правильно, и вы сможете отвечать на главный вопрос: возвращаются ли пользователи в ваш продукт?
📊 Simulative
Привет! На связи Илья Ковалев, ментор курса «Аналитик данных» 👋🏻
Retention или возвращаемость — одна из ключевых метрик в аналитике продукта. Она позволяет ответить на вопрос: сколько пользователей, зарегистрировавшихся в определенный день, вернулись на N-й день?
Привлечь нового пользователя гораздо дороже, чем удержать существующего, поэтому важно следить за этой метрикой. Если retention низкий — пользователи оттекают быстрее, чем успевают принести прибыль компании, и вы просто сжигаете бюджет на привлечение.
Формула простая:
Retention Day N = (Количество пользователей вернувшихся на N-й день / Общее количество пользователей в когорте) x 100%
Например, 1000 пользователей зарегистрировались 1 января. 300 из них вернулись 8 января (Day 7). Retention Day 7 = 300/1000 = 30%.
Очевидно, что каждый раз считать возвращаемость вручную — задача не для дата-аналитика, поэтому смоделируем запрос в SQL.
Допустим, у нас есть таблица events с событиями пользователей формата
user_id | event_timestamp | event_name и мы хотим посчитать retention в окнах 1/7/14/30 дней. Тогда, чтобы посчитать retention, нам необходимо:
1. Найти дату первой активности каждого пользователя (
cohort_date);2. Для каждой активности пользователя посчитать, на какой день после регистрации она произошла;
3. Посчитать, сколько уникальных пользователей было активно на каждый
day_number;4. Поделить на размер когорты.
SQL-запрос будет выглядеть так:
WITH first_activity AS (
SELECT
user_id,
MIN(DATE(event_timestamp)) AS cohort_date
FROM events
GROUP BY user_id
),
user_activity AS (
SELECT
e.user_id,
fa.cohort_date,
DATE(e.event_timestamp) AS activity_date,
DATE_DIFF(DATE(e.event_timestamp), fa.cohort_date, DAY) AS day_number
FROM events e
JOIN first_activity fa USING (user_id)
),
cohort_sizes AS (
SELECT
cohort_date,
COUNT(DISTINCT user_id) AS cohort_size
FROM first_activity
GROUP BY cohort_date
)
SELECT
ua.cohort_date,
ua.day_number,
COUNT(DISTINCT ua.user_id) AS returned_users,
COUNT(DISTINCT ua.user_id) * 100.0 / cs.cohort_size AS retention_rate
FROM user_activity ua
JOIN cohort_sizes cs USING (cohort_date)
WHERE ua.day_number IN (1, 7, 14, 30)
GROUP BY ua.cohort_date, ua.day_number, cs.cohort_size
ORDER BY ua.cohort_date, ua.day_number;
Какие окна retention смотреть, зависит от типа продукта и от частотности сервиса. Для частотных сервисов обычно смотрят на:
Для низкочастотных (B2B-сервисов, фудтеха) окно возвращаемости может быть выше.
Практические советы:1️⃣ Всегда смотрите retention в разрезе когорт, а не общий по всей базе. Когорты могут сильно различаться.2️⃣ Сегментируйте retention по источникам трафика. Часто оказывается, что дорогой канал приводит пользователей с низким retention.3️⃣ Retention — это про продукт, а не про маркетинг. Если Retention Day 1 низкий — проблема в онбординге или в product-market fit.4️⃣ Не путайте retention и churn. Churn = 1 - Retention. Если retention 30%, то churn 70%.5️⃣ Сравнивайте retention до и после запуска фичей. Это один из лучших способов оценить их влияние на продукт.
Retention — базовая метрика для любого продукта. Научитесь считать её правильно, и вы сможете отвечать на главный вопрос: возвращаются ли пользователи в ваш продукт?
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥16❤8 5
Привет! На связи Мария Жарова, ML-engineer Wildberries 👋
Если вы когда-нибудь работали с данными пользователей, то знаете: клиенты — это не одна большая одинаковая масса. Это скорее разношёрстная толпа со своими привычками, поведением и желанием покупать (или не покупать). И в какой-то момент бизнесу жизненно важно разобраться:
И здесь часто начинается хаос:
🟠 Маркетинг говорит: «Давайте дадим скидку всем!»
🟠 Финансы хватаются за голову: «Нет, давайте никому не дадим!»
🟠 А дата-сайентист сидит посередине и вспоминает, что есть простой способ разложить клиентов по полочкам, причём без высшей математики, без нейросетей и без миллионных бюджетов.
И этот способ — кластеризация! Она помогает автоматически «увидеть» эти сегменты, исходя из закономерностей в данных: группирует похожих клиентов, исходя из их поведения / предпочтений и т. д. Получается как будто маленькая карта характеров: можно найти лояльных фанатов бренда, охотников за скидками и холодных наблюдателей.
И каждому сегменту можно сделать уникальное, индивидуальное, а главное — интересное именно им предложение 😊 И на практике это работает куда лучше, чем гадать интуитивно.
Хотите разобраться, как это сделать своими руками? Приходите сегодня на вебинар, где мы разберём:
➖ Что такое кластеризация на понятных примерах (без страшных формул);
➖ Какие существуют рецепты подготовки данных, чтобы модель действительно увидела осмысленные сегменты;
➖ Как интерпретировать кластеры и превращать их в пользу для бизнеса.
Если хотите наконец понять, как машины «видят» группы там, где людям кажется сплошной шум, — присоединяйтесь👇
➡️ Зарегистрироваться на вебинар
📊 Simulative
Если вы когда-нибудь работали с данными пользователей, то знаете: клиенты — это не одна большая одинаковая масса. Это скорее разношёрстная толпа со своими привычками, поведением и желанием покупать (или не покупать). И в какой-то момент бизнесу жизненно важно разобраться:
Кому давать скидки? Кому показывать премиум-ассортимент? А кто вообще просто заходит «посмотреть», но никогда ничего не покупал?
И здесь часто начинается хаос:
И этот способ — кластеризация! Она помогает автоматически «увидеть» эти сегменты, исходя из закономерностей в данных: группирует похожих клиентов, исходя из их поведения / предпочтений и т. д. Получается как будто маленькая карта характеров: можно найти лояльных фанатов бренда, охотников за скидками и холодных наблюдателей.
И каждому сегменту можно сделать уникальное, индивидуальное, а главное — интересное именно им предложение 😊 И на практике это работает куда лучше, чем гадать интуитивно.
Хотите разобраться, как это сделать своими руками? Приходите сегодня на вебинар, где мы разберём:
Если хотите наконец понять, как машины «видят» группы там, где людям кажется сплошной шум, — присоединяйтесь
Please open Telegram to view this post
VIEW IN TELEGRAM
❤7🔥7 3
Soft skills в ML: почему навык коммуникации критичнее знания SOTA?
Привет! На связи Кристина Желтова, ментор курса «ML-инженер» 👋🏻
Среди начинающих специалистов бытует мнение, что ключ к карьерному успеху — крепкие харды и знание нюансов свежих архитектур и технологий. Без hard skills действительно невозможно успешно решать рабочие задачи, однако практика показывает, что именно «софты» часто становятся решающим фактором карьерного роста ML-инженера.
Список инструментов в ML-стеке постоянно расширяется, новые архитектуры появляются каждый месяц, но кое-что остаётся неизменным — необходимость работать с людьми, объяснять решения и адаптироваться к изменениям.
🤔 Представьте ситуацию: вы потратили месяцы на разработку качественной и технически мощной антифродовой модели, но когда пришло время презентации перед стейкхолдерами, ваша техническая экспертиза стала барьером в коммуникации — нюансы предобработки, архитектурные особенности модели, даже ML-метрики и результаты валидации часто звучат для заказчиков как «белый шум», за которым они пытаются разглядеть что-то важное и понятное для себя, если у них ещё остались на это силы и время.
Когда-то давно у меня была подобная ситуация, когда во время демонстрации результатов и дорожной карты решения я радостно рекламировала крутые подходы с топологическим анализом данных и мощной аналитикой для улучшения моделей, хотя по сути их интересовало далеко не это.
Основные советы, которые помогут сразу быть на одной волне с заказчиком можно уместить в несколько тезисов:
➖ Начинайте коммуникацию с проблемы. Не с архитектуры модели и тяжеловесных подробностей, а с задачи, которую решаете и возможных бизнес-эффектов решения.
➖ Объясняйте не только возможности модели, но и её ограничения. Это строит доверие и предотвращает нереалистичные ожидания.
➖ Подстраивайте презентацию и рассказ под аудиторию. Краткий и ёмкий отчет для руководства, более подробные слайды для менеджеров проектов и технические детали для коллег-разработчиков.
Но главное — не противопоставляйте soft skills и hard skills, развивайте их параллельно. Глубокие технические знания дают возможность успешно решать задачи, а развитые «мягкие» навыки помогают эффективно презентовать эти задачи и извлекать из них максимальную пользу для карьеры.
➡️ Записаться на поток
📊 Simulative
Привет! На связи Кристина Желтова, ментор курса «ML-инженер» 👋🏻
Среди начинающих специалистов бытует мнение, что ключ к карьерному успеху — крепкие харды и знание нюансов свежих архитектур и технологий. Без hard skills действительно невозможно успешно решать рабочие задачи, однако практика показывает, что именно «софты» часто становятся решающим фактором карьерного роста ML-инженера.
Список инструментов в ML-стеке постоянно расширяется, новые архитектуры появляются каждый месяц, но кое-что остаётся неизменным — необходимость работать с людьми, объяснять решения и адаптироваться к изменениям.
Многие исследования показывают, что команды с высоким эмоциональным интеллектом демонстрируют лучшую производительность. В ML-проектах, где техническая сложность идет рука об руку с неопределённостью результата, этот показатель выкручен на максимум.
Когда-то давно у меня была подобная ситуация, когда во время демонстрации результатов и дорожной карты решения я радостно рекламировала крутые подходы с топологическим анализом данных и мощной аналитикой для улучшения моделей, хотя по сути их интересовало далеко не это.
Основные советы, которые помогут сразу быть на одной волне с заказчиком можно уместить в несколько тезисов:
Но главное — не противопоставляйте soft skills и hard skills, развивайте их параллельно. Глубокие технические знания дают возможность успешно решать задачи, а развитые «мягкие» навыки помогают эффективно презентовать эти задачи и извлекать из них максимальную пользу для карьеры.
Кстати, с хардами я могу помочь! Уже завтра стартует новый поток курса «ML-инженер», где вы научитесь создавать модели машинного обучения, строить рекомендательные системы и обучать нейросети. Время пришло, решайтесь!
Please open Telegram to view this post
VIEW IN TELEGRAM
❤6🔥2 2
Simulative
Готовим ещё один полезный вебинар: как стать аналитиком данных в 2026 году В 2026 году спрос на аналитиков данных продолжит расти: компании ищут людей, умеющих превращать хаотичные данные в понятные бизнес-решения. Для новичков этот путь кажется сложным —…
Поговорим, как выйти аналитику на первую работу в 2026 году, разберём кейсы новичков и инсайты нанимающего менеджера из Яндекс eLama
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥5❤2 1
Приглашаем на день открытых дверей Simulative
Привет, на связи Андрон 👋
В 2023 году я основал Simulative, потому что видел одну проблему: большинство людей, которые заканчивают обучение, так и не находят работу. Они учились год-два, но на собеседованиях, оказывалось, что учили они не то. За последние два года мы трудоустроили множество студентов благодаря тому, что учим самому необходимому на реальных кейсах бизнеса.
Приглашаю на день открытых дверей Simulative, на котором обсудим:
➖ Как мы прошли путь от первых студентов до более 2 000 учеников;
➖ Что такое курсы-симуляторы, и как студенты учатся на кейсах из реального бизнеса;
➖ Как учиться, чтобы быстро достигать результат;
➖ Перспективы стать аналитиком в 2026 году и что ждёт джунов;
➖ Почему зачастую не получается найти работу после курсов и как этого избежать.
❗️ Встречаемся 25 ноября в 19:00 МСК
➡️ Зарегистрироваться на вебинар
📊 Simulative
Привет, на связи Андрон 👋
В 2023 году я основал Simulative, потому что видел одну проблему: большинство людей, которые заканчивают обучение, так и не находят работу. Они учились год-два, но на собеседованиях, оказывалось, что учили они не то. За последние два года мы трудоустроили множество студентов благодаря тому, что учим самому необходимому на реальных кейсах бизнеса.
Приглашаю на день открытых дверей Simulative, на котором обсудим:
Please open Telegram to view this post
VIEW IN TELEGRAM
Решим задачу по теорверу? Говорят, такая задача может встретиться на собеседованиях:
📊 Simulative
Из мешка с поровну перемешанными чёрными и белыми шарами достают не глядя один шар и кладут его в ящик. После этого в ящик добавляют белый шар, перемешивают и наугад достают один из них. Он оказывается белым. Какова вероятность, что и второй шар, который остался в ящике, тоже белый?
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥9 5❤3😁2
Чёрная пятница уходит, а вместе с ней — возможность получить третий курс в подарок!
Только до конца дня 22 ноября: покупаете два курса — и получаете третий, самый дорогой, в подарок. Отличный шанс закрыть все ключевые навыки fullstack-аналитика и выйти на новый уровень.
Для новичков — это быстрый путь к первой работе. Для продолжающих — возможность увидеть аналитику целиком: от визуализации до пайплайнов, от витрин до хранения данных.
⚠️ Напоминаем: акция не суммируется с другими скидками на Чёрную пятницу.
Время на исходе — забронируйте участие прямо сейчас!
➡️ Забронировать место
📊 Simulative
Только до конца дня 22 ноября: покупаете два курса — и получаете третий, самый дорогой, в подарок. Отличный шанс закрыть все ключевые навыки fullstack-аналитика и выйти на новый уровень.
Курсы, участвующие в акции:🟠 Аналитик данных;🟠 Инженер данных;🟠 BI-аналитик.
Для новичков — это быстрый путь к первой работе. Для продолжающих — возможность увидеть аналитику целиком: от визуализации до пайплайнов, от витрин до хранения данных.
Время на исходе — забронируйте участие прямо сейчас!
Please open Telegram to view this post
VIEW IN TELEGRAM
❤5🔥3 2
Привет, это Андрон! 👋🏻
Представьте, что вы аналитик в крупном ритейлере и ваша зона ответственности — ассортиментная матрица (более 100 000 SKU!).
Каждый месяц вам нужно принимать решения по каждому товару — какие выводим, на какие делаем акции, какие взять на пристальный контроль и так далее. Для решения этой задачи вы используете классический подход — двумерный ABC-анализ (по выручке и маржинальности).
Допустим, вы провели анализ и увидели, что интересующий вас товар попал в группу BB. Это хорошо или плохо? Какие выводы на основании этого можно сделать?
В вакууме — почти никакие, только если что-то общее типа «давайте запустим акцию, чтобы увеличить продажи и товар попал в группу А по выручке». Но есть ли в этом смысл, если товар попадет в группу С по маржинальности? А если вообще это уже пробовали... В общем, без контекста — сложно.
И помочь в этом может одна простая деталь. Нужно просто поменять формат отображения ABC-анализа.
В 99% случаев, что я встречал, в отчётах выводится информация о товаре и его группе только за рассматриваемый период. А на самом деле нам супер важно видеть динамику! Посудите сами:
➖ Сценарий 1. Товар был маржинальным (группа А), но продавался плохо (группа С). Мы сделали акцию и за несколько месяцев плавно вывели его в группу BB. Да, маржинальность просела, но выросли продажи и в абсолюте мы заработали больше! Это значит, что мы идем в верном направлении.
➖ Сценарий 2. Товар продавался хорошо (групп А) и маржинальность была в порядке (группа А). Но мы сделали акцию и продажи упали (так работает для элитных товаров, называется парадокс Веблена). Это значит, что пора бить тревогу и откатывать изменения.
➖ Сценарий 3. Товар продавался нормально (группа BB) и ничего не поменялось за несколько месяцев, т.к. мы с товаром ничего не делали. Это нейтральный сценарий — можно поработать с товаром, если есть ресурсы на это.
Пример такого отчёта закинул в комментарии. По строкам — товары. По столбцам — периоды. В ячейках — группы по ABC-анализу с подсветкой (светофор в зависимости от хорошести группы). Также есть подсветка букв: если показатель падает относительно предыдущего периода, он выделяется красным. Если растёт — зеленым. Если не меняется — чёрным.
🤔 Вообще в аналитике таких тонкостей очень много. Я уже много раз убедился, что опытные и начинающие аналитики владеют абсолютно одинаковыми инструментами. Разница лишь в том, правильно ли они их применяют и с каким КПД выжимают из них результат.
😘 😘 😘
А если хотите научиться выжимать 100% КПД из отчетов и различных анализов — приходите на последний в этом году поток моего тренинга «Как делать аналитику».
Тренинг — это двухмесячная программа с глубоким погружением в разные аналитические фреймворки: когортный анализ, реверс-инжиниринг, юнит-экономику и многое другое.
Например, тему из этого поста мы разбираем в занятии «Анализ больших ассортиментных матриц», но там примерно еще 5 часов контента про продвинутую аналитику ассортимента, кластеризацию, каннибализацию спроса, умный автозаказ и разные такие штуки)
Тренинг эволюционирует с каждым потоком — по просьбам участников большая часть занятий переведена в записанный формат (но лайвы всё равно будут!), увеличены дедлайны для сдачи домашек, добавлены новые темы. В общем, делаем всё, чтобы наносить вам непоправимую пользу 🙂
😶 Узнать подробности и записаться
📊 Simulative
Представьте, что вы аналитик в крупном ритейлере и ваша зона ответственности — ассортиментная матрица (более 100 000 SKU!).
Каждый месяц вам нужно принимать решения по каждому товару — какие выводим, на какие делаем акции, какие взять на пристальный контроль и так далее. Для решения этой задачи вы используете классический подход — двумерный ABC-анализ (по выручке и маржинальности).
Допустим, вы провели анализ и увидели, что интересующий вас товар попал в группу BB. Это хорошо или плохо? Какие выводы на основании этого можно сделать?
В вакууме — почти никакие, только если что-то общее типа «давайте запустим акцию, чтобы увеличить продажи и товар попал в группу А по выручке». Но есть ли в этом смысл, если товар попадет в группу С по маржинальности? А если вообще это уже пробовали... В общем, без контекста — сложно.
И помочь в этом может одна простая деталь. Нужно просто поменять формат отображения ABC-анализа.
В 99% случаев, что я встречал, в отчётах выводится информация о товаре и его группе только за рассматриваемый период. А на самом деле нам супер важно видеть динамику! Посудите сами:
Видите, да? Один и тот же товар, одна и та же группа по ABC-анализу, но абсолютно разная интерпретация (и действия по итогу!) в зависимости от предыдущей динамики. Вот так всего одна мелочь (форма отчёта) может сильно повлиять на качество принимаемых решений.
Пример такого отчёта закинул в комментарии. По строкам — товары. По столбцам — периоды. В ячейках — группы по ABC-анализу с подсветкой (светофор в зависимости от хорошести группы). Также есть подсветка букв: если показатель падает относительно предыдущего периода, он выделяется красным. Если растёт — зеленым. Если не меняется — чёрным.
А если хотите научиться выжимать 100% КПД из отчетов и различных анализов — приходите на последний в этом году поток моего тренинга «Как делать аналитику».
Тренинг — это двухмесячная программа с глубоким погружением в разные аналитические фреймворки: когортный анализ, реверс-инжиниринг, юнит-экономику и многое другое.
Например, тему из этого поста мы разбираем в занятии «Анализ больших ассортиментных матриц», но там примерно еще 5 часов контента про продвинутую аналитику ассортимента, кластеризацию, каннибализацию спроса, умный автозаказ и разные такие штуки)
Тренинг эволюционирует с каждым потоком — по просьбам участников большая часть занятий переведена в записанный формат (но лайвы всё равно будут!), увеличены дедлайны для сдачи домашек, добавлены новые темы. В общем, делаем всё, чтобы наносить вам непоправимую пользу 🙂
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥7❤6 2
employeesdepartmentsЭти две таблицы хотят объединиться. Давайте поможем им:
https://simulative.ru/blog/sql-join
Please open Telegram to view this post
VIEW IN TELEGRAM
😁10 5❤3🔥1
В какой последовательности изучать BI-аналитику?
Если вы только начинаете свой путь в BI-аналитике, то наверняка сталкивались с огромным объёмом информации и вопросами:
🟠 Стоит ли учить именно этот инструмент (Power BI) или язык (SQL, Python, DAX)?
🟠 В каком порядке изучать темы, чтобы не запутаться?
🟠 Что нужно освоить в первую очередь, чтобы быстро войти в профессию и не тратить годы на бессистемное обучение?
Мы с командой подготовили для вас бесплатный роадмап по карьере BI-аналитика. Это пошаговый план, который поможет вам выстроить чёткую траекторию обучения и быстрее достичь профессиональных целей.
Роадмап включает:
✅ Последовательность изучения тем — от базовых до продвинутых;
✅ Приоритеты: что изучать в первую очередь, а что можно отложить;
✅ Специфические навыки для разных направлений в BI (визуализация данных, ETL-процессы, работа с большими данными и т. д.).
Скачивайте роадмап, сохраняйте его к себе и используйте как чек-лист, чтобы не сбиваться с пути и не тратить время на лишнее. Он поможет вам:
✨ Избавиться от путаницы в обучении;
✨ Сформировать чёткий план действий;
✨ Быстро стартовать карьеру BI-аналитика без лишних тревог.
📌 Забрать роадмап
📊 Simulative
Если вы только начинаете свой путь в BI-аналитике, то наверняка сталкивались с огромным объёмом информации и вопросами:
Мы с командой подготовили для вас бесплатный роадмап по карьере BI-аналитика. Это пошаговый план, который поможет вам выстроить чёткую траекторию обучения и быстрее достичь профессиональных целей.
Роадмап включает:
Скачивайте роадмап, сохраняйте его к себе и используйте как чек-лист, чтобы не сбиваться с пути и не тратить время на лишнее. Он поможет вам:
📌 Забрать роадмап
Please open Telegram to view this post
VIEW IN TELEGRAM
❤6🔥3 2
Simulative
Решим задачу по теорверу? Говорят, такая задача может встретиться на собеседованиях: Из мешка с поровну перемешанными чёрными и белыми шарами достают не глядя один шар и кладут его в ящик. После этого в ящик добавляют белый шар, перемешивают и наугад достают…
Решали задачу все выходные, и теперь делимся верным ответом. Кстати, его дал один из участников нашего комьюнити — вступайте в наш уютный чат👇🏻
🔥3❤2 1
Forwarded from Дмитрий Малахов
Ухожу, посыпая голову пеплом. Позор джунглям. Старая задачка, ответ 2/3 с абсолютно понятной логикой:
Кажется, что ответ на эту задачу будет 50% — или чёрный, или белый. Но не будем спешить.
Первое, что нам нужно понять — что из мешка могли достать как белый, так и чёрный шар, который потом положили в ящик.
После того как из ящика наугад вытащили белый шар, с оставшимся шаром сложилась такая ситуация:
остался чёрный шар, который мы достали из мешка;
остался белый шар, который мы достали из мешка;
остался белый шар, который мы сами добавили в ящик.
Обратите внимание, что третья ситуация возникает, когда мы вытаскиваем белый шар, который мы достали до этого из мешка (и он оказался белым). Получается, что у нас есть три равновероятных ситуации, то есть каждая из которых имеет вероятность ⅓. А раз вариантов с оставшимся белым шаром у нас два, то и вероятность того, что в ящике остался именно белый шар, равна 2 × ⅓ = ⅔.
Ответ: в ящике остался белый шар с вероятностью ⅔.
Кажется, что ответ на эту задачу будет 50% — или чёрный, или белый. Но не будем спешить.
Первое, что нам нужно понять — что из мешка могли достать как белый, так и чёрный шар, который потом положили в ящик.
После того как из ящика наугад вытащили белый шар, с оставшимся шаром сложилась такая ситуация:
остался чёрный шар, который мы достали из мешка;
остался белый шар, который мы достали из мешка;
остался белый шар, который мы сами добавили в ящик.
Обратите внимание, что третья ситуация возникает, когда мы вытаскиваем белый шар, который мы достали до этого из мешка (и он оказался белым). Получается, что у нас есть три равновероятных ситуации, то есть каждая из которых имеет вероятность ⅓. А раз вариантов с оставшимся белым шаром у нас два, то и вероятность того, что в ящике остался именно белый шар, равна 2 × ⅓ = ⅔.
Ответ: в ящике остался белый шар с вероятностью ⅔.
❤8🔥5 4👍1
Итоговый проект студента Simulative: от сырых API-данных до полноценной аналитической инфраструктуры
Сегодня делимся одним из тех проектов, которые лучше любых слов показывают, чему реально учатся наши студенты.
Студентка курса «Аналитик данных» Татьяна Агафонова собрала полный конвейер данных маркетплейса: от загрузки транзакций через API до интерактивных дашбордов в Metabase.
Вот что входит в проект:
➖ Инфраструктура для работы с данными маркетплейса, собранная с нуля;
➖ Первичная историческая загрузка всех доступных транзакций;
➖ Ежедневный инкремент продаж в 07:00 (данные за «вчера»);
➖ База PostgreSQL с нормализованной схемой;
➖ Дашборд в Metabase (через Docker) по продажам, ассортименту и клиентам;
➖ Два аналитических исследования: оптимизация ассортимента и маржинальности и поведение клиентской базы.
👩💻 Проект на GitHub
📈 Дашборд
Это отличный пример того, как студент за несколько месяцев проходит путь от «умения писать запросы» до создания рабочего аналитического продукта, который можно использовать в реальном бизнесе.
📊 Simulative
Сегодня делимся одним из тех проектов, которые лучше любых слов показывают, чему реально учатся наши студенты.
Студентка курса «Аналитик данных» Татьяна Агафонова собрала полный конвейер данных маркетплейса: от загрузки транзакций через API до интерактивных дашбордов в Metabase.
Вот что входит в проект:
📈 Дашборд
Это отличный пример того, как студент за несколько месяцев проходит путь от «умения писать запросы» до создания рабочего аналитического продукта, который можно использовать в реальном бизнесе.
💡 Если хотите делать такие же проекты, присоединяйтесь к курсу «Аналитик данных»! За 5 месяцев обучения вы научитесь основам аналитики и соберёте своё первое портфолио на реальных задачах бизнеса. Ближайший поток стартует 28 ноября.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥17❤7 3😁1
Какие вебинары будут на этой неделе?
Обсудим, как мы учим студентов аналитике в Simulative, а также поделимся лайфхаками портфолио, которое поможет быстрее найти работу.
📌 25 ноября, 19:00 МСК — «Как начать карьеру в аналитике в 2026 году: прогнозы, ошибки и рабочие схемы трудоустройства»
Андрон Алексанян, CEO Simulative, расскажет, что изменилось в 2025 году и как этим можно воспользоваться, чтобы быстрее найти работу уже в 2026-м. Он уже 2 года подряд делает такие прогнозы и пока попадание стопроцентное 🙂
➡️ Зарегистрироваться на вебинар
📌 26 ноября, 19:00 МСК — «Как новичку получить опыт и собрать портфолио, которое реально продает»
Даниил Джепаров, автор канала Data Study и аналитик в Сравни.ру, помог десяткам новичков быстро найти первую работу. Он даст честные ответы на главные вопросы новичков: как получить работу без опыта, сделать портфолио, которое реально смотрит бизнес, и выделиться среди других кандидатов.
➡️ Зарегистрироваться на вебинар
📊 Simulative
Обсудим, как мы учим студентов аналитике в Simulative, а также поделимся лайфхаками портфолио, которое поможет быстрее найти работу.
📌 25 ноября, 19:00 МСК — «Как начать карьеру в аналитике в 2026 году: прогнозы, ошибки и рабочие схемы трудоустройства»
Андрон Алексанян, CEO Simulative, расскажет, что изменилось в 2025 году и как этим можно воспользоваться, чтобы быстрее найти работу уже в 2026-м. Он уже 2 года подряд делает такие прогнозы и пока попадание стопроцентное 🙂
📌 26 ноября, 19:00 МСК — «Как новичку получить опыт и собрать портфолио, которое реально продает»
Даниил Джепаров, автор канала Data Study и аналитик в Сравни.ру, помог десяткам новичков быстро найти первую работу. Он даст честные ответы на главные вопросы новичков: как получить работу без опыта, сделать портфолио, которое реально смотрит бизнес, и выделиться среди других кандидатов.
Регистрируйтесь и добавляйте события к себе в календарь, чтобы не забыть!
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥4❤3 1
Simulative
Video message
Please open Telegram to view this post
VIEW IN TELEGRAM
❤4👍4🔥3
Правильная организация мер в Power BI
Друзья, сегодня поделимся полезными советами — сохраняйте и ставьте огонёчки 🔥
Правильная организация мер в Power BI необходима для эффективной работы с аналитикой. И вот почему:
1️⃣ Производительность. Оптимизированные меры снижают нагрузку на модель, ускоряют расчёты и отклик отчётов.
2️⃣ Поддержка и масштабируемость. Чёткая структура упрощает понимание модели для новых разработчиков и облегчает внесение изменений и добавление новых метрик без риска поломки существующей логики.
3️⃣ Согласованность данных. Единый подход к расчётам гарантирует, что разные визуализации и отчёты показывают одни и те же цифры.
4️⃣ Удобство использования. Пользователи быстрее находят нужные метрики, если они логично сгруппированы и названы. А ещё снижается риск использования устаревших или некорректных мер.
Как правильно организовать меры?
1. Используйте папки для структурирования мер по тематическим блокам. Например:
😶 Финансы:
😶 Продажи:
😶 KPI:
😶 Временные сравнения:
2. Используйте стандарты именования:
Префиксы для типов мер:
➖
➖
➖
Единый стиль написания:
➖ CamelCase:
➖ Snake_case:
➖ Важно выбрать один формат и придерживаться его во всём проекте.
Избегание аббревиатур, если они не общеприняты (например, YoY, QoQ).
3. Оптимизация сложных мер. Разбивайте сложные формулы на промежуточные меры:
Избегайте избыточных вычислений внутри мер — выносите повторяющиеся логики в отдельные меры.
Комментируйте сложную логику (через // в DAX), особенно если используются неочевидные фильтры или итераторы.
4. Документирование мер. Используйте // или
5. Удаление неиспользуемых мер. Регулярно проверяйте модель и удаляйте:
🟠 Меры-дубликаты;
🟠 Устаревшие расчёты (
🟠 Меры, которые не используются в отчётах.
📊 Simulative
Друзья, сегодня поделимся полезными советами — сохраняйте и ставьте огонёчки 🔥
Правильная организация мер в Power BI необходима для эффективной работы с аналитикой. И вот почему:
Как правильно организовать меры?
1. Используйте папки для структурирования мер по тематическим блокам. Например:
Выручка, Прибыль, Рентабельность;Объём продаж, Средний чек, Конверсия;LTV, CAC, Retention Rate;YoY Growth, QoQ Change, MTD Sales.Sales/
├── Revenue_Actual
├── Revenue_Target
├── Revenue_Variance
Finance/
├── Gross_Profit
├── Net_Profit_Margin
Time/
├── Sales_MTD
├── Sales_YTD
2. Используйте стандарты именования:
Префиксы для типов мер:
KPI_ — ключевые показатели (KPI_Revenue_Growth); CALC_ — промежуточные вычисления (CALC_Weighted_Avg); TEMP_ / TEST_ — временные или тестовые меры (удалять после проверки). Единый стиль написания:
RevenueYTD;revenue_ytd; Избегание аббревиатур, если они не общеприняты (например, YoY, QoQ).
3. Оптимизация сложных мер. Разбивайте сложные формулы на промежуточные меры:
//Базовая мера
Revenue = SUM(Sales[Amount])
//Производная мера
Revenue_PY = CALCULATE([Revenue], SAMEPERIODLASTYEAR(Date[Date]))
//Сложная мера
Revenue_Growth% = DIVIDE([Revenue] - [Revenue_PY], [Revenue_PY])
Избегайте избыточных вычислений внутри мер — выносите повторяющиеся логики в отдельные меры.
Комментируйте сложную логику (через // в DAX), особенно если используются неочевидные фильтры или итераторы.
4. Документирование мер. Используйте // или
/* */ для описания меры в DAX: /*
Расчет средней маржинальности по клиентам,
исключая пробные заказы (Discount > 50%).
*/
Avg_Margin = AVERAGEX(Customers, [Net_Profit] / [Revenue])
5. Удаление неиспользуемых мер. Регулярно проверяйте модель и удаляйте:
TEMP_, TEST_);Правильная организация мер экономит часы поддержки, снижает количество ошибок и делает ваши отчёты быстрее и понятнее. Внедряйте эти практики с самого начала проекта!
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥16❤6 3
Участвуйте в конкурсе дашбордов с призовым фондом 200 000 ₽
Команда Simulative любит практику — задачи, которые дают рост, и обучение, за которое не стыдно. Поэтому делимся классной новостью!
Что вы получите:
🟠 Практическую работу с реальным датасетом крупной фармацевтической компании;
🟠 +1 мощный кейс в портфолио;
🟠 Сертификат AW BI;
🟠 Два полезных мастер-класса;
🟠 Поддержку комьюнити;
🟠 Оценку экспертов.
➡️ Подать заявку на конкурс
📊 Simulative
Команда Simulative любит практику — задачи, которые дают рост, и обучение, за которое не стыдно. Поэтому делимся классной новостью!
Наш партнёр AW BI запустил конкурс-хакатон «ФАРМАДАШ» вместе с фармацевтической компанией AstraZeneca. Призовой фонд: 200 000 ₽, но ценность здесь куда больше денег.
Что вы получите:
Приём заявок уже идёт! Датасет откроется 28 ноября, дедлайн сдачи работ — до 10 декабря. Итоги подведут 16 декабря.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥10❤4 3
Напоминаем: через 2 часа CEO Simulative Андрон Алексанян расскажет, как изменится рынок аналитиков в 2026 году
О чём поговорим:
➖ Какие навыки аналитиков будут востребованы в 2026;
➖ Инсайты и свежие кейсы из реального найма: как проходят собеседования у джунов;
➖ Как выстроить роадмап обучения, какие проекты делать, как оформить резюме, чтобы реально выделиться;
➖ Рабочая схема входа в аналитику: что точно работает для быстрого трудоустройства.
➡️ Зарегистрироваться
📊 Simulative
О чём поговорим:
Please open Telegram to view this post
VIEW IN TELEGRAM
❤6🔥2 2
Привет! На связи команда Simulative 👋🏻
Мы часто видим, как наши студенты рассказывают о своём обучении, делятся инсайтами и впечатлениями в Telegram, блогах и соцсетях. Каждый такой пост помогает другим сделать шаг в аналитику, разобраться в профессии и поверить в себя.
А теперь мы хотим сделать это осознанным направлением — и приглашаем вас стать частью авторского комьюнити Simulative ✍🏻
Заполните короткую форму ниже, и мы свяжемся, чтобы рассказать подробнее о формате и возможностях 🧡
✍️ Заполнить форму
📊 Simulative
Мы часто видим, как наши студенты рассказывают о своём обучении, делятся инсайтами и впечатлениями в Telegram, блогах и соцсетях. Каждый такой пост помогает другим сделать шаг в аналитику, разобраться в профессии и поверить в себя.
А теперь мы хотим сделать это осознанным направлением — и приглашаем вас стать частью авторского комьюнити Simulative ✍🏻
Если вы любите писать тексты, делиться опытом, пробовать себя в форматах — от постов в Telegram до статей и видео — присоединяйтесь! Мы будем вместе придумывать темы, делиться идеями и помогать вам развивать авторский голос.
Заполните короткую форму ниже, и мы свяжемся, чтобы рассказать подробнее о формате и возможностях 🧡
Please open Telegram to view this post
VIEW IN TELEGRAM
❤6🔥2 2