Долго ли, коротко ли, но мы в Delivery Club начали серию публикаций о развитии рекомендательных систем внутри компаний
Сегодня опубликовали первую часть на Хабр. Многие из этих моделей мне довелось писать самому или участвовать в их развитии как тим лид / ML product manager
В статье все, как я люблю - максимум ml4value. Необычные решения с несколькими моделями. В общем, мой рекомендасьон к прочтению - надеюсь, вам понравится)
#recsys
Сегодня опубликовали первую часть на Хабр. Многие из этих моделей мне довелось писать самому или участвовать в их развитии как тим лид / ML product manager
В статье все, как я люблю - максимум ml4value. Необычные решения с несколькими моделями. В общем, мой рекомендасьон к прочтению - надеюсь, вам понравится)
#recsys
Хабр
Эволюция рекомендаций ресторанов в Delivery Club. Часть 1
Всем привет! Меня зовут Иван Максимов, я работаю Lead Data Scientist’ом в команде рекомендаций и A/B-тестирования Delivery Club. Это первая из серии статей про нашу рекомендательную систему. Я...
👍28🔥13👏2👎1
В канале уже почти месяц не было постов: это потому что я готовил нечто интересное для вас всех) Но обо всем по порядку: на этой неделе небольшие вводные истории, а все лакомое буду писать уже с понедельника
Итак, примерно полгода назад я выступал и рассказывал о способах ускорить А/В тесты. Даже тогда я много времени уделял процессам или "культуре экспериментов"
Можно бесконечно применять CUPED, CUPAC и другие методы, но что делать если:
- Менеджер говорит: "Фича супер важна, нужно выкатить ее еще вчера"?
- Ключевая метрика не красится и предлагается посчитать еще десяток других, которых не было в изначальном дизайне?
- Хотим запустить сразу 20 маркетинговых баннеров в тест?
- Аналитик дизайнит тест аж целый спринт?
Имхо, успешность фичей определяется ответами именно на эти вопросы в вашей "культуре экспериментов". Верхнеуровнево все довольно просто:
1. Появилась идея + ее побрейнштормили внутри команды = конкретное описание фичи
2. Посчитан ожидаемый импакт от фичи в конкретных 1-3 метриках
3. Оцениваем адекватность фичи на пользователях через UX
4. Делаем фичу и проверяем, что она технически работает
5. Смотрим на нескольких боевых пользователях и тестируем edge кейсы
6. Дизайним А/В = приемочные, барьерные и контрольные метрики, сроки и % пользователей
7. Запускаем тест
8. Принимаем решение в соответствии с дизайном
Звучит легко, но в реальности gap между аналитиком, продактом и разработчиком сильно усложняет процесс)
Забыли прокинуть событие в аналитику, не учли важную метрику соседней команды, покатили фичу в пятницу вечером - Узнаете ли свой опыт?)
Серия постов на этой неделе будет посвящена "культуре экспериментов" или "как избежать таких сложностей"
#ab
Итак, примерно полгода назад я выступал и рассказывал о способах ускорить А/В тесты. Даже тогда я много времени уделял процессам или "культуре экспериментов"
Можно бесконечно применять CUPED, CUPAC и другие методы, но что делать если:
- Менеджер говорит: "Фича супер важна, нужно выкатить ее еще вчера"?
- Ключевая метрика не красится и предлагается посчитать еще десяток других, которых не было в изначальном дизайне?
- Хотим запустить сразу 20 маркетинговых баннеров в тест?
- Аналитик дизайнит тест аж целый спринт?
Имхо, успешность фичей определяется ответами именно на эти вопросы в вашей "культуре экспериментов". Верхнеуровнево все довольно просто:
1. Появилась идея + ее побрейнштормили внутри команды = конкретное описание фичи
2. Посчитан ожидаемый импакт от фичи в конкретных 1-3 метриках
3. Оцениваем адекватность фичи на пользователях через UX
4. Делаем фичу и проверяем, что она технически работает
5. Смотрим на нескольких боевых пользователях и тестируем edge кейсы
6. Дизайним А/В = приемочные, барьерные и контрольные метрики, сроки и % пользователей
7. Запускаем тест
8. Принимаем решение в соответствии с дизайном
Звучит легко, но в реальности gap между аналитиком, продактом и разработчиком сильно усложняет процесс)
Забыли прокинуть событие в аналитику, не учли важную метрику соседней команды, покатили фичу в пятницу вечером - Узнаете ли свой опыт?)
Серия постов на этой неделе будет посвящена "культуре экспериментов" или "как избежать таких сложностей"
#ab
YouTube
Иван Максимов | 13 способов ускорить А/В тест, или "Не CUPED-ом единым"
ML in Marketing hub: https://ods.ai/hubs/ml-in-marketing
Телеграм-канал https://news.1rj.ru/str/mlinmarketing
Спикер: Иван Максимов, Data Science Team Lead at Delivery Club
Многие аналитики для ускорения А/В тестов в первую очередь используют достаточно сложные статистические…
Телеграм-канал https://news.1rj.ru/str/mlinmarketing
Спикер: Иван Максимов, Data Science Team Lead at Delivery Club
Многие аналитики для ускорения А/В тестов в первую очередь используют достаточно сложные статистические…
🔥22👍12❤1👎1
Вчера мы опубликовали вторую часть серии статей про рекомендации ресторанов в Delivery Club. Она уже более техническая - про модели, фичи и архитектуру в проде
Если вы не читали первую часть, то стоит начать с нее 😉
#recsys
Если вы не читали первую часть, то стоит начать с нее 😉
#recsys
Хабр
Эволюция рекомендаций ресторанов в Delivery Club. Часть 2
Всем привет! Меня зовут Иван Максимов, и я работаю Lead Data Scientist-ом в Delivery Club. Это вторая часть статьи об изменении подхода к рекомендациям ресторанов в нашей компании. В первой части я...
🔥21👍6❤3🤩1
Автор канала @ml4value запускает курс по А/В: "Дизайн А/В в реальной жизни и культура экспериментов"
❓О чем курс
- На базовых принципах А/В разбираем спорные ситуации в компаниях
- Дизайним сложные А/В-тесты
- Обсуждаем, как запускать неординарные фичи
- Учимся хорошим культуре и процессу экспериментов
Вы узнаете, как эффективнее проводить эксперименты с фичами - и получать кратно больше фичей с импактом на бизнес.
Курс закроет gap между сухим мат. статом и желанием бизнеса "выкатить фичу еще вчера"
👨Коротко о преподавателе - Иван Максимов @Ivan_maksimov
- Автор канала @ml4value про пользу бизнесу от миашинного обучения
- 6+ лет в DS
- Руководит клиентской аналитикой и ML в Delivery Club. Создавал там in-house платформу А/В тестирования
- Еще вы можете его знать по докладу про ускорение А/В или по статьям (раз, два) на Хабре про рекомендательные системы
🧠Особенности курса
- Минимум мат. статистики
- Без программирования
- Много погружения в реальные проблемы бизнеса при экспериментах
👨💻Для кого
- Для аналитиков, продактов, ds и разработчиков
- От уровня junior+
- Для всех, кто хотя бы раз испытавал сложности с запуском фичей в продакшен
🗓 Когда и как
- Старт 19 мая, курс длится 6 недель
- 6 вебинаров + доп текстовые статьи + д/з на дизайн АВ + ответы на вопросы в чате
- 6-8 часов в неделю на прохождение курса
- 25 человек максимум, чтобы успеть ответить на все каверзные вопросы
💰За сколько?
- 14 700 руб до 11 мая
- 19 700 руб - после
Ссылка на регистрацию
Да пребудет с вами культура экспериментов!
❓О чем курс
- На базовых принципах А/В разбираем спорные ситуации в компаниях
- Дизайним сложные А/В-тесты
- Обсуждаем, как запускать неординарные фичи
- Учимся хорошим культуре и процессу экспериментов
Вы узнаете, как эффективнее проводить эксперименты с фичами - и получать кратно больше фичей с импактом на бизнес.
Курс закроет gap между сухим мат. статом и желанием бизнеса "выкатить фичу еще вчера"
👨Коротко о преподавателе - Иван Максимов @Ivan_maksimov
- Автор канала @ml4value про пользу бизнесу от миашинного обучения
- 6+ лет в DS
- Руководит клиентской аналитикой и ML в Delivery Club. Создавал там in-house платформу А/В тестирования
- Еще вы можете его знать по докладу про ускорение А/В или по статьям (раз, два) на Хабре про рекомендательные системы
🧠Особенности курса
- Минимум мат. статистики
- Без программирования
- Много погружения в реальные проблемы бизнеса при экспериментах
👨💻Для кого
- Для аналитиков, продактов, ds и разработчиков
- От уровня junior+
- Для всех, кто хотя бы раз испытавал сложности с запуском фичей в продакшен
🗓 Когда и как
- Старт 19 мая, курс длится 6 недель
- 6 вебинаров + доп текстовые статьи + д/з на дизайн АВ + ответы на вопросы в чате
- 6-8 часов в неделю на прохождение курса
- 25 человек максимум, чтобы успеть ответить на все каверзные вопросы
💰За сколько?
- 14 700 руб до 11 мая
- 19 700 руб - после
Ссылка на регистрацию
Да пребудет с вами культура экспериментов!
Google Docs
Запись на курс по А/В
Курс "Дизайн А/В в реальной жизни и культура экспериментов"
После заполнения формы вы можете оплатить курс переводом на карту тинькофф, привязанную к номеру +7 (985) 296-66-18. Мы вышлем вам чек на почту
До 11 мая сумма оплаты 14 700 руб, после - 19 700…
После заполнения формы вы можете оплатить курс переводом на карту тинькофф, привязанную к номеру +7 (985) 296-66-18. Мы вышлем вам чек на почту
До 11 мая сумма оплаты 14 700 руб, после - 19 700…
🔥24👍3🤮1
Всем привет!
Напоминаю, что сегодня последний день, когда можно записаться на курс по АВ тестированию по сниженной цене ↘️
Курс стартует уже 19 мая
Напоминаю, что сегодня последний день, когда можно записаться на курс по АВ тестированию по сниженной цене ↘️
Курс стартует уже 19 мая
Google Docs
Запись на курс по А/В
Курс "Дизайн А/В в реальной жизни и культура экспериментов"
После заполнения формы вы можете оплатить курс переводом на карту тинькофф, привязанную к номеру +7 (985) 296-66-18. Мы вышлем вам чек на почту
До 11 мая сумма оплаты 14 700 руб, после - 19 700…
После заполнения формы вы можете оплатить курс переводом на карту тинькофф, привязанную к номеру +7 (985) 296-66-18. Мы вышлем вам чек на почту
До 11 мая сумма оплаты 14 700 руб, после - 19 700…
🔥3👍1
Пару недель назад я вырос до руководителя клиентской аналитики и ML в Delivery Club 🚀
Если раньше я был тимлидом одной ML команды, то теперь тут целое направление: достаточно интересный челлендж!
Что, на мой взгляд, позволило это сделать
1. Окружение
В деливери все очень открыты новым идеям, даже довольно радикальным. Полностью переделать главную страницу приложения? Отказаться от готового вендорского решения по А/В и сделать свое? Легко!
В общем, я рад, что мои (и не только) идеи были поддержаны:)
2. Принципы ML4Value
Люди вокруг и особенно топ-менеджмент совсем по-разному воспринимают фразы "Давайте сделаем рек систему" и "Давайте повысим ARPU на 5%". Говорить в терминах business value от ML действительно работает
3. Soft skills
Да-да 😅
Сложно оценивать себя, но относительно других: я всего пару раз видел, когда data scientist'ам и аналитикам не хватает тех скиллов для роста. В подавляющем большинстве - это нехватка soft skills
Так что, помимо чтения статей про sota, не забывайте публично выступать, тренироваться в убеждении и других неожиданно ценных в DS навыках
4. "Душнила"
Возможно, это моя киллер фича. Если вижу, что что-то работает не так, я об этом скажу. Даже получил мини-награду за наибольшее число комментариев к рисерчам 💬
Почти 3 года назад, когда я был 6-ым аналитиком в чуть ли не стартапе Delivery Club, никто не знал, что такое случится. А теперь вперед к новым свершениям!)
Если раньше я был тимлидом одной ML команды, то теперь тут целое направление: достаточно интересный челлендж!
Что, на мой взгляд, позволило это сделать
1. Окружение
В деливери все очень открыты новым идеям, даже довольно радикальным. Полностью переделать главную страницу приложения? Отказаться от готового вендорского решения по А/В и сделать свое? Легко!
В общем, я рад, что мои (и не только) идеи были поддержаны:)
2. Принципы ML4Value
Люди вокруг и особенно топ-менеджмент совсем по-разному воспринимают фразы "Давайте сделаем рек систему" и "Давайте повысим ARPU на 5%". Говорить в терминах business value от ML действительно работает
3. Soft skills
Да-да 😅
Сложно оценивать себя, но относительно других: я всего пару раз видел, когда data scientist'ам и аналитикам не хватает тех скиллов для роста. В подавляющем большинстве - это нехватка soft skills
Так что, помимо чтения статей про sota, не забывайте публично выступать, тренироваться в убеждении и других неожиданно ценных в DS навыках
4. "Душнила"
Возможно, это моя киллер фича. Если вижу, что что-то работает не так, я об этом скажу. Даже получил мини-награду за наибольшее число комментариев к рисерчам 💬
Почти 3 года назад, когда я был 6-ым аналитиком в чуть ли не стартапе Delivery Club, никто не знал, что такое случится. А теперь вперед к новым свершениям!)
🔥58👏11👍4🎉1
We are hiring!
Что ж, не могу не воспользоваться возможностью: раз уж я стал руководить отделом клиентской аналитики и ML, то приглашаю вас познакомиться и, если будет интересно, пособеседоваться на вакансии у нас:
А какие вакансии?
1. Middle/Senior аналитик в команду лояльности
Аналитики в этой команде знают все о метрике retention и драйвят ее:
- Анализируют подписку DC Pro и находят точки роста в ней
- Занимаются удержанием клиентов через скидки - в том числе через ML-модели оттока и аплифта
- Следят за качеством онбординга новых пользователей и их метриками
2. Middle аналитик в команду аналитики супераппа
Delivery club - суперапп еды. У нас есть десятки сценариев заказов. Нужно будет:
- уметь определять сценарии и обвешивать их полезными метриками
- находить точки роста частотности пользователей в старых / новых сценариях заказа
- думать о путях пользователя внутри приложения и улучшать их
Также все персональные ML-рекомендации ресторанов/блюд лежат в этой команде. Аналитики думают о том, как улучшать персонализацию в приложении
3. Junior аналитик в команду монетизации
Даже +1 руб на заказ в пересчете на >5 млн MAU деливери клаба превращается в очень солидную сумму. Аналитики в этой команде:
- Думают, как повысить прибыль на заказ, не роняя конверсию и другие метрики
- Знают все про юнит экономику
- Анализируют стоимость доставки, surge (повышенные цены в пиковую нагрузку), модели upsell товаров и многое другое
Что еще интересного предлагаем
- Аналитики существенно драйвят бизнес delivery club: многие фичи были уже придуманы ими, и новым сотрудникам также предстоит придумывать и внедрять свои идеи. Мы работаем напрямую с продактами и командами разработки - можем довольно существенно влиять на их беклог
- Аналитические команды состоят из аналитиков и data scientist-ов: если есть желание, то можно посмотреть/потрогать/почелленджить ML-модели
- У нас своя довольно интересная (с switch-back тестами, слоями, линеаризацией, ускорением расчетов) in-house платформа А/В тестирования - можно много чего интересного узнать про А/В и при желании поучаствовать в развитии плафтормы
- Про чай, кофе, печеньки, дмс и прочие радости не пишу - думаю, тут и так все понятно)
На что будем смотреть
Junior:
- Уверенный SQL и python - нужно будет много работать с данными
- Хорошая база А/В тестирования: Т-тест, p-value и тд
- Знание базовых продуктовых метрик: конверсия, ретеншен, arpu
- Желание глубоко погружаться в бизнес-процессы
Middle = junior + ...
- Достаточно оптимальный код на SQL и python
- Глубокое понимание А/В тестирования: умение провести тест от дизайна до выводов для бизнеса
- Отличное знание продуктовых метрик и умение придумывать специфичные показатели под бизнес-процессы
- Желательно уметь строить интерпретируемые ML-модели: линейную и логистическую регрессию
Senior = middle + ...
- Синьер - полноценный драйвер команды/метрики. Может сказать "все неправильно - надо переделать" и успешно переделывает!
- Может найти точки роста продукта out-of-scope
- Имеет большой опыт и прекрасно понимет бизнес-процессы
По вакансиям можете скидывать резюме напрямую мне @Ivan_maksimov
Что ж, не могу не воспользоваться возможностью: раз уж я стал руководить отделом клиентской аналитики и ML, то приглашаю вас познакомиться и, если будет интересно, пособеседоваться на вакансии у нас:
А какие вакансии?
1. Middle/Senior аналитик в команду лояльности
Аналитики в этой команде знают все о метрике retention и драйвят ее:
- Анализируют подписку DC Pro и находят точки роста в ней
- Занимаются удержанием клиентов через скидки - в том числе через ML-модели оттока и аплифта
- Следят за качеством онбординга новых пользователей и их метриками
2. Middle аналитик в команду аналитики супераппа
Delivery club - суперапп еды. У нас есть десятки сценариев заказов. Нужно будет:
- уметь определять сценарии и обвешивать их полезными метриками
- находить точки роста частотности пользователей в старых / новых сценариях заказа
- думать о путях пользователя внутри приложения и улучшать их
Также все персональные ML-рекомендации ресторанов/блюд лежат в этой команде. Аналитики думают о том, как улучшать персонализацию в приложении
3. Junior аналитик в команду монетизации
Даже +1 руб на заказ в пересчете на >5 млн MAU деливери клаба превращается в очень солидную сумму. Аналитики в этой команде:
- Думают, как повысить прибыль на заказ, не роняя конверсию и другие метрики
- Знают все про юнит экономику
- Анализируют стоимость доставки, surge (повышенные цены в пиковую нагрузку), модели upsell товаров и многое другое
Что еще интересного предлагаем
- Аналитики существенно драйвят бизнес delivery club: многие фичи были уже придуманы ими, и новым сотрудникам также предстоит придумывать и внедрять свои идеи. Мы работаем напрямую с продактами и командами разработки - можем довольно существенно влиять на их беклог
- Аналитические команды состоят из аналитиков и data scientist-ов: если есть желание, то можно посмотреть/потрогать/почелленджить ML-модели
- У нас своя довольно интересная (с switch-back тестами, слоями, линеаризацией, ускорением расчетов) in-house платформа А/В тестирования - можно много чего интересного узнать про А/В и при желании поучаствовать в развитии плафтормы
- Про чай, кофе, печеньки, дмс и прочие радости не пишу - думаю, тут и так все понятно)
На что будем смотреть
Junior:
- Уверенный SQL и python - нужно будет много работать с данными
- Хорошая база А/В тестирования: Т-тест, p-value и тд
- Знание базовых продуктовых метрик: конверсия, ретеншен, arpu
- Желание глубоко погружаться в бизнес-процессы
Middle = junior + ...
- Достаточно оптимальный код на SQL и python
- Глубокое понимание А/В тестирования: умение провести тест от дизайна до выводов для бизнеса
- Отличное знание продуктовых метрик и умение придумывать специфичные показатели под бизнес-процессы
- Желательно уметь строить интерпретируемые ML-модели: линейную и логистическую регрессию
Senior = middle + ...
- Синьер - полноценный драйвер команды/метрики. Может сказать "все неправильно - надо переделать" и успешно переделывает!
- Может найти точки роста продукта out-of-scope
- Имеет большой опыт и прекрасно понимет бизнес-процессы
По вакансиям можете скидывать резюме напрямую мне @Ivan_maksimov
🔥14👍6🥰1
Сегодня пост про самый традиционный, но покрытый мифами инструмент - про скидки 😱
Представьте, что вы работаете в продуктовом ритейле и можете запустить абсолютно любую скидку: 10% на все, 20% на следующий заказ в течение недели после текущего, 5ый кофе в подарок, купил 2 пива - чипсы в подарок, ... .
Идей много, но как выбрать одну для эксперимента? Я много думал об этом, и вот какие базовые правила получились:
1. Помни про масштаб
Акция на 1 конкретный товар - это хорошо, но она покроет лишь малый процент аудитории. На уровне всей компании почти не заметна
2. Базовая безубыточность
Если у вас маржинальность 10%, то не стоит запускать скидку в 20% на все
3. Upsell - наше все
Уже прошло время популярности простых скидок вроде 2+1. Теперь хорошая акция увеличивает не только продажи товара со скидкой, но и что-то еще
- Продажи других товаров: купил дорогущий сыр по скидке - докупил к нему бутылку вина без скидки
- Будущие продажи
Топ пример - скидка 20% у Вкусвилла на любой товар в следующей покупке
В общем, сначала стоит учесть 3 этих базовых правила, а уже поверх прикручивать ML с прогнозом оттока, uplift и прочие прекрасные вещи 🚀
Представьте, что вы работаете в продуктовом ритейле и можете запустить абсолютно любую скидку: 10% на все, 20% на следующий заказ в течение недели после текущего, 5ый кофе в подарок, купил 2 пива - чипсы в подарок, ... .
Идей много, но как выбрать одну для эксперимента? Я много думал об этом, и вот какие базовые правила получились:
1. Помни про масштаб
Акция на 1 конкретный товар - это хорошо, но она покроет лишь малый процент аудитории. На уровне всей компании почти не заметна
2. Базовая безубыточность
Если у вас маржинальность 10%, то не стоит запускать скидку в 20% на все
3. Upsell - наше все
Уже прошло время популярности простых скидок вроде 2+1. Теперь хорошая акция увеличивает не только продажи товара со скидкой, но и что-то еще
- Продажи других товаров: купил дорогущий сыр по скидке - докупил к нему бутылку вина без скидки
- Будущие продажи
Топ пример - скидка 20% у Вкусвилла на любой товар в следующей покупке
В общем, сначала стоит учесть 3 этих базовых правила, а уже поверх прикручивать ML с прогнозом оттока, uplift и прочие прекрасные вещи 🚀
🔥23👍8
Продолжение про скидки
Если вы тоже любите ML и персонализацию, то наверняка задумывались про персонализацию скидок = оптимальный размер скидки для каждого клиента
Глобально есть 3 варианта это сделать:
- Классические прогноз churn + даем скидку тем, кто наиболее вероятно уйдет
- Uplift
- Контекстуальные многорукие бандиты + RL
На конференциях вы скорее всего услышите про успехи Uplift и бандитов. Сегодня я расскажу про то, почему они в моей практике не заводились, и почему старый-добрый churn все еще весьма хорош
Uplift
- Для построения модели аплифта нужна рассылка скидок со случайным размером номинала. Это дорого!
- Нужно регулярно такую рассылку повторять - иначе данные устаревают
- Если у вас вводится новый тип оффера, то случайную рассылку придется повторить
В целом, история с рассылками может быть и технически сложной (разослать, проверить что все долшло, аггрегировать дланные), долгой и дорогой
Также крайне проблематично интерпретировать uplift бизнесу и тем более построить дашборды для бизнеса по uplift модели
Бандиты и RL
- Для персонализации нужны как минимум контекстуальные бандиты. Придется здорово постараться, чтобы они начали сходиться к оптимуму за разумное число итераций. Нужно будет применить много трюков, чтобы оно в принципе работало
- Сложно конструировать долгосрочный reward
- Сложно построить дашборды поверх и отвечать на вопросы "Почему мы даем этому человеку такую скидку?"
Churn
- Крайне прост. Уже знаком бизнесу = можно легко интерпретировать, строить дашборды. Любому человеку в компании понятно верхнеуровнево, что это за модель и зачем она нужна
- Явно влияет на долгосрочные метрики (снижает churn)
- Относительно легко считать юнит экономику модели
- Есть накопленный опыт ml-сообщества с best practices
В общем, я бы предложил вам начать оптимизацию маркетинга точно с модели churn. А уже потом 7 раз подумать, стоит ли внедрять uplift/бандитов/rl 😉
#marketing@ml4value
Если вы тоже любите ML и персонализацию, то наверняка задумывались про персонализацию скидок = оптимальный размер скидки для каждого клиента
Глобально есть 3 варианта это сделать:
- Классические прогноз churn + даем скидку тем, кто наиболее вероятно уйдет
- Uplift
- Контекстуальные многорукие бандиты + RL
На конференциях вы скорее всего услышите про успехи Uplift и бандитов. Сегодня я расскажу про то, почему они в моей практике не заводились, и почему старый-добрый churn все еще весьма хорош
Uplift
- Для построения модели аплифта нужна рассылка скидок со случайным размером номинала. Это дорого!
- Нужно регулярно такую рассылку повторять - иначе данные устаревают
- Если у вас вводится новый тип оффера, то случайную рассылку придется повторить
В целом, история с рассылками может быть и технически сложной (разослать, проверить что все долшло, аггрегировать дланные), долгой и дорогой
Также крайне проблематично интерпретировать uplift бизнесу и тем более построить дашборды для бизнеса по uplift модели
Бандиты и RL
- Для персонализации нужны как минимум контекстуальные бандиты. Придется здорово постараться, чтобы они начали сходиться к оптимуму за разумное число итераций. Нужно будет применить много трюков, чтобы оно в принципе работало
- Сложно конструировать долгосрочный reward
- Сложно построить дашборды поверх и отвечать на вопросы "Почему мы даем этому человеку такую скидку?"
Churn
- Крайне прост. Уже знаком бизнесу = можно легко интерпретировать, строить дашборды. Любому человеку в компании понятно верхнеуровнево, что это за модель и зачем она нужна
- Явно влияет на долгосрочные метрики (снижает churn)
- Относительно легко считать юнит экономику модели
- Есть накопленный опыт ml-сообщества с best practices
В общем, я бы предложил вам начать оптимизацию маркетинга точно с модели churn. А уже потом 7 раз подумать, стоит ли внедрять uplift/бандитов/rl 😉
#marketing@ml4value
YouTube
Лекция 9 Case Study: Прогнозирование оттока пользователей
Группа ВК: https://vk.com/data_mining_in_action
Репозиторий курса на гитхабе: https://github.com/vkantor/MIPT_Data_Mining_In_Action_2016
Репозиторий курса на гитхабе: https://github.com/vkantor/MIPT_Data_Mining_In_Action_2016
👍21🔥7
ML helicopter view
Есть такое интересное выражение "helicopter view" - взгляд сверху, чтобы понять, а что вообще нужно делать в вашей ситуации
Кажется, в ML не хватает helicopter view. Сегодня попробую рассказать на примере, зачем это нужно и как работает
Ситуация
У вас есть модель, которая рекомендует пользователю товары в продуктовом магазине. Пользователи жалуются, что им "нерелевантно"
Что делают обычно
Тюнят модель, улучшают ml- метрики и запускают А/В
Helicopter view
А что вообще нужно пользователям? Так ли плохо, что части из них рекомендации "нерелевантны"?
Возможно, "релевантно" для пользователя - рекомендовать товары, которые он уже покупал. Тогда вы можете безо всякого ML сделать категорию "Вы покупали". А ML-ем рекомендовать что-то новое
Иногда "нерелевентность" - не так уж и плохо. Допустим, вы хотите повышать маржинальность бизнеса и продавать товары собственной торговой марки (СТМ), потому что у них выше маржа. Даже если они релевантны 15% пользователей (высокая вероятность заказа), то продвигать их в рекомендациях может быть все еще выгодно с точки зрения ожидаемой прибыли = вероятность заказа * прибыль
Так что иногда бывает полезно применять ML helicopter view 🚁
Есть такое интересное выражение "helicopter view" - взгляд сверху, чтобы понять, а что вообще нужно делать в вашей ситуации
Кажется, в ML не хватает helicopter view. Сегодня попробую рассказать на примере, зачем это нужно и как работает
Ситуация
У вас есть модель, которая рекомендует пользователю товары в продуктовом магазине. Пользователи жалуются, что им "нерелевантно"
Что делают обычно
Тюнят модель, улучшают ml- метрики и запускают А/В
Helicopter view
А что вообще нужно пользователям? Так ли плохо, что части из них рекомендации "нерелевантны"?
Возможно, "релевантно" для пользователя - рекомендовать товары, которые он уже покупал. Тогда вы можете безо всякого ML сделать категорию "Вы покупали". А ML-ем рекомендовать что-то новое
Иногда "нерелевентность" - не так уж и плохо. Допустим, вы хотите повышать маржинальность бизнеса и продавать товары собственной торговой марки (СТМ), потому что у них выше маржа. Даже если они релевантны 15% пользователей (высокая вероятность заказа), то продвигать их в рекомендациях может быть все еще выгодно с точки зрения ожидаемой прибыли = вероятность заказа * прибыль
Так что иногда бывает полезно применять ML helicopter view 🚁
👍29🔥6❤3🤔2
Вдруг осознал, что не написал ни строчки кода за 2 мес в роли хэда клиентской аналитики 😅
Мне всегда было интересно, чем же, если не кодом, занимаются такие люди, и вот чем:
1. Формулируют цели
Точнее, разделают верхнеуровневые цели компании на OKR команд и крупные фичи
Путь от "увеличить выручку компании на Х" до условно "сделать садджесты в поиске, чтобы повысить конверсию поиска на Y%", как оказалось, очень непрост, но интересен 🔎
2. Сетапят новые проекты
Никогда раньше мне не приходилось питчить и защищать столько идей
Узнал про такие штуки как amazon 6-pager, пресс-релиз идеи и другое
3. Строят процессы
Да-да, это я тот человек, который ставит стендапы, регулярный встречи по проектам и т.п. 😅
А еще помогаю найти лидеров в проектах, общаюсь со смежными отделами, получаю бюджеты и делаю прочие "неплпулярные" активности
4. Еще 1000 и 1 дело
Но об этом уже будет скучновато рассказывать)
------------
P.S. Мне все же хочется повышать уровень кода и ML, поэтому буду очень благодарен, если вы сможете мне в комментариях посоветовать годный курс по трансформерам в nlp/recsys на торче) Чтобы прям advanced, с кодом и домашками!
Мне всегда было интересно, чем же, если не кодом, занимаются такие люди, и вот чем:
1. Формулируют цели
Точнее, разделают верхнеуровневые цели компании на OKR команд и крупные фичи
Путь от "увеличить выручку компании на Х" до условно "сделать садджесты в поиске, чтобы повысить конверсию поиска на Y%", как оказалось, очень непрост, но интересен 🔎
2. Сетапят новые проекты
Никогда раньше мне не приходилось питчить и защищать столько идей
Узнал про такие штуки как amazon 6-pager, пресс-релиз идеи и другое
3. Строят процессы
Да-да, это я тот человек, который ставит стендапы, регулярный встречи по проектам и т.п. 😅
А еще помогаю найти лидеров в проектах, общаюсь со смежными отделами, получаю бюджеты и делаю прочие "неплпулярные" активности
4. Еще 1000 и 1 дело
Но об этом уже будет скучновато рассказывать)
------------
P.S. Мне все же хочется повышать уровень кода и ML, поэтому буду очень благодарен, если вы сможете мне в комментариях посоветовать годный курс по трансформерам в nlp/recsys на торче) Чтобы прям advanced, с кодом и домашками!
👍16🔥5👎2😱2
Зачем учить менеджеров и разработчиков аналитике?
Даным-давно на ранних этапах развития компании существовали 2 занятных метода провеления экспериментов: "метод ступеньки" и "города-близнецы"
Как вы могли догадаться, это сравнение неделя-к-неделе и город-к-городу. Если планомерно не обучать бизнес аналитической культуре, то все будут придумывать такие эксперименты 🙃
Как это исправить?
1. Провести единое обучение для всех менеджеров. Желательно позвать туда всех, вплоть до директоров. И предварительно до этого пообщаться с директорами про культуру экспериментов в их отделе
2. Онбординг бот для новичков. Пишет про АВ в их первый день. Просто, эффективно, надежно
3. Приходить на все запуски фичей и рассказывать, почему конкретно для этой фичи А/В тоже важен
Спойлер: это поначалу крайне сложно. Но настрйчивость и последовательность вам помогут. Раньше мы приходили под каждый пост с запуском фичи без А/В и просвещали людей. За это и стикер 🚨 нас даже прозвали А/В police
Даным-давно на ранних этапах развития компании существовали 2 занятных метода провеления экспериментов: "метод ступеньки" и "города-близнецы"
Как вы могли догадаться, это сравнение неделя-к-неделе и город-к-городу. Если планомерно не обучать бизнес аналитической культуре, то все будут придумывать такие эксперименты 🙃
Как это исправить?
1. Провести единое обучение для всех менеджеров. Желательно позвать туда всех, вплоть до директоров. И предварительно до этого пообщаться с директорами про культуру экспериментов в их отделе
2. Онбординг бот для новичков. Пишет про АВ в их первый день. Просто, эффективно, надежно
3. Приходить на все запуски фичей и рассказывать, почему конкретно для этой фичи А/В тоже важен
Спойлер: это поначалу крайне сложно. Но настрйчивость и последовательность вам помогут. Раньше мы приходили под каждый пост с запуском фичи без А/В и просвещали людей. За это и стикер 🚨 нас даже прозвали А/В police
🔥10👍2
АВ police существует до сих пор
Первые члены АВ police - @ermolova и я - недоумевают, как можно запускать фичи без А/В
Первые члены АВ police - @ermolova и я - недоумевают, как можно запускать фичи без А/В
🔥9😁5👍3
ML explainability & rude errors
Зачитался серией постов про обьяснимость ML-моделей. На мой взгляд, со стороны бизнеса чаще всего она нужна, чтобы не допускать грубых ошибок: путать класс "человек" и "обезьяна", отрицательный прогноз продаж, рекомендации алкоголя (запрещено законом) и тп
Поэтому часто обсудить с бизнесом, что такое "грубая ошибка" и учесть это в лоссе или ML-метрике становится очень хорошей идеей 😉
Вроде бы очень простая идея, но я крайне редко видел, чтобы ее применяли на практике
Зачитался серией постов про обьяснимость ML-моделей. На мой взгляд, со стороны бизнеса чаще всего она нужна, чтобы не допускать грубых ошибок: путать класс "человек" и "обезьяна", отрицательный прогноз продаж, рекомендации алкоголя (запрещено законом) и тп
Поэтому часто обсудить с бизнесом, что такое "грубая ошибка" и учесть это в лоссе или ML-метрике становится очень хорошей идеей 😉
Вроде бы очень простая идея, но я крайне редко видел, чтобы ее применяли на практике
🤔1
Forwarded from Reliable ML
Интерпретируемость ML моделей для конечного пользователя: где нужна на практике и что делать
Где нужна на практике
Мы недавно рассмотрели ключевых пользователей интерпретации ML-моделей и различия в их потребностях в интерпретации.
На практике - и в рамках концепции Reliable ML - ключевой целью работы над моделью является ее итоговое применение в бизнес-процессах и финансовая польза от этого применения. Следовательно, ключевыми целями интерпретации являются цели бизнес-заказчика (финансовая польза) и пользователя ML-решения (корректное применение в бизнес-процессе).
При этом чаще всего и бизнес-заказчик и пользователь ML-решения формулируют требования и участвуют в приемке решения совместно, поэтому для простоты в некоторой литературе их называют конечными пользователями модели.
В каких блоках цикла управления продуктом продвинутой аналитики интерпретируемость моделей машинного обучения для конечного пользователя вашей модели становится важной? Поделимся своим видением.
В отдельных случаях критично думать об интерпретируемости уже на этапе разработки MVP. Особенно, когда нужно «продать» ваше решение конечному пользователю, или при очень высокой цене ошибки, когда без интерпретируемости моделей бизнес не готов идти даже на проведение пилота.
Но наиболее важное значение интерпретируемость имеет на этапах внедрения решения и мониторинга модельного риска. То есть, понятность модели конечным пользователям приобретает критическое значение именно тогда, когда модель доказала свою эффективность по итогам пилотного эксперимента и было принято решение о ролл-ауте (масштабировании модели на все целевые объекты).
Что именно становится важным?
- Доверие к результату. Принятие решений моделью должно быть понятно бизнесу как в целом (global interpretation), так и на отдельных примерах (local interpretation).
В случае низкого доверия к работе модели и к её логике принятия решений (модель позиционируется или воспринимается как черный ящик) сильно возрастают трудности с интеграцией модели в бизнес-процесс и обучением конечных пользователей ее использованию. Попросту говоря, моделью не хотят пользоваться, нарушают рекомендации, а если что-то идет не так, то виновата всегда модель. Особенно, если решение о ее ролл-ауте в итоге было принято сверху.
И наоборот, высокое доверие к модели способствует ее корректному применению и эффективной и быстрой интеграции в бизнес-процессы.
- Применимость модели в реальных условиях. Реальные условия, в которых работает модель, всегда так или иначе отличаются от тех, на которых она строилась. Кажется, что это уже ни для кого не секрет на фоне большого числа форс-мажорных событий последних лет.
Понятность модели конечному пользователю в продуктиве – как модель пришла к конкретному результату (данные, факторы, логика работы, итоговый прогноз/рекомендация) – снижает риск некорректного применения модели на новых данных, при сложных кейсах, в меняющейся среде. В случае аномального поведения модели человек, которому понятна модель, с большей вероятностью исправит или предотвратит неправильное решение. Митигации риска аномального поведения модели с технической стороны также очень помогают системы мониторинга модельного риска. О них мы поговорим в отдельных постах.
- Информативность для бизнес-процесса. Конечному пользователю должно быть понятно, что делать при виде результата работы модели. Именно это называют информативностью. То есть, для работы в боевых условиях чаще всего критически важно, чтобы результат работы был не просто красивыми сведениями, а содержал конкретную рекомендацию к действию (push to action).
#interpretable_ml #business
Где нужна на практике
Мы недавно рассмотрели ключевых пользователей интерпретации ML-моделей и различия в их потребностях в интерпретации.
На практике - и в рамках концепции Reliable ML - ключевой целью работы над моделью является ее итоговое применение в бизнес-процессах и финансовая польза от этого применения. Следовательно, ключевыми целями интерпретации являются цели бизнес-заказчика (финансовая польза) и пользователя ML-решения (корректное применение в бизнес-процессе).
При этом чаще всего и бизнес-заказчик и пользователь ML-решения формулируют требования и участвуют в приемке решения совместно, поэтому для простоты в некоторой литературе их называют конечными пользователями модели.
В каких блоках цикла управления продуктом продвинутой аналитики интерпретируемость моделей машинного обучения для конечного пользователя вашей модели становится важной? Поделимся своим видением.
В отдельных случаях критично думать об интерпретируемости уже на этапе разработки MVP. Особенно, когда нужно «продать» ваше решение конечному пользователю, или при очень высокой цене ошибки, когда без интерпретируемости моделей бизнес не готов идти даже на проведение пилота.
Но наиболее важное значение интерпретируемость имеет на этапах внедрения решения и мониторинга модельного риска. То есть, понятность модели конечным пользователям приобретает критическое значение именно тогда, когда модель доказала свою эффективность по итогам пилотного эксперимента и было принято решение о ролл-ауте (масштабировании модели на все целевые объекты).
Что именно становится важным?
- Доверие к результату. Принятие решений моделью должно быть понятно бизнесу как в целом (global interpretation), так и на отдельных примерах (local interpretation).
В случае низкого доверия к работе модели и к её логике принятия решений (модель позиционируется или воспринимается как черный ящик) сильно возрастают трудности с интеграцией модели в бизнес-процесс и обучением конечных пользователей ее использованию. Попросту говоря, моделью не хотят пользоваться, нарушают рекомендации, а если что-то идет не так, то виновата всегда модель. Особенно, если решение о ее ролл-ауте в итоге было принято сверху.
И наоборот, высокое доверие к модели способствует ее корректному применению и эффективной и быстрой интеграции в бизнес-процессы.
- Применимость модели в реальных условиях. Реальные условия, в которых работает модель, всегда так или иначе отличаются от тех, на которых она строилась. Кажется, что это уже ни для кого не секрет на фоне большого числа форс-мажорных событий последних лет.
Понятность модели конечному пользователю в продуктиве – как модель пришла к конкретному результату (данные, факторы, логика работы, итоговый прогноз/рекомендация) – снижает риск некорректного применения модели на новых данных, при сложных кейсах, в меняющейся среде. В случае аномального поведения модели человек, которому понятна модель, с большей вероятностью исправит или предотвратит неправильное решение. Митигации риска аномального поведения модели с технической стороны также очень помогают системы мониторинга модельного риска. О них мы поговорим в отдельных постах.
- Информативность для бизнес-процесса. Конечному пользователю должно быть понятно, что делать при виде результата работы модели. Именно это называют информативностью. То есть, для работы в боевых условиях чаще всего критически важно, чтобы результат работы был не просто красивыми сведениями, а содержал конкретную рекомендацию к действию (push to action).
#interpretable_ml #business
👍4❤1