Forwarded from Маркетинг-аналитика с OWOX BI
Старое доброе и очень эффективное A/B тестирование.
История из наших рабочих будней: Райффайзенбанк в 2,2 раза увеличил онлайн-продажи с помощью Google Optimize.
Читать дальше ⬇️
https://www.owox.com/c/4ir
История из наших рабочих будней: Райффайзенбанк в 2,2 раза увеличил онлайн-продажи с помощью Google Optimize.
Читать дальше ⬇️
https://www.owox.com/c/4ir
owox
Transform your data into actionable insights with OWOX BI
Find your growth areas and achieve marketing goals faster with high-quality forecasts and useful insights from OWOX BI.
Forwarded from A/B testing
Данила Леньков из Avito о том, как проходит АБ-тестирование в Avito:
https://www.youtube.com/watch?v=9UGyCOvQ7Z4
via @ABtesting
https://www.youtube.com/watch?v=9UGyCOvQ7Z4
via @ABtesting
YouTube
A/B Experementation Platform. Данила Леньков, Avito
В этом докладе Данила Леньков рассказывает как устроено A/B тестирование в Avito:
— Зачем нужна платформа A/B
— Об экспериментах в Avito: полный цикл эксперимента, управление экспериментом, сплит трафика, админка, сбор метрик, виды метрик, витрина наблюдений…
— Зачем нужна платформа A/B
— Об экспериментах в Avito: полный цикл эксперимента, управление экспериментом, сплит трафика, админка, сбор метрик, виды метрик, витрина наблюдений…
Forwarded from Sergei Morozov (Сергей Морозов)
A/B тестирования
Я не рекомендую вводить изменения на сайтах без A/B тестирований. Вам может казаться, что какое-то изменение точно улучшит нужные метрики, но часто случается обратное. И за счет A/B можно тестировать изменения направленные не только на повышение конверсии в заказ. Пример:
На моем сайте trustland.ru я тестировал, как повысить вовлеченность посетителей на страницах с отзывами. В ходе тестов я выявил, как надо переработать боковой блок этих страниц, и что он должен быть слева, а не справа. Благодаря этим изменениям, примерно в 2 раза больше людей, которые заходят прочитать отзывы, начали заходить и на другие страницы сайта. Т.к. улучшились поведенческие факторы, позиции в поисковиках этих страниц начали расти.
К примеру, по запросам популярных онлайн школ: “geekbrains отзывы”, “skillbox отзывы”, “skillfactory отзывы”, сайт в Google стал занимать первое место и обходить более известные порталы.
Несколько полезных материалов по A/B:
1. Зачем и как проводить A/B тесты. Основные инструменты проведения.
2. Про анализ и статистическую значимость A/B тестов
3. Видео о том, как оценивать результаты A/B тестов нематематикам
4. Как устроено A/B тестирование в Avito и как в Яндексе
5. Видео от Академии Яндекса: 5 хаков для ускорения A/B тестирования
Я не рекомендую вводить изменения на сайтах без A/B тестирований. Вам может казаться, что какое-то изменение точно улучшит нужные метрики, но часто случается обратное. И за счет A/B можно тестировать изменения направленные не только на повышение конверсии в заказ. Пример:
На моем сайте trustland.ru я тестировал, как повысить вовлеченность посетителей на страницах с отзывами. В ходе тестов я выявил, как надо переработать боковой блок этих страниц, и что он должен быть слева, а не справа. Благодаря этим изменениям, примерно в 2 раза больше людей, которые заходят прочитать отзывы, начали заходить и на другие страницы сайта. Т.к. улучшились поведенческие факторы, позиции в поисковиках этих страниц начали расти.
К примеру, по запросам популярных онлайн школ: “geekbrains отзывы”, “skillbox отзывы”, “skillfactory отзывы”, сайт в Google стал занимать первое место и обходить более известные порталы.
Несколько полезных материалов по A/B:
1. Зачем и как проводить A/B тесты. Основные инструменты проведения.
2. Про анализ и статистическую значимость A/B тестов
3. Видео о том, как оценивать результаты A/B тестов нематематикам
4. Как устроено A/B тестирование в Avito и как в Яндексе
5. Видео от Академии Яндекса: 5 хаков для ускорения A/B тестирования
Forwarded from A/B testing
Статья, в которой автор Fareed Mosavat (ex. Dir of Product в Slack) рассказывает о разнице между хорошими и плохими тестами:
https://www.reforge.com/blog/good-experiment-bad-experiment
via @ABtesting
https://www.reforge.com/blog/good-experiment-bad-experiment
via @ABtesting
Reforge
The Importance of Product Trial: Good vs Bad Experiments — Reforge
Fareed Mosavat outlines the 12 lessons he has learned about what sets Good Experiments apart from Bad Experiments.
Forwarded from A/B testing
Advanced A/B Testing Panel with Top Experts [Video]
https://cxl.com/blog/advanced-testing-panel-with-top-experts-video/
via @ABtesting
https://cxl.com/blog/advanced-testing-panel-with-top-experts-video/
via @ABtesting
CXL
Advanced A/B Testing Panel with Top Experts [Video]
At CXL Live 2015 we had an amazing a/b split testing panel featuring statistics and testing gurus Lukas Vermeer from Booking.com, Matt Gershoff from
Forwarded from A/B testing
10 статистических ловушек в А/Б тестировании:
https://cxl.com/blog/testing-statistics-mistakes/
via @ABtesting
https://cxl.com/blog/testing-statistics-mistakes/
via @ABtesting
CXL
10 Statistics Mistakes and Traps in A/B Testing: The Guide for Optimizers
Learn the 10 most important statistical traps to avoid when doing A/B testing if you want to have statistically significant results.
Forwarded from A/B testing
Появились видеозаписи с Experiment Fest x Яндекс.Практикум:
https://www.youtube.com/watch?v=KvIJ8FCJzr4&list=PL6Wui14DvQPz-s7nng8Sedzj1Q5xLOs69&index=1
via @ABtesting
https://www.youtube.com/watch?v=KvIJ8FCJzr4&list=PL6Wui14DvQPz-s7nng8Sedzj1Q5xLOs69&index=1
via @ABtesting
YouTube
001. Методы сокращения дисперсии, и зачем это нужно — Анатолий Карпов
Доклад с совместного митапа Expfest x Яндекс.Практикум. Про эксперименты
Forwarded from A/B testing
Forwarded from Vit Cheremisinov
Онлайн-лекция про методы сокращения дисперсии для увеличения чувствительности метрик и сокращение времени a/b тестов.
На лекции мы обсудим
Методы трансформации данных для увеличения чувствительности метрик
CUPED и его модификации
Виды стратификаций для сокращения дисперсии
Спикеры
Виталий Черемисинов, experiment-fest
Искандер Мирмахмадов, experiment-fest
Когда - 1го апреля
Где - трансляция на youtube
Во сколько - с 20:00 до 22:00
Ссылка на трансляцию придет на почту в день мероприятия.
https://price-discovery.timepad.ru/event/1287320/
На лекции мы обсудим
Методы трансформации данных для увеличения чувствительности метрик
CUPED и его модификации
Виды стратификаций для сокращения дисперсии
Спикеры
Виталий Черемисинов, experiment-fest
Искандер Мирмахмадов, experiment-fest
Когда - 1го апреля
Где - трансляция на youtube
Во сколько - с 20:00 до 22:00
Ссылка на трансляцию придет на почту в день мероприятия.
https://price-discovery.timepad.ru/event/1287320/
price-discovery.timepad.ru
Способы ускорения экспериментов и увеличения чувствительности метрик / События на TimePad.ru
Онлайн-лекция про методы сокращения дисперсии для увеличения чувствительности метрик и сокращение времени a/b тестов.
Forwarded from BigQuery Insights
Как экспериментально оценить предпочтения пользователей, чтобы понять, что менять в продукте? Как проверить свои гипотезы и какие есть инструменты для принятия решений?
1 апреля в 21:00 (мск) ребята из ProductStar проведут бесплатный интенсив: «A/B тестирование, как инструмент для принятия решений».
👨🏫 Кто выступит?
Настя Московченко, Technical Manager в Яндекс и Костя Чукреев, Product Machine Learning Developer в Яндекс.
👩🏫 О чем пойдет речь?
— Что такое А/B-тестирование?
— Как проводятся А/B тесты и как размер выборки влияет них?
— Как оценить влияние фичи на ваш продукт?
— Как быстро проводить эксперименты и сделать их частью сервиса? Опыт Яндекс.Еды.
Два самых активных участника вебинара получат сертификат на бесплатное обучение в ProductStar.
Участие бесплатное, но регистрация обязательна.
Зарегистрироваться на вебинар 👉@ProductStarAnalyticsBot
1 апреля в 21:00 (мск) ребята из ProductStar проведут бесплатный интенсив: «A/B тестирование, как инструмент для принятия решений».
👨🏫 Кто выступит?
Настя Московченко, Technical Manager в Яндекс и Костя Чукреев, Product Machine Learning Developer в Яндекс.
👩🏫 О чем пойдет речь?
— Что такое А/B-тестирование?
— Как проводятся А/B тесты и как размер выборки влияет них?
— Как оценить влияние фичи на ваш продукт?
— Как быстро проводить эксперименты и сделать их частью сервиса? Опыт Яндекс.Еды.
Два самых активных участника вебинара получат сертификат на бесплатное обучение в ProductStar.
Участие бесплатное, но регистрация обязательна.
Зарегистрироваться на вебинар 👉@ProductStarAnalyticsBot
Forwarded from Интернет-аналитика // Алексей Никушин
Начинается онлайн-лекция про методы сокращения дисперсии для увеличения чувствительности метрик и сокращение времени a/b тестов.
Ссылка на трансляцию
https://www.youtube.com/watch?v=DtDGYUW0oGY
Начало в 20:00
Программа лекции https://price-discovery.timepad.ru/event/1287320/
@internetanalytics
Ссылка на трансляцию
https://www.youtube.com/watch?v=DtDGYUW0oGY
Начало в 20:00
Программа лекции https://price-discovery.timepad.ru/event/1287320/
@internetanalytics
YouTube
Методы ускорения a/b тестов
Enjoy the videos and music you love, upload original content, and share it all with friends, family, and the world on YouTube.
Forwarded from A/B testing
Forwarded from Trisigma — про эксперименты
EXPF x Яндекс.Практикум. Про эксперименты
В феврале был проведен совместный митап EXPF и Яндекс.Практикум, посвященный онлайн-экспериментам. Обсуждались подходы к анализу A/B-тестирований и как они организованы в разных командах. В митапе приняли участие аналитики и руководители направлений таких компаний как: Skyeng, Avito, X5, Яндекс, Mail ru, Raiffeisen, Uma tech, EXPF
Темы митапа:
- Методы сокращения дисперсии, и зачем это нужно — Анатолий Карпов, Mail ru
- Увеличение чувствительности в A/B с помощью Cuped — Валерий Бабушкин, X5, Яндекс
- A/B тесты и как мы их готовим — Станислав Гафаров, Uma tech
- Оценка аналитиков и гайдлайны — Виталий Черемисинов, EXPF
- Как аналитику сделать API для прода и не облажаться — Александр Кучин, Skyeng
- Статистика в АБ мифы и реальность — Данила Леньков, Avito
- Как ускорить А/Б тестирование с помощью машинного обучения — Нерсес Богиян, Raiffeisen
Все видео доступны здесь
https://www.youtube.com/watch?v=KvIJ8FCJzr4&list=PL6Wui14DvQPz-s7nng8Sedzj1Q5xLOs69&index=1
В феврале был проведен совместный митап EXPF и Яндекс.Практикум, посвященный онлайн-экспериментам. Обсуждались подходы к анализу A/B-тестирований и как они организованы в разных командах. В митапе приняли участие аналитики и руководители направлений таких компаний как: Skyeng, Avito, X5, Яндекс, Mail ru, Raiffeisen, Uma tech, EXPF
Темы митапа:
- Методы сокращения дисперсии, и зачем это нужно — Анатолий Карпов, Mail ru
- Увеличение чувствительности в A/B с помощью Cuped — Валерий Бабушкин, X5, Яндекс
- A/B тесты и как мы их готовим — Станислав Гафаров, Uma tech
- Оценка аналитиков и гайдлайны — Виталий Черемисинов, EXPF
- Как аналитику сделать API для прода и не облажаться — Александр Кучин, Skyeng
- Статистика в АБ мифы и реальность — Данила Леньков, Avito
- Как ускорить А/Б тестирование с помощью машинного обучения — Нерсес Богиян, Raiffeisen
Все видео доступны здесь
https://www.youtube.com/watch?v=KvIJ8FCJzr4&list=PL6Wui14DvQPz-s7nng8Sedzj1Q5xLOs69&index=1
YouTube
001. Методы сокращения дисперсии, и зачем это нужно — Анатолий Карпов
Доклад с совместного митапа Expfest x Яндекс.Практикум. Про эксперименты
Forwarded from Trisigma — про эксперименты
Tripadvisor и модификация CUPED
Мы уже писали выше, что многие компании всячески пытаются найти новые способы увеличения чувствительности метрик за счет оптимизации дисперсии.
Это нужно для увеличения скорости принятия решений по результатам a/b тестов.
В статье Tripadvisor подробно рассказывает про то, какие методы они используют у себя. Отдельно хочется обратить внимание на то, какую модификацию CUPED они предлагают.
Вместо ковариации используется коэффициент детерминации.
Их цитата про модификацию
"A nice benefit of using CUPED is that the resulting R-squared from the centered regression can be interpreted as the percentage variance reduction achieved compared to the normal method (Deng et. al, 2013). In other words, the more accurately we are able to predict the outcome metric using pre-experiment data, the greater the variance reduction. It is also a convenient way to calculate the variance on the estimator."
Это действительно будет работать, если вы хорошо подобрали переменные (потрали значительное время на исследование). В противном случае, результат не оправдает ожиданий.
https://www.tripadvisor.com/engineering/reducing-a-b-test-measurement-variance-by-30/
Про базовую реализацию CUPED можно прочитать в нашей статье
Мы уже писали выше, что многие компании всячески пытаются найти новые способы увеличения чувствительности метрик за счет оптимизации дисперсии.
Это нужно для увеличения скорости принятия решений по результатам a/b тестов.
В статье Tripadvisor подробно рассказывает про то, какие методы они используют у себя. Отдельно хочется обратить внимание на то, какую модификацию CUPED они предлагают.
Вместо ковариации используется коэффициент детерминации.
Их цитата про модификацию
"A nice benefit of using CUPED is that the resulting R-squared from the centered regression can be interpreted as the percentage variance reduction achieved compared to the normal method (Deng et. al, 2013). In other words, the more accurately we are able to predict the outcome metric using pre-experiment data, the greater the variance reduction. It is also a convenient way to calculate the variance on the estimator."
Это действительно будет работать, если вы хорошо подобрали переменные (потрали значительное время на исследование). В противном случае, результат не оправдает ожиданий.
https://www.tripadvisor.com/engineering/reducing-a-b-test-measurement-variance-by-30/
Про базовую реализацию CUPED можно прочитать в нашей статье
Forwarded from Trisigma — про эксперименты
Коррекция дисперсии при bootstrap
При работе с bootstrap часто возникает необходимость работать с bias/varience reduction.
Почему это важно?
Большинство аналитиков используют непараметрическую модификацию bootstrap'а, т.е. не берут в рассчет статистику популяции. Непараметрика может давать достаточно большой bias, а коррекция bias приводить к увеличению дисперсии. Проблемы известны, но вот решения очевидны не всегда.
Прекрасный материал на данную тему от Japan Institute of Statistical Mathematics
https://www.ism.ac.jp/editsec/aism/pdf/062_1_0209.pdf
EXPF 15 апреля в 20-00 проводит бесплатную онлайн лекцию про Bootstrap
Если вы используете bootstrap/планируете использовать/не знаете что можно использовать и хотите узнать больше про особенности, ограничения и возможности – лекция будет вам очень полезна
Про что поговорим на лекции
- Какие есть ограничения использования bootstrap
- Чем параметрический bootstrap отличается от непараметрического
- Почему boot распределение нельзя «скармливать» статистическому критерию
- Как сделать так, чтобы bootstrap был не таким прожорливым
https://price-discovery.timepad.ru/event/1293731/
При работе с bootstrap часто возникает необходимость работать с bias/varience reduction.
Почему это важно?
Большинство аналитиков используют непараметрическую модификацию bootstrap'а, т.е. не берут в рассчет статистику популяции. Непараметрика может давать достаточно большой bias, а коррекция bias приводить к увеличению дисперсии. Проблемы известны, но вот решения очевидны не всегда.
Прекрасный материал на данную тему от Japan Institute of Statistical Mathematics
https://www.ism.ac.jp/editsec/aism/pdf/062_1_0209.pdf
EXPF 15 апреля в 20-00 проводит бесплатную онлайн лекцию про Bootstrap
Если вы используете bootstrap/планируете использовать/не знаете что можно использовать и хотите узнать больше про особенности, ограничения и возможности – лекция будет вам очень полезна
Про что поговорим на лекции
- Какие есть ограничения использования bootstrap
- Чем параметрический bootstrap отличается от непараметрического
- Почему boot распределение нельзя «скармливать» статистическому критерию
- Как сделать так, чтобы bootstrap был не таким прожорливым
https://price-discovery.timepad.ru/event/1293731/
Forwarded from Trisigma — про эксперименты
Team-draft interleaving
Концепция Team-draft interleaving тестов звучит достаточно просто.
Представьте, что вы хотите проверить новый алгоритм ранжирования товаров в каталоге интернет-магазина.
Вместо того, что сравнивать два разных алгоримта на разныых ветках эксперимента - вы покажите пользователю сразу два алгоритма одновременно. Например, каждый второй товар - один алгоритм,каждый третий товар - другой алгоритм. Такой подход к эксперименту позволит невелировать ряд продуктовых факторов, которые будут влияться на его исход.
К этой методологии часто прибегую поисковые системы, чтобы лучше и быстрее оценивать качества новых поисковых алгоритмов.
На что важно обратить внимание
1) Ваши выбрки не независимы - пользователь находится сразу в двух ветках эксперимента. В этом случае дисперсия случайной величины будет считаться не как на независимых выборках и это будет сказываться на методах оценки эксперимента
2) Важно учитывать расположение выдаваемого алгоритмом результата - приоритет выдачи может сильно сказываться на исходах эксперимента
Чтобы лучше разобраться в этой методологии мы предлагаем почитать/посмотреть несколько материалов
1) Как к TDI подходит Netflix - статья без технических и математических нюансов
https://netflixtechblog.com/interleaving-in-online-experiments-at-netflix-a04ee392ec55
2) Paper с описанием статистической части метода от MS, Yahoo и Cornell University
https://www.cs.cornell.edu/people/tj/publications/chapelle_etal_12a.pdf
3) Очень доступный доклад от Романа Поборчего на AIC Analytics Day
https://www.youtube.com/watch?v=voY7waRb_D0
Концепция Team-draft interleaving тестов звучит достаточно просто.
Представьте, что вы хотите проверить новый алгоритм ранжирования товаров в каталоге интернет-магазина.
Вместо того, что сравнивать два разных алгоримта на разныых ветках эксперимента - вы покажите пользователю сразу два алгоритма одновременно. Например, каждый второй товар - один алгоритм,каждый третий товар - другой алгоритм. Такой подход к эксперименту позволит невелировать ряд продуктовых факторов, которые будут влияться на его исход.
К этой методологии часто прибегую поисковые системы, чтобы лучше и быстрее оценивать качества новых поисковых алгоритмов.
На что важно обратить внимание
1) Ваши выбрки не независимы - пользователь находится сразу в двух ветках эксперимента. В этом случае дисперсия случайной величины будет считаться не как на независимых выборках и это будет сказываться на методах оценки эксперимента
2) Важно учитывать расположение выдаваемого алгоритмом результата - приоритет выдачи может сильно сказываться на исходах эксперимента
Чтобы лучше разобраться в этой методологии мы предлагаем почитать/посмотреть несколько материалов
1) Как к TDI подходит Netflix - статья без технических и математических нюансов
https://netflixtechblog.com/interleaving-in-online-experiments-at-netflix-a04ee392ec55
2) Paper с описанием статистической части метода от MS, Yahoo и Cornell University
https://www.cs.cornell.edu/people/tj/publications/chapelle_etal_12a.pdf
3) Очень доступный доклад от Романа Поборчего на AIC Analytics Day
https://www.youtube.com/watch?v=voY7waRb_D0
Medium
Innovating Faster on Personalization Algorithms at Netflix Using Interleaving
By Joshua Parks, Juliette Aurisset, Michael Ramm
Forwarded from A/B testing
Хороший гайд по Байесовскому А/В-тестированию:
https://towardsdatascience.com/bayesian-a-b-testing-with-python-the-easy-guide-d638f89e0b8a
via @ABtesting
https://towardsdatascience.com/bayesian-a-b-testing-with-python-the-easy-guide-d638f89e0b8a
via @ABtesting
Medium
Bayesian A/B Testing with Python: the easy guide
If you landed on this page, you already know what an A/B test is, but maybe you have some doubt on how to analyse the results within a…
Forwarded from Trisigma — про эксперименты
Оценка качества систем сплитования
Если составить рейтинг того, про что забывают при проверке гипотез или разработке новых метрик - то A/A тесты войдут в топ 3.
A/A тесты требуются не только для проверки качества систем сплитования, но и для выбора метрик.
Не каждая метрика подходит для экспериментов в силу своих описательных особенностей.
Очень доступная статья про то, как проверить качество своей системы a/b тестов - https://habr.com/ru/company/hh/blog/321386/
Если составить рейтинг того, про что забывают при проверке гипотез или разработке новых метрик - то A/A тесты войдут в топ 3.
A/A тесты требуются не только для проверки качества систем сплитования, но и для выбора метрик.
Не каждая метрика подходит для экспериментов в силу своих описательных особенностей.
Очень доступная статья про то, как проверить качество своей системы a/b тестов - https://habr.com/ru/company/hh/blog/321386/
Хабр
Как оценить качество системы A/B-тестирования
Вот уже более полугода в компании используется единая система для проведения A/B-экспериментов. Одной из самых важных частей этой системы является процедура проверки качества, которая помогает нам...
Forwarded from Trisigma — про эксперименты
Материалы с прошедшей лекции по бутстрапу 15.04.2020
Скачать презентацию и R скрипт можно здесь
Запись стрима лекции на ютубе здесь
Скачать презентацию и R скрипт можно здесь
Запись стрима лекции на ютубе здесь
YouTube
Bootstrap: виды, особенности, ограничения и способы применения (EXPF)
На лекции обсудим
- Какие есть ограничения использования bootstrap
- Чем параметрический bootstrap отличается от непараметрического
- Почему boot распределение нельзя «скармливать» статистическому критерию
- Как сделать так, чтобы bootstrap был не таким…
- Какие есть ограничения использования bootstrap
- Чем параметрический bootstrap отличается от непараметрического
- Почему boot распределение нельзя «скармливать» статистическому критерию
- Как сделать так, чтобы bootstrap был не таким…