Как Flo проводят эксперименты:
https://medium.com/flo-engineering/how-flo-conducts-experiments-5ee35fc3327f
via @ABtesting
https://medium.com/flo-engineering/how-flo-conducts-experiments-5ee35fc3327f
via @ABtesting
Бесплатный курс про A/B-тесты от Devtodev, рассматриваются правила работы с гипотезами: как их искать и находить, как определять приоритеты, как отбрасывать ненужные, когда A/B-тест нужен, а когда нет: https://www.devtodev.com/education/online-course/ab-tests-from-a-to-b-part1
via @ABtesting
via @ABtesting
Forwarded from Datalytics
Статья про байесовский подход к оценке результатов A/B-тестирования. Хорошо и доступно описывается сам подход и его преимущества. Также в статье есть примеры кода, которые будут полезны для собственных проектов
https://towardsdatascience.com/why-you-should-try-the-bayesian-approach-of-a-b-testing-38b8079ea33a
https://towardsdatascience.com/why-you-should-try-the-bayesian-approach-of-a-b-testing-38b8079ea33a
Medium
Why you should try the Bayesian approach of A/B testing
The intuitive way of A/B testing. The advantages of the Bayesian approach and how to do it.
Эксперименты бывают долгими по-разным причинам:
1. Хотим увидеть очень маленькое изменение => надо много трафика.
Это решается или подбором (1) более чувствительной метрики, или (2) исправлением самой гипотезы.
Разработка более чувствительных метрик – это долгий аналитический процесс.
Если компания/продукт уже достаточно зрелая и вышла на стадию оптимизации, то имеет смысл потратить на это время и тем самым ускорить эксперименты. Яндекс и Booking много пишут про создание синтетических метрик, которые часто являются каким-либо математическим преобразованием над исходной метрикой.
Если мы говорим про запуск нового продукта/стартапа, то надо отправлять гипотезу на доработку (делать ux-ресерчи и тестировать мокапы) или вообще отказываться от ее проверки. АБ-тест тут не подходит – это очень дорогой способ проверки гипотезы, т.к. требует наличия разработанного продукта.
2. Эффект изменения сильно отложен => долго ждать обратной связи от рынка
В SaaS одна из главных метрик – это продление подписки. Если мы говорим про готовые подписки, то и ждать результатов гипотезы нужно год.
В таком сценарии надо искать прокси-метрики, которые могут "предсказывать" отложенные метрики.
Например, наша целевая метрика – % продлений через год. Подписка продляется через Apple Store автоматически через год. Это правило платформы, которое на которое не можем повлиять.
Но у этой метрики есть зеркальная метрика – отмены подписок. Отменять подписку пользователь может самостоятельно в любое время по собственному желанию. И мы, как продукт, можем на это желание влиять. Поэтому такая "обратная" метрика будет хорошим индикатором для основной метрики.
Другой пример – возвращение пользователей в продукт через месяц (monthly retention). Неохота ждать месяц для проверки влияния на эту метрику. Тут хорошее поле для исследований данных. Очень часто количество сессий / время в приложении / retention на первый день хорошо "предсказывают" retention через месяц. Поэтому можно брать эти прокси-метрики.
3. Делаем слишком много мелких изменений в продукте и хотим оценить их суммарный эффект
В таком случае принято резервировать долгосрочную контрольную группу и через один-два квартала сравнивать с ней с новый продукт. Тут не вижу способов как ускорить. Просто нужно принимать это как есть и коммуницировать стейкхолдерам.
(с) Антон Марцен
1. Хотим увидеть очень маленькое изменение => надо много трафика.
Это решается или подбором (1) более чувствительной метрики, или (2) исправлением самой гипотезы.
Разработка более чувствительных метрик – это долгий аналитический процесс.
Если компания/продукт уже достаточно зрелая и вышла на стадию оптимизации, то имеет смысл потратить на это время и тем самым ускорить эксперименты. Яндекс и Booking много пишут про создание синтетических метрик, которые часто являются каким-либо математическим преобразованием над исходной метрикой.
Если мы говорим про запуск нового продукта/стартапа, то надо отправлять гипотезу на доработку (делать ux-ресерчи и тестировать мокапы) или вообще отказываться от ее проверки. АБ-тест тут не подходит – это очень дорогой способ проверки гипотезы, т.к. требует наличия разработанного продукта.
2. Эффект изменения сильно отложен => долго ждать обратной связи от рынка
В SaaS одна из главных метрик – это продление подписки. Если мы говорим про готовые подписки, то и ждать результатов гипотезы нужно год.
В таком сценарии надо искать прокси-метрики, которые могут "предсказывать" отложенные метрики.
Например, наша целевая метрика – % продлений через год. Подписка продляется через Apple Store автоматически через год. Это правило платформы, которое на которое не можем повлиять.
Но у этой метрики есть зеркальная метрика – отмены подписок. Отменять подписку пользователь может самостоятельно в любое время по собственному желанию. И мы, как продукт, можем на это желание влиять. Поэтому такая "обратная" метрика будет хорошим индикатором для основной метрики.
Другой пример – возвращение пользователей в продукт через месяц (monthly retention). Неохота ждать месяц для проверки влияния на эту метрику. Тут хорошее поле для исследований данных. Очень часто количество сессий / время в приложении / retention на первый день хорошо "предсказывают" retention через месяц. Поэтому можно брать эти прокси-метрики.
3. Делаем слишком много мелких изменений в продукте и хотим оценить их суммарный эффект
В таком случае принято резервировать долгосрочную контрольную группу и через один-два квартала сравнивать с ней с новый продукт. Тут не вижу способов как ускорить. Просто нужно принимать это как есть и коммуницировать стейкхолдерам.
(с) Антон Марцен
Рекомендации по проведению A/B-тестов от Lime Engineering:
https://medium.com/lime-eng/experimentation-analysis-at-lime-bee846d62dd
via @ABtesting
https://medium.com/lime-eng/experimentation-analysis-at-lime-bee846d62dd
via @ABtesting
Medium
Experimentation Analysis at Lime
Inaccurate experimentation analysis leads to suboptimal business decisions. As Lime grows, the importance of standardized experiment…
Отличный Гайд по байесовской статистике и немного о байесовском A/B-тестировании и проверке гипотез.
via @ABtesting
via @ABtesting
Появился второй модуль бесплатного курса по A/B-тестированию от Devtodev. Первый модуль был о работе с гипотезами и подготовке к тестированию, а второй - о статистике тестов.
via @ABtesting
via @ABtesting
A/B-тесты - не единственный инструмент для понимания причинно-следственной связи: квазиэксперименты и контрфакты - альтернативные инструменты для причинного вывода:
https://medium.com/data-shopify/how-to-use-quasi-experiments-and-counterfactuals-to-build-great-products-487193794da
via @ABtesting
https://medium.com/data-shopify/how-to-use-quasi-experiments-and-counterfactuals-to-build-great-products-487193794da
via @ABtesting
Medium
How to Use Quasi-experiments and Counterfactuals to Build Great Products
A/B tests aren’t the only tool to understand causality: quasi-experiments and counterfactuals are powerful tools for causal inference.
Руководство по А/В-тестированию от VK tech:
https://medium.com/@vktech/practitioners-guide-to-statistical-tests-ed2d580ef04f
via @ABtesting
https://medium.com/@vktech/practitioners-guide-to-statistical-tests-ed2d580ef04f
via @ABtesting
Как платформы для экспериментов, такие как Optimizely, игнорируют один из самых фундаментальных принципов AB-тестирования:
https://towardsdatascience.com/unlocking-peeking-in-ab-tests-7847b9c2f6bb
via @ABtesting
https://towardsdatascience.com/unlocking-peeking-in-ab-tests-7847b9c2f6bb
via @ABtesting
PlanOut.js - библиотека, разработанная Facebook для A/B-тестирования. Помогает проводить тесты более качественно:
https://nimeetshah.medium.com/how-to-implement-an-a-b-testing-framework-in-reactjs-with-planout-f36c3fa29940
via @ABtesting
https://nimeetshah.medium.com/how-to-implement-an-a-b-testing-framework-in-reactjs-with-planout-f36c3fa29940
via @ABtesting
Как в Flo повысили долю успешных A/B тестов на 30% через внедрение нового процесса работы с гипотезами:
https://gopractice.ru/how_to_increase_the_number_of_successful_experiments/
via @ABtesting
https://gopractice.ru/how_to_increase_the_number_of_successful_experiments/
via @ABtesting
4 ошибки A/B-тестирования и как их исправлять:
https://towardsdatascience.com/a-b-testing-top-4-mistakes-with-business-cases-fixes-85e76767dfde
via @ABtesting
https://towardsdatascience.com/a-b-testing-top-4-mistakes-with-business-cases-fixes-85e76767dfde
via @ABtesting
Forwarded from BigQuery Insights
В сети появился отличный пример рассчета уровня значимости результатов A/B-тестирования в BigQuery с применением user-defined functions.
@BigQuery
@BigQuery
Что такое коэффициент несоответствия выборки (Sample Ratio Mismatch) и как с ним работать:
https://link.medium.com/ZJeoj3OlJbb
via @ABtesting
https://link.medium.com/ZJeoj3OlJbb
via @ABtesting
О формулировании гипотез, подходах и критериях корректности, и проверке гипотез разных уровней:
https://soundcloud.com/productsense/make-sense-120
via @ABtesting
https://soundcloud.com/productsense/make-sense-120
via @ABtesting
SoundCloud
Hear the world’s sounds
Explore the largest community of artists, bands, podcasters and creators of music & audio
Эдуард Григорян: Metric optimization for Quality Control of A/B testing:
https://www.youtube.com/watch?v=4qvpZEKkARI
via @ABtesting
https://www.youtube.com/watch?v=4qvpZEKkARI
via @ABtesting
YouTube
Эдуард Григорян: Metric optimization for Quality Control of A/B testing
Data Fest Online 2020
A/B Testing Track https://ods.ai/tracks/ab-testing-df2020
Посмотреть эфир и список треков и организаторов: https://datafest.ru/2020/
Зарегистрироваться на фест и получить доступ к трекам: https://ods.ai/events/datafest2020
Вступить…
A/B Testing Track https://ods.ai/tracks/ab-testing-df2020
Посмотреть эфир и список треков и организаторов: https://datafest.ru/2020/
Зарегистрироваться на фест и получить доступ к трекам: https://ods.ai/events/datafest2020
Вступить…
Основы математики АБ-тестирования:
https://towardsdatascience.com/a-gentle-introduction-to-the-mathematics-behind-a-b-testing-3afe354bdce3
via @ABtesting
https://towardsdatascience.com/a-gentle-introduction-to-the-mathematics-behind-a-b-testing-3afe354bdce3
via @ABtesting
О досрочном прекращении экспериментов
Система раннего предупреждения без которой можно потерять много времени и данных, не говоря уже о потенциальных потерях в доходах и нежелательных последствиях для пользовательского опыта.
via @ABtesting
Система раннего предупреждения без которой можно потерять много времени и данных, не говоря уже о потенциальных потерях в доходах и нежелательных последствиях для пользовательского опыта.
via @ABtesting