Forwarded from GoPractice!
Новое эссе на GoPractice!
“Как в Flo повысили долю успешных A/B тестов на 30% через внедрение нового процесса работы с гипотезами”
Дима Золотухин, Head of Analytics Flo (мобильное приложение № 1 в сфере женского здоровья), делится тем, как они повысили долю успешных экспериментов в компании на 30% через упразднение монополии на формулирование гипотез, а также введение эффективных процессов их приоритизации и тестирования.
Внутри вы найдете шаблон для формулирования гипотезы, алгоритм приоритизации, а также ряд других полезных артефактов, чтобы перенести опыт Flo на свою команду или компанию.
https://gopractice.ru/how_to_increase_the_number_of_successful_experiments/
Обсудить прочитанное можно в чате Ask Kevin! https://news.1rj.ru/str/askkevin
“Как в Flo повысили долю успешных A/B тестов на 30% через внедрение нового процесса работы с гипотезами”
Дима Золотухин, Head of Analytics Flo (мобильное приложение № 1 в сфере женского здоровья), делится тем, как они повысили долю успешных экспериментов в компании на 30% через упразднение монополии на формулирование гипотез, а также введение эффективных процессов их приоритизации и тестирования.
Внутри вы найдете шаблон для формулирования гипотезы, алгоритм приоритизации, а также ряд других полезных артефактов, чтобы перенести опыт Flo на свою команду или компанию.
https://gopractice.ru/how_to_increase_the_number_of_successful_experiments/
Обсудить прочитанное можно в чате Ask Kevin! https://news.1rj.ru/str/askkevin
GoPractice
ᐈ Приоритизация гипотез A/B-тестов и прокси метрики - GoPractice
✓ Приоритизация гипотез, прокси метрики в A/B-тестах — кейс команды Flo. Head of Analytics Flo Дима Золотухин
Forwarded from A/B testing
PlanOut.js - библиотека, разработанная Facebook для A/B-тестирования. Помогает проводить тесты более качественно:
https://nimeetshah.medium.com/how-to-implement-an-a-b-testing-framework-in-reactjs-with-planout-f36c3fa29940
via @ABtesting
https://nimeetshah.medium.com/how-to-implement-an-a-b-testing-framework-in-reactjs-with-planout-f36c3fa29940
via @ABtesting
Forwarded from A/B testing
4 ошибки A/B-тестирования и как их исправлять:
https://towardsdatascience.com/a-b-testing-top-4-mistakes-with-business-cases-fixes-85e76767dfde
via @ABtesting
https://towardsdatascience.com/a-b-testing-top-4-mistakes-with-business-cases-fixes-85e76767dfde
via @ABtesting
Замечательная статья под названием "Как не нужно проводить A/B тест: https://www.evanmiller.org/how-not-to-run-an-ab-test.htmlт
Forwarded from Datalytics
Ребята из EXPF подготовили отличный перевод статьи про методику проведения экспериментов Switchback. Эта техника тестирования полезна в условиях сильного влияния наблюдений (например, таксистов, курьеров или потребителей) друг на друга — эту проблему еще называют как “социальный эффект” или Network Effect.
В Ситимобил уже успешно внедряется свитчбэк-тестирование. В конце статьи вы можете прочитать комментарий об их опыте и впечатления от использования свитчбэка из первых уст.
Switchback-тестирование. Как бороться с социальными эффектами в A/B-тестах
16 марта у EXPF стартует интенсив «Математическая статистика и A/B-тесты», где будут на практике рассмотрены основные методологические и математические проблемы A/B тестирования. Этот интенсив будет полезен всем, кто хочет начать разбираться в теме и начать проводить A/B тесты так, чтобы их результатам можно было доверять.
В Ситимобил уже успешно внедряется свитчбэк-тестирование. В конце статьи вы можете прочитать комментарий об их опыте и впечатления от использования свитчбэка из первых уст.
Switchback-тестирование. Как бороться с социальными эффектами в A/B-тестах
16 марта у EXPF стартует интенсив «Математическая статистика и A/B-тесты», где будут на практике рассмотрены основные методологические и математические проблемы A/B тестирования. Этот интенсив будет полезен всем, кто хочет начать разбираться в теме и начать проводить A/B тесты так, чтобы их результатам можно было доверять.
Forwarded from Product Analytics
Хороший справочник по A/B-тестированию и выбору критериев с примерами кода на Python.
via @ProductAnalytics
via @ProductAnalytics
Иногда требуется рассчитать стат. значимость прямо в BigQuery для отчета в Data Studio. Мне недавно пришлось это делать. Помощь подоспела: https://towardsdatascience.com/google-datastudio-dashboard-how-to-add-a-b-test-significance-level-in-5-minutes-8b839f28a332
Medium
Google DataStudio dashboards: how to add A/B test significance level in 5 minutes
For those who display A/B tests in Google DataStudio, there is an easy way to integrate significance level. No need to use an external…
Отличный доклад Валерия Бабушкина с Матемаркетинга 2018 про альтернативное проведение АБ тестов https://www.youtube.com/watch?v=XWw4Wi6K0QU
YouTube
Валерий Бабушкин - A/B-тестирования при невозможности разбиения покупательской аудитории на группы
Совсем скоро Матемаркетинг - 23, 9-10 ноября
Подробности: https://matemarketing.ru/
Валерий Бабушкин, руководитель управления развития данных Х5 Retail Group на конференции Матемаркетинг (https://matemarketing.ru/) рассказывает о том, что эффективная обработка…
Подробности: https://matemarketing.ru/
Валерий Бабушкин, руководитель управления развития данных Х5 Retail Group на конференции Матемаркетинг (https://matemarketing.ru/) рассказывает о том, что эффективная обработка…
И презентация к докладу https://drive.google.com/file/d/1eQ73-jY_c2ejsaq6267AQNqNZFxNoFRy/view
Forwarded from Trisigma — про эксперименты
Beyond Power Analysis: Metric Sensitivity in A/B Tests
У Майков пару дней назад вышла новая статья про оптимизацию чувствительности метрик!
В статье описываются уже известные методики по работе с метрикой (например, логарифмирование или использование техники сокращения дисперсии), но зато коротко, ясно и понятно. Помимо этого, в статье описано то, как вы можете использовать исторические эксперименты для получения знаний о направленности метрики.
https://www.microsoft.com/en-us/research/group/experimentation-platform-exp/articles/beyond-power-analysis-metric-sensitivity-in-a-b-tests/
У Майков пару дней назад вышла новая статья про оптимизацию чувствительности метрик!
В статье описываются уже известные методики по работе с метрикой (например, логарифмирование или использование техники сокращения дисперсии), но зато коротко, ясно и понятно. Помимо этого, в статье описано то, как вы можете использовать исторические эксперименты для получения знаний о направленности метрики.
https://www.microsoft.com/en-us/research/group/experimentation-platform-exp/articles/beyond-power-analysis-metric-sensitivity-in-a-b-tests/
Microsoft Research
Beyond Power Analysis: Metric Sensitivity Analysis in A/B Tests - Microsoft Research
A/B test is commonly used to measure a feature impact. How can you maximize the chance of detecting an effect when there is one? How can you increase the confidence that there is no treatment effect when the metrics have no stat-sig movement?
#карпов #вебинар
Вчера прошел вебинар Анатолия Карпова про проблемы подглядывания в АБ тестах https://www.youtube.com/watch?v=jnFVmtaeSA0&t=2034s
Вчера прошел вебинар Анатолия Карпова про проблемы подглядывания в АБ тестах https://www.youtube.com/watch?v=jnFVmtaeSA0&t=2034s
И еще вебинар с отличными спикерами: Романом Поборчим, Валерием Бабушкиным, Искандером Мирмахмадовым, Данилой Леньков, Еленой Швец. https://www.youtube.com/watch?v=4yX3dBD8RcI
Forwarded from Аналитика. Это просто
Свежая статься Искандера Мирмахмадова про работу с социальными эффектами при работе с АБ тестами, https://bit.ly/3tYNWlr
Medium
Switchback-тестирование. Как бороться с социальными эффектами в A/B-тестах
Дисклеймер
Есть часто встречающаяся проблема при проведении АБ тестов - неравномерное деление трафика, например, 80%/20% или 90%/10%. Конечно, этого лучше избегать, но не всегда это возможно. Спланировать продолжительность теста в таком случае - тоже проблема. Распространенный калькуляторы предполагают, что трафик будет делиться поровну.
Статьи про особенности АБ тестов с неравным делением трафика и ссылка на калькулятор:
- https://bit.ly/3aQLRkY
- https://bit.ly/2S9G6HN
- https://www.statsig.com/calculator
Статьи про особенности АБ тестов с неравным делением трафика и ссылка на калькулятор:
- https://bit.ly/3aQLRkY
- https://bit.ly/2S9G6HN
- https://www.statsig.com/calculator
Medium
Дисбаланс в A/B-тестах. Есть ли разница между 99%/1% и 50%/50% в экспериментах?
Итак, по какой-то причине вы или ваша команда решили запустить A/B-тестирование с несбалансированными выборками (например, 65/45, 90/10…
Forwarded from Trisigma — про эксперименты
Как считать A/B, когда у вас зеттабайты данных? Что?!
В новой статье Microsoft подробно описывают трюки, которые позволят считать эксперименты на зеттабайтах данных (1зб = 1000 тб). На случай, если у вас вдруг где-то завалялось несколько винчестеров, статья будет полезна в решении задачи (ну мало ли)
Читать статью
В новой статье Microsoft подробно описывают трюки, которые позволят считать эксперименты на зеттабайтах данных (1зб = 1000 тб). На случай, если у вас вдруг где-то завалялось несколько винчестеров, статья будет полезна в решении задачи (ну мало ли)
Читать статью
Microsoft Research
More Trustworthy A/B Analysis: Less Data Sampling and More Data Reducing - Microsoft Research
You need to reduce data volume to save cost of storage and computation. But are you mindful of its impact on the analysis for A/B tests? Do you still have valid and sensitive metrics? Are you confident the A/B analysis is still trustworthy so that you can…
Forwarded from Trisigma — про эксперименты
Switchback-эксперименты в Ситимобил. Часть 1
Наши друзья из команды динамического ценообразования Ситимобил написали подробную статью про работу Switchback’а в их компании, тем самым начав серию статей посвященных этому особому способу сплитования.
Switchback – метод сплитования групп, где единицей рандомизации является не пользователь, а бакет по признакам гео и времени. Благодаря чему удается нивелировать социальный эффект и тем самым исключить влияние тестовой группы на контрольную.
EXPF также принимали участие в проекте по разработке свитчбэка в Ситимобиле. В команде Ситимобила работают сильные специалисты и поэтому не было ни минуты сомнения, что свитчбэк «взлетит».
Читать статью на Хабре
Наши друзья из команды динамического ценообразования Ситимобил написали подробную статью про работу Switchback’а в их компании, тем самым начав серию статей посвященных этому особому способу сплитования.
Switchback – метод сплитования групп, где единицей рандомизации является не пользователь, а бакет по признакам гео и времени. Благодаря чему удается нивелировать социальный эффект и тем самым исключить влияние тестовой группы на контрольную.
EXPF также принимали участие в проекте по разработке свитчбэка в Ситимобиле. В команде Ситимобила работают сильные специалисты и поэтому не было ни минуты сомнения, что свитчбэк «взлетит».
Читать статью на Хабре
Хабр
Switchback-эксперименты в Ситимобил. Эпизод 1: Скрытая сила switchback
Содержание Введение Про эксперименты Что такое сетевой эффект? Почему switchback помогает? Зачем так сложно, может, у вас нет сетевого эффекта? Убедили, как подобрать окно переключения по расстоянию и...
Forwarded from karpov.courses
Мы не смогли победить интернет в студии, но даже технические неполадки – не помеха на пути к знаниям!
Во-первых, вебинар базируется на статье «Dealing With Ratio Metrics in A/B Testing at the Presence of Intra-User Correlation and Segments».
Во-вторых, применение анонсированного метода, а также многих других, к задаче анализа тестов над метриками-отношениями можно подсмотреть в материале коллег из ВКонтакте.
Во-первых, вебинар базируется на статье «Dealing With Ratio Metrics in A/B Testing at the Presence of Intra-User Correlation and Segments».
Во-вторых, применение анонсированного метода, а также многих других, к задаче анализа тестов над метриками-отношениями можно подсмотреть в материале коллег из ВКонтакте.
Forwarded from karpov.courses
В материале выше разобрано бакетное преобразование метрики – этот метод очень часто применяется в промышленном A/B-тестировании. В материале коллег из ВКонтакте разбираются выборки длины 5000, попробуйте увеличить размер выборки, например, до 10000, а затем поварьируйте количество бакетов (скажем, от 10 до 100 с шагом в 10), чтобы проследить, как с изменением количества бакетов меняются (и меняются ли) чувствительность теста и контроль \alpha за false positive rate. Кроме того, над результатами бакетного преобразования можно запустить тест Манна-Уитни. Проверьте, как будут меняться чувствительность и контроль в зависимости от количества бакетов для теста Манна-Уитни. Также стоит поварьировать скошенность распределений просмотров и истинных CTR. Посмотрите, используя полученные данные, в каких пределах работает бакетное преобразование.
Если вы смогли самостоятельно провернуть все действия выше – поздравляем, вы освоили новый метод! Если нет – вебинар состоится 17 июня в 19:00.
Еще раз приносим свои извинения, и спасибо, что вы нас поддерживаете!
Если вы смогли самостоятельно провернуть все действия выше – поздравляем, вы освоили новый метод! Если нет – вебинар состоится 17 июня в 19:00.
Еще раз приносим свои извинения, и спасибо, что вы нас поддерживаете!
Forwarded from Product Analytics
Хороший пример оптимизации отклика на рекламные активности через анализ результатов A/B-тестирования от Starbucks.
Описание решения с примерами кода на Python.
via @ProductAnalytics
Описание решения с примерами кода на Python.
via @ProductAnalytics
Написал небольшой калькулятор для рассчета продолжительности теста. Он повторяет калькулятор Эвана Миллера и пока работает только для равного деления трафика и одного тестового варианта.
Но немного экономит времени
https://github.com/a-efimov/Pre-Calculate-AB-test
Но немного экономит времени
https://github.com/a-efimov/Pre-Calculate-AB-test
GitHub
GitHub - a-efimov/Pre-Calculate-AB-test
Contribute to a-efimov/Pre-Calculate-AB-test development by creating an account on GitHub.
Forwarded from Trisigma — про эксперименты
Как измерить влияние социального эффекта в A/B-тесте?
В нашем блоге вышла новая статья! Мы уже неоднократно рассказывали про социальные эффекты на митапах и конференциях, а также публиковали статьи про Switchback-эксперименты вместе с нашими друзьями из Ситимобил.
Борьба с социальными эффектами в экспериментах обладает своими особенностями. Во-первых, в каждом эксперименте должно соблюдаться предположение о том, что изменения в тесте воздействуют только на тестовую группу, а на контроль нет (SUTVA). Во-вторых, чтобы эта борьба не была напрасной, необходимо каким-то образом замерять влияние соц. эффекта. Это не так очевидно, как может показаться на первый взгляд.
Ксения Мензорова (DS Маркетплейса Ситимобил) сделала разбор статьи от LinkedIn, где приводится методика по определению влияния соц. эффекта в экспериментах
Читать на медиуме
В нашем блоге вышла новая статья! Мы уже неоднократно рассказывали про социальные эффекты на митапах и конференциях, а также публиковали статьи про Switchback-эксперименты вместе с нашими друзьями из Ситимобил.
Борьба с социальными эффектами в экспериментах обладает своими особенностями. Во-первых, в каждом эксперименте должно соблюдаться предположение о том, что изменения в тесте воздействуют только на тестовую группу, а на контроль нет (SUTVA). Во-вторых, чтобы эта борьба не была напрасной, необходимо каким-то образом замерять влияние соц. эффекта. Это не так очевидно, как может показаться на первый взгляд.
Ксения Мензорова (DS Маркетплейса Ситимобил) сделала разбор статьи от LinkedIn, где приводится методика по определению влияния соц. эффекта в экспериментах
Читать на медиуме