AB тесты и все вот про это вот все – Telegram
AB тесты и все вот про это вот все
1.88K subscribers
23 photos
1 video
4 files
249 links
Полезная информация об A/B тестировании. По любым вопросам можно писать - @ealexandr
Download Telegram
Forwarded from A/B testing
​​Как платформы для экспериментов, такие как Optimizely, игнорируют один из самых фундаментальных принципов AB-тестирования:
https://towardsdatascience.com/unlocking-peeking-in-ab-tests-7847b9c2f6bb

via @ABtesting
Forwarded from GoPractice!
Новое эссе на GoPractice!

“Как в Flo повысили долю успешных A/B тестов на 30% через внедрение нового процесса работы с гипотезами”

Дима Золотухин, Head of Analytics Flo (мобильное приложение № 1 в сфере женского здоровья), делится тем, как они повысили долю успешных экспериментов в компании на 30% через упразднение монополии на формулирование гипотез, а также введение эффективных процессов их приоритизации и тестирования.

Внутри вы найдете шаблон для формулирования гипотезы, алгоритм приоритизации, а также ряд других полезных артефактов, чтобы перенести опыт Flo на свою команду или компанию.

https://gopractice.ru/how_to_increase_the_number_of_successful_experiments/

Обсудить прочитанное можно в чате Ask Kevin! https://news.1rj.ru/str/askkevin
Forwarded from A/B testing
​​PlanOut.js - библиотека, разработанная Facebook для A/B-тестирования. Помогает проводить тесты более качественно:
https://nimeetshah.medium.com/how-to-implement-an-a-b-testing-framework-in-reactjs-with-planout-f36c3fa29940

via @ABtesting
Замечательная статья под названием "Как не нужно проводить A/B тест: https://www.evanmiller.org/how-not-to-run-an-ab-test.htmlт
Forwarded from Datalytics
Ребята из EXPF подготовили отличный перевод статьи про методику проведения экспериментов Switchback. Эта техника тестирования полезна в условиях сильного влияния наблюдений (например, таксистов, курьеров или потребителей) друг на друга — эту проблему еще называют как “социальный эффект” или Network Effect.

В Ситимобил уже успешно внедряется свитчбэк-тестирование. В конце статьи вы можете прочитать комментарий об их опыте и впечатления от использования свитчбэка из первых уст.

Switchback-тестирование. Как бороться с социальными эффектами в A/B-тестах

16 марта у EXPF стартует интенсив «Математическая статистика и A/B-тесты», где будут на практике рассмотрены основные методологические и математические проблемы A/B тестирования. Этот интенсив будет полезен всем, кто хочет начать разбираться в теме и начать проводить A/B тесты так, чтобы их результатам можно было доверять.
Beyond Power Analysis: Metric Sensitivity in A/B Tests

У Майков пару дней назад вышла новая статья про оптимизацию чувствительности метрик!

В статье описываются уже известные методики по работе с метрикой (например, логарифмирование или использование техники сокращения дисперсии), но зато коротко, ясно и понятно. Помимо этого, в статье описано то, как вы можете использовать исторические эксперименты для получения знаний о направленности метрики.

https://www.microsoft.com/en-us/research/group/experimentation-platform-exp/articles/beyond-power-analysis-metric-sensitivity-in-a-b-tests/
#карпов #вебинар
Вчера прошел вебинар Анатолия Карпова про проблемы подглядывания в АБ тестах https://www.youtube.com/watch?v=jnFVmtaeSA0&t=2034s
И еще вебинар с отличными спикерами: Романом Поборчим, Валерием Бабушкиным, Искандером Мирмахмадовым, Данилой Леньков, Еленой Швец. https://www.youtube.com/watch?v=4yX3dBD8RcI
Свежая статься Искандера Мирмахмадова про работу с социальными эффектами при работе с АБ тестами, https://bit.ly/3tYNWlr
Есть часто встречающаяся проблема при проведении АБ тестов - неравномерное деление трафика, например, 80%/20% или 90%/10%. Конечно, этого лучше избегать, но не всегда это возможно. Спланировать продолжительность теста в таком случае - тоже проблема. Распространенный калькуляторы предполагают, что трафик будет делиться поровну.
Статьи про особенности АБ тестов с неравным делением трафика и ссылка на калькулятор:
- https://bit.ly/3aQLRkY
- https://bit.ly/2S9G6HN
- https://www.statsig.com/calculator
Как считать A/B, когда у вас зеттабайты данных? Что?!

В новой статье Microsoft подробно описывают трюки, которые позволят считать эксперименты на зеттабайтах данных (1зб = 1000 тб). На случай, если у вас вдруг где-то завалялось несколько винчестеров, статья будет полезна в решении задачи (ну мало ли)

Читать статью
Switchback-эксперименты в Ситимобил. Часть 1

Наши друзья из команды динамического ценообразования Ситимобил написали подробную статью про работу Switchback’а в их компании, тем самым начав серию статей посвященных этому особому способу сплитования.

Switchback – метод сплитования групп, где единицей рандомизации является не пользователь, а бакет по признакам гео и времени. Благодаря чему удается нивелировать социальный эффект и тем самым исключить влияние тестовой группы на контрольную.

EXPF также принимали участие в проекте по разработке свитчбэка в Ситимобиле. В команде Ситимобила работают сильные специалисты и поэтому не было ни минуты сомнения, что свитчбэк «взлетит».

Читать статью на Хабре
Forwarded from karpov.courses
Мы не смогли победить интернет в студии, но даже технические неполадки – не помеха на пути к знаниям!

Во-первых, вебинар базируется на статье «Dealing With Ratio Metrics in A/B Testing at the Presence of Intra-User Correlation and Segments».

Во-вторых, применение анонсированного метода, а также многих других, к задаче анализа тестов над метриками-отношениями можно подсмотреть в материале коллег из ВКонтакте.
Forwarded from karpov.courses
В материале выше разобрано бакетное преобразование метрики – этот метод очень часто применяется в промышленном A/B-тестировании. В материале коллег из ВКонтакте разбираются выборки длины 5000, попробуйте увеличить размер выборки, например, до 10000, а затем поварьируйте количество бакетов (скажем, от 10 до 100 с шагом в 10), чтобы проследить, как с изменением количества бакетов меняются (и меняются ли) чувствительность теста и контроль \alpha за false positive rate. Кроме того, над результатами бакетного преобразования можно запустить тест Манна-Уитни. Проверьте, как будут меняться чувствительность и контроль в зависимости от количества бакетов для теста Манна-Уитни. Также стоит поварьировать скошенность распределений просмотров и истинных CTR. Посмотрите, используя полученные данные, в каких пределах работает бакетное преобразование.

Если вы смогли самостоятельно провернуть все действия выше – поздравляем, вы освоили новый метод! Если нет – вебинар состоится 17 июня в 19:00.

Еще раз приносим свои извинения, и спасибо, что вы нас поддерживаете!
Forwarded from Product Analytics
​​Хороший пример оптимизации отклика на рекламные активности через анализ результатов A/B-тестирования от Starbucks.
Описание решения с примерами кода на Python.

via @ProductAnalytics
Написал небольшой калькулятор для рассчета продолжительности теста. Он повторяет калькулятор Эвана Миллера и пока работает только для равного деления трафика и одного тестового варианта.
Но немного экономит времени
https://github.com/a-efimov/Pre-Calculate-AB-test