NEW BOT Телеграм, страница

AB тесты и все вот про это вот все

Много накопилось материалов по использованию Байесовских методов в AB тестах. Собрал их в единый список:
- https://telegra.ph/Primenenie-Bayesian-podhoda-v-AB-testah-03-02
- https://vidogreg.shinyapps.io/bayes-conversion-test/
- http://varianceexplained.org/r/bayesian_ab_baseball/
- https://medium.com/convoy-tech/the-power-of-bayesian-a-b-testing-f859d2219d5
- https://www.youtube.com/playlist?list=PLAKBwakacHbRRw278HMXpCsOOIIcLYGX5
- https://mobiledevmemo.com/its-time-to-abandon-a-b-testing/
- https://cxl.com/blog/bayesian-frequentist-ab-testing/
- https://cxl.com/blog/bayesian-ab-test-evaluation/
- https://towardsdatascience.com/bayesian-a-b-testing-with-python-the-easy-guide-d638f89e0b8a
- https://academy.yandex.ru/posts/prostoy-gid-po-bayesovskomu-a-b-testirovaniyu-na-python
- http://blog.analytics-toolkit.com/2017/5-reasons-bayesian-ab-testing-debunked/
- https://towardsdatascience.com/why-you-should-try-the-bayesian-approach-of-a-b-testing-38b8079ea33a
- https://www.countbayesie.com/blog/2016/5/1/a-guide-to-bayesian-statistics
- https://www.countbayesie.com/blog/2015/4/25/bayesian-ab-testing
- https://towardsdatascience.com/bayesian-ab-testing-part-i-conversions-ac2635f878ec
- https://towardsdatascience.com/bayesian-ab-testing-part-ii-revenue-1fbcf04f96cd
- https://towardsdatascience.com/bayesian-ab-testing-part-iii-test-duration-f2305215009c

Telegraph

Применение Bayesian подхода в A/B тестах

Я очень увлечен оптимизацией процессов, и классический вариант проведения A/B тестов меня не устраивал долгое время. Ощущение что все, или почти все продакты просто приняли способ обработки теста как так должно быть и не ищут новых путей. Есть калькулятор…

1.07K views11:48

AB тесты и все вот про это вот все

Forwarded from Product Analytics

Как увеличить мощность критериев для A/B-тестирования, используя машинное обучение? Дима Лунин, аналитик AvitoTech, подробно рассказал в своей статье, а ещё:
🔹 что такое CUPED-метод и как улучшить CUPED-алгоритм;
🔹 как использовать Uplift-модель в качестве статистического критерия;
🔹 методы и критерии, разработанные и придуманные командой AvitoTech.

Хабр

ML-критерии для A/B-тестов

Всем привет! Меня зовут Дима Лунин, и я аналитик в Авито. Как и в большинстве компаний, наш основной инструмент для принятия решений — это A/B-тесты. Мы уделяем им большое внимание: проверяем на...

885 views08:36

AB тесты и все вот про это вот все

Небольшой чек-лист для проведение АБ теста. Полезно им руководствоваться, чтобы не упустить какую-нибудь "мелочь".
https://www.notion.so/AB-dc3c2f5b1c394124ba65ef7f6100bbee

Alexandr's Notion on Notion

Проведение AB теста

Этапы проведения AB теста

1.42K views13:26

AB тесты и все вот про это вот все

И небольшой кейс по результатам AB теста. Просто и полезно.
http://holoway.io/page15625650.html

holoway.io

Как А/В тесты помогли увидеть увеличение конверсии в 1% при небольшом изменении формы заказа

1.03K views17:48

AB тесты и все вот про это вот все

Forwarded from Trisigma — про эксперименты

Когда останавливать A/B-тест? Часть 2: Monte Carlo

Мы написали вторую часть статьи по планированию времени на проведение эксперимента. На этот раз речь пойдет про метод Монте-Карло. Он универсален для любых метрик и любых статистических критериев (включая ранговых). В статье подсвечиваются моменты, в которых он лучше аналитического подхода по расчету MDE, а также с кодовыми примерами

Читать статью на медиуме

1.13K views10:13

AB тесты и все вот про это вот все

Отличная статья по приоритизации гипотез, разбираются несколько фреймворков, их плюсы и минусы: https://cxl.com/blog/better-way-prioritize-ab-tests/.
Собственно, это не только для AB теста полезно, и для любых фич, нововведений, даже если по ним нет возможности провести тест.

CXL

PXL: A Better Way to Prioritize Your A/B Tests

If you're doing it right, you probably have a large list of A/B testing ideas in your pipeline. Some good ones (data-backed or result of a careful

1.05K views15:18

AB тесты и все вот про это вот все

Статья от Joom о процессе запуска A/B теста - как определиться с гипотезой, задизайнить эксперимент, выбрать аудиторию, метрики, продолжительность.
https://habr.com/ru/company/joom/blog/661639/

Хабр

Как устроен запуск экспериментов в ИТ-продукте на примере Joom

Привет, Хабр! Меня зовут Леонид Огрель, я работаю аналитиком в Джум Лабс. В этой статье я расскажу, зачем нужен эксперимент в ИТ-продукте, и на что нужно обратить внимание при его запуске. Как...

1.04K views18:46

AB тесты и все вот про это вот все

Forwarded from Trisigma — про эксперименты

Как раскатывать фичи в A/B с помощью подхода CRL

Все мы привыкли, что фазы раскатки фичи в A/B следуют планомерному увеличению траффика по ходу эксперимента (например, с 1% до 100%). В этом подходе мы хотим учесть, что на маленькой доле траффика много не потеряем на случай, если вдруг целевые метрики просели. Если все ок, то выкатываемся на полную. Такой подход понятен, он работает как часы. Однако, в таком подходе все равно всегда есть риск, что плохой эффект заметен будет не сразу, а чуть погодя. В первую очередь это может коснуться метрик лояльности (например, spu – sessions per user)

В Microsoft и других крупных компаниях практикуется альтернативный подход, в котором фазы лишь условно следуют этому правилу. Подход именуем как Controlled Rollout (CRL). Условность в том, что раскатка зависит не от доли траффика, а от аудитории. Пользователей можно поделить на 4 сегмента: Dogfood, Internal, Insiders, Production.

- Dogfood – по сути внутренняя разработка, оунеры фичи и интересанты
- Internal – внутренние сотрудники, которые могут исчисляться сотнями или тысячами в зависимости от размера компании
- Insiders – внешние пользователи/потребители продукта, которые ранее проявляли интерес к новшевствам сервиса и готовые получать их как можно раньше
- Production – все внешние пользователи

Для каждой аудитории выделены свои критерии и чекеры, говорящие об успешной фазе раскатки и не везде нужно ориентироваться на целевые (OEC) метрики, как это принято при поэтапной раскатке, постепенно увеличивая долю траффика. Что это за метрики и как устроена методология – можно почитать в пейпере

982 views22:27

AB тесты и все вот про это вот все

Интересно, когда обычный AB тест заменяется "когортным анализом". Мы все знаем, что ничего это не даст, но делаем вид, что экономим время.
Видимо, чтобы получить ответ типа "Лучше бы провели AB тест". Тем временем прошёл месяц.

927 views20:52

AB тесты и все вот про это вот все

Друзья, проводите эксперименты

955 viewsedited 20:52

AB тесты и все вот про это вот все

Forwarded from Аналитика. Это просто

Коллеги из Delivery Club написали о внедрении switchback в A/B тестировании, https://habr.com/ru/company/deliveryclub/blog/670762/

Хабр

Как мы научились А/B-тестировать алгоритмы с помощью switchback-тестов

Привет! На связи Евгений Бокарев и Надежда Грачёва, в этой статье мы расскажем про внедрение switchback A/B-тестов в логистике Delivery Club. Обсудим, как оценивать результат эксперимента, если...

870 views10:14

AB тесты и все вот про это вот все

Forwarded from Trisigma — про эксперименты (Iskαnder)

How Airbnb Safeguards Changes in Production
Статья от Airbnb про их процесс выкатки A/B-тестов:

Introduction
По мере того, как Airbnb выросла до компании с более чем 1200 разработчиками, количество платформ и каналов для внесения изменений в наш продукт — и количество ежедневных изменений, которые мы вносим в прод, — также значительно выросло. Перед лицом этого роста нам постоянно необходимо масштабировать возможности обнаруживать ошибки до того, как они попадут в рабочую среду. Однако ошибки неизбежно ускользают от предварительной проверки, поэтому мы также вкладываем значительные ресурсы в механизмы для быстрого обнаружения ошибок, когда они все же попадают в прод. В этом статье мы рассмотрим причины и фундамент системы защиты изменений в рабочей среде, которую мы называем безопасным развертыванием (Safe Deploys). В двух следующих постах будет подробно рассказано о технической архитектуре, о том, как мы применяли ее к традиционным A/B-тестам и развертыванию кода соответственно

https://medium.com/airbnb-engineering/how-airbnb-safeguards-changes-in-production-9fc9024f3446

Medium

How Airbnb Safeguards Changes in Production

Part I: Evolution of Airbnb’s experimentation platform

865 views08:06

AB тесты и все вот про это вот все

Несколько материалов про мощность в A/B тестах:

https://medium.com/statistics-experiments/когда-останавливать-a-b-тест-часть-1-mde-7d39b668b488
https://towardsdatascience.com/understanding-power-analysis-in-ab-testing-14808e8a1554
https://r-analytics.blogspot.com/2012/10/t.html
https://cxl.com/blog/statistical-power/
https://core-analytics.ru/power/

Medium

Когда останавливать A/B-тест? Часть 1: MDE

Как оценить время на проведение эксперимента? Что необходимо учесть, чтобы точнее проанализировать его результаты? Теория и python

1.08K views20:55

AB тесты и все вот про это вот все

Повышаем чувствительность метрик в A/B тестах:

https://medium.com/statistics-experiments/statistics-experiments/увеличиваем-чувствительность-экспериментов-при-помощи-ранговой-трансформации-32a4f72a86fc
https://medium.com/statistics-experiments/cuped-или-увеличение-чувствительности-метрики-de7183fc964c
https://www.microsoft.com/en-us/research/group/experimentation-platform-exp/articles/beyond-power-analysis-metric-sensitivity-in-a-b-tests/
https://www.youtube.com/watch?v=DtDGYUW0oGY
https://www.youtube.com/watch?v=KswPj6MVvD4
https://www.youtube.com/watch?v=eA9KY1TxmEg

Medium

Увеличиваем чувствительность экспериментов при помощи ранговой трансформации

Это перевод статьи booking.ai про увеличение чувствительности метрик в экспериментах с маленькими эффектами.

946 views19:57

AB тесты и все вот про это вот все

Forwarded from Аналитика. Это просто

Гайд_по_студии_анализа_данных_в_GA4_Бизнес_Метрика.pdf

5.5 MB

Многие из Вас уже во всю опробовали Google Analytics 4, а остальные либо осваивают по-немногу, либо вовсе не используют.
В этом 75 страничном PDF Руководстве вы найдете путеводитель
1) как настроить ga4
2) в чем отличие старой от новой аналитики
3) полный обзор новых инструментов анализа данных в GA4.

Скачивайте гайд и начинайте свой переход на новую аналитику, ведь старая будет выключена уже в следующем году!

783 views10:34

AB тесты и все вот про это вот все

Forwarded from Время Валеры

Мой близкий друг Саша Сахнов - человек который на мой взгляд лучше всех разбирается в а/б тестах

Еще в далеком 2018 году мы с ним и рядом других людей начали писать на Хабр про А/Б.
Сейчас он запустил цикл статей про А/Б, где каждая статья будет сложнее предыдущей - первая довольно базовая статья про Бутстрап (Обратите внимание на центральный доверительный интервал)

Еще интересен небольшой разбор стратификации для повышения чувствительности тестов
Еще можно посмотреть это видео

Хабр

Бутстреп и А/Б тестирование

Привет, Хабр! В этой статье разберёмся, как с помощью бутстрепа оценивать стандартное отклонение, строить доверительные интервалы и проверять гипотезы. Узнаем, когда бутстреп незаменим, и в чём его...

❤1

876 views11:03

AB тесты и все вот про это вот все

А вот такое есть мнение про A/B тесты: https://adezb.medium.com/a-b-testing-is-dead-465c01dc0104

Medium

A/B testing is dead

Long live A/B testing

902 views14:28

AB тесты и все вот про это вот все

Forwarded from karpov.courses

•‎ Статья «Что такое А/В-тестирование»

Разбираемся, зачем бизнесу нужны А/В-тесты и рассматриваем их работу на реальных примерах.

•‎ Интервью Анатолия Карпова с Никитой Маршалкиным

Как проводятся А/В-тесты ВКонтакте? В чём состоят особенности проведения тестов в социальных сетях? Работает ли тестирование на больших данных? На эти вопросы отвечает Никита Маршалкин в интервью. В описании к видео вы найдёте список материалов, которые помогут освоить тему А/В-тестов.

• Вебинар Анатолия Карпова «Как и зачем оценивать размер выборки для А/В-теста?»

Чтобы грамотно провести А/В-тестирование, необходим чёткий план. В него входит в том числе определение размера выборки. Подробнее о том, как это сделать, рассказываем в записи вебинара.

•‎ Статья «Бутстреп и А/Б тестирование»

Преподаватель курса Hard ML Александр Сахнов рассказывает, как использовать бутстреп для решения разных задач, когда его применение необходимо и в чём его недостатки.

1.1K views16:11

AB тесты и все вот про это вот все

Forwarded from Аналитика. Это просто

Всем привет! Не так давно для экономии времени при поиске работы сделал простого бота, который собирает вакансии для аналитиков из известных мне каналов и чатов с вакансиями. После немного доработал. Сейчас он собирает и пересылает эти посты с вакансиями в отдельный канал-агрегатор.

Пока формат именно такой - пересылаемые сообщения. В дальнейшем подумаю, какой формат агрегации вакансий будет оптимальным. Хорошо бы также использовать другие источники вакансий, это, наверное, впереди.
В данный момент это все находится в стадии тестирования, поэтому не все пока идеально, например, иногда пересылаются и рекламные сообщения в каналах.

Критике и предложениям по улучшению работы буду очень благодарен.

Собственно, канал https://news.1rj.ru/str/analyst_job_aggregator

1.3K views10:47

AB тесты и все вот про это вот все

Forwarded from Alexey Nikushin

Если бы каждый 50ый из этого чата написал в фейсбуке/телеге/на стене - Матемаркетинг заебись! Придите на матемаркетинг - было бы вообще огонь

1.12K views15:41

AB тесты и все вот про это вот все

Через неделю, 25 октября 12.00 до 13.00 пройдет митап на тему А/B-тестирования в Сбере. Ссылка на регистрацию: https://meetup.sberbank.ru/w/w/2e1b29f8-8266-4c12-af0c-9243c098b511

Только для сотрудников 😳

1.02K viewsedited 15:09

About

Blog

Apps

Platform