AB тесты и все вот про это вот все – Telegram
AB тесты и все вот про это вот все
1.88K subscribers
23 photos
1 video
4 files
249 links
Полезная информация об A/B тестировании. По любым вопросам можно писать - @ealexandr
Download Telegram
На днях пересмотрел вебинары по бутстрапу (не могу скрывать симпатию к методу):
- от Искандера Мирмахмадова из EXPF - https://www.youtube.com/watch?v=8CMV5cK83ns
- от Анатолия Карпова - https://www.youtube.com/watch?v=-zps6hm0nX8

На два момента хочу обратить отдельное внимание:
1. Размер подвыборки делать таким же, как размер группы. Даже если у нас неравное деление пользователей, хоть и 90/10. Об этом на вопрос отвечал Анатолий после вебинара и пишется в статье https://ocw.mit.edu/courses/18-05-introduction-to-probability-and-statistics-spring-2014/resources/mit18_05s14_reading24/
2. Не нужно рассчитывать p-value по распределениям, получившимся в результате работы бутстрапа, так как измерения в них не независимы - забираются из одной и той же выборки и содержат повторы. Об этом говорил Искандер.
👍5
Forwarded from Ozon Tech
Ловите приглашение на
📌Ozon Tech Community A/B-testing Meetup 📌

25 января, 17:30
Офис Ozon, Москва Сити
offline | online

Кто о чём:

👨‍💻 Игорь Моисеев, аналитик-исследователь.
Об ошибках анализа и невалидных выводах по экспериментам.

👨‍💻 Антон Ермилов, руководитель группы разработки «Стенды метрик».
О создании централизованной системы аналитики, ошибках и проблемах в ней.

👨‍💻 Евгений Пак, руководитель отдела «Инструменты А/В-тестирования и стенды метрик».
О факапах при создании А/В-платформы.

👨‍💻 Александр Толмачев, руководитель службы аналитики Ozon Fintech.
О процессах А/В-тестирования в больших компаниях и связанных с ними проблемах.

👨‍💻 Вячеслав Коськин, старший менеджер по продукту в отделе «Инструменты А/В-тестирования и стенды метрик».
О сложностях, которые возникают у менеджеров в процессе тестирования.

Чтобы пообщаться лично, выпить кофе со спикерами и попасть на afterparty, нужно зарегистрироваться.

Чтобы получить ссылку на трансляцию — та же схема. Ссылок хватит на всех 🙂

#ozontech_meetup
👍2
Как-то неожиданно Google закрывает Google Optimize, в том числе 360. Пока пишут, что уже с 30 сентября. Допускаю, что несколько позже. Ссылка на новость.
Не перестаем радоваться, что у Метрики будет Вариокуб, аналогичный сервис. И все же как-то грустно - Google Optimize отлично подходит для небольших A/B -тестов.
🔥1
Собираю в github свои скрипты, которые писал для работы с A/B тестами.
А именно:
- расчет продолжительности эксперимента
- расчет p-value Хи-квадрат
- расчет p-value Т-тест
- расчет p-value Манна-Уитни
- бутстрап, по-умолчанию сравниваем средние

Все находится здесь.
Через некоторое время собираюсь сделать и децильный бутстрап.

Буду благодарен обратной связи, если где-то ошибся или что-то непонятно / неочевидно.
🔥28
Всем привет!
Снова в будни после выходного - считаю, несправедливо, что на женский день меньше выходных, чем на мужской.

Как и обещал, загрузил на гитхаб yupiter notebook с расчетом децильного бутстрапа.
Все измерения в выборках делятся на децили и бутстрап делаем на каждом дециле по отдельности. Это позволяет понять, в каких децилях мы получили (или не получили) стат. значимые отличия.

Например, на датафрейме, который лежит там же, мы видим, что в первых трех децилях победил 1 вариант, в остальных - 2. Это и обеспечило суммарную победу варианта 2.
👍81🔥1
Понимание, что такое A/B тесты и как их правильно проводить, одно из главных требований к продуктовому менеджеру, продуктовому аналитику, аналитику данных.

В свое время для подготовки к собеседованиям собрал список того, что должен знать. Также дополнял этот список. Получившийся список закрывает большинство вопросов, которые могут задать нам на собеседовании. И полноценный ответ на них значительно повысит шансы на успешное трудоустройство. 🫵

Собственно, список.
👍12🔥2
При проведении AB тестов мы беспокоимся про пересечения нескольких экспериментов, опасаясь из взаимного воздействия друг на друга. Иногда встречается и такое, что продуктовые команды не проводят более одного эксперимента одновременно.
В статье автор настаивает на том, что проводить много пересекающихся экспериментов не только не страшно, но и правильно.
Запускаем A/B-тест в Метрике: чек-лист с инструкцией и примером

В Метрике появился новый инструмент для проведения экспериментов на базе технологии Varioqub. С его помощью можно сравнивать несколько вариантов посадочной страницы или отдельных элементов сайта и принимать решения на основе данных.

Мы сделали для вас полезный чек-лист с инструкцией и примером, как настроить первый A/B-тест и ничего не упустить. Забирайте, чтобы повторить в своём проекте.

👉 Скачать чек-лист
👍3
Статьи с разбором самых распространенных ошибок при проведении AB-тестов. Часть 1. Часть 2
👍7😱1
💬 Сегодня я расскажу, как правильно интерпретировать результат A/B-эксперимента в Метрике

Буду объяснять немного упрощённо, чтобы пост не получился слишком сложным 🤓

Предположим, ваш A/B-тест идёт уже две недели и настало время проанализировать результаты.

Перейдите на страницу с результатами эксперимента, чтобы сравнить ваш эксперимент с контрольным вариантом и понять, есть ли статистически значимое изменение метрик.

Есть «прокрас»
Если ячейка выбранной метрики имеет красную или зелёную заливку, значит, эксперимент «прокрасился» и в A/B-тесте зафиксировано статистически значимое изменение.

🟢 Зелёный — основная метрика статистически значимо увеличилась.
🔴 Красный — основная метрика статистически значимо уменьшилась.

Чем темнее оттенок заливки, тем достовернее результат.

Нет «прокраса»
Если ячейка метрики серого цвета, значит, в A/B-тесте статистически значимого различия не обнаружено. Дальнейшее решение о ходе эксперимента поможет принять показатель MDE (Minimal Detectable Effect), который доступен в расширенной версии Varioqub.

MDE позволяет зафиксировать минимальный истинный эффект, ради которого, возможно, имеет смысл внести изменения.

Например, на 30-й день эксперимента MDE находится на уровне 1% и статистически значимого изменения нет. Если вы продолжите эксперимент и метрика прокрасится, то только для достижения эффекта, равного или меньшего 1%.

Проводите больше экспериментов и принимайте решения, основанные на данных!
Please open Telegram to view this post
VIEW IN TELEGRAM