Аналитика. Это просто – Telegram
Аналитика. Это просто
969 subscribers
120 photos
3 videos
4 files
517 links
Канал об аналитике. Web, мобильная, продуктовая. По любым вопросам можно писать - @ealexandr
Download Telegram
Беспилотные автомобили – будущее, к которому мы можем прикоснуться уже сейчас, достаточно пару минут постоять на тротуаре вдоль Комсомольского проспекта в Хамовниках. Пассажиров они пока не возят, но вполне себе объезжают полуостров в беспилотном режиме под присмотром специально подготовленного водителя.

28 мая в 20:00 у вас будет возможность позадавать вопросы про беспилотники и науку, с этим связанную, Боре Янгелю. Боря – инженер-исследователь, между работой в Яндексе успел поработать в Microsoft. В Яндексе работал над "мозгами" Алисы, а сегодня занимается алгоритмами предсказания дорожной обстановки для беспилотников.

Ребята из ruvds организуют прямой эффир с сессией вопросов и ответов. Эфир будет в их инстаграмме. Видео трансляции так же выложат на YouTube.

P.S. На фото - Боря. Он увлекается парашютным спортом.

Подробности по ссылке:
https://ruvds.timepad.ru/event/1313474/
Forwarded from Datalytics
A/B тестирование — это неотъемлемая часть работы над продуктом. С его помощью можно проверить гипотезу о том, поменяется ли выбранная продуктовая метрика, если изменить что-то в продукте, — например, увеличится ли количество пользователей, если изменить дизайн страницы регистрации. Для этого сравниваются результаты в тестовой и контрольной группах пользователей: первой выборке показывают новое решение, а у контрольной группы продукт остаётся неизменным.

При этом важно проверить, будет ли изменение статистически значимым: подтвердить, что наблюдаемая разница у тестовой и контрольных групп действительно связана с нововведениями в продукте, а не является случайностью. Для этого можно применять традиционный (частотный) или байесовский подход к A/B тестированию. У обоих методов есть свои сторонники и противники, но байесовский подход позволяет проще визуализировать данные и интерпретировать результат эксперимента. Академия Яндекса перевела статью из блога Towards Data Science о том, как провести байесовское A/B тестирование и разобраться в его работе.

https://academy.yandex.ru/posts/prostoy-gid-po-bayesovskomu-a-b-testirovaniyu-na-python
Forwarded from Интернет-аналитика // Алексей Никушин (Алексей Никушин)
Эксперимент

Завтра в 14:00 по Московскому времени мы предлагаем всем вместе посмотреть лекцию Анатолия Карпова, с которой он выступал на Матемаркетинге-2019.

Анатолий рассказывает какие подводные камни ожидают аналитиков при проведении экспериментов и как научиться их избегать. Вы глубже поймете статистику и разберетесь в том, каких ошибок можно избежать при проведении A/B тестов.

Добавьте напоминание себе в календарь

По окончании трансляции в закрытом чате появится ссылка на Zoom-конференцию, где в течение 20 минут Анатолий ответит на заданные вопросы. В чате, во время лекции можно будет задать вопросы спикеру, а также сразу получить презентацию и расшифровку доклада.

Ссылка на telegram-чат (будет удален по окончании лекции)

@internetanalytics
Побеждать надо не силу, а слабость

1. Как только разговор заходит о том, как стартап собирается победить конкурента — сразу слышу фразы типа «добавим фич», «сделаем удобнее (лучше, быстрее)». Это очень похоже на то, что мы собираемся сокрушить силу конкурента своей еще большей силой — количеством фич, удобством, скоростью и т.д.

2. Хотя еще Сунь Цзы в «Искусстве войны» писал: «Во время войны избегай чужой силы и бей туда, где есть слабость». Не надо стараться собрать больше сил там, где противник уже силен. Надо найти слабое место и собрать все свои силы там.

3. Во всех супермаркетах были и есть большие алкогольные отделы. Стали ли «Красное & Белое» создавать еще более большой выбор? Нет. Они увидели слабость — большой выбор, но долго идти из дома. WordPress — мощный инструмент для создания сайтов. Стала ли Тильда делать более мощный ВордПресс? Нет. Они увидели слабость — гибко и мощно, но слишком сложно для одностраничных лендингов.

4. Вывод. Не надо пытаться делать больше/лучше/удобнее то, что конкуренты уже делают. Не надо искать того, что конкуренты не делают — они, наверняка, не делают этого не из глупости. Надо искать то, что они уже делают — но плохо для какой-то определенной категории пользователей. И сделать это конкретное плохо — хорошо для конкретных людей.
Forwarded from Интернет-аналитика // Алексей Никушин (Алексей Никушин)
Подборка материалов для изучения SQL.
Попытался ранжировать от легкого к сложному

Для новичков: https://it-black.ru/category/rubriki/samouchitel-po-sql/

Вводные курсы на конкурирующих площадках:
https://www.datacamp.com/courses/intro-to-sql-for-data-science
https://www.datacamp.com/courses/joining-data-in-postgresql
https://www.geeksforgeeks.org/sql-tutorial/#basics
https://classroom.udacity.com/courses/ud197
https://app.dataquest.io/m/252/introduction-to-sql
https://www.khanacademy.org/computing/computer-programming/sql
Все на английском, но нет причин переживать - синтаксис все равно на английском, а все остальное там очень легкое для понимания.

Статья "Как думать на SQL": https://habrahabr.ru/post/305926/

Отдельно про оконные функции, так как это головная боль многих:
- Очень хорошая статья про оконные функции
- Курс на Datacamp (почти весь про "оконки")

Тренажёры по SQL:
http://www.sql-ex.ru/
https://sqlbolt.com/
https://www.w3schools.com/sql/

Совместная работа с SQL и Python
https://www.dataquest.io/course/sql-fundamentals
https://www.dataquest.io/course/sql-joins-relations
https://www.dataquest.io/course/sql-databases-advanced

Более продвинутый уровень.
https://www.datacamp.com/courses/introduction-to-relational-databases-in-python
https://www.codecademy.com/learn/learn-sql
https://www.hackerrank.com/domains/sql

Оптимизация SQL-запросов - доклад (2 часа)
— жизненный цикл запросов — механизм подготовки, кеширования и исполнения запросов в MS SQL;
— основы чтения планов выполнения запросов;
— влияние внешних ключей, кластерных представлений и вычислимых столбцов на производительность запроса;
— проблема неявного преобразования типов;
— статистика сервера и как она может влиять на скорость исполнения запроса.

Почти все бесплатно. Для Datacamp по интернету ходит ссылка-скидка на 75%
Теперь у вас нет оправданий, чтобы не знать базовый язык аналитиков.

@internetanalytics
Forwarded from Интернет-аналитика // Алексей Никушин (Алексей Никушин)
Подборка материалов для изучения SQL.
Попытался ранжировать от легкого к сложному

Для новичков: https://it-black.ru/category/rubriki/samouchitel-po-sql/

Вводные курсы на конкурирующих площадках:
https://www.datacamp.com/courses/intro-to-sql-for-data-science
https://www.datacamp.com/courses/joining-data-in-postgresql
https://www.geeksforgeeks.org/sql-tutorial/#basics
https://classroom.udacity.com/courses/ud197
https://app.dataquest.io/m/252/introduction-to-sql
https://www.khanacademy.org/computing/computer-programming/sql
Все на английском, но нет причин переживать - синтаксис все равно на английском, а все остальное там очень легкое для понимания.

Статья "Как думать на SQL": https://habrahabr.ru/post/305926/

Отдельно про оконные функции, так как это головная боль многих:
- Очень хорошая статья про оконные функции
- Курс на Datacamp (почти весь про "оконки")

Тренажёры по SQL:
http://www.sql-ex.ru/
https://sqlbolt.com/
https://www.w3schools.com/sql/

Совместная работа с SQL и Python
https://www.dataquest.io/course/sql-fundamentals
https://www.dataquest.io/course/sql-joins-relations
https://www.dataquest.io/course/sql-databases-advanced

Более продвинутый уровень.
https://www.datacamp.com/courses/introduction-to-relational-databases-in-python
https://www.codecademy.com/learn/learn-sql
https://www.hackerrank.com/domains/sql

Оптимизация SQL-запросов - доклад (2 часа)
— жизненный цикл запросов — механизм подготовки, кеширования и исполнения запросов в MS SQL;
— основы чтения планов выполнения запросов;
— влияние внешних ключей, кластерных представлений и вычислимых столбцов на производительность запроса;
— проблема неявного преобразования типов;
— статистика сервера и как она может влиять на скорость исполнения запроса.

Почти все бесплатно. Для Datacamp по интернету ходит ссылка-скидка на 75%
Теперь у вас нет оправданий, чтобы не знать базовый язык аналитиков.

@internetanalytics
Forwarded from Analyzecore
Когда-то я работал в банке 🏦. Мы всегда использовали таблицы для представления результатов анализа. Какую бы информацию не готовили, это почти всегда были таблицы. В лучшем случае, добавляли ужасный и бесполезный для отчета пайчарт, а особо продвинутые аналитики - донат чарт 🍩

Это могли быть довольно большие таблицы с кучей разнообразных цифр. Но, в банке все привыкли работать с таблицами и никого это не смущало. Свою тягу к красивому я реализовал там же, в таблицах. Я научился делать очень красивые таблицы, стал мастером красивых таблиц. )))

Прошло несколько лет и я случайно посмотрел вдохновляющее видео, которое открыло для меня визуализацию данных. Какой-то другой, совершенно удивительный мир, в котором цифры перерождались в визуальные объекты и могли очень точно и красиво донести основную мысль. (что, кстати, не отрицает и противоположного эффекта).

Хочу поделиться этим видео с вами и может быть кто-то еще разделит мой восторг и отношение к визуализации данных. Если нет, то вы, как минимум, найдете много интересных фактов. Если что, есть субтитры на многих языках.
https://www.ted.com/talks/david_mccandless_the_beauty_of_data_visualization

В качестве бонуса вторая ссылка на классику жанра от Ханса Рослинга. Мне кажется, одно из самых известных выступлений про визуализацию данных.
https://www.youtube.com/watch?v=hVimVzgtD6w
Forwarded from Datalytics
Отличная статья про визуализацию данных с помощью Plotly. Статья рассказывает о том как строить различные интерактивные визуализации от простых вроде line-chart до более сложных, например, отображение данных на карте

https://habr.com/ru/post/502958/
Forwarded from Интернет-аналитика // Алексей Никушин (Алексей Никушин)
Подборка сложных практических статей, которые с легкостью бы вошли в учебник по маркетинговой аналитике, если бы он существовал

Сергей Довганич из Renta опубликовал очень ёмкий шаблон для подготовки технического задания по внедрению расширенной электронной торговли (enhanced ecommerce) в Google Analytics. Вам или вашему аналитику остается только пройтись по рекомендациям и адаптировать под конкретный проект.
https://docs.google.com/document/d/1C93r88stYkevqEufnjhxK1jV00DYIPCw4jy9wIUIb_g/edit

Парни из digital-агентства newage написали статью о post-view атрибуции в Facebook: о ней мало кто сейчас говорит, а зря. Постарались по существу и на реальных цифрах.
https://newage.agency/ru/post-view-atribuciya-facebook-kak-pravilno-ocenivat-reklamnye-kampanii/

Антон Елфимов на GoPractice подробно описал процесс настройки аналитики мобильного приложения и создания структуры ивентов для аналитики приложения.
https://gopractice.ru/mobile_analytics_implementation/

Андрей Осипов @schoolWA опубликовал новый материал про bigquery, в этот раз это готовая ETL, которая позволяет загружать данные по рекламе facebook ads в google bigquery каждый день и данные по обменному курсу валют.
Все построено на google cloud functions, и по сути, будет почти бесплатно в использовании.
Статья: https://bit.ly/2XtKccE
Репозиторий: https://github.com/snegireff/facebook_ads_bigquery_etl

@internetanalytics
Forwarded from Интернет-аналитика // Алексей Никушин (Алексей Никушин)
Продолжаем.

Все мы прекрасно понимаем, что для того, чтобы собрать и агрегировать данные из разных источников, а после этого вычистить их и собрать в единый верный отчёт, нужно приложить уйму усилий и зачастую нагородить кучу костылей.

Несколько лет назад Даниил Кравцов из Томска переехал в Сан-Фран, чтобы найти инвестиции для своей ETL-платформы, которая позволяет автоматизировать процесс выгрузки данных из маркетинговых и рекламных источников.

В прошлом году Даниил был на Матемаркетинге и видео его выступления сегодня открыто для всех.

А кроме этого, он сегодня в 19:30 по Москве он на созвоне (вебинар) с Романом Нестером из Вышки - зарегистрироваться и задать вопросы можно по ссылке https://events.webinar.ru/event/4696094/4792944
Forwarded from Интернет-аналитика // Алексей Никушин (Алексей Никушин)
И последнее на сегодня.

На днях я читал отзыв Алексея Ярошенко об учебе в MADE.
Алексей 7 лет был маркетологом, а сейчас data scientist в крупнейшем белорусском интернет-гипермаркете 21vek.by. Так вот, он пишет, что MADE - это "бесплатно, долго, 1.5 года, «на выживание», отчисляя тех, кто не тянет". При этом, он подробно описывает пул материалов, которые он изучил "до" и "во время" школы.

И случайно так совпало, что MADE пришли ко мне за рекламным размещением. И я подумал, что ссылка на реальный отзыв гораздо лучше, чем просто пост в канале. И теперь, когда у вас есть ссылка на отзыв ученика, коротко рассказываю о промо-части:

- В Академии можно обучаться очно или дистанционно по одной из трех специальностей: Data Scientist, Machine Learning Engineer или Data Engineer.
- Они запускают командный "бой" Python против C++ на Хабре.
Тематика Big Data, ML и AI: фреймворки; сложные технические вопросы; задачи с кодом; очки опыта и рейды в комментарии.

Это сделано для того, чтобы перейти на следующий уровень и открыть новую специализацию. Тайминг ограничен. На решение каждой задачи – 5 минут.
Чья команда сильнее – Python или C++ можно будет узнать через неделю на на Хабре.

- На курсах MADE осваивают прикладной анализ данных, разработку моделей машинного обучения для высоконагруженных сервисов, обработку больших данных, компьютерное зрение, обработку естественного языка, распознавание речи и другие актуальные темы. Чтобы стать студентом Академии, нужно пройти вступительный отбор. Лучшие выпускники получат приглашение на работу в компанию.
Заявки принимаются до 1 августа.

Ссылка: https://vk.cc/auoVCA

#реклама
Forwarded from Про BI, DWH, DE
Коллеги, кто еще не знает, организаторы конференции по аналитике Go Analytics! - Adventum и OWOX - открыли доступы к записям выступлений за 4 года. 105 докладов по аналитике и продуктовому маркетингу точно помогут с пользой провести время.

Если не знаете, с чего начать - вот топ популярных докладов:
1. Simo Ahava, 8-bit-sheep: "In the war between tactics and strategy, communication wins the game"
2. Андрей Зайко, Adventum: "Внедряем аналитику Самое важное на старте за 30 минут"
3. Владимир Баяндин и Надежда Меньшикова, Skyeng: "Как data driven подход в операционных процессах помогает расти в три раза каждый год"

Доступ к докладам можно получить по ссылке: https://bit.ly/2MjC1KT
Forwarded from GoPractice!
Симулятор GoPractice станет частью магистерской программы Высшей Школы Экономики. Это первый и уникальный прецедент для российского высшего образования.

Два с небольшим года назад мы запустили Симулятор, где наши студенты смогли приобретать практические навыки в совершенно новом формате. Эксперимент по смене подхода к образованию с "теория потом практика" в "практика потом теория” оказался успешным (более 5000 студентов учатся в Симуляторе, улучшают свои продукты, добиваются прогресса в карьере).

Сегодня я хочу поделиться важным следующим шагом для GoPractice. Симулятор станет частью магистерской программы Высшей Школы Экономики «Коммуникации, основанные на данных» (https://datadrivencommunications.ru/). Это двухлетняя вечерняя магистратура, которая выпускает менеджеров по управлению продуктом и маркетингом на основе данных. В конце обучения студенты получают диплом государственного образца с международным приложением (European Diploma Supplement), который засчитывают зарубежные работодатели. 22 июня стартует третий набор, частью программы для которых будет обучение на Симуляторе GoPractice c поддержкой от фасилитатора от университета.

Это партнерство случилось во многом благодаря Роме Нестеру. Рома построил Сегменто (большие данные в таргетинге рекламы) и продал компанию Сбербанку. Теперь он делает в ВШЭ магистратуру, где студенты получат реальные практические навыки и будут востребованы бизнесом. По-моему, это очень круто, когда академический и бизнес миры соединяются вместе в образовании. И мы рады быть первопроходцами в этом процессе – департамент коммуникаций ВШЭ стал первым среди всех российских ВУЗов, кто внедрил онлайн-симулятор в свою обязательную программу с государственным дипломом.

4 июня в 7 часов по Москве будет вебинар с моим участием, где я буду отвечать на разные вопросы о своем опыта, о работе с продуктом, о продуктовой аналитике. Записаться можно тут: https://bit.ly/2ZKuHjf
Forwarded from Интернет-аналитика // Алексей Никушин (Алексей Никушин)
Леша Куличевский @kulichevskiy описал процесс создания системы сквозной аналитики без подключения сторонних сервисов.

Как подключаться к AmoCRM по API (на Python) и забирать данные о сделках.

https://github.com/kulichevskiy/end-to-end/blob/master/amocrm.ipynb
Forwarded from Интернет-аналитика // Алексей Никушин (Алексей Никушин)
Нашел просто потрясающие видео-обучалки по работе с массивами в Excel:

1. Массивы и принцип их работы в старых версиях

2. Динамические массивы в Excel Office 365 - просто бомба!

Файлы к видео доступны по ссылке
Автор - Эльбина Ризаханова (fb)

@internetanalytics
В 2016 году я был свидетелем следующей ситуации. Наш руководитель службы поддержки пришел к (тогда ещё CMO) Дане Шулейко и говорит: "Если мы продолжим расти в том же духе, то за следующие полгода мне нужно будет нанять 100 агентов поддержки – подтверди бюджет на найм". Даня подумал и ответил, что, пожалуй, подтвердит найм 5 человек: 4 инженеров и 1 проджект-менеджера, – а SLA остаются прежними. Так мы вступили на путь автоматизации рутинной работы.

В 2018 году, когда первые низковисящие фрукты оптимизации были уже сняты, мы начали использовать машинное обучение в этих задачах.

На сегодняшний день в Яндекс.Такси:
– 83% сообщений на первой линии поддержки разбирается роботом,
– 93% проверок биометрии водителей осуществляетcя алгоритмом полностью автоматически,
– 32% проверок фотографий автомобилей обрабатывается с помощью ML.

ML читает чаты между пользователем и водителем, слушает звонки, проверяет брендинг с камер, распознает усталых и отвлекшихся водителей и многое многое другое.

Если вы хотите так же, подключайтесь на бесплатную онлайн–конференцию DataStart, которая состоится 30 июня, – на ней будет делиться опытом непревзойдённая Таня Савельева, руководитель команды анализа неструктурированных данных.

https://datastart.ru/online-summer-2020/?utm_source=yataxi&utm_medium=cpc&utm_campaign=speaker
Продолжая тему A/A-тестов
Материал от команды EXPlatform про то, как ребята проверяют качество системы сплитования. В нем рассматриваются очень показательные кейсы с RATIO. Например, если неправильно посчитать метрику, это тоже может сказываться на результатах A/A-теста.

https://onedrive.live.com/view.aspx?resid=8612090E610871E4!288827&ithint=file%2cdocx&authkey=!AE3UclwDsmPl80Y
Еще раз про ratio.

Коллеги из VK делятся своим опытом работы с ratio метриками. В статье ребята сравнивают разные способы работы с ratio и оценивают чувствительность этих методов при помощи моделирования a/a тестов.
https://medium.com/@vktech/practitioners-guide-to-statistical-tests-ed2d580ef04f

Рассматриваются следующие инструменты, про многие из них мы уже писали раньше:
1) Дельта-метод для оценки дисперсии ratio
2) CUPED для ratio – про возможности CUPED для ratio метрик говорят редко, но в исходной статье есть целый раздел для приманения. Для оценки дисперсии коллеги из MS рекомендуют использовать дельта-метод.
3) Линеаризация от Яндекс
4) Bootstrap для ratio
5) Intra-user correlation – в научной среде для таких кейсов часто используют block bootstrap, но коллеги из ebay предлагают простое и доступное решение
Forwarded from WebAnalytics (Осиюк Дмитрий)
​​Google уже почти два года как выкатила крутейшую фичу в Google Data Studio — Extract Data. Это такой тип Data Source, который позволяет вытаскивать какой-то кусок данных из ваших существующих источников, гибко настраивать диапазон дат для извлечения и автоматически обновлять эти данные по расписанию. Например, можно настроить ежедневное извлечение данных с 2020.01.01 по вчерашний день и создавать такие метрики, как на скрине (коннектор GA не позволяет делать такие формулы). Это позволяет создавать метрики, аналогичные целям в GA, только даже на исторических данных и даже на уровне пользователей (цели в GA работают на сеансах). Главное ограничение: извлеченные источники данных пока что могут содержать только до 100 МБ данных.

via @WebAnalyst