Аналитика. Это просто – Telegram
Аналитика. Это просто
969 subscribers
120 photos
3 videos
4 files
517 links
Канал об аналитике. Web, мобильная, продуктовая. По любым вопросам можно писать - @ealexandr
Download Telegram
Forwarded from IT лекции
▪️ Уроки Django

Урок 1. Создаем пустой проект - Смотреть
Урок 2. Создаем модели базы данных - Смотреть
Урок 3. Создаем админку - Смотреть
Урок 4. Выводим записи в браузер. - Смотреть
Урок 5. Фильтрация по категориям - Смотреть

#python #django

@itlecture
Forwarded from LEFT JOIN
Диалог @a_nikushin и @data_karpov о доступном образовании для аналитиков на Youtube вдохновил меня рассказать одну свою историю и поделиться ссылками.

Так сложилось, что в Университете мне очень повезло с преподавателями (от линейной алгебры до баз данных и языков программирования). Один из них, В. Л. Аббакумов, разжег настоящую страсть к методам анализа данных своими лекциями и лабораторными заданиями. В. Л. — практик и был моим научным руководителем по дипломной работе (мы делали кластеризацию данных Ленты), а затем и по кандидатской диссертации (строили нейронную сеть специальной архитектуры, тогда еще в Matlab).

Уже несколько лет назад в рамках ШАД и Computer Science Яндекса у него был записан курс Анализ данных на Python в примерах и задачах в двух частях. Настало время поделиться ссылками на первый и второй плейлисты на Youtube.

Первая часть посвящена описательным статистикам, проверке статистических гипотез, иерархическому кластерному анализу и кластерному анализу методом к-средних, классификационным моделям (деревья, Random Forest, GBM). В целом, весь плейлист достоин внимания без отрыва 🤓
Во второй части более глубокое погружение в нейронные сети, keras, deep learning, xgboost и снова все лекции крайне рекомендованы.🎖
Смотреть можно смело на 1.5x.

Материалы к видео:
Часть 1. Занятия и материалы
Часть 2. Занятия и материалы
Forwarded from data будни
Ребята из product sense собрали фильмы, из которых можно чему-то научиться. Для аналитиков они тоже будут полезны.

Особо обращаю внимание на эти:
- Человек, который изменил все (Moneyball), 2012
- Основатель (The Founder), 2016
- Скрытые фигуры (Hidden Figures), 2016
- Остановись и гори (Halt and Catch Fire), 2014

https://productsense.io/productmovies
Forwarded from WebAnalytics (Осиюк Дмитрий)
​​Параметры в Google Data Studio — очень крутая штука. Вот пример, как с их помощью реализовать динамический выбор Secondary Dimension, как в Google Analytics: https://bit.ly/329isNQ

via @WebAnalyst
Интересная новость об изменениях в работе Беру и Яндекс Маркета. Я это так понимаю, что планы по доходам жестко не выполняются, и необходимо срочно что-то менять. Очень "радуют" попытки в чистом поле создать "русский Амазон", просто взяв две большие конторы и кучу денег. Практика показывает, что это не так работает, и нужно много времени и много труда...
Еще показательно, что все это неким образом объединится, а в комментариях шутят, что все это объединится с Go и превратится в Go Покупки.

Интересная тенденция с модными сейчас супераппами. Не уверен, что это правильно - строить этакого Франкенштейна, в котором будет сразу все. Вопрос спорный, время рассудит, хорошо это или плохо.
https://vc.ru/trade/156754-beru-stanet-chastyu-yandeks-marketa-marketpleys-smenit-nazvanie-a-servis-budet-edinoy-ploshchadkoy-dlya-onlayn-pokupok
Forwarded from What does data mean?
Неплохой разбор подзапросов в SQL

И пара лично выстраданных лайфхаков по изучению.

1. Сайты с упражнениями бессмысленны, если базовый синтаксис вы уже знаете.

Найдите/сделайте свой датасет. Абсолютно неважно, что у него будет внутри, лишь бы лично вам в нём интересно было копаться.

Задавайте к своим данным вопросы, ищите ответы.
Если кажется, что вопрос какой-то тупой и вытащить инфу из датасета невозможно, то это даже плюс, смекалочка сама себя не разовьет.

2. Изучайте схемы данных, рисуйте свои на бумажках, расписывайте/проговаривайте вслух, что именно хотите получить.

Важно не механически перебирать колонки в запросе, а понимать, что происходит.
Forwarded from Грокс
В штатах узурпируется data-driven подход, а математика становится аморальной. Думаю, многие из вас уже слышали про обвинения алгоритмов в дискриминации. Например, ещё в 2007 году систему распознавание речи критиковали за сексизм, ибо мужской голос определялся лучше, чем женский. Подобные случаи множатся и уже нисколько не удивляют моё отечественное сознание. Однако это что-то новенькое: суд запретил университету Калифорнии использовать SAT и ACT тесты (местный ЕГЭ) для приёма, потому что дети из бедных семей их хуже сдают.

Знаю, что критиков ЕГЭ много, но обратите внимание на причину. Вы понимаете степень абсурда? Баллы же оцениваются не по уровню доходов в семье, а по количеству знаний. Ученики с плохим результатом сдают тест хуже не из-за того, что они из бедных семей, а потому что они менее образованы. Вообще ирония заключается в том, что стандартизированные тесты появились в том числе, чтобы избавиться от дискриминации, дабы при зачислении в университет не обращали внимание на элитарность школы, рекомендационные письма и прочее.

В США в статистике не должно быть неравенства. У негров больше ипотечная ставка? Значит это банковский расизм, а не отражение исторически сложившегося социального неравенства. У жены меньше лимит по карте? Значит это сексистский кредитный скоринг Goldman Sachs. Кстати, благосостояние коррелирует ещё со здоровьем, почему бы не отменить тогда нормативы для спортсменов и космонавтов, спасателей? Завершу мысль чужими словами: «Freedom is the freedom to say that two plus two make four. If that is granted, all else follows» — Джордж Оруэлл, 1984. #мысливслух
Forwarded from Product Analytics
​​Как мобильная аналитика улучшает экономику приложения:

https://www.cossa.ru/special/mobile/274100/

via @ProductAnalytics
Продвигает бутстрап в массы
Как проанализировать эффект от нововведения?

Иногда в работе бывает такое: "Мы внедрили новую фичу в продукте, про A/B тест забыли, да и времени на него нет. Теперь вот не понимаем каков эффект. Проанализируй и скажи что-как."
Что делать в такой ситуации? Есть несколько способов:

- Иногда помогает сравнение метрик до и после. Если нововведение оказало мощный эффект, это будет видно. Встречается редко. Сезонность, тренды и прочие факторы могут привести в ложным выводам.

- Можно провести ухудшающий A/B тест. "Откатываем" часть пользователей к старому варианту и сравниваем с текущим. Самый надежный способ в плане достоверности.

- Использовать библиотеку casual impact. Умные ребята из google придумали хитрый способ измерить эффект от нововведения без A/B тестов. Если грубо, то строится прогноз метрики на данных до нововведения и подбираются надежные ковариаты. Отклонения текущих значений от предсказанных можно трактовать как эффект от нововведения. Подробнее тут и тут.
Forwarded from This is Data
​​Наконец-то закончил статью на одну из самых сложных для понимания тем - оконные функции в SQL.
На ее написание ушло почти пять месяцев с перерывом на отпуск :)

В статье на простых примерах с картинками разбирается принцип работы данных функций, а в конце вас ждут кейсы с расчетом моделей атрибуции «Первый клик» и «С учетом давности взаимодействий».
#из_личного
После того, как я закончила курсы, я искала работу примерно пять месяцев. Это было непростое время, потому что с каждым новым отказом вера в то, что поиск закончится успехом, уменьшалась. Первые три собеседования были просто провальными. Но они дали представление о том, какими примерно будут следующие. Я выработала систему подготовки к собеседованиям в зависимости от того, кто будет на другом конце - HR, Product manager или тех.специалист. Ко всем у меня был свой подход. Для HR важнее была история - что делала, что умею, ключевые слова по скилам. Продакту уже больше важны кейсы, причём продуктовые - AB тесты(какие метрики смотреть), воронки, событийная аналитика. Тех.спецы, понятно, больше про hard skills - те же AB тесты, но уклон в методы проверки, Python и способы хранения данных в нем (помимо наших любимых датафреймов, есть ещё списки, словари, сэты, кортежи и проч, что не дают, например, в курсе Яндекс.Практикум), конечно, SQL. И перед каждым собеседованием - подготовка: повторение старого, изучение нового. И нужно прокачивать умение рассказывать занимательные истории. Если при рассказе о том, как вы считали ROMI и что вам пришлось преодолеть при этом, у вас горят глаза - вы у цели!
Помимо самих курсов у меня был небольшой опыт копания в данных «по знакомству». Так или иначе, данные сейчас есть у многих бизнесов, но они не всегда знают, что с ними делать. Мне удалось попасть в частную медицинскую клинику и на практике применить мои знания - посчитать LTV, спрогнозировать загрузку врачей, поотвечать на вопросы маркетинга. В общем, в моем резюме появилась важная графа - релевантный опыт работы и несколько историй для собеседования.
Для себя я сделала вывод, что поиск работы в айти - это отдельный навык. Ему я училась немногим меньше, чем самой аналитике на курсах.
Кстати, это не мой случай, но вам может помочь - если у вас есть опыт хотя бы опосредованно связанный с аналитикой (опыт в маркетинге, опыт построения отчётов в 1С, автоматизация в эксель, работа с кодом, может что-то ещё, о чем я даже не знаю), это надо выставить на первое место в резюме и упомянуть на собеседовании.
Ну и напоследок - к пятому месяцу я была порядочно всем этим вымотана. С трудом верила в успех, но стискивала зубы перед каждым собесом. Некоторое случайное стечение обстоятельств (ну и, конечно, мои мольбы о том, чтобы меня взяли уже наконец и я покажу класс), и я получила отличный оффер. И у вас получится 🦾, если вы в поисках. Ко всем вашим знаниям и умениям, приложится подходящий случай.
Forwarded from Вастрик.Пынь
📊 Минипост: Очарованные циферками

В последнее время я всё чаще наблюдаю феномен «пабмеда» — когда на любую точку зрения в интернете находятся «данные», её подтверждающие. Мы никому больше не верим на слово, но как только видим график — аргумент как будто бы становится в десять раз авторитетнее. Машина ведь врать не будет!

Особенно резко проблема стоит в модных data-driven компаниях с плоской структурой, где человек с паверпоинтом побеждает здравый смысл примерно всегда.

Вопрос — что делать? Как выживать в таком мире? Можно ли победить глупость или лучше её возглавить, пока остальные не одумались?

https://vas3k.ru/notes/datadriven/
Forwarded from Max Godzi
Вышел существенный апдейт Retentioneering
https://github.com/retentioneering/retentioneering-tools
Попробуйте и ставьте пожалуйста репу звезды.

Попробовать можно слету в Google Colab без установки, все стало очень просто.

Мы с Анатолием Зайцевым переписали вообще все и добавили инструмент простого AB тестирования, ускорили в более чем десять раз скорость кластеризации, переработали и сделали суперудобным функционал степматриц.

P.S. Очень важное дополнение - различные варианты нормировки и развесовки ребер графа - вы можете четко видеть сколько пользователей сделало переход, либо сколько сессий с таким переходом было, либо сколько событий переходов во всем датасете. Можно явно выбирать как вы хотите это нормировать - на общее число пользователей или переходов, или на количество переходов из конкретного узла - получаются разные инсайты на графе и в матрицах переходов.