NEW BOT Телеграм, страница

Анализируешь данные, изучаешь data science или разрабатываешь ML-приложения и их прототипы? Недавно @selectelnews выпустил бесплатный Data Science Docker Container с фреймворками и инструментами ML/DL.

Без навыков Devops с его помощью можно развернуть рабочую среду и обучать нейросети, экспериментировать с данными и запускать проекты машинного обучения.

Из явных плюсов:

— Выгодная оплата — платить нужно только за потребляемые ресурсы в облаке или кластере Managed Kubernetes. Если запускаешь контейнер на своем компьютере — платить вообще не нужно.

— Понятная документация. @selectelnews снял двухминутную инструкцию со всеми этапами запуска контейнера и описал процесс в базе знаний.

Запускай контейнер по ссылке: https://slc.tl/DqLun

187 views21:10

Аналитика. Это просто

Forwarded from BigQuery Insights

Хороший пример сегментации клиентов с использованием BigQuery ML и модели k-means.

@BigQuery

161 views13:02

Аналитика. Это просто

Forwarded from Ivan Begtin (Ivan Begtin)

Для тех кто работает с данными постоянно, выбирает инструменты для экспериментов, создает методологии и исполняемые статьи (executive papers) подборка инструментов для автоматизации работы:

Проекты с открытым кодом:
- Jupyter Notebook и JupyterLab [1] - стандарт де-факто, используется в большинстве проектов
- Apache Zeppelin [2] - система записных книжек с поддержкой SQL и Scala, с открытым кодом
- BeakerX [3] - расширения для Jupyter Notebook с дополнительными возможностями, такими как интерактивными таблицами
- Polynote [4] - платформа для записных книжек на Scala от Netflix
- Elyra [5] - расширения для Jupyter Notebook для работа с AI

Внутри редакторов кода
- Pycharm [6] - поддерживает Jupyter Notebook прямо в среде разработки. Коммерческий
- Hydrogen [7] - поддержка Jupyter Notebook внутри редактора Atom. Открытый и бесплатный

Облачные коммерческие продукты:
- DeepNote [8] - коммерческий продукт совместимый с Jupyter
- franchise [9] - облачные записные книжки для работы с SQL
- Starboard [10] - записные книжки с поддержкой Markdown, Latex, Javanoscript и Python. Стартап
- Google Colab [11] - облачные записные книжки на базе Jupyter от Google
- Microsoft Azure Notebooks [12] - облачные записные книжки на базе Jupyter от Microsoft
- Wolfram Notebooks [13] - специализированные научные блокноты на базе языка Wolfram

Корпоративные продукты:
- DataIku [14] - комплексный продукт организации работы data scientist'ов

Список наверняка неполный и его ещё не раз можно пополнять.

Ссылки:
[1] http://jupyter.org
[2] https://zeppelin.apache.org/
[3] http://beakerx.com/
[4] https://polynote.org
[5] https://elyra.readthedocs.io/en/latest/
[6] https://www.jetbrains.com/help/pycharm/jupyter-notebook-support.html
[7] https://nteract.io/atom
[8] https://deepnote.com
[9] https://franchise.cloud/
[10] https://starboard.gg
[11] https://colab.research.google.com
[12] https://notebooks.azure.com/
[13] https://www.wolfram.com/notebooks/
[14] http://dataiku.com/

#datascience #tools

jupyter.org

Project Jupyter

The Jupyter Notebook is a web-based interactive computing platform. The notebook combines live code, equations, narrative text, visualizations, interactive dashboards and other media.

145 views18:02

Аналитика. Это просто

Forwarded from Грокс (Ilya Pestov)

Про свободу слова. Попробуйте в Facebook Messenger кому-нибудь отправить ссылку https://gnews.org/534248/. Она не отправится. Я уже свыкся с мыслью, что социальные платформы превратились в Министерства правды и фильтруют публичный контент как им вздумается, но обращаю ваше внимание, что это личная переписка, которую Facebook якобы не читает.

165 views10:34

Аналитика. Это просто

Forwarded from Аналитика и Разработка от ProductStar

📌 Полезные материалы с вебинара «Когортный анализ. Привлечение и удержание пользователей продукта»

Вы просили — мы выкладываем!

1. Запись вебинара 👉 https://bit.ly/2yUJRqG

2. Презентация с вебинара 👉 https://bit.ly/36nQWNL

3. Победители:

Сертификаты в размере 3.000₽ на курсы и мини-курсы выиграли Екатерина Пермякова, Алексей Михайлович, Ксения Плотникова, Никита Скоб.

Чтобы получить свои призы, напишите @ProductStarTeambot

4. Оставить отзыв и получить сертификат о прослушивании вебинара 👉 https://bit.ly/2ONNUtC

5. Остались вопросы после вебинара? Задай их нам! @ProductStarTeambot

186 views20:19

Аналитика. Это просто

Forwarded from Войти в IT

Андрей Дорожный со своей командой дата-журналистов запустили проекты по обучению визуализации в Tableau и программированию на языке Python. Ссылка на Мастерскую важных историй.

YouTube

Мастерская Важных историй

Мастерская — это образовательный проект «Важных историй» (istories.media) для журналистов, в котором мы рассказываем о крутых инструментах для сбора, анализа и визуализации данных.
Мы хотим, чтобы как можно больше журналистов в России знали, как делать качественные…

151 views21:22

Аналитика. Это просто

Forwarded from WebAnalytics (Осиюк Дмитрий)

В Google Analytics App+Web меняется подход к идентификации пользователей! Приоритетным будет объединение данных по внутреннему User ID авторизованного пользователя, если его нет — будут использоваться данные Google Signals (из множества продуктов Google), если и его нет — то Device ID.

https://support.google.com/analytics/answer/9213390?hl=en

via @WebAnalyst

177 views08:03

Аналитика. Это просто

Forwarded from Trisigma — про эксперименты

Experiment Fest x Karpov.courses – Meetup 15.11.2020 (видеозаписи)

На прошлой неделе мы совместно с нашими друзьями из Karpov.courses провели митап по анализу данных и экспериментам

- Как Ситимобил научился проводить правильные эксперименты с водительскими мотивациями
Регина Дан, product manager ситимобил
Виталий Черемисинов, co-founder EXPF

- Сравниваем CTR правильно
Анатолий Карпов, основатель KarpovCourses и ведущий аналитик mail.ru

- Как сформировать лучший ассортимент в ретейле
Алена Трескова, ведущий аналитик Мвидео
Искандер Мирмахмадов, co-founder EXPF

- Предиктивный CUPED для региональных АБ-тестов
Тимур Исмагилов, ведущий аналитик Avito
Соня Стороженко, аналитик Avito

https://www.youtube.com/watch?v=odMSrE0qzig

YouTube

EXPF x karpov.courses – митап про анализ данных

0:00 - 1:57 – Открытие митапа
1:58 - 46:06 – Как Ситимобил научился проводить правильные эксперименты с водительскими мотивациями (Регина Дан, product manager Ситимобил, Виталий Черемисинов, co-founder EXPF)
46:07 - 1:39:40 – Сравниваем CTR правильно (Анатолий…

148 views11:44

Аналитика. Это просто

И снова про образование.
К разным курсам достаточно вопросов. Она из главных проблем - преподаватели не в состоянии нормально донести то, что знают и умеют сами. Из-за этого теряется полнота, системность знаний. Ведь преподают, может, и отличные специалисты, но абсолютное большинство из них:
1. Не владеют методиками обучения, вот прямо совсем.
2. Не умеют просто объяснить сложные вещи.

Кстати, п.2 часто касается и преподавателей в ВУЗах и учителей в школах. Но это уже другая проблема.
Не хочу в какие-то конкретные курсы или онлайн-шкулу швырнуть камень. Но, проблема системная. Уверен, что это не только моя боль. На курсе по мат. анализу на одном из ресурсов на просьбу одного из обучающихся более доступно объяснять, а не шпарить по учебнику, последовал отчет типа "Это же не для средних умов материал". Утрирую, тем не менее, смысл именно такой. Учебник мы все сможем почитать, но нормальные комментарии и пояснения преподавателя - бесценно.

Есть, конечно, яркие противоположности. И как раз сильно выделяются прежде всего университетские курсы. Преподаватели не только знают свой предмет, но и умеют доступно подать материал. Сразу чувствуешь уровень, после многих преподавателей онлайн-университетов. Несколько примеров:
* Не могу не выделить курсы по статистике от Анатолия Карпова на Степике. Больше всего в них подкупает именно доступность сложного материала, за это очень ценю. Ссылки: https://stepik.org/course/76/, https://stepik.org/course/524/, https://stepik.org/course/2152/
* Курс по теории вероятностей от Томского государственного университета. Ссылка: https://ru.coursera.org/learn/theory-of-chances.
* Случайно (на самом деле нет - все youtube со своими рекомендациями) встретил курсы по анализу данных на Python от Computer Science Center с преподавателем Вадимом Аббакумовым. Все очень подробно, доступно, в целом, круто. Ссылки: https://www.youtube.com/watch?v=enpPFqcIFj8&list=PLlb7e2G7aSpRb95_Wi7lZ-zA6fOjV3_l7 и https://www.youtube.com/watch?v=5l0e_Q0gpnc&list=PLlb7e2G7aSpT1ntsozWmWJ4kGUsUs141Y

Stepik: online education

Основы статистики

Курс знакомит слушателей с основными понятиями и методами математической статистики. В течение трех недель мы рассмотрим наиболее широко используемые статистические методы и принципы, стоящие за ними. Полученных знаний будет достаточно для решения широкого…

205 viewsedited 17:29

Аналитика. Это просто

Forwarded from Beards Analytics (Andrey Osipov)

Классная штука, особенно радует, что можно iframe в dataStudio вставлять и получается клевый, интерактивный инструмент)

Retentioneering — это библиотека, которая помогает продуктовым и маркетинговым аналитикам обрабатывать логи событий и траектории пользователей в мобильных приложениях, веб-сайтах и других цифровых продуктов. С помощью этого фреймворка можно сегментировать пользователей, строить ML-пайплайны для прогнозирования категории пользователей или определения вероятности совершения целевого действия, основываясь на исторических данных.

Недавно вышел самый крупный апдэйт библиотеки с момента релиза: Retentioneering 2.0

- Существенно переработан функционал построения графов поведения пользователей.
- Более удобным и расширенным стал функционал степ-матриц, появилась возможность анализировать цели.
- Добавлены инструменты простого анализа AB тестов включая статистические тесты.
- Переработан функционал построения воронок.
- Полностью новый сайт с документацией с пошаговыми гайдами по ключевым функциям.

GitHub

GitHub - retentioneering/retentioneering-tools: Retentioneering: product analytics, data-driven CJM optimization, marketing analytics…

Retentioneering: product analytics, data-driven CJM optimization, marketing analytics, web analytics, transaction analytics, graph visualization, process mining, and behavioral segmentation in Pyth...

207 views13:53

Аналитика. Это просто

Forwarded from GoPractice!

Новое эссе на GoPractice!

“Расчет LTV. Как надо и не надо считать Lifetime Value”

При расчете LTV часто допускают ошибки. Причем ошибки допускают даже авторы статей с первой страницы результатов Google про то, как посчитать LTV.

Самые распространенные ошибки при расчете LTV:
- Расчет LTV на основе выручки (Revenue), а не прибыли (contribution margin).
- Расчет LTV через Lifetime пользователей, полученный через 1/churn или другими способами.
- Расчет LTV через среднее количество покупок пользователей.

В этом эссе обсудим, как надо и не надо считать LTV (Lifetime Value).

https://gopractice.ru/how-to-calculate-ltv/

Обсудить прочитанное можно в чате Ask Kevin! https://news.1rj.ru/str/askkevin

GoPractice

LTV — как правильно считать - GoPractice

Как правильно рассчитывать LTV? Почему при расчете используется валовая прибыль, а не выручка? Как прогнозировать LTV на основе данных нескольких первых дней?

172 views21:17

Аналитика. Это просто

Только сейчас посмотрел доклад Павла Левчука с ММ 2018 по ретеншету и черну. Ну прямо очень крутой доклад с подробным разбором работы с данными сущностями. https://www.youtube.com/watch?v=JNgzuZuepV0

YouTube

Павел Левчук - Как продуктовому аналитику атаковать проблему churn? // Матемаркетинг-2018

Совсем скоро Матемаркетинг - 23, 9-10 ноября
Подробности: https://matemarketing.ru/

Павел обожает стартапы и челленджи. С 2008 года он помогает стартапам расти, в основном за счет сбора, анализа и принятия решений на основе данных. С 2013 года ведет ecommerce…

199 views07:30

Аналитика. Это просто

Forwarded from WebAnalytics (Осиюк Дмитрий)

Google представил базовый вводный онлайн-курс по #GA4. Он короткий, бесплатный, на русском языке и в виде интерактивной инфографики. Подойдет для всех, кто хочет начать изучение возможностей системы и отличий от предыдущих версий.

https://bit.ly/37uVUc6

via @WebAnalyst

140 views22:50

Аналитика. Это просто

Forwarded from LEFT JOIN

Бытует мнение, что аналитик в наше время может обойтись без уверенной математической базы (об этом гласят многие программы подготовки аналитиков). С моей же точки зрения тяжело рассуждать о вероятности оттока, не понимая теории вероятностей, сложно говорить о медиане и нормальности распределения, не зная математическую статистику, и точно не рассчитать градиент функции, не понимая математического анализа: список можно продолжать долго.

Но есть спасение — море бесплатных курсов от ведущих американских вузов! Собрал подборку по всему курсу математики и приложил дополнительный курс по R для анализа данных. Внутри курсы от Harvard, MIT и Georgia Tech. Даже если вы, как и я, уже изучили всё это 15 лет назад — повторение пройденного материала крайне полезно.

https://leftjoin.ru/all/free-education-for-analysts/

leftjoin.ru

Бесплатные курсы математики для аналитиков и инженеров данных

162 views11:26

Аналитика. Это просто

Forwarded from Datalytics

Эмели Драль и Лена Самуйлова опубликовали на Github легковесную библиотеку для генерации интерактивных отчетов по анализу датасетов для ML моделей. Это полноценный MVP, который сегодня умеет оценивать только Data Drift, а совсем скоро научится делать ещё массу всего полезного, например, ассеcсмент ML модели, а дальше полноценный мониторинг

https://evidentlyai.com/blog/evidently-001-open-source-tool-to-analyze-data-drift

Ссылка на github

Evidentlyai

Introducing Evidently 0.0.1 Release: Open-Source Tool To Analyze Data Drift

We are excited to announce our first release. You can now use Evidently open-source python package to estimate and explore data drift for machine learning models.

161 views10:01

Аналитика. Это просто

Forwarded from GoPractice!

Новая статья на GoPractice!

“Проверка гипотез спроса и ценности для новых продуктов без разработки”

Многие считают, что для их продукта или функциональности проверить востребованность или ценность до разработки – невозможно. Скорее всего, это не так.

Несколько недель назад я попросил поделиться примерами, как люди проверяли ценность новых продуктов или фичей без разработки. В комментариях оставили много интересных кейсов, которые Денис Мартынцев в сотрудничестве с GoPractice категоризовал и подробно описал в этой статье. Используйте их как источник идей для проверки ключевых гипотез в ваших продуктах.

https://gopractice.ru/testing_hypotheses_without_development/

Обсудить прочитанное можно в чате Ask Kevin! https://news.1rj.ru/str/askkevin
Канал Дениса – https://news.1rj.ru/str/growhorse

GoPractice

Проверка гипотез спроса и ценности продукта без разработки - GoPractice

Как проверить гипотезу спроса и гипотезу ценности продукта без его разработки? Как с этой задачей справлялись известные продукты?

222 views11:38

Аналитика. Это просто

Forwarded from Этюды для программистов на Python (Дима Федоров)

Продолжаем традицию еженедельных переводов и сегодня две статьи про особенности использования groupby в (🐼)

1) Объяснение функций Grouper и Agg в Pandas

2) Понимание функции transform в Pandas

Кейсы по анализу данных и переводы доступны по ссылке 🐍

159 views09:32

Аналитика. Это просто

Интересный аналог Яндекс Вебвизора от Microsoft: https://clarity.microsoft.com/. Записи сессий, тепловые карты, куча сегментов и фильтров, хранение записей до 12 месяцев. Сейчас на тесте, более подробно позже.

159 views09:49

Аналитика. Это просто

246 views09:49

Аналитика. Это просто

Считается, что при проведении AB тестов лучше всего придерживаться распределения трафика поровну, например, 50/50, так как чем больше распределение неравномерно, тем больше вероятность влияния на результат разного рода случайностей: выбросов, рекламных акций, иных девиаций. Если у нас много трафика, это частично нивелирует проблему, но решить полностью ее не сможет. И растет риск ошибки при анализе теста.
В реальности нам часто приходится сталкиваться с невозможностью распределить трафик поровну, и нередко приходится работать с распределением и 90% / 10%, из них 90% на тестовый вариант.
Ребята из ExperimentFest сделали разбор таких случаев в своей статье http://bit.ly/3aQLRkY.
И вот из недавнего.

Трафик был распределен в соотношении, близком к 90% в тестовом варианте и 10% в контрольном варианте. Uplift по CR из пользователя в покупателя составил 22% с pvalue 0.000, но шампанское осталось неоткрытым - уж больно хорош отказался результат, чтобы его принять. Искал ошибки у себя, искал девиации в распределении трафика по полу/возрасту, тех. параметрам, гео, и проч.
И, когда разложил на графике количество пользователей, заказов, уровень стат. значимости по дням, все сошлось.
На графике трафика можно увидеть убывание, так как продаваемые товары подвержены сезонности. И в контрольную группу в какой-то момент попадали 100-120 пользователей.
В определенный период началась акция с большими скидками на сайте, в этот период количество заказов выросло в 1.5 - 2 раза по сравнению с предыдущими периодами.
И на графике заказов в тестовой группе эта акция сказалась - заметен значительный прирост. В контрольной группе этого роста нет. Ведь в тестовой группе в день было 1200 - 1500, а в контрольной группе 90 - 100. И откуда же взяться всплеску заказов в этой несчастной группке.
И реальное соотношение трафика было не 90/10, а от 16/1 к 9/1.
На графиках также можно увидеть, что стат. значимость перевалила за 0.95 именно в тот момент, когда этот всплеск начался. Выходит, что результат теста был определен именно за счет этой акции. А если мы остановили бы тест за день до этой акции, результаты не были стат. значимы.
Так что результаты теста с приростом на 22% в топку, запускаем в следующем году, когда начнется сезон, с распределением трафика 50/50.
Такие вот интересные приключения могут нас ожидать, когда мы делим трафик сильно неравномерно.

Medium

Дисбаланс в A/B-тестах. Есть ли разница между 99%/1% и 50%/50% в экспериментах?

Итак, по какой-то причине вы или ваша команда решили запустить A/B-тестирование с несбалансированными выборками (например, 65/45, 90/10…

207 views08:14

About

Blog

Apps

Platform