Everything is data – Telegram
Everything is data
260 subscribers
12 photos
28 links
Рассказываю про дата-аналитику. Датавиз, дашборды, А/Б-тесты — все тут.
По всем вопросам @yadvichuk
Download Telegram
Субботний #датавиз.

Сегодня я прочувствовала выражение «забанили в гугле» на себе — переборщила с запросами по апи =)

Спарсила мировую статистику по «выстрелившим» запросам согласно Google Trends за 2022 год и построила ridge-plot. Тематик запросов оказалось не так много, как я ожидала. Для сравнения в комментариях оставлю ковидный 2020.

Инструменты: python, pytrends (как неофициальный апи к Google Trends), seaborn.

Все линии нормированы на максимальное значение в ряду — так удобнее охватить таймлайн и сравнить протяженность тренда. При этом сравнить популярность двух запросов в абсолютных величинах нельзя.

Было бы интересно поисследовать локальный топ запросов по России, но доступ к нему закрыт.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6🔥2
Вот и прошел июль

Что было интересного в прошлом месяце:
Выяснили, законно ли отрывать ноль на графике;
Нашли open-source замену покинувшему нас GA-Universal Analytics;
Разобрались, как не обмануть читателя цветовой схемой;
Послушали несколько митапов для дата-инженеров и не только.

Вчера не вышел «понедельничный фреймворк» — он выйдет через неделю в немного другом формате.

Stay tuned!
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6
Субботний #датавиз.

В блужданиях по Кэгглу я нашла датасет, в котором собраны фильмы и сериалы с Нетфликса с кратким описанием. Почему бы не сделать из этого арт?

Чем бóльшим шрифтом написано слово, тем чаще оно встречается в синопсисах. Кажется, рождественские ромкомы довольно популярны 😁

Инструменты: python и тонко настроенный matplotlib с либой WordCloud поверх.

Хочу спарсить синопсисы литературы разных жанров и посмотреть, что покажет такой подход — но оставлю это на другой раз.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥9👍42
Понедельничный #фреймворк

Я экспериментирую с форматом лонгридов — кажется, что так читать их намного приятнее.

Сегодня поговорим про фреймворк PXL. Он должен избавить нас от субъективности ICE/RICE-подобных фреймворков.

В конце статьи вы найдете гугл-таблицу с примером использования — копируйте, пользуйтесь и внедряйте у себя, если актуально.

Расскажите в комментариях, что думаете об этом? Возможно, кто-то даже внедрял, будет круто послушать опыт.

https://telegra.ph/PXL-frejmvork-kogda-ne-vse-testy-odinakovo-polezny-08-06
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
Нашла очень приятный пример учебной иллюстрации.

Амазон запустил классный проект Machine Learning University, в рамках которого публикаются краткие описания основных концепций ML. На мой вкус, достаточно наглядно, но иногда хочется побольше математики.

#рекомендасьон #датавиз

https://mlu-explain.github.io/
🔥5👍2
Субботний #датавиз.

Датавиз нужен нам, чтобы рассказывать истории. Но сам по себе график ничего не расскажет — нужно подкрепить его контекстом.

К примеру, возьмем данные о безработице в РФ с 1992 по 2010 (доступны в репозитории ООН). Вне контекста тенденции неясны.

Но стоит лишь добавить контекст:
распад СССР в 1991 году;
дефолт в 1998 году;
мировой экономический кризис 2008-2013 годов;

и график становится наглядной иллюстрацией.

Я использовала диаграмму Найтингейл – у нее интересная история появления, о которой расскажу на будущей неделе.

У круглых диаграмм одна глобальная проблема — считается, что наш мозг очень плохо оценивает углы и сравнивает площади. А почему так и что с этим делать – расскажу завтра.

Здесь я рассказывала, как плохо подобранная цветовая схема обманывает читателя;
А здесь — про rule of thumb масштабов, когда отсутствие нуля по оси Y меняет весь смысл.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2🌚21
Понедельничный #фреймворк

Мы поговорили про «умные» системы планирования, учитывающие контекст, трафик и альтернативные способы решения проблемы. Но что, если раскидать задачки по приоритетам нужно прямо сейчас и «на коленке»?

Тогда подойдет фреймворк MoSCoW. Приятный бонус — он легко применяется как к планированию в команде, так и для себя.

https://telegra.ph/MoSCoW--kak-razobrat-hotelki-i-stat-ehffektivnee-08-13
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3👌1
О канале

Привет!

Недавно пришло много новых читателей, добро пожаловать!

Меня зовут Алена и мне проще всего описать себя как Full stack аналитика. В моей работе есть место BI, дата-инжинирингу, дата-аналитике и даже разработке 😁 И мне это очень нравится!

Этот канал — отражение моих интересов. Я датавиз-гик и мне нравится исследовать, как рассказать историю с помощью данных.

Навигация:
#датавиз — классные визуализации. А каждую субботу я делаю небольшой датавиз экспромтом;
#фреймворк — рубрика по понедельникам о том, как построить работу и понять заказчика;
#рекомендасьон — ресурсы, которые я хочу порекомендовать, как правило образовательные;
#конференции — подборки понравившихся выступлений с прошедших конференций;
#инструменты — программы и библиотеки, которые могут пригодиться аналитику.

Немного обо мне:
🔹 Аналитик данных в Sberdevices;
🔹 Закончила физфак МГУ (а потом и ФПО МГУ);
🔹 Пишу на Python и C++;
🔹 Интересуюсь NLP.

Я всегда рада общению, можно на ты, можно на вы — как кому комфортнее.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍138
Everything is data pinned « О канале Привет! Недавно пришло много новых читателей, добро пожаловать! Меня зовут Алена и мне проще всего описать себя как Full stack аналитика. В моей работе есть место BI, дата-инжинирингу, дата-аналитике и даже разработке 😁 И мне это очень нравится!…»
Хочу рассказать про (буквально!) исторический пример того, насколько важна хорошая визуализация.

В тексте легко упустить факты — датавиз же помогает выделить те части истории, которые мы хотим подсветить. Например, понятная визуализация помогла Флоренс Найтингейл дать ход реформам, спасшим тысячи жизней.

О том, как это случилось — сегодняшний рассказ:
https://telegra.ph/Kak-horoshij-dataviz-spas-nemalo-zhiznej-08-17
👍5🔥3
О, как интересно — Python интегрируют в Excel.

Не утихают холивары о-самом-главном-инструменте аналитика. Лично я пользуюсь Экселем только для просмотра. У кого-то Эксель — основной инструмент. Это не зло само по себе, скорее индикатор, что культуре обращения с данными в компании есть куда расти и что масштабирование будет непростым.

Кажется, что такая интеграция поможет начинающим аналитикам — тем, кто уже освоил Excel, но с pandas работает со словарем. Опытным аналитикам проще написать код — даже плохой код читается в разы лучше, чем формулы в ячейках. 

Грустно одно — сам дистрибутив питона в облаке и поставить сторонние библиотеки нельзя. А в будущем эту фичу закроют под отдельную подписку.

https://techcommunity.microsoft.com/t5/excel-blog/announcing-python-in-excel-combining-the-power-of-python-and-the/ba-p/3893439
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4🤯1
🌆 Занятная иллюстрация из статьи по урбанистике

Автор из университета Южной Калифорнии построил преимущественное направление на азимут улиц основных городов мира. Графики упорядочены по росту информационной энтропии. А чем выше столбец, тем больше улиц в этом направлении.

Анализ проводился на основе данных OpenStreetMap. В Python такие карты удобно читать с помощью библиотеки OSMnx.

Логично, что чем старше город, тем «хаотичнее» направления в нём. Я хорошо знаю всего пару городов с этой иллюстрации, с ощущениями совпадает 🙂

Рекомендую посмотреть и оригинальную статью - в ней авторы выделили «похожие» города и удобно визуализировали полученные кластеры с помощью t-SNE.

В комментариях — hi-res версия.

#датавиз
👍64
Не писала некоторое время — увеличилась нагрузка на работе, добралась до интересного мне проекта, вот время и закончилось.

Но нагрузка приходит в норму, вот и я понемногу возобновлю вещание.

Недавно я решила повысить умение работы с данными в продуктовой команде — умение не столько оперировать ими, сколько правильно интерпретировать. Мне важно погрузить в контекст, чтобы мы говорили на одном языке. Отсюда и родился небольшой внутренний лекторий.

Один из модулей — про датавиз. При подготовке я нашла классные рулбуки, которыми и хочу поделиться.

Постер Financial Times — четко размечено, какой график выбрать, чтобы подсветить нужную идею. Хочется распечатать и оставить на видном месте.

Таблица USI — как Менделеева, только про графики. Каждый «элемент» проиллюстрирован и размечен — указано, какой цели служит и как его воспримет смотрящий. Лучше смотреть на компьютере.

Стайлгайд Карины Спитальник — в первую очередь он применим для Tableau, но много полезных идей можно взять и для других BI-систем.

#датавиз
Please open Telegram to view this post
VIEW IN TELEGRAM
3👍3🔥3
🎧 Музыкальный датавиз

Нашла, пожалуй, уникальный датасет с самыми разными характеристиками миллиона песен — от метаданных до громкости, популярности и bpm каждой песни.

Стало интересно, а что уже делали с этими данными - и смотрите, как хорошо получилось у Шона Миллера скрестить топ-100 Rolling Stones с ними.

Песни собраны по альбомам, что даёт распределения величин — на борде прослеживается, что редко выстреливают все песни сборника, или что не всегда сохранение ритма и тональности от трека к треку — путь к успеху.

Список, кстати, что надо - если не знали, откуда подступиться к метал-музыке, можно начать с классики🔥
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥7👍4