Я у мамы аналитик – Telegram
Я у мамы аналитик
2.81K subscribers
77 photos
2 files
244 links
Как могу анализирую материалы на тему работы с данными:
- инфраструктура и инструменты;
- роли и компетенции аналитиков;
- продуктовый подход к аналитике;
- роль аналитики в создании и развитии продуктов.

Обратная связь @s_valuev, рекламу не размещаю
Download Telegram
Качественные обзоры рынка СУБД на русском - большая редкость (популярность прошлой заметки на тему это только подтверждает).

Вот еще пример неплохого обзора от SH Capital:
🔹динамические визуализации - огонь;
🔹данные сегментированы по типам СУБД (актуально, чтобы мокрое с солёным не сравнивать);
🔹сделали свой «квадрант Гартнера» с популярностью и потенциалом развития;
🔹занятный обзор ключевых инвестиционных сделок (не припомню, чтобы где-то еще такое можно было систематизированно посмотреть).

🔗 Ссылка

#базы_данных #анализ_рынка
Sankey-диаграммы периодически мелькают в различных топах визуализаций (чего стоит только легендарная карта вторжения Наполеона в Россию в 1812), но массовыми их назвать сложно.

Чаще всего их используют для отображения потоков или маршрутов, но есть и другие, более интересные кейсы:
🔹отображение того, как эволюционирует покупательский опыт с течением времени (в примере у автора эволюция классов арендуемых автомобилей);
🔹анализ иерархически организованных данных;
🔹поиск паттернов в данных в качестве альтернативы ML (пример очень специфичный, но что-то в этом есть).

Про подготовку данных и реализацию (на примере Power BI) можно почитать тут.

P.S. А еще кто-то в интернете неправ ведет блог, посвященный исключительно санкеям (некоторые выглядят максимально ужасающе, но найти что-то интересное можно).

🔗Ссылка

#визуализации
На этой неделе опубликовали новый Gartner Magic Quadrant по аналитическим и BI-системам.

Как вы понимаете, Microsoft опять в лидерах и уже хвастается в блоге и рассылках. Немного подробнее, почему так - в сегодняшней заглавной статье.

Рядом с Power BI, по традиции, расположились Tableau и Qlik, а вот ThoughtSpot окончательно свалился в визионеры.

Общее количество участников сократилось с 22 до 20 (результат покупок ряда инструментов другими игроками). Подробнее посмотреть кто куда переехал можно тут.

А вот что было в предыдущей серии (2020 vs 2019).

🔗 Ссылка

#business_intelligence
Это очень крутая идея и топовая реализация!

Жаль, что для исследования доступен только Нью-Йорк.

Из похожего, но ближе к нашим реалиям (хоть и с существенно меньшей функциональностью) приходит в голову проект по визуализации возраста зданий. С того момента, как я о нем писал, к Санкт-Петербургу успели добавить Москву, Казань и Владимир (круто, что ребята развиваются).

#проекты
Forwarded from Reveal the Data
Смотрите какой кайф. Очень качественный и удобный инструмент для урбанистики. Классно построен флоу работы — находишь нужную тебе точку на карте, устанавливаешь радиус интереса и дальше исследуешь место в формате скролителлинга. Необычный приём когда совмещены технологии бизнесового инструмента и подхода из журналистики. Немного напомнило OneSoil, про который рассказывал ранее.

И какой же крутой графический дизайн у этого инструмента. Я даже готов простить донат-чарты с одной цифрой и немного странную визуализацию с полукругами про пятно застройки. =)
На сайте ещё есть отличная статья про процесс создания инструмента.

За ссылку спасибо Андрею Кармацкому и Соне Буториной.

#ссылка
Похоже, в Microsoft тоже решили, что с VBA уже хватит (прямо как ребята, запихнувшие в Excel Jupiter Notebook).

На замену ему в закрытую бету выпущены новые формульные функции, обозванные lambda (что логично, ведь это и есть лямбда-выражения).

Выглядит как упрощённое программирование прямо в ячейке без танцев с бубном и переходов в другие окна. Интересно будет посмотреть на это все в боевых условиях, когда (если) оно выйдет в свет.

Будущее, что ли, наступает?

🔗Ссылка

#excelное
Сегодня у нас новая, экспериментальная рубрика.

Я довольно давно ищу книги, которые потенциально полезны аналитикам, периодически даже нахожу и читаю их.

Некоторое количество отзывов по ним я уже написал лично для себя, но кажется, что они (как и все, о чем я пишу) могут быть кому-то полезны (например, могут уберечь от покупки чего-то ненужного).
Встречаем, «Все лгут. Поисковики, Big Data и Интернет знают о вас все», Сет Cтивенс-Давидовиц.

Я давно собирался написать о ней и только недавно понял, что меня останавливало - минимальная практическая полезность. Но кажется в последнее время я стал отходить от концепции повсеместного утилитаризма и готов поделиться мыслями о книге (не является ли их появление после прочтения книги признаком наличия пользы? 🤔).

Честно говоря, название сформировало ожидание, что я погружусь в увлекательный мир большых данных, инфраструктуры там, машинное обучение, графики вот это вот все. В итоге же из перечисленного есть только графики, а книга и вовсе оказалась про людей.

Автор рассматривает различные актуальные для США общепринятые нормы, социально одобряемые точки зрения, публикации статистики и на основании данных по поисковым запросам (Гугл, сайты с 18+ контентом, социальные сети) ставит под сомнение их честность.

Основные мысли:
🔹Все лгут, особенно в социальных сетях, опросах, публичном выражении своего мнения;
🔹Что не врёт: поисковые запросы, клики, просмотры;
🔹«В среднем, цифровая сыворотка правды показывает мир хуже, чем мы думали» (а еще говорят, нельзя быть пессимистом);
🔹Сотрудник Гугл пишет, что Гугл знает про вас все (какая ирония).

Разочаровывает одно - все эти выводы довольно очевидные и не требуют Big Data для своего обоснования.

Тем не менее, если читать в качестве художественной литературы, а не профессиональной, то все неплохо.

🔗 Ссылка на бумажную версию

#книжное
Радует, что в последнее время чаще встречаются упоминания «аналитики по аналитике» - это когда мы не только пилим отчеты для пользователей, но еще и отслеживаем метрики их использования.

В статье описан пример реализации такого «дашборда по дашбордам» с целью исследования популярности разных легаси и не очень BI-систем Ростелекома.

Еще по касательной задета тема развития Self-Service подхода, но с предсказуемыми результатами ("нужен дешевый, простой инструмент с минимальным time to market»). Кажется, правда, что такие выводы можно было и существенно дешевле сделать 😉.

P.S. 8 аналитических систем в одной (хоть и огромной) организации - это сильно.

🔗 Ссылка

#business_intelligence
Чаще всего при возникновении задачи по вычислению объема рынка у меня начинаются какие-то танцы с бубном вокруг аналитических ресурсов, Яндекса, Гугла и личного опыта.

#анализ_рынка

Кажется, что улучшить ситуацию можно примерно так:
Forwarded from CustDEVotion
🔬💰🗺 #Полезное #Нельзя_просто_так_оценить_рынок

Для чего считать объём рынка?

На этой неделе я совершенно случайно наткнулся на замечательное видео одной из лекций школы Яндекса по управлению продуктами. 👤Александр Скурихин из ФРИИ делится собственным опытом оценки рынка для стартапов.

Мне эта лекция помогла связать в единую картину всякие PAM, TAM, SAM, SOM с Hype Cycles от Gartner и кривой проникновения инноваций. Стоит заметить, что Александр использует немного другие расшифровки объёмов рынка. Я знаю и много где встречал такие.

Ещё одним приятным моментом стал совет учитывать сегментированность рынка, которую я люблю смотреть в отчётах Mordor Intelligence (не думаю, что к ним имеют отношение Саурон или Саруман). В них отдельная диаграмма есть для этого.

В конце лекции даже есть авторская методика расчёта объёма рынка и несколько примеров. В методике упоминается Trendwatching, но никаких рекомендаций про него не даётся. Подумаю, может их канвас к этому прикрутить.

Объём рынка, это те деньги, которые может заработать компания. Если не посчитать его заранее, можно впустую потратить ресурсы, ведь заработать в выбранном сегменте может быть невозможно.

Поделитесь, пожалуйста, собственными рекомендациями в комментариях, я хочу модернизировать свой подход к оценке.
Описание ролей в командах, работающих с данными, выполненное в стиле «для самых маленьких».

Можно посмотреть, чем с точки зрения выполняемых задач и требуемых компетенций отличаются вот эти ребята:
🔹Product managers;
🔹Data analysts;
🔹Data scientists;
🔹Data engineers;
🔹Machine learning engineers;
🔹SRE / MLOps engineers.

Самое интересное начинается с инженеров (вроде аналитиков от саентистов уже все научились отличать, чего не скажешь про остальные роли).

🔗 Ссылка

#компетенции
Решил, что у меня маловато одновременно идущих образовательных мероприятий (/sarcasm mode off) и вписался на десятидневный марафон по data literacy (она же «грамотная работа с данными») от Data Yoga.

Подкупает сама тема, обещания связать данные с получением ценности и системой принятия решений, а также интенсивный формат.
По моему опыту участия в других марафонах, это сильнее мобилизирует (предполагаю, что так это работает не у всех).

Ну и бесплатно же (правда только в материальном плане, так как времени и сил потратить придется достаточно).

P.S. Разные образовательные мероприятия, изредка даже с отзывами, теперь можно найти в канале по тегу #учебное

🔗Ссылка

#учебное #data_literacy
Сказ про то, как в России новомодные термины понимают.

Знакомые исследователи столкнулись с клевым когнитивным искаженим, в результате которого NLP (оно же Natural Language Processing или обработка естественного языка) в беседах с респондентами плавно превращается в «Нейролингвистическое программирование».

Вот уж, действительно, пришла беда откуда не ждали (а ведь говорили преимущественно с «технарями»).

Хотя, казалось бы, предугадать такое можно было: поисковая выдача Гугла и Яндекса тоже от этой аббревиатуры не в восторге - там мешанина из успешного успеха и статей для дата-саентистов.

Мораль сей басни такова: если пользуетесь при коммуникации с другими людьми «общепринятыми» и «всем понятными» определениями и сокращениями (коих в сфере аналитики пруд пруди) не стесняйтесь «синхронизировать контексты», то есть явно проговаривать, что вы в них вкладываете.

Возможно, сбережете себе некоторе количество нервных клеток.

#компетенции
Кстати, что в первую очередь всплывает у вас в сознании при упоминании «NLP»?
Anonymous Poll
45%
«Natural Language Processing»
51%
«Нейролингвистическое программирование»
4%
«Что происходит?» (ничего из перечисленного)
Отличное 40-минутное выступление Романа Бунина про навыки, необходимые для работы с визуализациями.

Что понравилось:
🔹экспресс-повышение data-ink ratio;
🔹наглядные heatmap’ы, отображающие то, как и почему пользователи читают дашборды (и как это должно влиять на проектирование);
🔹переверстка изначально странного дашборда в онлайн-режиме в сжатые сроки;
🔹визуализация модели компетенций визуализатора ❤️
🔗 Ссылка

#компетенции
Еще один интересный проект в копилку, причём снова с городами, картами и AI.

Ребята в Ecopia довольно точно распознают различные объекты на карте, могут обогащать их клиентскими данными и строить 3D-модели местности.

По итогу получается этакий OneSoil для урбанистов.

Жалко только, что нет полноценной большой демки на сайте (есть только кусочек карты с переключалками слоёв).
В качестве бонуса присутствует цветовая гамма в духе Симпсонов.

А вот тут создатели рассказывают историю развития сервиса.

🔗Ссылка

#проекты