Я у мамы аналитик – Telegram
Я у мамы аналитик
2.81K subscribers
77 photos
2 files
244 links
Как могу анализирую материалы на тему работы с данными:
- инфраструктура и инструменты;
- роли и компетенции аналитиков;
- продуктовый подход к аналитике;
- роль аналитики в создании и развитии продуктов.

Обратная связь @s_valuev, рекламу не размещаю
Download Telegram
Похоже, в Microsoft тоже решили, что с VBA уже хватит (прямо как ребята, запихнувшие в Excel Jupiter Notebook).

На замену ему в закрытую бету выпущены новые формульные функции, обозванные lambda (что логично, ведь это и есть лямбда-выражения).

Выглядит как упрощённое программирование прямо в ячейке без танцев с бубном и переходов в другие окна. Интересно будет посмотреть на это все в боевых условиях, когда (если) оно выйдет в свет.

Будущее, что ли, наступает?

🔗Ссылка

#excelное
Сегодня у нас новая, экспериментальная рубрика.

Я довольно давно ищу книги, которые потенциально полезны аналитикам, периодически даже нахожу и читаю их.

Некоторое количество отзывов по ним я уже написал лично для себя, но кажется, что они (как и все, о чем я пишу) могут быть кому-то полезны (например, могут уберечь от покупки чего-то ненужного).
Встречаем, «Все лгут. Поисковики, Big Data и Интернет знают о вас все», Сет Cтивенс-Давидовиц.

Я давно собирался написать о ней и только недавно понял, что меня останавливало - минимальная практическая полезность. Но кажется в последнее время я стал отходить от концепции повсеместного утилитаризма и готов поделиться мыслями о книге (не является ли их появление после прочтения книги признаком наличия пользы? 🤔).

Честно говоря, название сформировало ожидание, что я погружусь в увлекательный мир большых данных, инфраструктуры там, машинное обучение, графики вот это вот все. В итоге же из перечисленного есть только графики, а книга и вовсе оказалась про людей.

Автор рассматривает различные актуальные для США общепринятые нормы, социально одобряемые точки зрения, публикации статистики и на основании данных по поисковым запросам (Гугл, сайты с 18+ контентом, социальные сети) ставит под сомнение их честность.

Основные мысли:
🔹Все лгут, особенно в социальных сетях, опросах, публичном выражении своего мнения;
🔹Что не врёт: поисковые запросы, клики, просмотры;
🔹«В среднем, цифровая сыворотка правды показывает мир хуже, чем мы думали» (а еще говорят, нельзя быть пессимистом);
🔹Сотрудник Гугл пишет, что Гугл знает про вас все (какая ирония).

Разочаровывает одно - все эти выводы довольно очевидные и не требуют Big Data для своего обоснования.

Тем не менее, если читать в качестве художественной литературы, а не профессиональной, то все неплохо.

🔗 Ссылка на бумажную версию

#книжное
Радует, что в последнее время чаще встречаются упоминания «аналитики по аналитике» - это когда мы не только пилим отчеты для пользователей, но еще и отслеживаем метрики их использования.

В статье описан пример реализации такого «дашборда по дашбордам» с целью исследования популярности разных легаси и не очень BI-систем Ростелекома.

Еще по касательной задета тема развития Self-Service подхода, но с предсказуемыми результатами ("нужен дешевый, простой инструмент с минимальным time to market»). Кажется, правда, что такие выводы можно было и существенно дешевле сделать 😉.

P.S. 8 аналитических систем в одной (хоть и огромной) организации - это сильно.

🔗 Ссылка

#business_intelligence
Чаще всего при возникновении задачи по вычислению объема рынка у меня начинаются какие-то танцы с бубном вокруг аналитических ресурсов, Яндекса, Гугла и личного опыта.

#анализ_рынка

Кажется, что улучшить ситуацию можно примерно так:
Forwarded from CustDEVotion
🔬💰🗺 #Полезное #Нельзя_просто_так_оценить_рынок

Для чего считать объём рынка?

На этой неделе я совершенно случайно наткнулся на замечательное видео одной из лекций школы Яндекса по управлению продуктами. 👤Александр Скурихин из ФРИИ делится собственным опытом оценки рынка для стартапов.

Мне эта лекция помогла связать в единую картину всякие PAM, TAM, SAM, SOM с Hype Cycles от Gartner и кривой проникновения инноваций. Стоит заметить, что Александр использует немного другие расшифровки объёмов рынка. Я знаю и много где встречал такие.

Ещё одним приятным моментом стал совет учитывать сегментированность рынка, которую я люблю смотреть в отчётах Mordor Intelligence (не думаю, что к ним имеют отношение Саурон или Саруман). В них отдельная диаграмма есть для этого.

В конце лекции даже есть авторская методика расчёта объёма рынка и несколько примеров. В методике упоминается Trendwatching, но никаких рекомендаций про него не даётся. Подумаю, может их канвас к этому прикрутить.

Объём рынка, это те деньги, которые может заработать компания. Если не посчитать его заранее, можно впустую потратить ресурсы, ведь заработать в выбранном сегменте может быть невозможно.

Поделитесь, пожалуйста, собственными рекомендациями в комментариях, я хочу модернизировать свой подход к оценке.
Описание ролей в командах, работающих с данными, выполненное в стиле «для самых маленьких».

Можно посмотреть, чем с точки зрения выполняемых задач и требуемых компетенций отличаются вот эти ребята:
🔹Product managers;
🔹Data analysts;
🔹Data scientists;
🔹Data engineers;
🔹Machine learning engineers;
🔹SRE / MLOps engineers.

Самое интересное начинается с инженеров (вроде аналитиков от саентистов уже все научились отличать, чего не скажешь про остальные роли).

🔗 Ссылка

#компетенции
Решил, что у меня маловато одновременно идущих образовательных мероприятий (/sarcasm mode off) и вписался на десятидневный марафон по data literacy (она же «грамотная работа с данными») от Data Yoga.

Подкупает сама тема, обещания связать данные с получением ценности и системой принятия решений, а также интенсивный формат.
По моему опыту участия в других марафонах, это сильнее мобилизирует (предполагаю, что так это работает не у всех).

Ну и бесплатно же (правда только в материальном плане, так как времени и сил потратить придется достаточно).

P.S. Разные образовательные мероприятия, изредка даже с отзывами, теперь можно найти в канале по тегу #учебное

🔗Ссылка

#учебное #data_literacy
Сказ про то, как в России новомодные термины понимают.

Знакомые исследователи столкнулись с клевым когнитивным искаженим, в результате которого NLP (оно же Natural Language Processing или обработка естественного языка) в беседах с респондентами плавно превращается в «Нейролингвистическое программирование».

Вот уж, действительно, пришла беда откуда не ждали (а ведь говорили преимущественно с «технарями»).

Хотя, казалось бы, предугадать такое можно было: поисковая выдача Гугла и Яндекса тоже от этой аббревиатуры не в восторге - там мешанина из успешного успеха и статей для дата-саентистов.

Мораль сей басни такова: если пользуетесь при коммуникации с другими людьми «общепринятыми» и «всем понятными» определениями и сокращениями (коих в сфере аналитики пруд пруди) не стесняйтесь «синхронизировать контексты», то есть явно проговаривать, что вы в них вкладываете.

Возможно, сбережете себе некоторе количество нервных клеток.

#компетенции
Кстати, что в первую очередь всплывает у вас в сознании при упоминании «NLP»?
Anonymous Poll
45%
«Natural Language Processing»
51%
«Нейролингвистическое программирование»
4%
«Что происходит?» (ничего из перечисленного)
Отличное 40-минутное выступление Романа Бунина про навыки, необходимые для работы с визуализациями.

Что понравилось:
🔹экспресс-повышение data-ink ratio;
🔹наглядные heatmap’ы, отображающие то, как и почему пользователи читают дашборды (и как это должно влиять на проектирование);
🔹переверстка изначально странного дашборда в онлайн-режиме в сжатые сроки;
🔹визуализация модели компетенций визуализатора ❤️
🔗 Ссылка

#компетенции
Еще один интересный проект в копилку, причём снова с городами, картами и AI.

Ребята в Ecopia довольно точно распознают различные объекты на карте, могут обогащать их клиентскими данными и строить 3D-модели местности.

По итогу получается этакий OneSoil для урбанистов.

Жалко только, что нет полноценной большой демки на сайте (есть только кусочек карты с переключалками слоёв).
В качестве бонуса присутствует цветовая гамма в духе Симпсонов.

А вот тут создатели рассказывают историю развития сервиса.

🔗Ссылка

#проекты
В сегодняшней статье с провокационным названием «The Analyst’s Workflow is Broken» описаны забавные, но довольно реалистичные будни аналитиков, занимающихся ad-hoc запросами.
Как говорится, «найди себя».

Основная боль - зоопарк инструментов, среди которых нет одного универсального (то есть позволяющего закрыть большинство популярных запросов).

В качестве решения предлагают новый подход - «BI notebook», приводя в качестве примера свою разработку.

🔗 Ссылка

#инструменты
Ваш покорный слуга героически проспал новости про существование еще одного инструмента визуализации от Microsoft - Charticulator.
Причем ладно еще статью в блоге MS в 2018, так ведь и коллеги по цеху напоминали в январе сего года тут и тут.

Зачем я все-таки о нем пишу: похоже, сейчас это самый простой способ сделать кастомную визуализацию для Power BI без написания кода.
Вот для примера галерея с демонстрацией результатов.

Процесс простой: выгружаем датасет или его кусок в csv, идем в веб-версию, накликиваем визуализацию и выгружаем уже в виде готового шаблона.

Все это не сложнее в использовании, чем тот же Data Wrapper, хотя олдскульный microsoft-style интерфейс и соответствующее удобство использования могут понравиться не всем.

🔗 Ссылка

#инструменты
Одной строкой про марафон data literacy: читать каждый день комфортно (возможно дело в привычке), надо записывать, иллюстрации в статьях классные, отличная идея с сообществом марафона в telegram, там было и продолжает появляться много интересного.

Помимо конспекта у меня получился список интересных ссылок из дополнительных материалов и чата, которыми я с удовольствием делюсь:
🔹Конспекты «Cвода знаний по управлению данными»;
🔹Еще один взгляд на модель компетенций аналитика в формате Miro-доски;
🔹Ужасающих размеров карта современных маркетинговых инструментов, которая перестала влезать в классическое табличное представление;
🔹Классные статьи про гистограммы и шкалы;
🔹Калькулятор для A/B тестов (он же использовался в GoPractice);
🔹Три статьи про историю визуализации: раз, два, три;
🔹Памятка по когнитивным искажениями.

Самостоятельно найти что-то полезное все еще можно в книге марафона:

🔗Ссылка

#учебное
Как говорится, не дашбордами едиными живём. Я реально считаю, что создание понятных презентаций по итогам проведенного анализа - отдельный вид искусства.

В статье предлагается набор практик по созданию общего styleguide для презентаций, чтобы единообразно представлять данные внутри одной организации.

Ключевые идеи (что приятно, с созданием хороших дашбордов это тоже коррелирует):
🔹 пишем выводы в самом начале, что актуально для той части целевой аудитории, которой важна самая суть (топы);
🔹 промежуточные выводы выносим в названия слайдов;
🔹 используем одинаковые шаблоны отображения информации, чтобы пользователи привыкали к логике повествования и легче воспринимали последующие итерации;
🔹используем контрастные цвета для сравнения разных параметров в одной визуализации;
🔹системно используем один выбранный цвет для отображения каждой конкретной переменной, одинаковые форматы дат, единый глоссарий (классика);
🔹помним про правило "чем проще, тем лучше».

🔗 Ссылка

#инструменты
Набрел на интересную попытку систематизировать процесс выбора визуализации в виде вот такой схемы (надо признать, качество изображения хромает).

В зависимости от различных входных параметров (что хотим отобразить, каково количество элементов, меняются ли данные во времени, etc.) предлагается та или иная визуализация.

Внутри есть примеры всех рекомендуемых графиков, правда не всегда удачные (несортированный пай-чарт должен войти в антитоп всех визуализаций ever).

🔗Ссылка

P.S. Спасибо Роману Бунину за разоблачение коварных индусов с медиума, которые не оставляют ссылок на оригиналы (цитирую):
"Эту шутку, кажется, придумал Andrew Abela в книге Advanced Presentations by Design. Вот его сайт — https://extremepresentation.com/design/7-charts/".

#визуализации
«Ключевые инструменты бизнес-аналитики. 67 инструментов, которые должен знать каждый менеджер», Бернард Марр.

Несмотря на кликбейт в названии (всегда задевает за живое), могу рекомендовать к прочтению, хоть и с ограничениями. Кстати, в оригинале там "60+ tools every manager needs to turn data into insights", что в разы лучше отражает суть книги.

Все инструменты и методы описаны в одной структуре: общее описание (включая вопросы, на которые дает ответ инструмент), рекомендации к применению, возможные источники данных, практический пример использования.

Что хорошо:
🔹возможность сравнения инструментов (как раз из-за единой структуры глав);
🔹связывание инструментов с целями бизнеса;
🔹фокусировка на практическом использовании в реальных кейсах;
🔹внятное описание ценности и границ применимости;
🔹те части, которые меня наиболее интересовали - анализ рынка, целевой аудитории, клиентов и финансов проработаны лучше всего (сразу видно, что автор бизнес-консультант).

Что не так хорошо:
🔻Важно! Техническая реализация не описана от слова «совсем». Если важно освоить любой из описанных в книге методов - она для этого не подойдет.
🔻слабые, на мой взгляд, 2 последние части - про анализ сотрудников и операционной деятельности. Кажется, что они тут просто для количества.
🔻только для бумажных версий книг: есть много ссылок на дополнительные материалы, но невозможность перейти по ним сильно напрягает. Даже если какая-то статья сильно заинтересовала добраться до ее чтения проблематично (вбивать ее URL в браузер - это то еще удовольствие).

В конечном итоге: важно понимать, что книга нацелена на «бизнесовую» аудиторию (там так и написано «сможете понять, что можно делегировать вашему аналитику»), так что технических и процессных подробностей по инструментам там минимальное количество. Тем не менее, это прекрасная возможность заглянуть в смежную область аналитики, подсмотреть практики из разных сфер и попробовать нанести непоправимую пользу своей компании.

🔗 Ссылка на бумажную версию

#книжное
Сегодня предлагаю посмотреть как безобидная попытка двух друзей составить топ песен The Beatles вышла из-под контроля и превратилась в дашборд в Tableau Public.

Очень понравилась идея сделать рейтинг альбомов по оценкам входящих в них песен и визуализировать боксплотами.
Топ песен тоже есть, наравне с изрядной долей иронии авторов.

А еще вот тут живенько описана история реализация проекта.

🔗Ссылка

#проекты
На прошлой неделе в пятницу увидел классный пост канала «Дашбордец» про аналитику, моделирование и винишко. Он вдохновил меня расчехлить несколько релевантных статей на эту же тематику.

The Data Scientist’s Guide To Buying Wine
Вот что происходит когда состав вина начинает рассматривать дата-саентист (спойлер: коэффициенты корреляции, хитмапы, примеры кода на питоне).
🔗Ссылка

Single Malt Scotch Whiskey
Можно сказать, что это практическое пособие по выбору Шотландского односолодового виски на основании анализа данных. Собрана классная статистика о зависимости вкуса и качеств от региона происхождения (за Islay и двор стреляю в упор).
🔗Ссылка

19 Beer Infographics To Make You See Double
Набор визуализаций на любой вкус про мир пива: от серьезных статистических и социальных до топов страннейшего пива и пивных коктейлей (за что?).
Мне лично очень понравился граф видов и сортов пива.
🔗Ссылка

#оффтоп #визуализации