Я у мамы аналитик – Telegram
Я у мамы аналитик
2.81K subscribers
77 photos
2 files
244 links
Как могу анализирую материалы на тему работы с данными:
- инфраструктура и инструменты;
- роли и компетенции аналитиков;
- продуктовый подход к аналитике;
- роль аналитики в создании и развитии продуктов.

Обратная связь @s_valuev, рекламу не размещаю
Download Telegram
Forwarded from Reveal the Data
Смотрите какой кайф. Очень качественный и удобный инструмент для урбанистики. Классно построен флоу работы — находишь нужную тебе точку на карте, устанавливаешь радиус интереса и дальше исследуешь место в формате скролителлинга. Необычный приём когда совмещены технологии бизнесового инструмента и подхода из журналистики. Немного напомнило OneSoil, про который рассказывал ранее.

И какой же крутой графический дизайн у этого инструмента. Я даже готов простить донат-чарты с одной цифрой и немного странную визуализацию с полукругами про пятно застройки. =)
На сайте ещё есть отличная статья про процесс создания инструмента.

За ссылку спасибо Андрею Кармацкому и Соне Буториной.

#ссылка
Похоже, в Microsoft тоже решили, что с VBA уже хватит (прямо как ребята, запихнувшие в Excel Jupiter Notebook).

На замену ему в закрытую бету выпущены новые формульные функции, обозванные lambda (что логично, ведь это и есть лямбда-выражения).

Выглядит как упрощённое программирование прямо в ячейке без танцев с бубном и переходов в другие окна. Интересно будет посмотреть на это все в боевых условиях, когда (если) оно выйдет в свет.

Будущее, что ли, наступает?

🔗Ссылка

#excelное
Сегодня у нас новая, экспериментальная рубрика.

Я довольно давно ищу книги, которые потенциально полезны аналитикам, периодически даже нахожу и читаю их.

Некоторое количество отзывов по ним я уже написал лично для себя, но кажется, что они (как и все, о чем я пишу) могут быть кому-то полезны (например, могут уберечь от покупки чего-то ненужного).
Встречаем, «Все лгут. Поисковики, Big Data и Интернет знают о вас все», Сет Cтивенс-Давидовиц.

Я давно собирался написать о ней и только недавно понял, что меня останавливало - минимальная практическая полезность. Но кажется в последнее время я стал отходить от концепции повсеместного утилитаризма и готов поделиться мыслями о книге (не является ли их появление после прочтения книги признаком наличия пользы? 🤔).

Честно говоря, название сформировало ожидание, что я погружусь в увлекательный мир большых данных, инфраструктуры там, машинное обучение, графики вот это вот все. В итоге же из перечисленного есть только графики, а книга и вовсе оказалась про людей.

Автор рассматривает различные актуальные для США общепринятые нормы, социально одобряемые точки зрения, публикации статистики и на основании данных по поисковым запросам (Гугл, сайты с 18+ контентом, социальные сети) ставит под сомнение их честность.

Основные мысли:
🔹Все лгут, особенно в социальных сетях, опросах, публичном выражении своего мнения;
🔹Что не врёт: поисковые запросы, клики, просмотры;
🔹«В среднем, цифровая сыворотка правды показывает мир хуже, чем мы думали» (а еще говорят, нельзя быть пессимистом);
🔹Сотрудник Гугл пишет, что Гугл знает про вас все (какая ирония).

Разочаровывает одно - все эти выводы довольно очевидные и не требуют Big Data для своего обоснования.

Тем не менее, если читать в качестве художественной литературы, а не профессиональной, то все неплохо.

🔗 Ссылка на бумажную версию

#книжное
Радует, что в последнее время чаще встречаются упоминания «аналитики по аналитике» - это когда мы не только пилим отчеты для пользователей, но еще и отслеживаем метрики их использования.

В статье описан пример реализации такого «дашборда по дашбордам» с целью исследования популярности разных легаси и не очень BI-систем Ростелекома.

Еще по касательной задета тема развития Self-Service подхода, но с предсказуемыми результатами ("нужен дешевый, простой инструмент с минимальным time to market»). Кажется, правда, что такие выводы можно было и существенно дешевле сделать 😉.

P.S. 8 аналитических систем в одной (хоть и огромной) организации - это сильно.

🔗 Ссылка

#business_intelligence
Чаще всего при возникновении задачи по вычислению объема рынка у меня начинаются какие-то танцы с бубном вокруг аналитических ресурсов, Яндекса, Гугла и личного опыта.

#анализ_рынка

Кажется, что улучшить ситуацию можно примерно так:
Forwarded from CustDEVotion
🔬💰🗺 #Полезное #Нельзя_просто_так_оценить_рынок

Для чего считать объём рынка?

На этой неделе я совершенно случайно наткнулся на замечательное видео одной из лекций школы Яндекса по управлению продуктами. 👤Александр Скурихин из ФРИИ делится собственным опытом оценки рынка для стартапов.

Мне эта лекция помогла связать в единую картину всякие PAM, TAM, SAM, SOM с Hype Cycles от Gartner и кривой проникновения инноваций. Стоит заметить, что Александр использует немного другие расшифровки объёмов рынка. Я знаю и много где встречал такие.

Ещё одним приятным моментом стал совет учитывать сегментированность рынка, которую я люблю смотреть в отчётах Mordor Intelligence (не думаю, что к ним имеют отношение Саурон или Саруман). В них отдельная диаграмма есть для этого.

В конце лекции даже есть авторская методика расчёта объёма рынка и несколько примеров. В методике упоминается Trendwatching, но никаких рекомендаций про него не даётся. Подумаю, может их канвас к этому прикрутить.

Объём рынка, это те деньги, которые может заработать компания. Если не посчитать его заранее, можно впустую потратить ресурсы, ведь заработать в выбранном сегменте может быть невозможно.

Поделитесь, пожалуйста, собственными рекомендациями в комментариях, я хочу модернизировать свой подход к оценке.
Описание ролей в командах, работающих с данными, выполненное в стиле «для самых маленьких».

Можно посмотреть, чем с точки зрения выполняемых задач и требуемых компетенций отличаются вот эти ребята:
🔹Product managers;
🔹Data analysts;
🔹Data scientists;
🔹Data engineers;
🔹Machine learning engineers;
🔹SRE / MLOps engineers.

Самое интересное начинается с инженеров (вроде аналитиков от саентистов уже все научились отличать, чего не скажешь про остальные роли).

🔗 Ссылка

#компетенции
Решил, что у меня маловато одновременно идущих образовательных мероприятий (/sarcasm mode off) и вписался на десятидневный марафон по data literacy (она же «грамотная работа с данными») от Data Yoga.

Подкупает сама тема, обещания связать данные с получением ценности и системой принятия решений, а также интенсивный формат.
По моему опыту участия в других марафонах, это сильнее мобилизирует (предполагаю, что так это работает не у всех).

Ну и бесплатно же (правда только в материальном плане, так как времени и сил потратить придется достаточно).

P.S. Разные образовательные мероприятия, изредка даже с отзывами, теперь можно найти в канале по тегу #учебное

🔗Ссылка

#учебное #data_literacy
Сказ про то, как в России новомодные термины понимают.

Знакомые исследователи столкнулись с клевым когнитивным искаженим, в результате которого NLP (оно же Natural Language Processing или обработка естественного языка) в беседах с респондентами плавно превращается в «Нейролингвистическое программирование».

Вот уж, действительно, пришла беда откуда не ждали (а ведь говорили преимущественно с «технарями»).

Хотя, казалось бы, предугадать такое можно было: поисковая выдача Гугла и Яндекса тоже от этой аббревиатуры не в восторге - там мешанина из успешного успеха и статей для дата-саентистов.

Мораль сей басни такова: если пользуетесь при коммуникации с другими людьми «общепринятыми» и «всем понятными» определениями и сокращениями (коих в сфере аналитики пруд пруди) не стесняйтесь «синхронизировать контексты», то есть явно проговаривать, что вы в них вкладываете.

Возможно, сбережете себе некоторе количество нервных клеток.

#компетенции
Кстати, что в первую очередь всплывает у вас в сознании при упоминании «NLP»?
Anonymous Poll
45%
«Natural Language Processing»
51%
«Нейролингвистическое программирование»
4%
«Что происходит?» (ничего из перечисленного)
Отличное 40-минутное выступление Романа Бунина про навыки, необходимые для работы с визуализациями.

Что понравилось:
🔹экспресс-повышение data-ink ratio;
🔹наглядные heatmap’ы, отображающие то, как и почему пользователи читают дашборды (и как это должно влиять на проектирование);
🔹переверстка изначально странного дашборда в онлайн-режиме в сжатые сроки;
🔹визуализация модели компетенций визуализатора ❤️
🔗 Ссылка

#компетенции
Еще один интересный проект в копилку, причём снова с городами, картами и AI.

Ребята в Ecopia довольно точно распознают различные объекты на карте, могут обогащать их клиентскими данными и строить 3D-модели местности.

По итогу получается этакий OneSoil для урбанистов.

Жалко только, что нет полноценной большой демки на сайте (есть только кусочек карты с переключалками слоёв).
В качестве бонуса присутствует цветовая гамма в духе Симпсонов.

А вот тут создатели рассказывают историю развития сервиса.

🔗Ссылка

#проекты
В сегодняшней статье с провокационным названием «The Analyst’s Workflow is Broken» описаны забавные, но довольно реалистичные будни аналитиков, занимающихся ad-hoc запросами.
Как говорится, «найди себя».

Основная боль - зоопарк инструментов, среди которых нет одного универсального (то есть позволяющего закрыть большинство популярных запросов).

В качестве решения предлагают новый подход - «BI notebook», приводя в качестве примера свою разработку.

🔗 Ссылка

#инструменты
Ваш покорный слуга героически проспал новости про существование еще одного инструмента визуализации от Microsoft - Charticulator.
Причем ладно еще статью в блоге MS в 2018, так ведь и коллеги по цеху напоминали в январе сего года тут и тут.

Зачем я все-таки о нем пишу: похоже, сейчас это самый простой способ сделать кастомную визуализацию для Power BI без написания кода.
Вот для примера галерея с демонстрацией результатов.

Процесс простой: выгружаем датасет или его кусок в csv, идем в веб-версию, накликиваем визуализацию и выгружаем уже в виде готового шаблона.

Все это не сложнее в использовании, чем тот же Data Wrapper, хотя олдскульный microsoft-style интерфейс и соответствующее удобство использования могут понравиться не всем.

🔗 Ссылка

#инструменты
Одной строкой про марафон data literacy: читать каждый день комфортно (возможно дело в привычке), надо записывать, иллюстрации в статьях классные, отличная идея с сообществом марафона в telegram, там было и продолжает появляться много интересного.

Помимо конспекта у меня получился список интересных ссылок из дополнительных материалов и чата, которыми я с удовольствием делюсь:
🔹Конспекты «Cвода знаний по управлению данными»;
🔹Еще один взгляд на модель компетенций аналитика в формате Miro-доски;
🔹Ужасающих размеров карта современных маркетинговых инструментов, которая перестала влезать в классическое табличное представление;
🔹Классные статьи про гистограммы и шкалы;
🔹Калькулятор для A/B тестов (он же использовался в GoPractice);
🔹Три статьи про историю визуализации: раз, два, три;
🔹Памятка по когнитивным искажениями.

Самостоятельно найти что-то полезное все еще можно в книге марафона:

🔗Ссылка

#учебное
Как говорится, не дашбордами едиными живём. Я реально считаю, что создание понятных презентаций по итогам проведенного анализа - отдельный вид искусства.

В статье предлагается набор практик по созданию общего styleguide для презентаций, чтобы единообразно представлять данные внутри одной организации.

Ключевые идеи (что приятно, с созданием хороших дашбордов это тоже коррелирует):
🔹 пишем выводы в самом начале, что актуально для той части целевой аудитории, которой важна самая суть (топы);
🔹 промежуточные выводы выносим в названия слайдов;
🔹 используем одинаковые шаблоны отображения информации, чтобы пользователи привыкали к логике повествования и легче воспринимали последующие итерации;
🔹используем контрастные цвета для сравнения разных параметров в одной визуализации;
🔹системно используем один выбранный цвет для отображения каждой конкретной переменной, одинаковые форматы дат, единый глоссарий (классика);
🔹помним про правило "чем проще, тем лучше».

🔗 Ссылка

#инструменты
Набрел на интересную попытку систематизировать процесс выбора визуализации в виде вот такой схемы (надо признать, качество изображения хромает).

В зависимости от различных входных параметров (что хотим отобразить, каково количество элементов, меняются ли данные во времени, etc.) предлагается та или иная визуализация.

Внутри есть примеры всех рекомендуемых графиков, правда не всегда удачные (несортированный пай-чарт должен войти в антитоп всех визуализаций ever).

🔗Ссылка

P.S. Спасибо Роману Бунину за разоблачение коварных индусов с медиума, которые не оставляют ссылок на оригиналы (цитирую):
"Эту шутку, кажется, придумал Andrew Abela в книге Advanced Presentations by Design. Вот его сайт — https://extremepresentation.com/design/7-charts/".

#визуализации