Sankey-диаграммы периодически мелькают в различных топах визуализаций (чего стоит только легендарная карта вторжения Наполеона в Россию в 1812), но массовыми их назвать сложно.
Чаще всего их используют для отображения потоков или маршрутов, но есть и другие, более интересные кейсы:
🔹отображение того, как эволюционирует покупательский опыт с течением времени (в примере у автора эволюция классов арендуемых автомобилей);
🔹анализ иерархически организованных данных;
🔹поиск паттернов в данных в качестве альтернативы ML (пример очень специфичный, но что-то в этом есть).
Про подготовку данных и реализацию (на примере Power BI) можно почитать тут.
P.S. А еще кто-то в интернетенеправ ведет блог, посвященный исключительно санкеям (некоторые выглядят максимально ужасающе, но найти что-то интересное можно).
🔗Ссылка
#визуализации
Чаще всего их используют для отображения потоков или маршрутов, но есть и другие, более интересные кейсы:
🔹отображение того, как эволюционирует покупательский опыт с течением времени (в примере у автора эволюция классов арендуемых автомобилей);
🔹анализ иерархически организованных данных;
🔹поиск паттернов в данных в качестве альтернативы ML (пример очень специфичный, но что-то в этом есть).
Про подготовку данных и реализацию (на примере Power BI) можно почитать тут.
P.S. А еще кто-то в интернете
🔗Ссылка
#визуализации
На этой неделе опубликовали новый Gartner Magic Quadrant по аналитическим и BI-системам.
Как вы понимаете, Microsoft опять в лидерах и уже хвастается в блоге и рассылках. Немного подробнее, почему так - в сегодняшней заглавной статье.
Рядом с Power BI, по традиции, расположились Tableau и Qlik, а вот ThoughtSpot окончательно свалился в визионеры.
Общее количество участников сократилось с 22 до 20 (результат покупок ряда инструментов другими игроками). Подробнее посмотреть кто куда переехал можно тут.
А вот что было в предыдущей серии (2020 vs 2019).
🔗 Ссылка
#business_intelligence
Как вы понимаете, Microsoft опять в лидерах и уже хвастается в блоге и рассылках. Немного подробнее, почему так - в сегодняшней заглавной статье.
Рядом с Power BI, по традиции, расположились Tableau и Qlik, а вот ThoughtSpot окончательно свалился в визионеры.
Общее количество участников сократилось с 22 до 20 (результат покупок ряда инструментов другими игроками). Подробнее посмотреть кто куда переехал можно тут.
А вот что было в предыдущей серии (2020 vs 2019).
🔗 Ссылка
#business_intelligence
Это очень крутая идея и топовая реализация!
Жаль, что для исследования доступен только Нью-Йорк.
Из похожего, но ближе к нашим реалиям (хоть и с существенно меньшей функциональностью) приходит в голову проект по визуализации возраста зданий. С того момента, как я о нем писал, к Санкт-Петербургу успели добавить Москву, Казань и Владимир (круто, что ребята развиваются).
#проекты
Жаль, что для исследования доступен только Нью-Йорк.
Из похожего, но ближе к нашим реалиям (хоть и с существенно меньшей функциональностью) приходит в голову проект по визуализации возраста зданий. С того момента, как я о нем писал, к Санкт-Петербургу успели добавить Москву, Казань и Владимир (круто, что ребята развиваются).
#проекты
Forwarded from Reveal the Data
Смотрите какой кайф. Очень качественный и удобный инструмент для урбанистики. Классно построен флоу работы — находишь нужную тебе точку на карте, устанавливаешь радиус интереса и дальше исследуешь место в формате скролителлинга. Необычный приём когда совмещены технологии бизнесового инструмента и подхода из журналистики. Немного напомнило OneSoil, про который рассказывал ранее.
И какой же крутой графический дизайн у этого инструмента. Я даже готов простить донат-чарты с одной цифрой и немного странную визуализацию с полукругами про пятно застройки. =)
На сайте ещё есть отличная статья про процесс создания инструмента.
За ссылку спасибо Андрею Кармацкому и Соне Буториной.
#ссылка
И какой же крутой графический дизайн у этого инструмента. Я даже готов простить донат-чарты с одной цифрой и немного странную визуализацию с полукругами про пятно застройки. =)
На сайте ещё есть отличная статья про процесс создания инструмента.
За ссылку спасибо Андрею Кармацкому и Соне Буториной.
#ссылка
Похоже, в Microsoft тоже решили, что с VBA уже хватит (прямо как ребята, запихнувшие в Excel Jupiter Notebook).
На замену ему в закрытую бету выпущены новые формульные функции, обозванные lambda (что логично, ведь это и есть лямбда-выражения).
Выглядит как упрощённое программирование прямо в ячейке без танцев с бубном и переходов в другие окна. Интересно будет посмотреть на это все в боевых условиях, когда (если) оно выйдет в свет.
Будущее, что ли, наступает?
🔗Ссылка
#excelное
На замену ему в закрытую бету выпущены новые формульные функции, обозванные lambda (что логично, ведь это и есть лямбда-выражения).
Выглядит как упрощённое программирование прямо в ячейке без танцев с бубном и переходов в другие окна. Интересно будет посмотреть на это все в боевых условиях, когда (если) оно выйдет в свет.
Будущее, что ли, наступает?
🔗Ссылка
#excelное
Сегодня у нас новая, экспериментальная рубрика.
Я довольно давно ищу книги, которые потенциально полезны аналитикам, периодически даже нахожу и читаю их.
Некоторое количество отзывов по ним я уже написал лично для себя, но кажется, что они (как и все, о чем я пишу) могут быть кому-то полезны (например, могут уберечь от покупки чего-то ненужного).
Я довольно давно ищу книги, которые потенциально полезны аналитикам, периодически даже нахожу и читаю их.
Некоторое количество отзывов по ним я уже написал лично для себя, но кажется, что они (как и все, о чем я пишу) могут быть кому-то полезны (например, могут уберечь от покупки чего-то ненужного).
Встречаем, «Все лгут. Поисковики, Big Data и Интернет знают о вас все», Сет Cтивенс-Давидовиц.
Я давно собирался написать о ней и только недавно понял, что меня останавливало - минимальная практическая полезность. Но кажется в последнее время я стал отходить от концепции повсеместного утилитаризма и готов поделиться мыслями о книге (не является ли их появление после прочтения книги признаком наличия пользы? 🤔).
Честно говоря, название сформировало ожидание, что я погружусь в увлекательный мир большых данных, инфраструктуры там, машинное обучение, графики вот это вот все. В итоге же из перечисленного есть только графики, а книга и вовсе оказалась про людей.
Автор рассматривает различные актуальные для США общепринятые нормы, социально одобряемые точки зрения, публикации статистики и на основании данных по поисковым запросам (Гугл, сайты с 18+ контентом, социальные сети) ставит под сомнение их честность.
Основные мысли:
🔹Все лгут, особенно в социальных сетях, опросах, публичном выражении своего мнения;
🔹Что не врёт: поисковые запросы, клики, просмотры;
🔹«В среднем, цифровая сыворотка правды показывает мир хуже, чем мы думали» (а еще говорят, нельзя быть пессимистом);
🔹Сотрудник Гугл пишет, что Гугл знает про вас все (какая ирония).
Разочаровывает одно - все эти выводы довольно очевидные и не требуют Big Data для своего обоснования.
Тем не менее, если читать в качестве художественной литературы, а не профессиональной, то все неплохо.
🔗 Ссылка на бумажную версию
#книжное
Я давно собирался написать о ней и только недавно понял, что меня останавливало - минимальная практическая полезность. Но кажется в последнее время я стал отходить от концепции повсеместного утилитаризма и готов поделиться мыслями о книге (не является ли их появление после прочтения книги признаком наличия пользы? 🤔).
Честно говоря, название сформировало ожидание, что я погружусь в увлекательный мир большых данных, инфраструктуры там, машинное обучение, графики вот это вот все. В итоге же из перечисленного есть только графики, а книга и вовсе оказалась про людей.
Автор рассматривает различные актуальные для США общепринятые нормы, социально одобряемые точки зрения, публикации статистики и на основании данных по поисковым запросам (Гугл, сайты с 18+ контентом, социальные сети) ставит под сомнение их честность.
Основные мысли:
🔹Все лгут, особенно в социальных сетях, опросах, публичном выражении своего мнения;
🔹Что не врёт: поисковые запросы, клики, просмотры;
🔹«В среднем, цифровая сыворотка правды показывает мир хуже, чем мы думали» (а еще говорят, нельзя быть пессимистом);
🔹Сотрудник Гугл пишет, что Гугл знает про вас все (какая ирония).
Разочаровывает одно - все эти выводы довольно очевидные и не требуют Big Data для своего обоснования.
Тем не менее, если читать в качестве художественной литературы, а не профессиональной, то все неплохо.
🔗 Ссылка на бумажную версию
#книжное
Радует, что в последнее время чаще встречаются упоминания «аналитики по аналитике» - это когда мы не только пилим отчеты для пользователей, но еще и отслеживаем метрики их использования.
В статье описан пример реализации такого «дашборда по дашбордам» с целью исследования популярности разных легаси и не очень BI-систем Ростелекома.
Еще по касательной задета тема развития Self-Service подхода, но с предсказуемыми результатами ("нужен дешевый, простой инструмент с минимальным time to market»). Кажется, правда, что такие выводы можно было и существенно дешевле сделать 😉.
P.S. 8 аналитических систем в одной (хоть и огромной) организации - это сильно.
🔗 Ссылка
#business_intelligence
В статье описан пример реализации такого «дашборда по дашбордам» с целью исследования популярности разных легаси и не очень BI-систем Ростелекома.
Еще по касательной задета тема развития Self-Service подхода, но с предсказуемыми результатами ("нужен дешевый, простой инструмент с минимальным time to market»). Кажется, правда, что такие выводы можно было и существенно дешевле сделать 😉.
P.S. 8 аналитических систем в одной (хоть и огромной) организации - это сильно.
🔗 Ссылка
#business_intelligence
Чаще всего при возникновении задачи по вычислению объема рынка у меня начинаются какие-то танцы с бубном вокруг аналитических ресурсов, Яндекса, Гугла и личного опыта.
#анализ_рынка
Кажется, что улучшить ситуацию можно примерно так:
#анализ_рынка
Кажется, что улучшить ситуацию можно примерно так:
Forwarded from CustDEVotion
🔬💰🗺 #Полезное #Нельзя_просто_так_оценить_рынок
Для чего считать объём рынка?
На этой неделе я совершенно случайно наткнулся на замечательное видео одной из лекций школы Яндекса по управлению продуктами. 👤Александр Скурихин из ФРИИ делится собственным опытом оценки рынка для стартапов.
Мне эта лекция помогла связать в единую картину всякие PAM, TAM, SAM, SOM с Hype Cycles от Gartner и кривой проникновения инноваций. Стоит заметить, что Александр использует немного другие расшифровки объёмов рынка. Я знаю и много где встречал такие.
Ещё одним приятным моментом стал совет учитывать сегментированность рынка, которую я люблю смотреть в отчётах Mordor Intelligence (не думаю, что к ним имеют отношение Саурон или Саруман). В них отдельная диаграмма есть для этого.
В конце лекции даже есть авторская методика расчёта объёма рынка и несколько примеров. В методике упоминается Trendwatching, но никаких рекомендаций про него не даётся. Подумаю, может их канвас к этому прикрутить.
Объём рынка, это те деньги, которые может заработать компания. Если не посчитать его заранее, можно впустую потратить ресурсы, ведь заработать в выбранном сегменте может быть невозможно.
Поделитесь, пожалуйста, собственными рекомендациями в комментариях, я хочу модернизировать свой подход к оценке.
Для чего считать объём рынка?
На этой неделе я совершенно случайно наткнулся на замечательное видео одной из лекций школы Яндекса по управлению продуктами. 👤Александр Скурихин из ФРИИ делится собственным опытом оценки рынка для стартапов.
Мне эта лекция помогла связать в единую картину всякие PAM, TAM, SAM, SOM с Hype Cycles от Gartner и кривой проникновения инноваций. Стоит заметить, что Александр использует немного другие расшифровки объёмов рынка. Я знаю и много где встречал такие.
Ещё одним приятным моментом стал совет учитывать сегментированность рынка, которую я люблю смотреть в отчётах Mordor Intelligence (не думаю, что к ним имеют отношение Саурон или Саруман). В них отдельная диаграмма есть для этого.
В конце лекции даже есть авторская методика расчёта объёма рынка и несколько примеров. В методике упоминается Trendwatching, но никаких рекомендаций про него не даётся. Подумаю, может их канвас к этому прикрутить.
Объём рынка, это те деньги, которые может заработать компания. Если не посчитать его заранее, можно впустую потратить ресурсы, ведь заработать в выбранном сегменте может быть невозможно.
Поделитесь, пожалуйста, собственными рекомендациями в комментариях, я хочу модернизировать свой подход к оценке.
Описание ролей в командах, работающих с данными, выполненное в стиле «для самых маленьких».
Можно посмотреть, чем с точки зрения выполняемых задач и требуемых компетенций отличаются вот эти ребята:
🔹Product managers;
🔹Data analysts;
🔹Data scientists;
🔹Data engineers;
🔹Machine learning engineers;
🔹SRE / MLOps engineers.
Самое интересное начинается с инженеров (вроде аналитиков от саентистов уже все научились отличать, чего не скажешь про остальные роли).
🔗 Ссылка
#компетенции
Можно посмотреть, чем с точки зрения выполняемых задач и требуемых компетенций отличаются вот эти ребята:
🔹Product managers;
🔹Data analysts;
🔹Data scientists;
🔹Data engineers;
🔹Machine learning engineers;
🔹SRE / MLOps engineers.
Самое интересное начинается с инженеров (вроде аналитиков от саентистов уже все научились отличать, чего не скажешь про остальные роли).
🔗 Ссылка
#компетенции
Решил, что у меня маловато одновременно идущих образовательных мероприятий (/sarcasm mode off) и вписался на десятидневный марафон по data literacy (она же «грамотная работа с данными») от Data Yoga.
Подкупает сама тема, обещания связать данные с получением ценности и системой принятия решений, а также интенсивный формат.
По моему опыту участия в других марафонах, это сильнее мобилизирует (предполагаю, что так это работает не у всех).
Ну и бесплатно же (правда только в материальном плане, так как времени и сил потратить придется достаточно).
P.S. Разные образовательные мероприятия, изредка даже с отзывами, теперь можно найти в канале по тегу #учебное
🔗Ссылка
#учебное #data_literacy
Подкупает сама тема, обещания связать данные с получением ценности и системой принятия решений, а также интенсивный формат.
По моему опыту участия в других марафонах, это сильнее мобилизирует (предполагаю, что так это работает не у всех).
Ну и бесплатно же (правда только в материальном плане, так как времени и сил потратить придется достаточно).
P.S. Разные образовательные мероприятия, изредка даже с отзывами, теперь можно найти в канале по тегу #учебное
🔗Ссылка
#учебное #data_literacy
Сказ про то, как в России новомодные термины понимают.
Знакомые исследователи столкнулись с клевым когнитивным искаженим, в результате которого NLP (оно же Natural Language Processing или обработка естественного языка) в беседах с респондентами плавно превращается в «Нейролингвистическое программирование».
Вот уж, действительно, пришла беда откуда не ждали (а ведь говорили преимущественно с «технарями»).
Хотя, казалось бы, предугадать такое можно было: поисковая выдача Гугла и Яндекса тоже от этой аббревиатуры не в восторге - там мешанина из успешного успеха и статей для дата-саентистов.
Мораль сей басни такова: если пользуетесь при коммуникации с другими людьми «общепринятыми» и «всем понятными» определениями и сокращениями (коих в сфере аналитики пруд пруди) не стесняйтесь «синхронизировать контексты», то есть явно проговаривать, что вы в них вкладываете.
Возможно, сбережете себе некоторе количество нервных клеток.
#компетенции
Знакомые исследователи столкнулись с клевым когнитивным искаженим, в результате которого NLP (оно же Natural Language Processing или обработка естественного языка) в беседах с респондентами плавно превращается в «Нейролингвистическое программирование».
Вот уж, действительно, пришла беда откуда не ждали (а ведь говорили преимущественно с «технарями»).
Хотя, казалось бы, предугадать такое можно было: поисковая выдача Гугла и Яндекса тоже от этой аббревиатуры не в восторге - там мешанина из успешного успеха и статей для дата-саентистов.
Мораль сей басни такова: если пользуетесь при коммуникации с другими людьми «общепринятыми» и «всем понятными» определениями и сокращениями (коих в сфере аналитики пруд пруди) не стесняйтесь «синхронизировать контексты», то есть явно проговаривать, что вы в них вкладываете.
Возможно, сбережете себе некоторе количество нервных клеток.
#компетенции
Кстати, что в первую очередь всплывает у вас в сознании при упоминании «NLP»?
Anonymous Poll
45%
«Natural Language Processing»
51%
«Нейролингвистическое программирование»
4%
«Что происходит?» (ничего из перечисленного)
Отличное 40-минутное выступление Романа Бунина про навыки, необходимые для работы с визуализациями.
Что понравилось:
🔹экспресс-повышение data-ink ratio;
🔹наглядные heatmap’ы, отображающие то, как и почему пользователи читают дашборды (и как это должно влиять на проектирование);
🔹переверстка изначально странного дашборда в онлайн-режиме в сжатые сроки;
🔹визуализация модели компетенций визуализатора ❤️
🔗 Ссылка
#компетенции
Что понравилось:
🔹экспресс-повышение data-ink ratio;
🔹наглядные heatmap’ы, отображающие то, как и почему пользователи читают дашборды (и как это должно влиять на проектирование);
🔹переверстка изначально странного дашборда в онлайн-режиме в сжатые сроки;
🔹визуализация модели компетенций визуализатора ❤️
🔗 Ссылка
#компетенции
Еще один интересный проект в копилку, причём снова с городами, картами и AI.
Ребята в Ecopia довольно точно распознают различные объекты на карте, могут обогащать их клиентскими данными и строить 3D-модели местности.
По итогу получается этакий OneSoil для урбанистов.
Жалко только, что нет полноценной большой демки на сайте (есть только кусочек карты с переключалками слоёв).
В качестве бонуса присутствует цветовая гамма в духе Симпсонов.
А вот тут создатели рассказывают историю развития сервиса.
🔗Ссылка
#проекты
Ребята в Ecopia довольно точно распознают различные объекты на карте, могут обогащать их клиентскими данными и строить 3D-модели местности.
По итогу получается этакий OneSoil для урбанистов.
Жалко только, что нет полноценной большой демки на сайте (есть только кусочек карты с переключалками слоёв).
В качестве бонуса присутствует цветовая гамма в духе Симпсонов.
А вот тут создатели рассказывают историю развития сервиса.
🔗Ссылка
#проекты
В сегодняшней статье с провокационным названием «The Analyst’s Workflow is Broken» описаны забавные, но довольно реалистичные будни аналитиков, занимающихся ad-hoc запросами.
Как говорится, «найди себя».
Основная боль - зоопарк инструментов, среди которых нет одного универсального (то есть позволяющего закрыть большинство популярных запросов).
В качестве решения предлагают новый подход - «BI notebook», приводя в качестве примера свою разработку.
🔗 Ссылка
#инструменты
Как говорится, «найди себя».
Основная боль - зоопарк инструментов, среди которых нет одного универсального (то есть позволяющего закрыть большинство популярных запросов).
В качестве решения предлагают новый подход - «BI notebook», приводя в качестве примера свою разработку.
🔗 Ссылка
#инструменты