NEW BOT Телеграм, страница

Я у мамы аналитик

«Ключевые инструменты бизнес-аналитики. 67 инструментов, которые должен знать каждый менеджер», Бернард Марр.

Несмотря на кликбейт в названии (всегда задевает за живое), могу рекомендовать к прочтению, хоть и с ограничениями. Кстати, в оригинале там "60+ tools every manager needs to turn data into insights", что в разы лучше отражает суть книги.

Все инструменты и методы описаны в одной структуре: общее описание (включая вопросы, на которые дает ответ инструмент), рекомендации к применению, возможные источники данных, практический пример использования.

Что хорошо:
🔹возможность сравнения инструментов (как раз из-за единой структуры глав);
🔹связывание инструментов с целями бизнеса;
🔹фокусировка на практическом использовании в реальных кейсах;
🔹внятное описание ценности и границ применимости;
🔹те части, которые меня наиболее интересовали - анализ рынка, целевой аудитории, клиентов и финансов проработаны лучше всего (сразу видно, что автор бизнес-консультант).

Что не так хорошо:
🔻Важно! Техническая реализация не описана от слова «совсем». Если важно освоить любой из описанных в книге методов - она для этого не подойдет.
🔻слабые, на мой взгляд, 2 последние части - про анализ сотрудников и операционной деятельности. Кажется, что они тут просто для количества.
🔻только для бумажных версий книг: есть много ссылок на дополнительные материалы, но невозможность перейти по ним сильно напрягает. Даже если какая-то статья сильно заинтересовала добраться до ее чтения проблематично (вбивать ее URL в браузер - это то еще удовольствие).

В конечном итоге: важно понимать, что книга нацелена на «бизнесовую» аудиторию (там так и написано «сможете понять, что можно делегировать вашему аналитику»), так что технических и процессных подробностей по инструментам там минимальное количество. Тем не менее, это прекрасная возможность заглянуть в смежную область аналитики, подсмотреть практики из разных сфер и попробовать нанести непоправимую пользу своей компании.

🔗 Ссылка на бумажную версию

#книжное

1.18K viewsStas Valuev, edited 14:04

Я у мамы аналитик

Сегодня предлагаю посмотреть как безобидная попытка двух друзей составить топ песен The Beatles вышла из-под контроля и превратилась в дашборд в Tableau Public.

Очень понравилась идея сделать рейтинг альбомов по оценкам входящих в них песен и визуализировать боксплотами.
Топ песен тоже есть, наравне с изрядной долей иронии авторов.

А еще вот тут живенько описана история реализация проекта.

🔗Ссылка

#проекты

1.07K viewsStas Valuev, 13:51

Я у мамы аналитик

На прошлой неделе в пятницу увидел классный пост канала «Дашбордец» про аналитику, моделирование и винишко. Он вдохновил меня расчехлить несколько релевантных статей на эту же тематику.

The Data Scientist’s Guide To Buying Wine
Вот что происходит когда состав вина начинает рассматривать дата-саентист (спойлер: коэффициенты корреляции, хитмапы, примеры кода на питоне).
🔗Ссылка

Single Malt Scotch Whiskey
Можно сказать, что это практическое пособие по выбору Шотландского односолодового виски на основании анализа данных. Собрана классная статистика о зависимости вкуса и качеств от региона происхождения (за Islay и двор стреляю в упор).
🔗Ссылка

19 Beer Infographics To Make You See Double
Набор визуализаций на любой вкус про мир пива: от серьезных статистических и социальных до топов страннейшего пива и пивных коктейлей (за что?).
Мне лично очень понравился граф видов и сортов пива.
🔗Ссылка

#оффтоп #визуализации

Дашбордец

Котятки🐱
Сегодня пятничка, нас ждет винишко и математика, - интересная статья про моделирование, которая расскажет на понятном языке, как математические модели предсказывают.
Линк: https://pudding.cool/2021/03/wine-model/
Отдельное спасибо за наводку гуру…

1.15K viewsStas Valuev, 13:52

Я у мамы аналитик

На этой неделе попробую вернуться в более серьезное русло (не все же про музыку с алокоголем писать).

Начнем со свежайшей статьи на русском языке про тренды развития BI-систем.

Что внутри:
🔹небольшой обзор рынка и проблематики;
🔹интереснейшая часть про Augmented Business Intelligence (в свое время можно было прочесть у Gartner, но если пропустили - вам сюда);
🔹эволюция визуализаций (3D, storytelling, BIM);
🔹собранные из разных источников тенденции развития BI-инструментов.

Если смотреть на получившийся список трендов достаточно долго, в голову действительно приходит вывод про их общую направленность на демократизацию данных (вот тут хорошая статья на эту тему).

🔗Ссылка

#business_intelligence

1.01K viewsStas Valuev, 13:44

Я у мамы аналитик

Принес кое-что про большие данные почитать: «Big Data: перспективы развития, тренды и объемы рынка больших данных».

В статье собраны обзоры состояния мирового рынка аналитики и Big Data в разных разрезах. Прогнозируемый объем в 274,3 млрд долларов к 2022 году - это сильно.
Что интересно, присутствует и обзор рынка РФ, причем с какой-никакой оценкой в деньгах (правда от 10 до 30 млрд рублей - такая себе точность).

И дополнение к статье: крутой отчет Mordor Intelligence о мировом рынке Big Data as a service. На всякий случай: это когда клиент получает инфраструктуру для обработки больших данных как готовую услугу у своего сервис-провайдера (по факту, не занимается ее самостоятельной поддержкой).

Такой формат потребления составляет около 5-7% от всего объема мирового рынка и можно предположить, что на территории СНГ эта доля будет еще ниже из-за меньшей степени зрелости рынка.

🔗Ссылка

#анализ_рынка

1.11K viewsStas Valuev, 14:16

Я у мамы аналитик

На хабре любезно перевели крутую статью Andreessen Horowitz «The Emerging Architectures for Modern Data Infrastructure» про то, как модно и со вкусом обрабатывать данные в современном мире.

Самое полезное - это, конечно, архитектурные схемы с распределенными по ним решениями и инструментами.
Это неплохая отправная точка, чтобы начать собираться со стеком технологий, который лежит в основе современных аналитических систем.

Еще можно заценить тренды развития этих архитектур, которые когда-нибудь и до нас дойдут.

🔗Ссылка

#data_engineering

1.17K viewsStas Valuev, 13:59

Я у мамы аналитик

Глоссарий, в котором сгруппированы и описаны 26 базовых англоязычных термина из мира аналитики, Big Data и AI.

Не сказал бы, что эти определения сложно найти в другом месте (там даже ссылки на первоисточники), но то как все систематизировано вызывает уважение.

Плюс, есть наглядная градация по уровням зрелости организаций.

🔗Ссылка

#учебное

1.16K viewsStas Valuev, 13:44

Я у мамы аналитик

Роль очистки данных нередко недооценивают, а мне вот близка позиция автора статьи «Data Cleaning IS Analysis, Not Grunt Work», что это и есть аналитическая работа в чистом виде.

Аргументация выглядит так: «We’re doing cleaning because we want to extract the useful signal from the noise, and we decide certain bits of noise “correctable” at the data point level for that purpose».

В целом, в статье предлагается уйти от общепринятого подхода, когда для решения задачи данные сначала единовременно очищаются, а после анализируются.

Альтернатива такова: ничего безвозвратно не перетирать, создавая алгоритмы трансформации данных с возможностью отката и переиспользования (в статье есть визуализация для наглядности).

Ничего не напоминает? Мне вот кажется, что это попытка приземлить инфраструктурные практики продвинутых компаний на "простых" аналитиков (пропаганда перехода от ETL к ELT, если угодно).

🔗Ссылка

#инструменты

1.16K viewsStas Valuev, 14:02

Я у мамы аналитик

В исследованиях рынков есть такой классный тип артефактов - Landscape. В идеале, он должен помогать понять 2 вещи:
🔹какие типы процессов или операций есть в отрасли;
🔹какие существуют инструменты для их реализации или автоматизации.

У такого формата есть существенный минус: сходу ничерта не ясно, да и понять что-то без дополнительной аналитики и пояснений непросто (особенно в новой для себя сфере).

Поэтому особое внимание к себе привлекают материалы вроде сегодняшнего The 2020 Data & AI Landscape, где есть и ландшафт рынка и понятные выводы.

Помимо картинок есть описание основных трендов в развитии инфраструктур для обработки данных, самой аналитики и AI (их довольно много, рекомендую самостоятельно ознакомиться).

Вот ссылка на картинку в хорошем разрешении.

🔗Ссылка на статью

#инструменты #анализ_рынка

5.73K viewsStas Valuev, 10:47

Я у мамы аналитик

Google запустил публичную бета-версию своей платформы «Know Your Data» для работы с датасетами в графическом веб-интерфейсе.

Если упрощать, то это аттракцион под названием «почувствуй себя дата саентистом, зная примерно 0 языков программирования».

В качестве примера можно поковыряться в любом из стандартных наборов данных TensorFlow.
Можно быстро и по-всякому пофильтровать изображения, посмотреть, как все размечено, протегировано, как параметры соотносятся друг с другом (поделать exploratory data analysis).

🔗Ссылка

#инструменты

1.45K viewsStas Valuev, 14:58

Я у мамы аналитик

В статье с Хабра «Все что вы (не) хотели знать о Data Science» обнаружил интересный взгляд на содержание профессии Data Scientist.

Стоит посмотреть хотя бы ради описания того, как разные функциональные роли вроде data engineer, analyst, MLOps накладываются на 3 ключевых области компетенций:
🔹математика и статистика;
🔹разработка и администрирование;
🔹знание предметной области.

Еще есть верхнеуровнево про грейды дата саентистов, подготовку к собеседованиям и специфику Ситимобила.

🔗Ссылка

P.S. Утаскиваю из комментариев замечательное дополнение: «Как стать дата-шрушером aka вкатиться в DS». Более практичный и подробный взгляд изнутри с нецензурщиной и мемами.

#компетенции

4.3K viewsStas Valuev, edited 13:39

Я у мамы аналитик

Спонсор сегодняшнего поста - статья с vc «Тренды ИИ: что происходит в сфере искусственного интеллекта в 2021 году».

По-моему отличная идея: ближе к середине года смотреть, какие из прошлых прогнозов начали сбываться, а какие еще нет.

Главный тренд 2021 года: демократизация ИИ.

Сам стэк технологий становится доступнее простым смертным. В результате появляются новые продукты, сервисы, open-source инструменты. Соответственно, растет количество новостей и публикаций реальных (и не очень) кейсов в СМИ.

По итогам 2020 года:

Что и где, как и прогнозировалось, развивается и получает практическое применение:
🔹NLP примерно везде;
🔹компьютерное зрение;
🔹беспилотники;
🔹исследования лекарств в медтехе;
🔹дипфейки;
🔹рассуждения об этике и морали применительно к AI.

Что пока не полетело:
🔻цифровые двойники предприятий;
🔻чипирование и нейроинтерфейсы;
🔻повальное внедрение чат-ботов (но это не точно);
🔻готовые платформы для создания продуктов на базе ИИ.

🔗Ссылка

#анализ_рынка

1.35K viewsStas Valuev, 15:07

Я у мамы аналитик

Небольшой текст, описывающий внедрение процесса обязательного документирования в команде аналитиков.

Как часто бывает, это компиляция нескольких подходов и методов вроде Culture Map, 5W1H, командного целеполагания и измерения промежуточных результатов.

🔗Ссылка

#компетенции

1.3K viewsStas Valuev, 16:19

Я у мамы аналитик

«12 SQL and NoSQL Datastores for Your Application» - еще одна
статья-введение в современные СУБД.

Есть слайды, на которых нормально пояснены:
🔹разница между OLTP / OLAP;
🔹SQL / NoSQL;
🔹разные варианты хранения неструктурированных или частично структурированных данных.

Гвоздь программы: сводная табличка с классическими и облачными решениями (AWS, Azure, GCP) для хранения всех возможных типов данных.

🔗Ссылка

#базы_данных

4.49K viewsStas Valuev, 13:59

Я у мамы аналитик

Краткая история появления роли дата-инженера на фоне развития инструментов для работы с данными и команд, которые их используют.

Упрощенно, это путешествие от мира, где данными владеют суровые «айтишники» к светлому будущему, где независимые команды управляют каждая своим доменом данных и эффективно обмениваются информацией.

🔗Ссылка

#data_engineering

1.29K viewsStas Valuev, 14:13

Я у мамы аналитик

Занятный кейс использования матриц в Excel в качестве альтернативы протягиванию формул.

Вроде как таблицы с большим количеством вычислений становятся более «антивандальными» и простыми в поддержке.

С другой стороны, использование такой функциональности для совсем уж базовых сценариев вроде «вычел-поделил» похоже на выстрел из пушки по воробьям.

Надо будет попробовать на досуге (вроде как работает и в Google Sheets).

И да, поделитесь опытом подобных извращений, если имели удовольствие его получить.

🔗Ссылка

#excelное

1.28K viewsStas Valuev, 14:52

Я у мамы аналитик

С помощью статьи «Analytics Maturity Model: Levels, Technologies, and Applications» можно глубже погрузиться в тему data literacy и уровни развития аналитики в организациях.

По сути, описаны отличия пяти уровней зрелости:
🔹Отсутствие аналитики;
🔹Описательная;
🔹Диагностическая;
🔹Предикативная;
🔹Предписательная.

Очень круто, что сформулированы необходимые изменения для перехода с этапа на этап и общие рекомендации в конце статьи.

Немного другая интерпретация, чуть менее подробно, но зато на русском - тут.

🔗Ссылка

#компетенции

1.64K viewsStas Valuev, 14:00

Я у мамы аналитик

«Data Strategy: Good Data vs. Bad Data» - классная статья про то, как стратегия компании влияет (точнее, должна влиять) на стратегию по работе с данными.

Есть интересная классификация данных:
🔹«хорошие» - это те, которые осознанно собраны и обработаны для того, чтобы решить конкретную задачу бизнеса;
🔻«плохие» - это те, которые мы просто собрали и пытаемся на их основании делать выводы, не отталкиваясь от текущей стратегии и приоритетов.

Еще тут зачем-то снова переизобрели HADI-циклы (или PDCA, как кому удобнее), но уже применительно к обработке данных.
Получилось 5 этапов: Action -> Data -> Information -> Insight -> Decision.

🔗Ссылка

#компетенции #стратегия

1.54K viewsStas Valuev, edited 12:19

Я у мамы аналитик

Продолжение классной статьи про роль дата-инженера, на этот раз про тренды и будущее.

Очевидно, все они напрямую связаны с общими по отрасли (аналитика, ML, Big Data):
🔹дата-инженеры в будущем частично заменят дата-саентистов (задач по инфраструктуре будет только больше);
🔹после того, как ответственность за данные перетечет из единого центра компетенций к отдельным командам, каждой из них потребуется поддержка дата-инженера или свой собственный специалист такого профиля;
🔹появится больше стартапов-единорогов, решающих задачи дата-инженеров (далеко ходить не надо, Snowflake и Databricks уже безумно взлетели);
🔹инструменты для перемещения данных станут повсеместно распространены, будут у всех, учить их обязательно;
🔹обработка данных в реальном времени станет отраслевым стандартом.

🔗Ссылка

#data_engineering #компетенции

1.79K viewsStas Valuev, 13:44

Я у мамы аналитик

Инструментальных статей для аналитиков и дата-саентистов на любом ресурсе хоть отбавляй.

Может сложиться впечатление, что эта роль - чисто про hard-skills: взял правильный инструмент, закодил/залоукодил обработку данных, красиво визуализировал.

При чтении сегодняшней статьи разу вспоминается фраза «самые важные вещи на свете - это не вещи». Переформулировать это изречение можно так: инструменты - это замечательно, но критическое мышление и здравый смысл еще никто не отменял.

Про них и расскажут по ссылке ниже.

🔗 Ссылка

#компетенции

1.74K viewsStas Valuev, 11:28

Я у мамы аналитик

Кажется, что ведение канала - единственная вещь, которая заставляет меня на 100% ощущать себя слоупоком.

Еще в прошлую пятницу ребята из @it_resume выкатили на Хабр подборку telegram-каналов для аналитиков.
Ссылка на нее довольно резво разлетелась по всем задействованным каналам (что чертовски логично).

А вот у меня только сегодня доходят руки написать что-то типа «Мама, я в телевизоре!».

Лично меня порадовала сама статья:

В ней есть почти все классные каналы, которые читаю. На ребят, с которыми не был знаком, тоже было не грех подписаться.

Широк набор освещаемых тем: от дата-инжиниринга и хард-скилловых вещей до визуализации и нежно любимого мной BI.

Неожиданно для меня список получился довольно «очеловеченным». Упоминания авторов и их историй напомнили о том, что за всеми постами, ссылками, картинками стоят живые люди. Поэтому и сами каналы такие разные - со своим стилем, экспертизой в предметной области, взглядом на аналитику. И круто, что таким образом можно смотреть на предмет своего интереса с разных сторон.

Жаль только, что ряд классных каналов не попал в подборку. Частично с этим поборолся Роман Бунин вот тут. Я тоже занялся систематизацией того, что читаю, возможно чем-то поделюсь позже.

🔗Ссылка

#каналы

1.54K viewsStas Valuev, 14:52

About

Blog

Apps

Platform