Data Nature 🕊 – Telegram
Data Nature 🕊
5.93K subscribers
382 photos
6 videos
3 files
196 links
Канал о жизни BI аналитики и инфо-дизайна в корп реалиях с фокусом на работающих практиках управления.
Веду как летопись полезного для себя и людей с такими же неврозами.

александр бараков @alexbarakov
datanature.ru
data-nature.com

(рекламу не размещаю)
Download Telegram
Ничего нового, никаких умных мыслей

Вместе с ребятами из Т-банк, Яндекс, Авито, positive tech, Андреем Data Yoga, Ромой Reveal the data, Сашей из DataBar и др - пили пиво и приятно душнили.

ИИ Скепсис и тревога, ИИ равнодушие и отвага

Записал себе два наблюдения

1) некоторые тех компании уже начали при бекфиле (замене ушедшего сотрудника) запрашивать обязательное подтверждение, что его не может заменить ИИ. Форма фриза найма ?)

2) дата тикток - лента дата инсайтов, сделать думскролинг полезным для компании. (И оставить таким же вредным для сотрудника ))

Изучал на неделе взгляд табло на будущее биай.
Рисуют новый продукт рядом со старым.

Отсюда родился вопрос-кейс (пишите ответы в комменты):
Вы развиваете свой опенсорс BI в компании - как бы вы поделили инвестиции на ближ 3 года в разработку между
- фичами классического биай (чтобы делать быстро дашборды и работать с данными и логикой)
- фичами нового биай (ии
агенты и чат-парадигма)

Ваши 2 цифры?
пример 80 на 20

А если на 6+ лет?
🛫 Ускользающая мудрость: Стоимость прокачки любой метрики в какой то момент становится запредельной и для достижения максимальной пользы нужно комбинировать разные драйверы, опытным путем находя точки где дальнейшие инвестиции не разумны.

Иллюстрация таких «точек» на примере пользы от BI.

Последний график претендует на другую динамику.
Нужно вложить много, но и масштабируемость пользы будет выше. Нет?

На прошедшей на неделе стратсессии по развитию BI в Авито родились эти графики и показались свежим откровением. Сейчас смотрю - вроде база.

Воистину мысль осознанная заново - новая мысль.
AI Актуалочка

На последних стратсессиях по данным и аналитике - встретил новый фактор. Блок некоторых участников обсуждать и комититься на долгосрочные цели. Причина - зачем мы строим планы в текущей парадигме, если вот прям совсем скоро GenAI трансформирует все. Приходится тратить много сил, чтобы вернуть креатив и вовлеченность
Кстати - Про проблему FOMO (Fear of missing out, страх, что все что-то знают и делают, а только ты – все упускаешь) в контектсе GenAI истерии вышел терапевтический выпуск с Евгением Котом. Помогает. Главное не поймайте ФОМО во время прослушивания подкаста про ФОМО.


В итоге это проводит к двойственной стратегии - условно вы планируете и "старый BI" с его понятными практиками и пользой и "новый BI" с этими всеми экспериментами и гипотезами. В условиях нехватки ресурса - это такая себе стратегия, ну а как иначе. Нельзя останавливаться - надо бежать во все стороны, и при этом не отставать (сарказм).

Я писал про DG здравого смысла, про то, что надо трезво оценивать текущую и целевую зрелость своей компании с учетом ее рынка и размера. Видимо нужна такая же модель зрелости для AI.

Наверное там должны быть тезисы типа:

- если твоя выручка меньше ярда долларов, (или) ты не техкомпания - не трать деньги на хостинг своей Gen AI инфры. Следи за трендами, и качай свой Core BI, хранилище и DQ. Максимум делай 1 пилот по самому критичному AI usecase своего бизнеса.

- если ты относительно богат и лидер отрасли - подели бюджет на три части:
1/3 на дата гавернанс на построение качественного слоя дата продуктов и метаданных, управление рисками
1/3 на разработку: proof-of-concept'ы по консервативно ранжированному списку юзкейсов, найм и обучение людей
Только 1/3 на инфру.

Посерчил и не нашел ничего толкового. Только вендорский и big4 булшит.
Видимо рано еще.
Если кто находил что толковое по GenAI зрелости - кидайте.
Ссылки на более-менее интересные статьи, что я нашел - оставлю в комментах.
5 BI вендоров и стол

В этом мире автогенерирумой экспертизы провели ламповый, но круглый стол с ребятами из Visiology, Data Lens, Loginom, PIX BI. Еще Маша Гришина к нам пришла разогнать тоску своим отборным обесцениванием.
Наговорили 2 часа не под запись. Спасибо ребят.

Для написания саммари в пост👇 мучил промптами текстовую расшифровку нашей встречи, плюнул и написал сам. Сука сглаживает все. Бесит, ведь не ждешь уже подвоха.

На фото справа - Сергей aka Громов - человек, который не пришел - предпочел дебри природы
дебрям современного биай.
Кто его осудит
.

Всем лета.

Тезисы
Вот мой конспект тезисов:

💁‍♂ Российский биай (vs мировой):
- считает что догнал в ux и core фичах (спорно)
- сильно отстает в платформенности (да)
- будет опережать в ИИ, тут все стартовали с одной точки (возможно да)

🧐 80% роcсийского рынка все еще на западном биай несмотря на риски - «Если что-то работает, то, конечно, никому неохота переделывать»

Борьба концепций - биай как рисовалка (молодежь) vs биай end to end (старики). Борьбы видимо нет. Просто делят клиентов по зрелости стека и запросам. Впереди консолидация рынка.

😰 Про суперсет и другой оперсорс: «Если организация научилась управлять сайзингом, ресурсом и набрала решимости идти в продукт/опенсорс — всё-таки может взлететь на большом масштабе и ресурсе. Кор фичи отточить а дальше легче.
Иначе через три года - осознание и откат к рыночным корпоративным продуктам.»

Ну и что там про Gen AI

🤗 GenAI быстрее стартует там где выше толерантность к ошибкам ("где руками косячат еще больше")
В итоге сценарии в дата менеджменте (глоссарии, документация, DQ) - более перспективные чем в биай.

😟 «Мы видим панику в глазах у стоящих на обрыве: компании боятся пускать ИИ в DWH и неструктурированные источники...» хм, ну не знаю

🤑 «GenAI ложно воспринимается как волшебная таблетка - как сам BI 10 лет назад. Порог входа в движуху очень высокий»
Решения от вендоров (облачные, но и тех пока нет) будут косо-криво интегрироваться с экосистемами компаний (каталоги, мета, документация, метрики), а свой end-to-end дата ассистент это супердорого и сложно.
Придётся строить серьёзный фундамент, с DG и другим блекджеком. А это уже не секси.
Короче сдувается драйв и все смотрят на бихтехи?

😭 Вендоры играют с
- саммаризацией - добыча инсайтов из дашбордов
- навигацией - продвинутый поиск и рекомендация готовых отчетов
- сoding копайлотами - они есть и будут на каждом углу: писать SQL, DAX, HTML и проч - нормальная тема, но это уже принятая нами реальность.

Чистые дата ассистенты пытаются делать, и тут все признаются - все работает только на "красивых" примерах. На продукт пока не тянет.
Please open Telegram to view this post
VIEW IN TELEGRAM
- Как внедрять стандарты там, где бизнес быстро меняется и аналитики не успевают думать про гавернанс?
- Как делать кор слои метрик, отчетов, витрин в децентрализованных мульти-доменах?
- Как реально качать селфсервис сценарии на стыке оперсорс BI и LLM?
- Как прокачивать качество и культуру визуализации, не уходя в избыточность и датавизо-поклонничество?
- А нужны ли вообще процессы и центры экспертизы или аджальный хаос лучше подходит этому миру?

Если у тебя есть ответ на один из этих вопросов выше - откликайся на вакансию к нам в команду Core BI.

Мы делаем постмодерновый BI с блекджеком и здравым смыслом.
Ищем звезду. Стек значения не имеет.

Детали - в посте Димы, CV в личку

#АвитоBI
Бенчмарки по численности и функционалу data ролей

В этом году делал полевой ресерч структур дата/BI команд в российском Tech сегменте (cпасибо всем за участие).
В эту же тему делал ранее более широкий
опрос.
В итоге после очистки осталось 64 российских компаний из разных отраслей и я таки собрал данные в
публичный деш.

Вот хайлайт выводов

Пропорции ролей


На 1 data роль - 11.7 casual users (обычные бизнес пользователи)
На 1 BI/DA - 25 casual users
На 1 DE - 1.9 BI/DA

Структура data ролей (в среднем):
51% — BI/DA (на 1 BI - 8-10 Data-аналитиков)
26% — Data Engineers.
17% — Data Scientists.
7% — DG/DQ

В условном IT+ecomm - количество дата ролей значимо больше, чем в других отраслях:
На 1 data роль - 8.3 casual users
На 1 BI/DA - 15 casual users

Воздержусь от других выводов - слишком малая выборка и много вопросов к тому кто, кого, куда относит на стыках DE-BI, DA-DS.
Кажется специфика компании ее история и аналитическая традиция влияет на состав (и нейминг) ролей не меньше, чем размер или отрасль.

Данные можно соотнести с databenchmarks.
Забавно что если сделать регруппинг моих ролей по их корзинам insight / engineering / ML (DS попадает в Insight, BI и DG в Engineering) то получаются очень близкие цифры.

Другие наблюдения из интервью

BI COE/Core BI

В децентрализованной модели - масштаб спонсирует организацию: при небольшом числе доменов и BI-аналитиков (менее 30) - BI CoE себя не окупает.

При росте возникает BI Core/CoE, который берёт на себя стандартизацию, кросс-доменные практики работы с качеством, демократизацию, обучение, координацию инициатив развития.

Триггер - когда несколько доменов начинают автономно строить свои собственные процессы управления BI/данными.

Размер Core BI обычно 3–5 человек. Больше - только если команда берет на себя дополнительные домены на поддержку, как правило корп функций.

Есть варианты «виртуального» CoE (сборные советы чемпионов) - могут давать ограниченный эффект на малом-среднем масштабе.

Другие Роли


- Подход 1: BI работает рядом с SA и DE, деля между собой функции в BI-цикле. BI - деши и репортинг витрины. SA и DE - качество остальных слоев данных.
- Подход 2: BI как fullstack/AE. DE занимается платформой и кор слоем витрин.
При этом все может быть гибридно и неоднородно внутри одной компании от домена к домену.

Курирование доменов

Зрелые компании вводят дополнительную роль Дата партнеров (нейминг разнится), отвечающие за BI сертификацию, полноту метаданных, за качество данных внутри домена. Это могут быть BI-лиды, системные аналитики. Роль замыкает на себя рутины гавернанса.

Кому есть что добавить - велком
3 вакансии в Авито
для тех, кто ищет новые вызовы классных задач

1️⃣ Аналитик данных на задачи Аналитической платформы
Классные ребята, которые строят продуктовые метрики и отчетность по внутренним аналитическим инструментам и CJM, анализируют воронку использования, ищут точки роста эффективности, влияют на приоритизацию фич.

2⃣ BI-разработчик в команду Рекламы
Классные ребята с амбициозными целями, позиция с с влияниеv (!) на бизнес и миксом хардовой инженерии и софтововыми хороводами с бизнесом под музыку данных

3⃣ Секретная вакансия (еще не на сайте, пишите в ЛС)
Классные ребята в HR BI команде ищут себе классного тимлида. В меню все что мы любим - BI-разработка и дата-аналитика, системный анализ и интеграции данных, метрики и редизайн процессов, стратегия и работа со стейкхолдерами. Диджитальный HR снова в моде в этом сезоне.

Требования высокие, но и работа хороша

Всем классной пятницы

#АвитоBI
Please open Telegram to view this post
VIEW IN TELEGRAM
Сходил на эфир к Владу Каменскому, CEO Юниверс дата.

Влад участвовал в создании издания DAMA DM BoK на русском языке и делает с командой ламповый дата каталог из Петербурга ☔️
См их пост как LLM делает глоссарий.

📽️ Видео

Почти половину эфира НЕ говорили про ИИ.
Ну а потом таки говорили.
Про ИИ в дата менеджменте.
Делал основанные на ощущении прогнозы. Например что ценность ИИ в DG наступит быстрее чем в BI.

Еще про доменные роли,
Про бигтех и качество данных.
В ролике есть таймкоды 🙂

Кто любит такое - ставьте на x2 и велком в комменты.
Please open Telegram to view this post
VIEW IN TELEGRAM
ADKAR + self-service BI: Кормить и учить готовить

Третьего дня на стратсесии тренер подсветил модель чендж менеджмента ADKAR - и заставил пару часов на нее медитировать.
В итоге все немного прониклись. Вроде здравый смысл, но есть в этом что-то простое и точное про поведение людей.

Мысль ушла в сторону вовлечения неаналитиков в selfservice BI - вечную боль, и вечный миф всех биай проектов.
Настолько вечный, что ты уже начинаешь смотреть на тему без спешки и обращаться к гадалкам универсальным практикам управления.

Коротко: ADKAR это о том что любые изменения идут через последовательные этапы
- Awareness (Осведомленность) — Человек осведомлен и понимает необходимость изменений
- Desire (Желание) — У человека есть личная мотивация участвовать.
- Knowledge (Знание) — Человек имеет информацию и навыки, необходимые для работы по-новому.
- Ability (Способность) — Человек имеет ресурс и инструменты применять новые навыки на практике.
- Reinforcement (Закрепление) — Новый подход подкрепляется, чтобы стать нормой.


Набросал табличку проникновения self-service сценариев в роль продакта (цифры из головы) и проблемность этапов ADKAR.

Общее наблюдение - есть паттерн, что ведется разработка тулов (A), потом обучение (K), при этом пропускается Понимание и Желание. Желание строится на потребности, и хорошо когда она есть и сильная. Но если нет - нужно ее создавать (а иногда не стоит). Видимо отрезая продактов от адхок поддержки аналитиков и создавая давление в проектах/калибровках, требующее самообслуживания.

Прикольно, что многообразие практик внедрения дата культуры реально ложится на эти 5 этапов, и можно строить тактику более комплексно, не теряя ничего из фокуса, анализировать, где больше всего барьеров в моменте.

Но тезис о том, что нужно двигаться строго слева направо спорный - если создать желание и знание, но не дать сразу возможностей (тулов) будет не гуд.

У кого какой опыт, какие цифры?