Тимлидское об аналитике – Telegram
Тимлидское об аналитике
1.67K subscribers
34 photos
1 video
62 links
Мысли, идеи, озарения и советы от тимлида дата-аналитики Яндекс.eLama.
Download Telegram
Приветствую, любители аналитики!

А сегодня в 19 часов Мск состоится бесплатный вебинар для новичков в питоне, где я расскажу, как использовать простые команды для первичного анализа и очистки датасета.

Регистрируйтесь и приходите общаться!

(Запись будет только для тех, кто зарегался)
🔥6
А это я. Увидимся через 45 минут!
This media is not supported in your browser
VIEW IN TELEGRAM
О навыках дата-аналитика

Приветствую, любители аналитики!

Несколько слов о скиллах, необходимых дата-аналитику в моём понимании. Это те навыки, которые я выделил за несколько лет опыта и стараюсь развивать в себе и в участниках моей команды.

Hard skills:
👑 SQL — must have;
👑 Clickhouse, PostgreSQL и другие СУБД — must have;
👑 Python + pandas — must have;
😶 Электронные таблицы — крайне желательно;
*️⃣ Airflow или другие средства автоматизации — желательно;
*️⃣ Яндекс.Метрика или другие системы веб-аналитики, любой Tag Manager — желательно;
*️⃣ Git — желательно;
*️⃣ BI-системы — будет плюсом.

Soft skills
А вот тут хотел бы остановиться подробней. Каждый пунктик глубоко осмыслен и необходим!

🟡 Внимательность и дотошность. Для специалиста, имеющего дело с данными, крайне важно видеть в них изъяны и не пропустить ничего существенного. То есть постоянно проверять цифры, значения, нестыковки, выяснять причины расхождений, докапываться до истины и при этом не сходить с ума, а может, даже находить в этом удовольствие — чертовски важный навык.

🟡 Коммуникабельность, умение излагать мысли. Дата-аналитик — не кондовый технарь, и взаимодействие с людьми, причём с разными и со многими, составляет немалую часть его работы. Поэтому уметь понять, что хочет заказчик, а иногда и помочь ему это понять, а также объяснить задачу разработчикам или дата-инженерам — must have.

🟡 Изобретательность. В дата-аналитике бывают рутинные, шаблонные задачи, и их стараются поскорее автоматизировать. А вот новых задач, вызовов и требований — сколько угодно. Поэтому умение подобрать или сгенерировать решение технической или аналитической проблемы очень полезно.

🟡 Самостоятельность. Это лично от меня :) Впрочем, полагаю, любой руководитель хотел бы, чтобы его сотрудники были способны сами решать вопросы с заказчиками, добывать информацию, организовывать нужные процессы в рамках своих задач и т. д.

🟡 Нацеленность на результат. Всё вышеперечисленное почти бессмысленно без этого. Аналитики — активные и важные участники функционирования бизнеса, они повышают его управляемость. Выходит, на них висит немалая доля ответственности за «здоровье» бизнеса. Не знаю, можно ли научить сотрудника ответственности, поэтому стараюсь подбирать к себе людей, кто изначально хочет быть полезным, доводить любое дело до логического завершения, не терпит висюков и долгов.

🟡 Доброжелательность. Удивительно, но с этим качеством все взаимодействия становятся проще! Да и приятнее работать в дружном коллективе, чем в токсичном или отстраненном, не так ли?

🟡 Любознательность, интерес к технике и бизнесу, обучаемость. Дата-аналитику приходится работать с крайне изменчивыми сущностями — развивающийся бизнес, прогрессирующая сфера IT, а также сами люди, которые никогда не устают удивлять. Поэтому лучше сразу нацелиться на постоянный рост и бесконечное саморазвитие. В конце концов, не в этом ли одна из основ жизни вообще?

Софтам тоже можно научиться, главное держать их в фокусе внимания и время от времени проводить самоанализ.

Ну а по хардам — добро пожаловать на курс «Аналитик данных», где я выступаю ментором, то есть тем парнем, который не дает заснуть или отложить домашку в долгий ящик. Там есть всё что нужно и даже больше.

Кстати, курс стартует уже сегодня! Так что, если вы ждали знака записаться, то это он.
Действуйте!
👍155🔥2
Смех смехом, а ребята сделали статистический анализ количества спичек в коробках и выявили шринкфляцию. Полезно для тех, кто думает, что статистика - это капец как сложно и страшно. Такой анализ может сделать каждый!
https://pikabu.ru/story/podozrenie_na_shrinkflyatsiyu_spichek_i_net_myi_ne_psikhi_13226193?utm_source=linkshare&utm_medium=sharing
😁5
Подумываю написать пару постов о своем опыте использования нейросетей. (Ибо, хотим мы того или нет, будущее за ними, и оно уже наступило.) Интересно?

Поставьте 🦾 или просто 👍 если да
И 🥱 или 👎 - если нет.
👍62🥱2
Как устроена работа дата-аналитика в Яндекс eLama

Приветствую, любители аналитики!

В моей команде 5 человек, включая меня, а кроме нас в дата-офисе есть команды дата-инженеров, которые собирают данные, и бизнес-аналитиков, которые визуализируют данные и взаимодействуют с заказчиками.

Таким образом, мы находимся посередине конвейера данных и отвечаем за:

🟠 Разработку и поддержку витрин данных первых слоёв. Это расширенные таблицы с информацией об основных бизнес-сущностях.
🟠 Наш сервис Self-analytics, который позволяет заказчикам получать выгрузки самостоятельно, без нас. Суть раскрыта, например, в моей старой статье на Хабре. С тех пор техническая реализация сменилась, но подход остался.
🟠 Прогнозирование метрик. Вот тут моя замороченная статья о нашем прогнозировании.
🟠 Настройку веб-аналитики. С помощью Google и Яндекс тег-менеджеров ловим события на сайтах компании, шлем в Метрику или GA, а оттуда забираем к себе в хранилище.
🟠 Помощь бизнес-аналитикам в составлении конкретных витрин для BI-отчётов. Узкоспециальные витрины они делают сами, но мы их ревьюим и деплоим.
🟠 Консультирование коллег по вопросам данных в нашем аналитическом хранилище.
🟠 Обслуживание аналитического хранилища: проверка качества данных в первичных витринах, бэкапирование, обновление витрин, документирование и т. д.

Работаем мы спринтами, то есть:

На планировании (по пятницам) набираем задачи на неделю.
Новые задачи идут в бэклог, т. е. пока спринт не кончится, никто не вклинится со своей хотелкой (за редкими исключениями).
Стадии задачи: бэклог → в работе → ревью → приёмка → закрыто.
У сотрудников есть «специализации»: каждое наше направление или группу заказчиков ведёт как минимум двое сотрудников.
Операционка (например, подключение нового источника данных) и квартальные проекты.


Кроме того, у нас есть дежурство. Дежурный аналитик меняется каждую неделю и отвечает за:
мониторинг обновления и качества данных, решение инцидентов;
выдачу доступов;
быстрые задачи, т. е. занимающие не более 2-3 часов;
ответы на вопросы.

Эти задачи у дежурного имеют приоритет над спринтовыми. Конечно, при необходимости ему помогают коллеги.

Чтобы всё это организовать, мы пользуемся таск-трекером, корпоративным мессенджером, календарём, облачным диском, средством для созвонов и другими офисными инструментами.

👨‍💻 Работаем в основном удалённо. 3 раза в неделю созваниваемся на получасовую планерку (дэйлик) и ещё полчаса уходит на планирование спринта. Остальные созвоны ситуативные.

А иногда съезжаемся вместе, чтобы пообщаться и затусить, как же без этого!

Работы у нас много и вся она интересная. Делитесь в комментариях, как устроена работа в вашем отделе 😉

PS. Про нейросети я понял, ждите в скором времени!
🔥12👍4
Приветствую, любители аналитики!

Давайте поглядим, что накопилось интересного в Тимлидском за последний месяц.
Я посвятил много внимания конкретно своему месту работы и своему видению его.

Прошлые вспоминалки
Дайджест №1
Дайджест №2
Дайджест №3
Дайджест №4
Дайджест №5

Аналитика для бизнеса
Конвейер данных - основные этапы работы с данными
Как онбордятся дата-аналитики в Яндекс eLama - процессы погружения новичка
С какими данными работает аналитик - основные виды источников
О навыках, необходимых дата-аналитику, особенно о софтовых
Как устроена работа дата-аналитика в Яндекс eLama - в моей команде

Аналитика для жизни
Об отдыхе и его бескомпромиссности
🔥8
О нейросетях

Приветствую, любители аналитики!

Последуем за трендом и затронем тему нейросетей.

Я неоднократно заявлял, что работа дата-аналитика - это постоянные вызовы, задачи с которыми раньше не приходилось сталкиваться. Невозможно всему научиться заранее, постоянно приходится осваивать новые инструменты, подходы, бест-практисы.

И в этом кроется первая возможность применения нейро-помощников.
Я теперь почти не пользуюсь поисковыми системами, ведь там часто приходится перелопачивать несколько сайтов, выискивать по крупицам ответы в полотнах текста (и хорошо еще, если это не SEO-текст, написанный копирайтером по ТЗ).
Нейронка даст ответ на любой прямо поставленный вопрос, а если остались неясности, их можно доуточнить в диалоге с ней. Это потрясающе, будущее наступило.

Особый интерес представляет способность этих механизмов создавать ответы, а не просто их откуда-то брать. То есть, никто нигде не писал ответа, его просто нет в интернете, а нейросеть сама его составила.

Технически они просто "угадывают" следующие слова на основе огромного количества правил. Поэтому их стоит проверять, особенно если тема сложная, непроторенная. Нейронки могут ошибаться, галлюцинировать, но делают это всё реже.

Вторая прогрессивная возможность, интересная дата-специалистам и айтишникам вообще - это, конечно, вайб-кодинг. Это программирование с помощью ИИ: пишете промпты типа "напиши скрипт, который сделает то-то" и оно вам выдает код. Разные нейросети по-разному с этим справляются. Например, Яндекс Алиса пока не очень умеет, но есть ассистенты, специально заточенные под кодинг.Я использую для вайб-кодинга Claude и вполне им доволен.

Когда-то я любил программировать, но это давно в прошлом. Сейчас меня радует, если код делает то, что мне нужно, решает мою задачу, и неважно кем и как он написан. И нейронка даёт мне именно это!

В завершение несколько простых советов по использованию нейро-ассистентов.

1. Общайтесь с ними как можно больше. Это создаст привычку, поможет понять, как им писать, чтобы получить наиболее качественный ответ, разовьет навык промтинга.
Я завел хобби - выяснять у Алисы разные внерабочие интересующие меня вопросы типа истории музыкальных групп или русских писателей. Получается очень интересно, подумываю даже опубликовать наши с ней диалоги.

2. Для повышения качества и точности ответа промпт может содержать компоненты:
Роль – от лица кого вам должна отвечать нейросеть;
Контекст – описание вашей ситуации;
Задача – собственно, что требуется от ИИ;
Ограничения – «направляющие» запреты на использование определенных элементов решения;
Формат вывода – в каком виде хотите получить ответ
• и любые другие составляющие
Можете выделять их естественным языком или заключать в XML тэги (программы их хорошо понимают).

3. Не стоит требовать сразу всё в первом вопросе, можно доуточнять итеративно.

4. Забудьте про поисковые системы. Спрашивайте ассистента, а уж он пусть ищет.

5. Проверяйте ответ. Требуйте ссылку на источник инфы или пробуйте раскусить ИИ, указывайте на его ошибки, высказывайте недоверие или сомнения, выводите на чистую воду, ловите на противоречиях. Требуйте уточнить информацию.
Кстати, говорят, помогают даже угрозы или посулы типа: "если ошибешься, я тебя уволю" или "За правильный ответ получишь 1000 долларов".

6. Помните, это не человек, не бойтесь его оскорбить, не стесняйтесь в высказываниях, это машина, а вы пишете ей команды. Заметил за собой поначалу, что тщательно обдумываю, как бы спросить поделикатней. Постепенно эта нелепая неловкость, отнимающая долю ресурсов, ушла.

А еще жду выхода статьи, где расписал свой реальный кейс вайб-кодинга - О прогнозировании аппроксимацией на SQL. Как выйдет, скину вам ссылочку.

На этом пока всё, успехов вам в освоении нового!
🔥156👍5
Приветствую, любители аналитики!

А вот и обещанная моя статейка, которая получилась "два в одном" — рассматривается две темы:
* о вайб-кодинге — как я его применил
* о прогнозировании аппроксимирующей функцией.

Реальный кейс из бизнеса, рекомендую заценить.
🔥10
Нейросети и тайм-менеджмент

Приветствую, любители аналитики!

В последнее время активно ищу варианты применения нейросетей в работе с данными. Посещаю все активности Яндекса и сторонние конференции, посвящённые этой теме. Обычно там рассказывают о довольно специфичных кейсах, которые трудно перенять или масштабировать.

Но первая возможность, которую дает нам ИИ, лежит у нас под носом. Это обучение.
Можно задать любой вопрос, запросить программу любого курса и попросить наполнить эту программу, а по ходу прохождения - задавать вопросы, чтобы разрешить неясности. Извините, но это потрясающе.

Предлагаю вам попробовать.
Как-то я заводил тему о культовой книге "Тайм-драйв" Глеба Архангельского. Думал, буду подкидывать вам главы оттуда, чтоб вдохновлялись.
Но понял, что мне лень заниматься этой рутиной.

Поэтому сделайте сами, а я расскажу, как это организовать почти мгновенно. Идёт?
Итак, инструкция:

1. Откройте Алису. (Эксперимент показал, что она справилась с задачей лучше ДипСика, который выдал устаревшие данные)

2. Введите промпт:
Напиши содержание последнего издания книги Г.Архангельского "Тайм-драйв".
и дождитесь ответа.
Она выдаст содержание 30-го издания (да, книга переиздавалась десятки раз!)

3. Изучите содержание. Это уже начало структуризации вашей работы со своими ресурсами!
Выберите наиболее интересующую главу и введите промпт для её раскрытия, например, такой:
Сделай тезисный конспект Главы 1. Организация отдыха

4. Уточняйте промптом каждый пункт, о котором хотите узнать больше.
Запоминайте и внедряйте!

Таким нехитрым способом вы:
а) привыкнете пользоваться дарами наступившего будущего;
б) получите структурированные советы организации своего времени, сил и дел.
И то и другое - маст хэв для аналитика!
🔥146👎1
Извините, что ничего не пишу, просто с внедрением в работу ИИ-помощников стало меньше времени
😁33🔥10💯1
Приветствую, любители аналитики!

Хочу с вами посоветоваться.
Давеча я проводил вебинар для растущих аналитиков на тему "Как мотивировать себя на обучение".
В нём резюмировал свои многолетние изыскания о личной эффективности применительно к процессу самообразования и достижения карьерной (или любой другой) цели.

Что скажете, если я повторю такой вебинар для вас?
Придёте послушать?

Поставьте лайк, если да и дислайк - если нет.
Если наберется, скажем, 20 лайков - буду готовить мероприятие.
👍6713
Приветствую, любители аналитики!

Пока готовится вебинар по мотивации (надеюсь выкатить его 27 ноября) приглашаю вас на другой.

Завтра, 20 ноября в 19.00 по Москве буду рассказывать Как стать аналитиком данных в 2026 году на вебинаре Simulative.
Подойдет всем, кто ищет работу в сфере аналитики данных уровня junior.

Расскажу о требованиях к кандидатам, подкину советы по поиску вакансий и составлению резюме и раскрою, как видит эту движуху тимлид, ищущий человека себе в команду.

Регистрируйтесь!
5👍3
Приветствую, любители аналитики!

Я уже писал про поток и про ресурсы как инструменты повышения личной эффективности.
Хочу обсудить еще один важный концепт (меня с ним познакомил К.Н.Дыкин, коуч, который мне очень помог 9 лет назад).

Речь о том, что дела бывают энергонасыщающими (Е+) и энергоистощающими (Е-).

Е+ — это дела, которые вдохновляют вас, вводят в поток и удерживают в нём, а результатом вы будете гордиться. Они притягивают вас, манят, и вам не терпится поскорее ими заняться.

Е- — это дела, которые "стремятся" выкинуть вас из потока, которые не хочется делать и приходится прилагать силы не только на их выполнение, но и на то, чтобы не отвлечься и не бросить. У вас вытягивает энергию сама мысль о том, что их придется делать.

Как использовать эти сущности в своей деятельности?

Очевидно, нужно делать побольше дел Е+ и поменьше Е-. Совсем без Е- обойтись, конечно, нельзя. Но основу вашей жизни должны составлять дела Е+.
Если это не так, вам следует тщательно проанализировать, почему.

По-хорошему дела Е- должны свестись к уровню "лягушек", маленьких, но противных дел, которые Г.Архангельский рекомендовал "съедать" каждое утро по 1-2, чтобы не копились.
Большие проекты должны быть Е+, а лучше — Е++. Как, например, смена профессии или вход в аналитику данных.

А еще бывает, что Е+ дело через какое-то время превращается в Е-. То есть, ваша энергия в процессе выполнения задачи сначала растет, достигает пика в точке Z, затем идет на спад.

Ваша задача — научиться чуять эту точку Z и при её достижении — спокойно останавливаться, делать перерыв. Найдите свою ширину комфортного шага (ШКШ), длительность работы, в которую ваш интерес к ней не иссякает. Лучше сделать два Е+ шага, чем один Е-. (Кстати, сравните этот подход с методом Помодоро.)

Попробуйте на этих выходных проанализировать свою текущую жизнь, выписать проекты, дела и делишки и классифицировать их как Е--, Е-, Е+, Е++. Можно ли что-то сделать, чтобы изменить баланс в сторону энергонасыщения?

А я рассчитываю доготовить вебинар о мотивации к обучению, чтобы провести его 27 ноября. Так что освобождайте вечер четверга заранее!
🔥156👍5💩2🥴2
Приветствую, любители аналитики!

В общем, я не удержался и создал, наконец, канал о своём общении с Яндекс.Алисой на всякие внерабочие темы.

Это развлекуха, а может, и пища для ума или вдохновения. Заглядывайте на досуге: @alice_i_wonder
2👎1
Приветствую, любители аналитики!

Ну вот, завтра провожу вебинар "Как мотивировать себя к обучению".
Расскажу, к чему пришёл по этой теме за 20 лет изучения и внедрения подходов к повышению личной эффективности.

Приходите завтра, 27 ноября 2025 г. в 19:00 по Москве в Zoom. Ссылочка будет за час до вебинара, регистрируйтесь, чтобы не пропустить.

Вход свободный.
Жду!
🔥7👏2
Приветствую, любители аналитики!
Вебинар "Как мотивировать себя к обучению" стартует уже через пару часов. Вы успели освободить время, поставить Zoom и подготовить чаёчек с бутером?
Регайтесь, ссылка придет автоматом.

PS. И на вебинаре практически не будет рекламной части! Только мясо.
🔥3👍2
Приветствую, любители аналитики!

Расскажу-ка о таком неочевидном, но важном оргвопросе в работе любой обслуживающей команды, в т.ч. дата-аналитиков, как SLA.

Service Level Agreement
— соглашение об уровне предоставления услуг, это документ, фиксирующий:
* перечень предоставляемых услуг;
* порядок работы с задачами и обращениями;
* сроки реагирования и решения;
* ответственность сторон;
* раскрытие процессов, влияющих на качество и скорость работы.

Это «правила игры» между аналитической командой и заказчиками, которые помогают:
1. Сформировать чёткие ожидания. Устраняет разночтения: все понимают, что, когда и в каком виде получит заказчик.
2. Приоритезировать задачи. Помогает распределять нагрузку и определять, чьи и какие дела делать первыми.
4. Управление ресурсами. Позволяет планировать загрузку аналитиков и избегать «пожаров».
5. Разрешение конфликтов. Служит базой для обсуждения спорных ситуаций.

Наш SLA включает в себя следующие разделы.

1. Описание отдела аналитики
* Терминология
* Команды отдела и роли сотрудников
* Назначение команд

2. Перечень услуг. У моей команды:
* Настройка отправки веб-событий
* Консультирование по указанным системам
* Разработка, поддержка и обновление витрин первично обработанных данных с реализованной бизнес-логикой, а также контроль качества этих данных.
* Разработка и поддержка витрин данных (SQL-запросов) для конечных отчетов
* Разработка и поддержка сервиса Self-Analytics
* Документирование
* Управление доступами
* Политики работы с данными (политика ведения метаданных, политика доступа и т.д.)

3. Порядок обработки обращений
* как подать обращение или поставить задачу;
* время реакции на обращение, т.е. когда мы должны увидеть обращение и что-то ответить;
* когда задача будет выполнена: скажем, быстрые задачи, требующие до 3 часов на решение - делаем сразу, остальные кладем в баклог;
* стадии выполнения задачи от принятия до закрытия;
* ответственность заказчика: если поставил мегасрочную (!) задачу и пропал, не отвечает на уточняющие вопросы - пусть пеняет на себя.

4. Спринты
Это о том, что у нас есть дежурство и дежурный, который принимает входящие, и спринтовая деятельность - когда берутся задачи из баклога и выполняются.
Здесь же описывается, как и когда происходит планирование спринта, какие есть правила приоритезации, чтобы заказчик мог хоть приблизительно представить, когда его задачу возьмут в работу.

5. Критичные данные
Здесь описывается, каким классам данных в нашем аналитическом хранилище уделяется повышенное внимание (данные о юзерах, их финансах, их аккаунтах и т.д.)
Это тоже способ приоритезации задач.

Таким образом, SLA — инструмент повышения прозрачности. Он помогает:
* аналитикам — защищать своё время и фокус;
* заказчикам — получать предсказуемый результат.

Можно его назвать "договором" между аналитиком и заказчиком. Заглядывают в него редко, но если возникли сомнения или взаимное непонимание, SLA поможет понять, как поступать.
10👍6
Спринт-планирование

Приветствую, любители аналитики!

Раз уж завели разговор об организации рабочих процессов, поговорим теперь и о том, как у нас устроено планирование спринтов.

Спринт — это период в несколько дней (у нас - неделя), в течение которого выполняются только взятые в план задачи.


Управление задачами ведется с помощью тасктрекера. В нем есть всё что нужно: задачи, со статусом, исполнителем, назначенным спринтом и т.д. Мы пользуемся Яндекс Трекером, раньше работали с Jira.

Раз в неделю (утром в пятницу) мы созваниваемся и проводим это самое действо, состоящее из этапов:

1. Закрытие текущего спринта. Обычно, с задачами спринта работают в отдельном разделе, который называется Доска задач (или канбан-доска).
Что делается для закрытия спринта:
* Актуализируется статус задач. Уточняю у каждого исполнителя, на чем остановились в каждой задаче, обсуждаем, что осталось сделать, проверяю, что стоит коммент, отражающий ситуацию на данный момент.
* Закрываются задачи, которые прошли все стадии - исполнение, ревью на нашей стороне, приёмку заказчиком.
* Закрывается спринт. В Я.Трекере при этом сразу открывается новый.

2. Добавление задач из бэклога в новый спринт. Бэклог — это все задачи команды. В Я.Трекере это называется Очередь. Я заранее просматриваю все задачи там и, исходя из своего опыта прикидываю сколько времени займет каждая. Время оценивается в сторипойнтах. 1sp = от 0.5 до 1.5 часа. Т.о. 5sp = 1 день.
Также вчерне назначаю исполнителей, ориентируясь на контекст и зоны ответственности членов команды.
Далее на созвоне мы назначаем задачам новый спринт, тем самым добавляя их в него.
Объём задач на спринт таков, чтобы на каждого суммарно приходилось по 20sp. На дежурного - чуть меньше, скажем, 15sp.
В процессе обсуждения с командой может поменяться исходный исполнитель задачи, сторипойнты, а то и вовсе задача может закрыться/отмениться сразу.
Задачи, не влезшие в спринт по сторипойнтам, остаются в бэклоге до следующего планирования. Это важный момент, он подсвечен в SLA, т.о. аналитики спокойны, что никто не наедет за неисполнение не-спринтовой задачи.

Вот и всё. Новый спринт собран, все идут заниматься своим делом и не парятся, что что-то упустили. Благоприятные условия для входа в поток)
5👍5🤔1🤮1