И вновь приветствую, любители аналитики!
Я тут немного уходил по уши в ремонт, потом болел, поэтому на время пропал с радаров. Не обессудьте!
Но нынче наконец отпуск, надеюсь наверстать.
И возвращаюсь к темам о стрессе, напрягах и выгорании, которые для многих даже более актуальны, чем недостаток энергии (а зачастую, являются причинами этого недостатка).
Давно заметил за собой, что зациклен на результате.
Плохо это или хорошо? Ведь в каждом втором резюме или вакансии встречается фраза "ориентированность на результат", значит, это благодетель?
Вот какие заметки я нашел в своих анналах.
>> 2016-06-25
По мне, работа, сделанная на 90% - не сделанная работа. Ведь результат – законченная на 100% работа, и только она приносит мне удовлетворение.
Чем это плохо?
- Я постоянно недоволен и это заметно. Недовольство угнетает или напрягает окружающих.
- Это понижает самооценку
- Это отнимает силы, вдохновение, конструктивный настрой, снижает продуктивность
- Это может зацикливать на одной задаче.
Чем это хорошо?
+ Помогает доводить начатое до конца
+ Самокритичен, добиваюсь приемлемого качества.
Как нивелировать плохое?
1) Давать себе больше времени на решение задачи. Если не решается – отложить.
Почему я не даю себе времени?
* Осудят окружающие?
Решение: Объяснять, что задача потребует больше ресурсов. Я и так много сделал, больше чем другой бы.
* Хочется поскорее освободить себя от этого дела и перейти к более интересному.
Решение: по-возможности отложить дело, пока не восстановится готовность им заниматься.
2) Научиться радоваться промежуточным результатам. И других убеждать в ценности промежуточных результатов.
Что мешает?
* Страх, что дело не сдвинется дальше: не хватит сил, времени, способностей.
На чем он основан? Опыт фейлов запоминается лучше, чем опыт успехов. Гораздо лучше.
>> конец цитаты
Даже такой не очень глубокий самоанализ в блокноте помогает снизить свой стресс, взять себя в руки, принять решение, а также изменить своё поведение так, чтобы не вредить себе, а становиться продуктивнее и счастливее.
Я тут немного уходил по уши в ремонт, потом болел, поэтому на время пропал с радаров. Не обессудьте!
Но нынче наконец отпуск, надеюсь наверстать.
И возвращаюсь к темам о стрессе, напрягах и выгорании, которые для многих даже более актуальны, чем недостаток энергии (а зачастую, являются причинами этого недостатка).
Давно заметил за собой, что зациклен на результате.
Плохо это или хорошо? Ведь в каждом втором резюме или вакансии встречается фраза "ориентированность на результат", значит, это благодетель?
Вот какие заметки я нашел в своих анналах.
>> 2016-06-25
По мне, работа, сделанная на 90% - не сделанная работа. Ведь результат – законченная на 100% работа, и только она приносит мне удовлетворение.
Чем это плохо?
- Я постоянно недоволен и это заметно. Недовольство угнетает или напрягает окружающих.
- Это понижает самооценку
- Это отнимает силы, вдохновение, конструктивный настрой, снижает продуктивность
- Это может зацикливать на одной задаче.
Чем это хорошо?
+ Помогает доводить начатое до конца
+ Самокритичен, добиваюсь приемлемого качества.
Как нивелировать плохое?
1) Давать себе больше времени на решение задачи. Если не решается – отложить.
Почему я не даю себе времени?
* Осудят окружающие?
Решение: Объяснять, что задача потребует больше ресурсов. Я и так много сделал, больше чем другой бы.
* Хочется поскорее освободить себя от этого дела и перейти к более интересному.
Решение: по-возможности отложить дело, пока не восстановится готовность им заниматься.
2) Научиться радоваться промежуточным результатам. И других убеждать в ценности промежуточных результатов.
Что мешает?
* Страх, что дело не сдвинется дальше: не хватит сил, времени, способностей.
На чем он основан? Опыт фейлов запоминается лучше, чем опыт успехов. Гораздо лучше.
>> конец цитаты
Даже такой не очень глубокий самоанализ в блокноте помогает снизить свой стресс, взять себя в руки, принять решение, а также изменить своё поведение так, чтобы не вредить себе, а становиться продуктивнее и счастливее.
Telegram
Тимлидское об аналитике
Приветствую любителей аналитики!
Лет 10 назад попалась мне книжка "Отказываюсь выбирать" Барбары Шер.
Она про сканеров - людей, которым много что интересно, они берутся за тысячу дел, но редкое доводят до конца.
Оказывается, это норма!)
Я ещё вернусь к…
Лет 10 назад попалась мне книжка "Отказываюсь выбирать" Барбары Шер.
Она про сканеров - людей, которым много что интересно, они берутся за тысячу дел, но редкое доводят до конца.
Оказывается, это норма!)
Я ещё вернусь к…
👍6❤2
Заходите сегодня, коллеги! Пообщаемся о том, как у нас готовят данные
Forwarded from Simulative
📎 Витрины данных: как аналитики превращают сырые данные в удобные таблицы
Ребята, мы решили продолжать традицию контентных стримов без регистрации и смс.
Сегодня в 18:30 по МСК нас вновь навестит Павел Беляев — руководитель группы дата-аналитиков в компании Яндекс eLama и автор телеграм-канала «Тимлидское об аналитике».
Витрина данных — готовая таблица для анализа, где всё очищено, структурировано и подогнано под задачи. Но за кажущейся простотой скрывается целая жизнь: от рождения до «пенсии».
1️⃣ Выявление потребности и ТЗ
2️⃣ Сбор данных (иногда — охота за недостающими)
3️⃣ Разработка скрипта/запроса
4️⃣ Отладка и тестирование
5️⃣ Внедрение и использование
6️⃣ Доработки (куда без них?)
7️⃣ «Уход на покой» — когда витрина теряет актуальность
Павел поделится личным опытом, лайфхаками и подводными камнями, через которые прошёл сам и его команда.
💬 Будет много практики, примеров и ответов на ваши вопросы.
❗️ Не пропустите! Ссылку на подключение к трансляции мы пришлем за 1 час до её начала.
Ребята, мы решили продолжать традицию контентных стримов без регистрации и смс.
Сегодня в 18:30 по МСК нас вновь навестит Павел Беляев — руководитель группы дата-аналитиков в компании Яндекс eLama и автор телеграм-канала «Тимлидское об аналитике».
💡 О чём поговорим?
Витрина данных — готовая таблица для анализа, где всё очищено, структурировано и подогнано под задачи. Но за кажущейся простотой скрывается целая жизнь: от рождения до «пенсии».
Разберём все этапы:
1️⃣ Выявление потребности и ТЗ
2️⃣ Сбор данных (иногда — охота за недостающими)
3️⃣ Разработка скрипта/запроса
4️⃣ Отладка и тестирование
5️⃣ Внедрение и использование
6️⃣ Доработки (куда без них?)
7️⃣ «Уход на покой» — когда витрина теряет актуальность
Павел поделится личным опытом, лайфхаками и подводными камнями, через которые прошёл сам и его команда.
💬 Будет много практики, примеров и ответов на ваши вопросы.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9❤3❤🔥1🤝1
Приветствую любителей аналитики!
Если следовать дальше по жизненному циклу витрины данных, то придем к шагу визуализации витрины.
Этой задачей занимаются BI-аналитики (сокращение от Business Intelligence, если что).
Я не застремался и взял интервью у нашего биайщика - Алины.
Получилось живенько, зацените!
https://vkvideo.ru/video897309_456239035
PS. Если вам зайдет, буду интервьюировать и других интересных специалистов.
Если следовать дальше по жизненному циклу витрины данных, то придем к шагу визуализации витрины.
Этой задачей занимаются BI-аналитики (сокращение от Business Intelligence, если что).
Я не застремался и взял интервью у нашего биайщика - Алины.
Получилось живенько, зацените!
https://vkvideo.ru/video897309_456239035
PS. Если вам зайдет, буду интервьюировать и других интересных специалистов.
Telegram
Тимлидское об аналитике
О цикле жизни витрины данных
Приветствую любителей аналитики!
Продолжим разбирать конвейер данных. Про ETL я немножко высказался, теперь рассмотрим работу с витринами данных.
Витрина данных - это такая таблица, готовая для анализа: в ней данные обработаны…
Приветствую любителей аналитики!
Продолжим разбирать конвейер данных. Про ETL я немножко высказался, теперь рассмотрим работу с витринами данных.
Витрина данных - это такая таблица, готовая для анализа: в ней данные обработаны…
❤10🔥7👍3
Forwarded from Simulative
Недавно мы в прямом эфире разбирали 7 этапов создания витрин данных — от сбора сырой информации до «пенсии» устаревших таблиц. Если пропустили — ловите запись:
Смотрите там, где удобно:
VK Video
YouTube
Павел Беляев (тимлид дата-аналитиков в Яндекс eLama) рассказал, с какими подводными камнями сталкивается команда, как правильно ставить ТЗ и почему даже идеальная витрина однажды устаревает.
А теперь важное 👇
Если после эфира вы подумали:
💭 «Хочу так же уверенно разбираться в данных»
💭 «Как бы потренироваться на реальных задачах?»
— у нас как раз стартовали два курса-симулятора, где вы сможете прокачать навыки в безопасной среде, но на реальных кейсах:
Если сомневаетесь, какой курс выбрать, — пишите, поможем определиться! Главное — начать!
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6
Энергетический дневник
Приветствую, любители аналитики!
Расскажу-ка я вам о своей личной методике самоанализа с целью повышения своей эффективности.
Она подкинула мне системные инсайты и дала важнейший инструмент для работы наряду с состоянием потока Михая и тайм-менеджментом Архангельского.
У меня было чертовски мало ресурсов и офигеть как много планов и задач.
Меня бесило, что я ничего не успеваю по своим личным проектам.
Я решил основательно разобраться в ситуации и вот какую методику использовал.
1. Поставил вопросы:
а) какого чёрта?
б) можно ли втиснуть больше дел в свой график?
2. Выбрал метод сбора данных:
Дневник самонаблюдения.
Длительность наблюдения: 4-6 недель
Частота фиксации наблюдений: ежедневно
Собираемые данные: а вот тут остановимся подробней.
Я разбил дни на слоты, в которые у меня есть время на свои дела.
По будням:
1) утро по дороге на работу (это было в доковидные времена) - предположительно 0.6 часа чистыми
2) обед - 0.5 часа чистыми, т.е., после вычитания времени на жор
3) дорога домой - 0.6 ч.
4) вечер дома - 1.5 ч.
По выходным слоты составляют 2-3 часа:
1) утро до завтрака
2) день до обеда (этот слот я позже разделил на два)
3) от обеда до ужина (и этот)
4) вечер
Измеряем две метрики:
Уровень физической энергии (Ф), то есть физических, телесных сил на данный момент
Уровень умственной энергии (У), то есть способность работать головой: связно продуктивно мыслить, решать интеллектуальные задачи, анализировать, планировать, креативить и т.д.
Шкала измерений очень простая - целые числа от 1 до 3
То есть, прислушиваемся к себе и проставляем оценку, например: У2Ф2, что означает примерно "Умственная энергия средняя, Физическая - тоже средняя".
3. Собственно собрал данные.
Рисуем табличку на неделю, где в столбцах будет:
* Умственная энергия
* Физическая энергия
* время в часах,
а в строках - временные слоты.
На пересечении фиксируем соответствующие значения. Получается что-то такое.
Пока достаточно, а в другой раз расскажу, чем еще обогатить самоисследование и как использовать результаты для повышения своей продуктивности.
Приветствую, любители аналитики!
Расскажу-ка я вам о своей личной методике самоанализа с целью повышения своей эффективности.
Она подкинула мне системные инсайты и дала важнейший инструмент для работы наряду с состоянием потока Михая и тайм-менеджментом Архангельского.
Собственно, эту троицу я рекомендую как базовую для максимально продуктивной жизни.
У меня было чертовски мало ресурсов и офигеть как много планов и задач.
Меня бесило, что я ничего не успеваю по своим личным проектам.
Я решил основательно разобраться в ситуации и вот какую методику использовал.
1. Поставил вопросы:
а) какого чёрта?
б) можно ли втиснуть больше дел в свой график?
2. Выбрал метод сбора данных:
Дневник самонаблюдения.
Длительность наблюдения: 4-6 недель
Частота фиксации наблюдений: ежедневно
Собираемые данные: а вот тут остановимся подробней.
Я разбил дни на слоты, в которые у меня есть время на свои дела.
По будням:
1) утро по дороге на работу (это было в доковидные времена) - предположительно 0.6 часа чистыми
2) обед - 0.5 часа чистыми, т.е., после вычитания времени на жор
3) дорога домой - 0.6 ч.
4) вечер дома - 1.5 ч.
По выходным слоты составляют 2-3 часа:
1) утро до завтрака
2) день до обеда (этот слот я позже разделил на два)
3) от обеда до ужина (и этот)
4) вечер
Измеряем две метрики:
Уровень физической энергии (Ф), то есть физических, телесных сил на данный момент
Уровень умственной энергии (У), то есть способность работать головой: связно продуктивно мыслить, решать интеллектуальные задачи, анализировать, планировать, креативить и т.д.
Шкала измерений очень простая - целые числа от 1 до 3
То есть, прислушиваемся к себе и проставляем оценку, например: У2Ф2, что означает примерно "Умственная энергия средняя, Физическая - тоже средняя".
3. Собственно собрал данные.
Рисуем табличку на неделю, где в столбцах будет:
* Умственная энергия
* Физическая энергия
* время в часах,
а в строках - временные слоты.
На пересечении фиксируем соответствующие значения. Получается что-то такое.
Пока достаточно, а в другой раз расскажу, чем еще обогатить самоисследование и как использовать результаты для повышения своей продуктивности.
Google Docs
Энергетический дневник (Тимлидское об аналитике)
🔥10❤1
Приветствую, любители аналитики!
Продолжим разговор о жизненном цикле витрин данных и сегодня расскажу, как у нас построен процесс релиза витрин, их выкатывания.
Напомню, что у нас
Витрина данных = представление (view) + кэш-таблица (table), записанная с него.
Кэш-таблицы может и не быть, если представление отрабатывает мгновенно или очень быстро.
Релиз происходит, конечно, уже после проверки витрины, то есть ревьюер и заказчик - удовлетворены результатом.
Вот шаги процесса релиза:
1. Занести метаданные витрины. То есть, описание самой таблицы и вьи, а также описание каждого поля. Мы заносим метаданные в электронную табличку, из которой специальный даг Airflow регулярно пишет их в Clickhouse, где и живут витрины.
2. Мержнуть код представления и DDL-запрос создания кэш-таблицы. Мы используем репозиторий gitLab для хранения всех наших вьей и следим, чтобы в продовском хранилище всегда была последняя версия мастер-ветки. Мы даже запилили механизм CI/CD, который при мерже автоматически пишет вью в Кликхаус (об этом, авось, как-нибудь отдельно).
3. Поставить витрину на обновление. Как и метаданные, витрины, подлежащие обновлению, перечислены в особой электронной таблице, по которой проходится даг обновления.
4. Поставить на мониторинг качества данных. При необходимости, можно указать дагу проверки качества данных, что для этой витрины требуется проверять выполнение таких-то условий (консистентность и/или количество строк).
5. Сообщить коллегам о готовности. Да, по-хорошему, о появлении новой витрины стоит написать хотя бы в канал команды в корпоративном мессенджере, чтобы все порадовались.
Вот теперь витриной можно пользоваться.
Продолжим разговор о жизненном цикле витрин данных и сегодня расскажу, как у нас построен процесс релиза витрин, их выкатывания.
Напомню, что у нас
Витрина данных = представление (view) + кэш-таблица (table), записанная с него.
Кэш-таблицы может и не быть, если представление отрабатывает мгновенно или очень быстро.
Релиз происходит, конечно, уже после проверки витрины, то есть ревьюер и заказчик - удовлетворены результатом.
Вот шаги процесса релиза:
1. Занести метаданные витрины. То есть, описание самой таблицы и вьи, а также описание каждого поля. Мы заносим метаданные в электронную табличку, из которой специальный даг Airflow регулярно пишет их в Clickhouse, где и живут витрины.
2. Мержнуть код представления и DDL-запрос создания кэш-таблицы. Мы используем репозиторий gitLab для хранения всех наших вьей и следим, чтобы в продовском хранилище всегда была последняя версия мастер-ветки. Мы даже запилили механизм CI/CD, который при мерже автоматически пишет вью в Кликхаус (об этом, авось, как-нибудь отдельно).
3. Поставить витрину на обновление. Как и метаданные, витрины, подлежащие обновлению, перечислены в особой электронной таблице, по которой проходится даг обновления.
4. Поставить на мониторинг качества данных. При необходимости, можно указать дагу проверки качества данных, что для этой витрины требуется проверять выполнение таких-то условий (консистентность и/или количество строк).
5. Сообщить коллегам о готовности. Да, по-хорошему, о появлении новой витрины стоит написать хотя бы в канал команды в корпоративном мессенджере, чтобы все порадовались.
Вот теперь витриной можно пользоваться.
Telegram
Тимлидское об аналитике
О цикле жизни витрины данных
Приветствую любителей аналитики!
Продолжим разбирать конвейер данных. Про ETL я немножко высказался, теперь рассмотрим работу с витринами данных.
Витрина данных - это такая таблица, готовая для анализа: в ней данные обработаны…
Приветствую любителей аналитики!
Продолжим разбирать конвейер данных. Про ETL я немножко высказался, теперь рассмотрим работу с витринами данных.
Витрина данных - это такая таблица, готовая для анализа: в ней данные обработаны…
👍6🐳2
Дайджест №4
Приветствую любителей аналитики!
Давненько мы не обозревали, что вышло интересного в Тимлидском за последнее время.
Кстати, каналу исполнилось уже 3 месяца, хлоп-хлоп-хлоп!
Прошлые вспоминалки
Дайджест №1
Дайджест №2
Дайджест №3
Аналитика для бизнеса
* Витрина для анализа эффективности рекламных кампаний
* Как можно тестировать витрину данных
* Эксклюзивное интервью с BI-аналитиком Яндекс.eLama
* Процесс релиза витрин данных
Аналитика для жизни
* Тайм-драйв Глеба Архангельского. Мотивация: как справляться с неприятными задачами.
* Зацикленность на результате?
* Энергетический дневник для анализа своих сил
Приветствую любителей аналитики!
Давненько мы не обозревали, что вышло интересного в Тимлидском за последнее время.
Кстати, каналу исполнилось уже 3 месяца, хлоп-хлоп-хлоп!
Прошлые вспоминалки
Дайджест №1
Дайджест №2
Дайджест №3
Аналитика для бизнеса
* Витрина для анализа эффективности рекламных кампаний
* Как можно тестировать витрину данных
* Эксклюзивное интервью с BI-аналитиком Яндекс.eLama
* Процесс релиза витрин данных
Аналитика для жизни
* Тайм-драйв Глеба Архангельского. Мотивация: как справляться с неприятными задачами.
* Зацикленность на результате?
* Энергетический дневник для анализа своих сил
Telegram
Тимлидское об аналитике
Приветствую, любители аналитики!
Ну что, нашему канальчику чуть меньше двух недель, давайте вспомним, о чем шла речь.
Попробую такой дайджест выдавать регулярно, чтобы не пропускалось / вспоминалось полезное.
Аналитика для бизнеса
Ценность аналитики - где…
Ну что, нашему канальчику чуть меньше двух недель, давайте вспомним, о чем шла речь.
Попробую такой дайджест выдавать регулярно, чтобы не пропускалось / вспоминалось полезное.
Аналитика для бизнеса
Ценность аналитики - где…
🔥10
Коллеги, завтра буду рассказывать о чертовски важной штуке - о Качестве данных.
Приходите на вебинар, регайтесь!
И готовьте вопросы, вдруг смогу ответить!
24 июня в 18.30
Приходите на вебинар, регайтесь!
И готовьте вопросы, вдруг смогу ответить!
24 июня в 18.30
👍8
Энергетический дневник 2
Приветствую любителей аналитики!
Недавно я описывал чертовски полезный способ самоанализа - энергетический дневник.
Мы договорились фиксировать время, а также уровень физической и умственной энергии.
Эти метрики можно дополнить флагами, показывающими наличие у вас в данном временном слоте:
* Интернета (И)
* Стола (П)
* Непрерывности времени, когда точно никто не отвлечёт (Т)
* Компьютера (К)
* любых других инструментов и условий, необходимых вам для работы по своим делам (например - Вдохновение. Почему бы нет?).
Обогащенный дневник может выглядеть как-то так.
Эти данные пригодятся вам при анализе своих возможностей.
Ведь для разных видов работ нужны соответствующие условия, а не только лишь время (которое, худо-бедно, имеют ввиду все) или энергия (о которой большинство слышали, хотя в расчет мало кто принимает).
Например, если вы бодры и свежи, у вас час времени, но отсутствует интернет, вам не удастся собрать из него какие-то сведения для проекта.
Или, если у вас с собой ноут, вы едете из Рыбацкого на Беговую в метро, где есть и вай-фай и сиденье, да еще и не дозвонится до вас никто, то у вас есть почти час для полноценной работы. Кайф! (Лично я обожаю работать в метро, я даже написал так книгу)
Наконец, можно добавить опциональный столбец с комментарием, где словесно кратко описывать свое состояние, поясняющее значения метрик.
Например:
У:2 Ф:3 Комментарий: выспался
У:1 Ф:1 Комментарий: болел после вчерашней пьянки...
Такие комменты помогут разобраться, что именно повышает, а что снижает вашу энергию и попытаться эти факторы усилить или избегать соответственно.
Приветствую любителей аналитики!
Недавно я описывал чертовски полезный способ самоанализа - энергетический дневник.
Мы договорились фиксировать время, а также уровень физической и умственной энергии.
Эти метрики можно дополнить флагами, показывающими наличие у вас в данном временном слоте:
* Интернета (И)
* Стола (П)
* Непрерывности времени, когда точно никто не отвлечёт (Т)
* Компьютера (К)
* любых других инструментов и условий, необходимых вам для работы по своим делам (например - Вдохновение. Почему бы нет?).
Обогащенный дневник может выглядеть как-то так.
Эти данные пригодятся вам при анализе своих возможностей.
Ведь для разных видов работ нужны соответствующие условия, а не только лишь время (которое, худо-бедно, имеют ввиду все) или энергия (о которой большинство слышали, хотя в расчет мало кто принимает).
Например, если вы бодры и свежи, у вас час времени, но отсутствует интернет, вам не удастся собрать из него какие-то сведения для проекта.
Или, если у вас с собой ноут, вы едете из Рыбацкого на Беговую в метро, где есть и вай-фай и сиденье, да еще и не дозвонится до вас никто, то у вас есть почти час для полноценной работы. Кайф! (Лично я обожаю работать в метро, я даже написал так книгу)
Наконец, можно добавить опциональный столбец с комментарием, где словесно кратко описывать свое состояние, поясняющее значения метрик.
Например:
У:2 Ф:3 Комментарий: выспался
У:1 Ф:1 Комментарий: болел после вчерашней пьянки...
Такие комменты помогут разобраться, что именно повышает, а что снижает вашу энергию и попытаться эти факторы усилить или избегать соответственно.
Telegram
Тимлидское об аналитике
Энергетический дневник
Приветствую, любители аналитики!
Расскажу-ка я вам о своей личной методике самоанализа с целью повышения своей эффективности.
Она подкинула мне системные инсайты и дала важнейший инструмент для работы наряду с состоянием потока Михая…
Приветствую, любители аналитики!
Расскажу-ка я вам о своей личной методике самоанализа с целью повышения своей эффективности.
Она подкинула мне системные инсайты и дала важнейший инструмент для работы наряду с состоянием потока Михая…
👍11👏2🔥1
Проверка нужности витрины данных
Приветствую, любители аналитики!
Сегодня повествую о последнем шаге Жизненного цикла витрин данных, который часто незаслуженно забывается.
Витрины рождаются, приносят пользу, а затем перестают приносить пользу, после чего должны бытьпохоронены выведены из эксплуатации.
Почему? Так ведь поддержка витрины требует времени и нервов дата-специалистов.
Вам интересно заниматься делами, которые никому не нужны? А компании интересно за это вам платить?
Поэтому все витрины следует постоянно проверять на предмет их полезности для общества. Их смотрят? Их данные приносят пользу, отражают актуальные аспекты ситуации или процессов? Они ещё нужны?
Вручную такой мониторинг весьма заморочно осуществлять. Опросы конечных пользователей отвлекают их от работы, занимают время аналитика и, к тому же, дают не очень-то надежную информацию. Пользователи не фиксируют, когда в последний раз глядели конкретный отчет, а некоторые отчеты, которые им вообще не нужны, они хотят оставить "на всякий случай" (который, скорее всего, и не наступит).
В общем, лучше процесс автоматизировать. Лично я - вообще приверженец "агрессивной" автоматизации, ибо мы создали машины, чтобы они работали на нас, а не наоборот.
Для этого в большинстве СУБД есть лог запросов. Проверяем его и видим, к каким витринам когда в последний раз обращались.
Читайте мою статейку, где я описываю, как это сделано у нас. Там и код запроса есть.
Приветствую, любители аналитики!
Сегодня повествую о последнем шаге Жизненного цикла витрин данных, который часто незаслуженно забывается.
Витрины рождаются, приносят пользу, а затем перестают приносить пользу, после чего должны быть
Почему? Так ведь поддержка витрины требует времени и нервов дата-специалистов.
Вам интересно заниматься делами, которые никому не нужны? А компании интересно за это вам платить?
Поэтому все витрины следует постоянно проверять на предмет их полезности для общества. Их смотрят? Их данные приносят пользу, отражают актуальные аспекты ситуации или процессов? Они ещё нужны?
Вручную такой мониторинг весьма заморочно осуществлять. Опросы конечных пользователей отвлекают их от работы, занимают время аналитика и, к тому же, дают не очень-то надежную информацию. Пользователи не фиксируют, когда в последний раз глядели конкретный отчет, а некоторые отчеты, которые им вообще не нужны, они хотят оставить "на всякий случай" (который, скорее всего, и не наступит).
В общем, лучше процесс автоматизировать. Лично я - вообще приверженец "агрессивной" автоматизации, ибо мы создали машины, чтобы они работали на нас, а не наоборот.
Для этого в большинстве СУБД есть лог запросов. Проверяем его и видим, к каким витринам когда в последний раз обращались.
Читайте мою статейку, где я описываю, как это сделано у нас. Там и код запроса есть.
Telegram
Тимлидское об аналитике
О цикле жизни витрины данных
Приветствую любителей аналитики!
Продолжим разбирать конвейер данных. Про ETL я немножко высказался, теперь рассмотрим работу с витринами данных.
Витрина данных - это такая таблица, готовая для анализа: в ней данные обработаны…
Приветствую любителей аналитики!
Продолжим разбирать конвейер данных. Про ETL я немножко высказался, теперь рассмотрим работу с витринами данных.
Витрина данных - это такая таблица, готовая для анализа: в ней данные обработаны…
🔥7🤨1
Коллеги, заглядывайте. Кое-что расскажу о нашей дата-аналитической работе
👍4
Forwarded from Simulative
This media is not supported in your browser
VIEW IN TELEGRAM
⚡️ Открытый эфир: рабочий день дата-аналитика в Яндекс eLama
Приветствуем, любители аналитики!
Мы вновь попросили Пашу Беляева провести для вас полезный открытый стрим, а Паша, в свою очередь, предложил очень интересную тему — заглянуть в закулисье Data Office Яндекс eLama и узнать, как на самом деле выглядит рабочий день дата-аналитика!
Что обсудим:
🔸 Data Office eLama изнутри: как устроена команда, какие задачи решает Data Office и почему именно сюда обращаются все, кто работает с данными — от маркетинга до продукта.
🔸 Задачи дата-аналитика: поддержка витрин данных, настройка веб-аналитики, сервисы "самоаналитики" для самостоятельных выгрузок, прогнозирование, консультации по данным.
🔸 Технологии и процессы: разберём, какой стек используют аналитики, как проходят планёрки, спринты и дежурства, и как строится работа над квартальными целями.
🔸 Реальные кейсы: услышите примеры задач, с которыми сталкиваются аналитики eLama — из первых рук!
Когда: 15 июля в 18:30 по МСК
Спикер: Павел Беляев, руководитель группы дата-аналитиков Яндекс eLama и автор телеграм-канала «Тимлидское об аналитике»
Не упустите шанс узнать, как работают с большими данными в Яндекс eLama, задать вопросы эксперту и вдохновиться на развитие в аналитике!
Регистрация на эфир не нужна — ссылку на трансляцию мы пришлем 15 июля за 1 час до эфира. Следите за обновлениями!
Приветствуем, любители аналитики!
Мы вновь попросили Пашу Беляева провести для вас полезный открытый стрим, а Паша, в свою очередь, предложил очень интересную тему — заглянуть в закулисье Data Office Яндекс eLama и узнать, как на самом деле выглядит рабочий день дата-аналитика!
Что обсудим:
🔸 Data Office eLama изнутри: как устроена команда, какие задачи решает Data Office и почему именно сюда обращаются все, кто работает с данными — от маркетинга до продукта.
🔸 Задачи дата-аналитика: поддержка витрин данных, настройка веб-аналитики, сервисы "самоаналитики" для самостоятельных выгрузок, прогнозирование, консультации по данным.
🔸 Технологии и процессы: разберём, какой стек используют аналитики, как проходят планёрки, спринты и дежурства, и как строится работа над квартальными целями.
🔸 Реальные кейсы: услышите примеры задач, с которыми сталкиваются аналитики eLama — из первых рук!
Когда: 15 июля в 18:30 по МСК
Спикер: Павел Беляев, руководитель группы дата-аналитиков Яндекс eLama и автор телеграм-канала «Тимлидское об аналитике»
Не упустите шанс узнать, как работают с большими данными в Яндекс eLama, задать вопросы эксперту и вдохновиться на развитие в аналитике!
Регистрация на эфир не нужна — ссылку на трансляцию мы пришлем 15 июля за 1 час до эфира. Следите за обновлениями!
👍14❤1
Извянки, любители аналитики, что не пощщу ничего уж пару недель. У меня случилось два переезда, но теперь этот "кризис" позади.
А пока вызревает новый пост, вот вам полезненькое. Пачка каналов сотрудников Яндекса об их работе и о карьере.
Народ у нас тут профессиональный и активный, поэтому наверняка найдётся что здесь почитать.
Заходите https://news.1rj.ru/str/addlist/gioPBbD38dYxYWQy
А пока вызревает новый пост, вот вам полезненькое. Пачка каналов сотрудников Яндекса об их работе и о карьере.
Народ у нас тут профессиональный и активный, поэтому наверняка найдётся что здесь почитать.
Заходите https://news.1rj.ru/str/addlist/gioPBbD38dYxYWQy
🔥9👍3🥰2❤1
Энергетический дневник - 3
Приветствую, любители аналитики!
В прошлых постах я описывал мой способ подсчитать свою реальную "энергоёмкость". Раз и два.
Напомню коротко:
Вот такая табличка получается.
Недели через четыре такого учета можно подводить итог. Давайте взглянем, что же получилось и какие выводы о своих ресурсах мы можем сделать.
Итак, мы выписываем на отдельном листе все комбинации уровней умственной и физической энергии, а рядом с каждой - сумму времени, вот так. Это итог за неделю, но лучше понаблюдать за собой 4-6 недель для более гладкого усреднения.
Что же мы теперь имеем о себе сказать?
1) Нерабочего времени у нас примерно 40 часов в неделю. Это не включая: ночной сон, жор, гигиеническое; но включая: отдых, тупняк, часть дороги куда-либо, походы в магазин, время с семьей ит.д.
2) Основная масса на среднем состоянии - У2Ф2, "хвосты" редки.
3) Состояния высокой умственной энергии при низкой физической (У3Ф1) - почти не бывает. Выходит, креативить или думать когда физически устал - невозможно.
4) Верно и обратное - не бывает физического бодрячка при абсолютно мутных мозгах (У1Ф3). Эти наблюдения доказывают нам тесную взаимосвязь физической и умственной энергетики, что само по себе подталкивает нас к соответствующим шагам в саморазвитии.
5) Если анализировать доп.параметры, можно увидеть, сколько реально времени у вас для работы на компьютере, сколько можно выделить на задачи, требующие длительной концентрации и т.д.
6) Выйдет, что ваши 40 часов - это далеко не 40 полноценных часов, какой бы тайм-менеджмент вы ни применяли. И это обязательно следует учитывать при планировании.
Вот и ответы на вопросы - почему я нифига не успеваю?!
А дальше покажу как встроить свой "энергетический профиль" в свою деятельность и спокойненько перемалывать дела, оставаясь удовлетворённым (и даже гордым!) собой.
Приветствую, любители аналитики!
В прошлых постах я описывал мой способ подсчитать свою реальную "энергоёмкость". Раз и два.
Напомню коротко:
каждый день фиксируем свое состояние в каждом из временных слотов по двум параметрам - физическая энергия и умственная энергия, а также приблизительную длительность слота.
Вот такая табличка получается.
Недели через четыре такого учета можно подводить итог. Давайте взглянем, что же получилось и какие выводы о своих ресурсах мы можем сделать.
Итак, мы выписываем на отдельном листе все комбинации уровней умственной и физической энергии, а рядом с каждой - сумму времени, вот так. Это итог за неделю, но лучше понаблюдать за собой 4-6 недель для более гладкого усреднения.
Что же мы теперь имеем о себе сказать?
1) Нерабочего времени у нас примерно 40 часов в неделю. Это не включая: ночной сон, жор, гигиеническое; но включая: отдых, тупняк, часть дороги куда-либо, походы в магазин, время с семьей ит.д.
2) Основная масса на среднем состоянии - У2Ф2, "хвосты" редки.
3) Состояния высокой умственной энергии при низкой физической (У3Ф1) - почти не бывает. Выходит, креативить или думать когда физически устал - невозможно.
4) Верно и обратное - не бывает физического бодрячка при абсолютно мутных мозгах (У1Ф3). Эти наблюдения доказывают нам тесную взаимосвязь физической и умственной энергетики, что само по себе подталкивает нас к соответствующим шагам в саморазвитии.
5) Если анализировать доп.параметры, можно увидеть, сколько реально времени у вас для работы на компьютере, сколько можно выделить на задачи, требующие длительной концентрации и т.д.
6) Выйдет, что ваши 40 часов - это далеко не 40 полноценных часов, какой бы тайм-менеджмент вы ни применяли. И это обязательно следует учитывать при планировании.
Вот и ответы на вопросы - почему я нифига не успеваю?!
А дальше покажу как встроить свой "энергетический профиль" в свою деятельность и спокойненько перемалывать дела, оставаясь удовлетворённым (и даже гордым!) собой.
Telegram
Тимлидское об аналитике
Энергетический дневник
Приветствую, любители аналитики!
Расскажу-ка я вам о своей личной методике самоанализа с целью повышения своей эффективности.
Она подкинула мне системные инсайты и дала важнейший инструмент для работы наряду с состоянием потока Михая…
Приветствую, любители аналитики!
Расскажу-ка я вам о своей личной методике самоанализа с целью повышения своей эффективности.
Она подкинула мне системные инсайты и дала важнейший инструмент для работы наряду с состоянием потока Михая…
🔥14❤3⚡1
Качество данных
Приветствую, любители аналитики!
Как ни странно, многочисленные курсы и учебные материалы по аналитике очень мало уделяют внимания такому крайне важному аспекту как качество данных.
Меж тем, конечные пользователи предпочитают надёжность данных разнообразию данных. Лучше быть уверенным в центральных метриках, чем иметь огромный зоопарк данных, которым не можешь доверять.
Как-то я проводил вебинар на эту тему, но хочу вновь к ней вернуться и подраскрыть в более спокойном формате. Сначала немножко определений.
Требования к качеству данных — желаемые значения метрик качества данных.
Метрики качества данных — показатели, отражающие различные аспекты истинности данных.
Пойдем с конца, то есть с метрик (или измерений) КД. Нет единой универсальной классификации метрик, но, в принципе, они все интуитивно понятны. Приведем несколько наиболее популярных.
Актуальность — соблюдены ли графики обновления, получения данных?
Допустимость — соответствие значений областям или множествам допустимых значений (наборы справочных значений или интервалы).
Полнота — все ли требующиеся данные присутствуют? Все строки доехали? Все требуемые столбцы заполнены?
Консистентность (непротиворечивость) — согласованность данных между собой. Например, дата активации пользователя не может быть до даты регистрации.
Соответствие (точность, истинность) — степень близости данных к «реальности». Измерить ее бывает крайне трудно, можно судить лишь по собранным данным в источнике.
Приветствую, любители аналитики!
Как ни странно, многочисленные курсы и учебные материалы по аналитике очень мало уделяют внимания такому крайне важному аспекту как качество данных.
Меж тем, конечные пользователи предпочитают надёжность данных разнообразию данных. Лучше быть уверенным в центральных метриках, чем иметь огромный зоопарк данных, которым не можешь доверять.
Как-то я проводил вебинар на эту тему, но хочу вновь к ней вернуться и подраскрыть в более спокойном формате. Сначала немножко определений.
Качество данных (КД) определим как степень соответствия данных требованиям для их использования.
Требования к качеству данных — желаемые значения метрик качества данных.
Метрики качества данных — показатели, отражающие различные аспекты истинности данных.
Пойдем с конца, то есть с метрик (или измерений) КД. Нет единой универсальной классификации метрик, но, в принципе, они все интуитивно понятны. Приведем несколько наиболее популярных.
Актуальность — соблюдены ли графики обновления, получения данных?
Допустимость — соответствие значений областям или множествам допустимых значений (наборы справочных значений или интервалы).
Полнота — все ли требующиеся данные присутствуют? Все строки доехали? Все требуемые столбцы заполнены?
Консистентность (непротиворечивость) — согласованность данных между собой. Например, дата активации пользователя не может быть до даты регистрации.
Соответствие (точность, истинность) — степень близости данных к «реальности». Измерить ее бывает крайне трудно, можно судить лишь по собранным данным в источнике.
Telegram
Тимлидское об аналитике
Приветствую, любители аналитики!
Поговорим о целевой метрике, которую какой-то романтик назвал North Star Metric.
Полярная звезда аналитики, правда, поэтично?
NSM - это ключевая метрика, отражающая главную ценность продукта или цель компании. Это ориентир…
Поговорим о целевой метрике, которую какой-то романтик назвал North Star Metric.
Полярная звезда аналитики, правда, поэтично?
NSM - это ключевая метрика, отражающая главную ценность продукта или цель компании. Это ориентир…
🔥9
Яндекс опубликовал в своём канале мою тему о цикле жизни витрин данных, которую мы с вами разбирали в течение нескольких постов. Ну эту вот: https://news.1rj.ru/str/teamlytics/24
🔥6
Forwarded from Yandex for Analytics
Привет аналитикам! На связи Павел Беляев, тимлид группы обработки данных в дата-офисе сервиса eLama и автор канала «Тимлидское об аналитике». Основной продукт моей команды — это витрины данных. Уже 7 лет я занимаюсь их разработкой, поддержкой, управлением и так далее.
Сегодня я хочу поделиться своими наблюдениями за их жизнью 🔭 Надеюсь, это поможет вам выстроить работу дата-аналитиков так, чтобы получилось максимально эффективно и продуктивно.
А вот полезные материалы по карточкам:
Подписывайтесь:
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍13