О чём этот блог?
http://leftjoin.ru/all/o-chyom-etot-blog/
Всем привет, меня зовут Николай Валиотти.
Занимаюсь бизнес-аналитикой и анализом данных с 2009 года, успел поработать в данном направлении в Ленте, Yota, Юлмарте, Балтике и Tapcore / Airpush. За это время прошел путь от изучения SQL во всевозможных СУБД (MSSQL, MySql, Postgresql, Oracle, Redshift, Snowflake, Vertica, Clickhouse, BigQuery и других) с разнообразными инструментами аналитики (Tableau, Oracle BI, PowerBI, Redash, Mode, Looker, Statsbot).
Строил разнообразные ML модели классификации, прогнозирования, регрессии, кластеризации в пакетах SPSS, R, Matlab.
В 2014 защитил кандидатскую диссертацию на тему разработки нейросетевой модели для оценки бизнес-показателей в телекоме (анализ интервенций).
Сегодня консультирую разработчиков в мобильной индустрии, грузоперевозках и ритейле.
В этом блоге и, привязанном к нему телеграмм канале (@leftjoin), буду писать и рассказывать на тему аналитики, визуализации, хранилищ данных. Буду рассматривать и изучать технологические решения хранилищ данных, BI инструменты, SQL инструменты. Планирую уделять внимание построению полезных бизнес-отчетов, немаловажной частью является визуализация данных, о которой будет серия постов с готовыми решениями.
Буду делиться полезными ссылками, видео и книгами.
Частично коснемся машинного обучения, построению моделей данных по ходу моего изучения Python :)
http://leftjoin.ru/all/o-chyom-etot-blog/
Всем привет, меня зовут Николай Валиотти.
Занимаюсь бизнес-аналитикой и анализом данных с 2009 года, успел поработать в данном направлении в Ленте, Yota, Юлмарте, Балтике и Tapcore / Airpush. За это время прошел путь от изучения SQL во всевозможных СУБД (MSSQL, MySql, Postgresql, Oracle, Redshift, Snowflake, Vertica, Clickhouse, BigQuery и других) с разнообразными инструментами аналитики (Tableau, Oracle BI, PowerBI, Redash, Mode, Looker, Statsbot).
Строил разнообразные ML модели классификации, прогнозирования, регрессии, кластеризации в пакетах SPSS, R, Matlab.
В 2014 защитил кандидатскую диссертацию на тему разработки нейросетевой модели для оценки бизнес-показателей в телекоме (анализ интервенций).
Сегодня консультирую разработчиков в мобильной индустрии, грузоперевозках и ритейле.
В этом блоге и, привязанном к нему телеграмм канале (@leftjoin), буду писать и рассказывать на тему аналитики, визуализации, хранилищ данных. Буду рассматривать и изучать технологические решения хранилищ данных, BI инструменты, SQL инструменты. Планирую уделять внимание построению полезных бизнес-отчетов, немаловажной частью является визуализация данных, о которой будет серия постов с готовыми решениями.
Буду делиться полезными ссылками, видео и книгами.
Частично коснемся машинного обучения, построению моделей данных по ходу моего изучения Python :)
Redash — полноценная on-demand аналитика
https://leftjoin.ru/all/redash-polnocennaya-on-demand-analitika/
Сегодня мы рассмотрим и постараемся разобраться в весьма популярном сейчас инструменте под названием Redash. Инструмент крайне удобен тем, что он умеет работать с Clickhouse (https://clickhouse.yandex/docs/ru/). Все остальные разработчики BI-утилит не поддерживают Clickhouse. Буквально недавно появился ODBC драйвер под Tableau.
Я сделаю краткий обзор полезных фич Redash’a, а в дальнейшей серии постов разберу какие полезные запросы и отчеты с помощью Redash можно построить.
https://leftjoin.ru/all/redash-polnocennaya-on-demand-analitika/
Сегодня мы рассмотрим и постараемся разобраться в весьма популярном сейчас инструменте под названием Redash. Инструмент крайне удобен тем, что он умеет работать с Clickhouse (https://clickhouse.yandex/docs/ru/). Все остальные разработчики BI-утилит не поддерживают Clickhouse. Буквально недавно появился ODBC драйвер под Tableau.
Я сделаю краткий обзор полезных фич Redash’a, а в дальнейшей серии постов разберу какие полезные запросы и отчеты с помощью Redash можно построить.
Домашняя страница Redash
Итак, что такое Redash? Это инструмент для on-demand аналитики, его можно использовать на совершенно разнообразных база данных. К примеру, Redash можно подключить к БД под управлением MySQL или HP Vertica.
Основное, что предлагает нам Redash — удобная консоль для написания SQL-запросов к базе данных.
Итак, что такое Redash? Это инструмент для on-demand аналитики, его можно использовать на совершенно разнообразных база данных. К примеру, Redash можно подключить к БД под управлением MySQL или HP Vertica.
Основное, что предлагает нам Redash — удобная консоль для написания SQL-запросов к базе данных.
Консоль для написания SQL-запросов
Соответственно, первый главный вывод: для того, чтобы использовать redash вы должны знать SQL или иметь в штате специалиста, который знает SQL.
Помимо базовой консоли Redash предлагает инструменты визуализации (в их числе построение Funnel-диаграмм, когортного анализа и сводных таблиц (правда функционал последних крайне скудный)), а также инструменты построения дашбордов и систем оповещения (по почте или в slack).
Разберем чуть детальнее базовую консоль. Пользователю доступны полезные фичи: использование фильтров, мультифильтров и параметров запроса:
Соответственно, первый главный вывод: для того, чтобы использовать redash вы должны знать SQL или иметь в штате специалиста, который знает SQL.
Помимо базовой консоли Redash предлагает инструменты визуализации (в их числе построение Funnel-диаграмм, когортного анализа и сводных таблиц (правда функционал последних крайне скудный)), а также инструменты построения дашбордов и систем оповещения (по почте или в slack).
Разберем чуть детальнее базовую консоль. Пользователю доступны полезные фичи: использование фильтров, мультифильтров и параметров запроса:
Использование параметров, фильтров и мульти-фильтров в запросах одновременно
Отдельной строкой следует отметить возможности визуализации, они действительно удобны и богаты, особенно учитывая, что можно настроить автоматическое обновление отчетов согласно необходимому расписанию.
В следующей заметке подробнее обсудим визуализацию в Redash, позже — построение дашбордов и системы уведомлений.
Отдельной строкой следует отметить возможности визуализации, они действительно удобны и богаты, особенно учитывая, что можно настроить автоматическое обновление отчетов согласно необходимому расписанию.
В следующей заметке подробнее обсудим визуализацию в Redash, позже — построение дашбордов и системы уведомлений.
Визуализация данных в Redash
http://leftjoin.ru/all/vizualizaciya-dannyh-v-redash/
В Redash легко и удобно визуализировать информацию, я рассмотрю в этом посте примеры отображения данных на различных графиках. Все примеры будут на временных рядах (https://ru.wikipedia.org/wiki/%D0%92%D1%80%D0%B5%D0%BC%D0%B5%D0%BD%D0%BD%D0%BE%D0%B9_%D1%80%D1%8F%D0%B4), построенных на данных за каждый месяц.
Поскольку я про аналитику, то вместе с графиками мы будем изучать полезные показатели бизнеса. Начнем с довольной традиционной метрики для ритейла/e-commerce AOV (Average Order Value) — средняя сумма заказа (в данном случае за месяц). Показатель позволяет отслеживать изменения, связанные с покупательским поведением (стали ли в среднем больше или меньше покупать).
http://leftjoin.ru/all/vizualizaciya-dannyh-v-redash/
В Redash легко и удобно визуализировать информацию, я рассмотрю в этом посте примеры отображения данных на различных графиках. Все примеры будут на временных рядах (https://ru.wikipedia.org/wiki/%D0%92%D1%80%D0%B5%D0%BC%D0%B5%D0%BD%D0%BD%D0%BE%D0%B9_%D1%80%D1%8F%D0%B4), построенных на данных за каждый месяц.
Поскольку я про аналитику, то вместе с графиками мы будем изучать полезные показатели бизнеса. Начнем с довольной традиционной метрики для ритейла/e-commerce AOV (Average Order Value) — средняя сумма заказа (в данном случае за месяц). Показатель позволяет отслеживать изменения, связанные с покупательским поведением (стали ли в среднем больше или меньше покупать).
Пример столбиковой диаграммы в Redash на основе показателя AOV (Average Order Value)
С точки зрения отображения столбиковой диаграммы все довольно штатно, но удобно — есть возможность управлять цветом диаграммы, подписью данных, форматом подписи данных (убрать или показать данные после запятой).
Зачастую динамика гораздо отчетливее, если посмотреть либо на традиционной график, либо на так называемую area-диаграмму. В данном случае мы исследуем новых пользователей, а также какую долю MAU (Monthly Active Users) занимают новые пользователи.
С точки зрения отображения столбиковой диаграммы все довольно штатно, но удобно — есть возможность управлять цветом диаграммы, подписью данных, форматом подписи данных (убрать или показать данные после запятой).
Зачастую динамика гораздо отчетливее, если посмотреть либо на традиционной график, либо на так называемую area-диаграмму. В данном случае мы исследуем новых пользователей, а также какую долю MAU (Monthly Active Users) занимают новые пользователи.
