О чём этот блог?
http://leftjoin.ru/all/o-chyom-etot-blog/
Всем привет, меня зовут Николай Валиотти.
Занимаюсь бизнес-аналитикой и анализом данных с 2009 года, успел поработать в данном направлении в Ленте, Yota, Юлмарте, Балтике и Tapcore / Airpush. За это время прошел путь от изучения SQL во всевозможных СУБД (MSSQL, MySql, Postgresql, Oracle, Redshift, Snowflake, Vertica, Clickhouse, BigQuery и других) с разнообразными инструментами аналитики (Tableau, Oracle BI, PowerBI, Redash, Mode, Looker, Statsbot).
Строил разнообразные ML модели классификации, прогнозирования, регрессии, кластеризации в пакетах SPSS, R, Matlab.
В 2014 защитил кандидатскую диссертацию на тему разработки нейросетевой модели для оценки бизнес-показателей в телекоме (анализ интервенций).
Сегодня консультирую разработчиков в мобильной индустрии, грузоперевозках и ритейле.
В этом блоге и, привязанном к нему телеграмм канале (@leftjoin), буду писать и рассказывать на тему аналитики, визуализации, хранилищ данных. Буду рассматривать и изучать технологические решения хранилищ данных, BI инструменты, SQL инструменты. Планирую уделять внимание построению полезных бизнес-отчетов, немаловажной частью является визуализация данных, о которой будет серия постов с готовыми решениями.
Буду делиться полезными ссылками, видео и книгами.
Частично коснемся машинного обучения, построению моделей данных по ходу моего изучения Python :)
http://leftjoin.ru/all/o-chyom-etot-blog/
Всем привет, меня зовут Николай Валиотти.
Занимаюсь бизнес-аналитикой и анализом данных с 2009 года, успел поработать в данном направлении в Ленте, Yota, Юлмарте, Балтике и Tapcore / Airpush. За это время прошел путь от изучения SQL во всевозможных СУБД (MSSQL, MySql, Postgresql, Oracle, Redshift, Snowflake, Vertica, Clickhouse, BigQuery и других) с разнообразными инструментами аналитики (Tableau, Oracle BI, PowerBI, Redash, Mode, Looker, Statsbot).
Строил разнообразные ML модели классификации, прогнозирования, регрессии, кластеризации в пакетах SPSS, R, Matlab.
В 2014 защитил кандидатскую диссертацию на тему разработки нейросетевой модели для оценки бизнес-показателей в телекоме (анализ интервенций).
Сегодня консультирую разработчиков в мобильной индустрии, грузоперевозках и ритейле.
В этом блоге и, привязанном к нему телеграмм канале (@leftjoin), буду писать и рассказывать на тему аналитики, визуализации, хранилищ данных. Буду рассматривать и изучать технологические решения хранилищ данных, BI инструменты, SQL инструменты. Планирую уделять внимание построению полезных бизнес-отчетов, немаловажной частью является визуализация данных, о которой будет серия постов с готовыми решениями.
Буду делиться полезными ссылками, видео и книгами.
Частично коснемся машинного обучения, построению моделей данных по ходу моего изучения Python :)
Redash — полноценная on-demand аналитика
https://leftjoin.ru/all/redash-polnocennaya-on-demand-analitika/
Сегодня мы рассмотрим и постараемся разобраться в весьма популярном сейчас инструменте под названием Redash. Инструмент крайне удобен тем, что он умеет работать с Clickhouse (https://clickhouse.yandex/docs/ru/). Все остальные разработчики BI-утилит не поддерживают Clickhouse. Буквально недавно появился ODBC драйвер под Tableau.
Я сделаю краткий обзор полезных фич Redash’a, а в дальнейшей серии постов разберу какие полезные запросы и отчеты с помощью Redash можно построить.
https://leftjoin.ru/all/redash-polnocennaya-on-demand-analitika/
Сегодня мы рассмотрим и постараемся разобраться в весьма популярном сейчас инструменте под названием Redash. Инструмент крайне удобен тем, что он умеет работать с Clickhouse (https://clickhouse.yandex/docs/ru/). Все остальные разработчики BI-утилит не поддерживают Clickhouse. Буквально недавно появился ODBC драйвер под Tableau.
Я сделаю краткий обзор полезных фич Redash’a, а в дальнейшей серии постов разберу какие полезные запросы и отчеты с помощью Redash можно построить.
Домашняя страница Redash
Итак, что такое Redash? Это инструмент для on-demand аналитики, его можно использовать на совершенно разнообразных база данных. К примеру, Redash можно подключить к БД под управлением MySQL или HP Vertica.
Основное, что предлагает нам Redash — удобная консоль для написания SQL-запросов к базе данных.
Итак, что такое Redash? Это инструмент для on-demand аналитики, его можно использовать на совершенно разнообразных база данных. К примеру, Redash можно подключить к БД под управлением MySQL или HP Vertica.
Основное, что предлагает нам Redash — удобная консоль для написания SQL-запросов к базе данных.
Консоль для написания SQL-запросов
Соответственно, первый главный вывод: для того, чтобы использовать redash вы должны знать SQL или иметь в штате специалиста, который знает SQL.
Помимо базовой консоли Redash предлагает инструменты визуализации (в их числе построение Funnel-диаграмм, когортного анализа и сводных таблиц (правда функционал последних крайне скудный)), а также инструменты построения дашбордов и систем оповещения (по почте или в slack).
Разберем чуть детальнее базовую консоль. Пользователю доступны полезные фичи: использование фильтров, мультифильтров и параметров запроса:
Соответственно, первый главный вывод: для того, чтобы использовать redash вы должны знать SQL или иметь в штате специалиста, который знает SQL.
Помимо базовой консоли Redash предлагает инструменты визуализации (в их числе построение Funnel-диаграмм, когортного анализа и сводных таблиц (правда функционал последних крайне скудный)), а также инструменты построения дашбордов и систем оповещения (по почте или в slack).
Разберем чуть детальнее базовую консоль. Пользователю доступны полезные фичи: использование фильтров, мультифильтров и параметров запроса:
Использование параметров, фильтров и мульти-фильтров в запросах одновременно
Отдельной строкой следует отметить возможности визуализации, они действительно удобны и богаты, особенно учитывая, что можно настроить автоматическое обновление отчетов согласно необходимому расписанию.
В следующей заметке подробнее обсудим визуализацию в Redash, позже — построение дашбордов и системы уведомлений.
Отдельной строкой следует отметить возможности визуализации, они действительно удобны и богаты, особенно учитывая, что можно настроить автоматическое обновление отчетов согласно необходимому расписанию.
В следующей заметке подробнее обсудим визуализацию в Redash, позже — построение дашбордов и системы уведомлений.
Визуализация данных в Redash
http://leftjoin.ru/all/vizualizaciya-dannyh-v-redash/
В Redash легко и удобно визуализировать информацию, я рассмотрю в этом посте примеры отображения данных на различных графиках. Все примеры будут на временных рядах (https://ru.wikipedia.org/wiki/%D0%92%D1%80%D0%B5%D0%BC%D0%B5%D0%BD%D0%BD%D0%BE%D0%B9_%D1%80%D1%8F%D0%B4), построенных на данных за каждый месяц.
Поскольку я про аналитику, то вместе с графиками мы будем изучать полезные показатели бизнеса. Начнем с довольной традиционной метрики для ритейла/e-commerce AOV (Average Order Value) — средняя сумма заказа (в данном случае за месяц). Показатель позволяет отслеживать изменения, связанные с покупательским поведением (стали ли в среднем больше или меньше покупать).
http://leftjoin.ru/all/vizualizaciya-dannyh-v-redash/
В Redash легко и удобно визуализировать информацию, я рассмотрю в этом посте примеры отображения данных на различных графиках. Все примеры будут на временных рядах (https://ru.wikipedia.org/wiki/%D0%92%D1%80%D0%B5%D0%BC%D0%B5%D0%BD%D0%BD%D0%BE%D0%B9_%D1%80%D1%8F%D0%B4), построенных на данных за каждый месяц.
Поскольку я про аналитику, то вместе с графиками мы будем изучать полезные показатели бизнеса. Начнем с довольной традиционной метрики для ритейла/e-commerce AOV (Average Order Value) — средняя сумма заказа (в данном случае за месяц). Показатель позволяет отслеживать изменения, связанные с покупательским поведением (стали ли в среднем больше или меньше покупать).
