LEFT JOIN – Telegram
LEFT JOIN
45K subscribers
944 photos
28 videos
6 files
1.2K links
Понятно про анализ данных, технологии, нейросети и, конечно, SQL.

Услуги — leftjoin.ru
Курсы по аналитике — https://stepik.org/users/431992492

Автор — @valiotti
Реклама — @valiotti

Перечень РКН: https://tapthe.link/PpkTHavwS
Download Telegram
Визуализация данных в Redash
http://leftjoin.ru/all/vizualizaciya-dannyh-v-redash/

В Redash легко и удобно визуализировать информацию, я рассмотрю в этом посте примеры отображения данных на различных графиках. Все примеры будут на временных рядах (https://ru.wikipedia.org/wiki/%D0%92%D1%80%D0%B5%D0%BC%D0%B5%D0%BD%D0%BD%D0%BE%D0%B9_%D1%80%D1%8F%D0%B4), построенных на данных за каждый месяц.
Поскольку я про аналитику, то вместе с графиками мы будем изучать полезные показатели бизнеса. Начнем с довольной традиционной метрики для ритейла/e-commerce AOV (Average Order Value) — средняя сумма заказа (в данном случае за месяц). Показатель позволяет отслеживать изменения, связанные с покупательским поведением (стали ли в среднем больше или меньше покупать).
Пример столбиковой диаграммы в Redash на основе показателя AOV (Average Order Value)

С точки зрения отображения столбиковой диаграммы все довольно штатно, но удобно — есть возможность управлять цветом диаграммы, подписью данных, форматом подписи данных (убрать или показать данные после запятой).
Зачастую динамика гораздо отчетливее, если посмотреть либо на традиционной график, либо на так называемую area-диаграмму. В данном случае мы исследуем новых пользователей, а также какую долю MAU (Monthly Active Users) занимают новые пользователи.
В диаграмме используется принцип stacked — это когда данные двух рядов суммируются и показываются один над другим.

В этом примере наша диаграмма максимально информативна — мы даем понять какую долю занимают новые пользователи, а используя принцип stacked показываем сколько всего было активных пользователей за месяц (по сути, убиваем двух зайцев сразу).
А вообще мы могли бы представить данные и в несколько ином виде. Например, довольно популярно смешение разных типов диаграмм. Представим, что MAU представлено столбиковой диаграммой (зеленым на графике), а доля новых пользователей от MAU красной линией, которая отложена по вспомогательной (правой оси).
Два типа диаграмм на одном графике

C redash можно строить сводные таблицы, отображать воронки и когорты, а также использовать карт для отображения гео-данных.

В следующих постах я расскажу о диаграмме для построения воронки (но перед этим научимся подключать google analytics).
Как подключить google analytics к redash?
http://leftjoin.ru/all/kak-podklyuchit-google-analytics-k-redash/

В этой статье разберем как подключить источник данных Google Analytic к сервису Redash (http://redash.io/) [подробнее Redash и его возможности мы разбирали в предыдущих заметках (http://leftjoin.ru/all/redash-polnocennaya-on-demand-analitika/)].
Создаем сервисный аккаунт в Google
Переходим в консоль сервисных аккаунтов (https://console.cloud.google.com/projectselector/iam-admin/serviceaccounts?supportedpurview=project&project=&folder=&organizationId=).
Взболтать, но не смешивать: как подружить бизнес и IT
Противостояние заказчиков и исполнителей вечно и неизбежно. Первые пишут ужасные ТЗ, вторые выдают результат хз, и с обеих сторон копятся взаимные претензии.

Это происходит даже в рамках одной компании, где бизнес выступает в качестве заказчика, а IT — исполнителя. Подразделения настолько разные, что не понимают друг друга, а в это время работа буксует.

Все так живут, и ладно, справляются же как-то?
В МТС решили, что нет, не ладно. Евгений Селиверстов, руководитель продуктовой культуры, рассказал, как компания смогла перестроить работу и улучшить взаимодействие бизнеса и IT. Теперь оба направления более полно используют свои ресурсы, вовлекаются в совместную работу и главное — говорят на одном языке. Примеры — в видео выше, а подробности в телеграм-канале Грейд Клуба.

Грейд Клуб — HR-платформа Яндекса Практикума по развитию цифровых команд. На канале постят новости на стыке HR и IT, кейсы и полезные материалы, поэтому очень советуем подписаться!
#реклама
Когда мы все установили, Analytics API должен гореть зеленым

Добавляем сервисного пользователя в Google Analytics
Далее, необходимо добавить созданного нами сервисного пользователя в Google Analytics. Пользователь будет иметь примерно такой вид:

user@PROJECT-ID.iam.gserviceaccount.com.

Необходимо добавлять пользователя (https://support.google.com/analytics/answer/1009702) с правами на Чтение и Просмотр.
Создаем новый источник данных в Redash
Идем в Настройки (Settings) -> Добавляем новый источник данных
Подключаем новый источник данных.

Нас интересует источник данных Google Analytics, поэтому ищем «google»:
Ищем google analytics в источниках данных.

Вспоминаем, куда мы сохранили JSON файл, он нам сейчас потребуется
Выбираем созданный ранее JSON файл

Пишем запрос к новому источнику данных
Именно в таком виде запрос выполняется в консоли redash:
{
"ids": "ga:128886640",
"start_date": "30daysAgo",
"end_date": "yesterday",
"metrics": "ga:users,ga:newUsers,ga:goal1Starts,ga:goal2Completions,ga:goal3Starts,ga:transactions,ga:transactionRevenue",
"dimensions": "ga:date"
}Как узнать параметры для выполнения запроса?
У Google есть отличный ресурс Query Explorer (https://ga-dev-tools.appspot.com/query-explorer/), в котором можно найти все необходимые метрики и измерения, которые доступны в Google Analytics.
Надеюсь, данная инструкция оказалась вам полезной, далее мы разберемся как построить воронку целей в Redash на основании данных из Google Analytics.
Строим funnel-репорт в redash
http://leftjoin.ru/all/stroim-funnel-report-v-redash/

Итак, мы планировали разобрать Funnel-визуализацию отчета в redash.

В первую очередь, построим запрос к подключенному нами источнику данных (http://leftjoin.ru/all/kak-podklyuchit-google-analytics-k-redash/) — google analytics.
Прямо вот такой текст необходимо положить в консоль запроса:
{
"ids": "ga:128886640",
"start_date": "30daysAgo",
"end_date": "yesterday",
"metrics": "ga:users,ga:goal1Completions,ga:goal2Completions,ga:goal3Completions"
}Мы данном запросе мы просим API Google Analytics отдать данные за последние 30 дней по аккаунту GA: 128886640. Мы хотим увидеть число пользователей и число выполнения целей 1, 2 и 3.
В итоге получаем таблицу следующего вида:

ga:users
ga:goal1Completions
ga:goal2Completions
ga:goal3Completions
3,926
105
41
32

Отлично, это именно то, что нам нужно для построения воронки.

Расскажу об одной очень полезной фиче Redash: query-results. Чтобы подключить таблицы с результатами выполнения запросов, идем в Data Sources и ищем query-results (beta). Подключаем новый источник данных.

Теперь у нас появилась возможность обращаться к результатам запросов redash. Так, например, мы можем воспользоваться результатами запроса к Google Analytics.
Как это сделать?

Необходимо выбрать слева источник данных query-results:
Выпадающее меню с выбором источников данных (в консоли — слева)

Теперь научимся делать funnel-визуализацию. Для этого пишем следующий SQL-запрос:
select 'Добавление товара в корзину' as step_name, ga_goal1Completions as goalCompletion from query_8
union all
select 'Просмотр корзины' as step_name, ga_goal2Completions from query_8
union all
select 'Оформление заказа' as step_name, ga_goal3Completions from query_8В данном случае query_8 — это как раз таблица с результатами запроса к источнику данных Google Analytics.
Настроим визуализацию: