subquery.ru - dbt, clickhouse, cube – Telegram
subquery.ru - dbt, clickhouse, cube
649 subscribers
10 photos
1 video
46 links
SubQuery — автоматизация данных для аналитиков и data-инженеров.

Пайплайны, описанные кодом, с визуализацией и тестами, готовый dbt-стек c IDE, планировщик запусков и безопасная совместная работа.

𝗕𝗹𝗼𝗴
https://subquery.ru

𝗗𝗶𝗿𝗲𝗰𝘁
@mironovich
Download Telegram
Channel name was changed to «Burger Data»
DataStudio обновил галерею коннекторов. Кажется, они хотят наконец повзрослеть.
https://datastudio.google.com/org/tXiKbUj-SzeLfhrnoPxQDQ/datasources/create
Сохранение реферала
Чё, трется источник после почтовых регистраций и онлайн-оплат? utm_nooverride=1 не прописываете? В интернете ходят слухи, что он не работает с развала СССР, они врут, я проверял, причем никаких допиливаний в GTM не требуется. В поле referrer вообще лучше не лезть.

Есть еще способ - дописать utm_referrer= именно с пустым значением. Эффект тот же - новый реферал не передастся.

Напомню, сегодня никаких релизов, в остальном хорошей пятницы!

@Burgerdata
Воронки в DataStudio
Недавно в службу костыльного надзора (РКН) поступили сведения о некоторых аналитиках, которые для создания воронок в Data Studio транслируют в GA ненужные id сессий и других тому учат.
Не волнуйтесь, виновные наказаны и отре'fuck'торены, а я делюсь с вами простейшим решением:
Пользователи * MAX(CASE WHEN REGEXP_MATCH(Шаг воронки, '.*') THEN 1 ELSE 0 END)

Если же вы хотите настоящую воронку с зависимостью от предыдущих этапов (и у вас нет 360, где это изи), то помогут отдельные сегменты с последовательностями и логарифмическая линейка для косметики.

@Burgerdata
Проверка счетчика Метрики
Если Яндекс Метрика вторая по популярности в мире система веб-аналитики, то наверняка yaCounter is not defined где-то в топе самых частых консольных ошибок. Такой вот антирекорд, а между тем есть простой дедовский способ. Для того чтобы узнать, готов ли счетчик, достаточно всего лишь каждые 50 миллисекунд...

https://burgerdata.com/blog/kak-pravilno-podklyuchit-yandex-metriku-cherez-google-tag-manager/

@Burgerdata
BQ и GA
Старик закинул невод в море,
корыто, бабку и избу,
и тихо про себя промолвил
...
Всплыла тут статейка про расхождения данных в BQ и GA, про HLL++. Гляньте быстренько.
https://www.analyticspros.com/blog/google-analytics/why-google-analytics-users-dont-match-bigquery-users/

А вообще грустно, когда за мемасики удаляют. Хороших выходных!

@Burgerdata
Новинки Google Spreadsheets
Я не узнаю эту компанию! Очень много новостей в последнее время.
Сегодня праздник у любителей всякого шита, где планируется ряд нововведений, некоторые из которых уже начали появляется в ваших мониторах, например, slicer'ы.

https://www.benlcollins.com/spreadsheets/sheets-new-features/

И, кстати, мне дали доступ к бете коннектора BQ для шитов, так что, возможно, позже обозрю в блоге.

@Burgerdata
Ищу джуниора в отдел
С вас желание, усердие, трудолюбие, упорство, самостоятельность и базовые навыки кодинга. С нас обучение английскому утром или вечером, физ-культуре в собственном зале, искусству игре на PS4, секретам баристы, своеобразному юмору, и если время останется, то веб-аналитике.

Вот вакансия https://hh.ru/vacancy/26831700

Вот, что говорит обо мне предыдущий джуниор (ныне мидл):
- Козлина!

Мск, MGCom
Аудит аналитики
Вижу, что в инфополе тема набирает обороты, всё больше клиентов заказывают, аналитиков пишут и спрашивают листы для проверки. В этом вопросе я не большой помощник, потому что в моем личном чек-листе всего один пункт, он называется "Гавно?" и ответ уже предустановлен.
Однако ж могу посоветовать эксельку от индонезийского профсоюза фрилансеров с драфтовым названием "Айти агентство", выглядит здорово, и ребятам спасибо за труды.
Недавно еще наткнулся на свежий агрегатор чек-листов у Джеффа. Этот парень просто машина по производству контента, причем не всегда скучного.

@Burgerdata
События в Яндекс Метрики
Берем лучшее из двух миров: customTask и Параметры визитов, и начинаем собирать в Метрике гугловские события.
https://burgerdata.com/blog/sobytiya-v-yandex-metrike/

@Burgerdata
Scheduling Queries
Если вы из тех, кто утром достает кашку из мультиварки, йогурты из йогуртницы или хлеб из хлебопечки, то теперь к пробуждающему кофейку будут готовы и данные из запросницы благодаря новой опции планирования запросов.

Запросы конечно должны быть на стандарте. Любителям теребить морщинистый диалект адаптироваться поможет моя статья.

@Burgerdata
Multiclass logistic regression
BigQuery теперь умеет тренировать модель логистической регрессии для задач со множеством классов.
В общем, тянуть уже некуда, пора заниматься машинным обучением, так что вот вам занятие на выходные 🤤

https://cloud.google.com/bigquery/docs/reference/standard-sql/bigqueryml-syntax-create#training_a_multiclass_logistic_regression_model_with_automatically_calculated_weights

@Burgerdata
Google Optimize Personalization
На следующей неделе обещают выкатить возможность персонализировать контент через оптимайз.

Официальной доки я пока не нашел, но из рассказанного без метки confidential следует, что вы сможете брать аудитории из GA, проводить над ними эксперименты и продолжать конкретной аудитории показывать лучший для неё вариант. В бесплатной версии 10 персонализаций на контейнер.

Также у оптимайза появится Javanoscript API, с этим пока без подробностей.

@Burgerdata
The Good, the Bad and the Ugly Practice

Вот две вещи я не люблю: расизм и..
когда делают вот так
dataLayer.push({
event: ‘GA_EVENT’,
eventCategory: ‘Click’,
eventAction:..
})

1. Чтобы переименовать событие, придется упрашивать Диму из IT отдела взять вас в ближайший спринт
2. GTM злопамятный, и если один из параметров не передать, он припомнит вам последний
3. Может показаться ересью, но при таком подходе GTM вообще не нужен
4. It’s disgusting

Мой вариант, старый как Брюс Уиллис, но все еще актуальный, описан в одной из статей

@Burgerdata

https://burgerdata.com/blog/nastroyka-otpravki-sobytiy-v-google-analytics-cherez-gtm/
GTM & SPA

Вопреки тому, что пишут в интернете и рассказывают на конференциях, нет никаких сложностей в настройке трекинга современных одностраничных web приложений.

1. отправляете просмотр по gtm.historyChange
2. именуете счетчик

Подробнее:

Клиентский роутинг в SPA в основном работает с помощью history API, которое успешно тречится встроенным триггером GTM. Говорят, что при этом возникают проблемы с источниками. Конечно! Но это связано с принципом работы встроенного тега GA, который каждый раз при срабатывании создает новый объект счетчика с заново определяющимися полями, в том числе location и referral.

Пример:

Юзер загремел на ваш реактивный сайт с adwords, пощелкал ссылки, url поменялся, из него пропали метки, однако перезагрузки страницы не произошло, и document.referrer в браузере по-прежнему указывает на google.com
Любой сработающий далее тег аналитикса создаст новый сеанс с органики. По этому поводу я встречал у клиентов целые библиотеки на сотни строк, эмулирующие механизм GA по определению источника, и все равно приводящие к ошибкам.

Решение:

В переменной с настройками GA поставьте true в пункте «Задать имя трекера», и если у вас на сайте несколько UA, то задайте для них разные имена. Теперь аналитикс не будет создавать новый объект, если такой уже есть.

Подвох:

Помимо location и referrer объект будет сохранять и другие поля, например, dimensionXX. Так что если в одном теге вы их указали, а в другом нет, злопамятный аналитикс передаст предыдущие. Это может быть критично для параметров уровня хита, но в моей практике проблем никогда не доставляло.

Где шутки:

Осень, грустно, ашуткоминоз.

@Burgerdata