NEW BOT Телеграм, страница

Data Apps Design

Let’s examine some integrations I currently use UNLOADing customer/partner/chauffeur labels to S3 bucket files Let’s say we want to exchange some data with other teams be it Backend, Financial Service, Frontend. You may also treat it as publishing data for…

Continued:

Also, pay attention to how a model is built with dbt_utils.unpivot macro:

{{ dbt_utils.unpivot(
  relation=ref('dim_chauffeurs_labels'),
  cast_to='varchar',
  exclude=['actual_dt', 'chauffeur_id'],
  field_name='label',
  value_name='value'
) }}

A list of attributes unloaded could be expanded or narrowed without actual code changes. Schema is ['actual_dt', 'chauffeur_id', 'label', 'value']

407 viewsArtemiy Kzr, 13:11

Data Apps Design

Forwarded from Igor Kalinovskiy

#анонс

В докладе Артемий расскажет про

- Анализ T2M команд разработки на событиях Github (Webhook)
- Аналитику документ-ориентированной БД MongoDB
- Использование специальных функций и типов данных, оптимизация скорости

Добавить в календарь 🗓

(всякое бывает, и время может измениться, хотя мы постараемся, чтобы такого не было! Но все равно в день конференции следите за финальной сеткой выступлений)

#DevsCamp
#TeamLeadCamp
#TeamLead

450 viewsArtemiy Kzr, 09:40

Data Apps Design

Looker action -> Braze (Customer engagement platform)

Let's keep observing ways to build reverse-ETL pipelines.

Looker enables its user to leverage Actions Hub – way of integrating Looker with 3rd party tools. Amongst most notable are:

– Airtable
– S3
– Braze
– Dropbox
– gDrive / gSheets / gAnalytics / gAds
– Hubspot
– mParticle

We calculate certain labels/traits/dimensions on our passengers/chauffeurs based on their behaviour and services usage in DWH.

Looker Action enables scheduled sync of data from Redshift to Braze user cards.

All you need to perform sync is:

– Identifier (user_id / external_id)
– Dimensions which will become traits in Braze card
– Schedule for this Action

Then in Braze we are able to:

– Target our campaigns precisely
– Deliver personal experiences and communications
– Split segments and perform A/B testing
– Identify users who are about to churn

#reverse_etl

432 viewsArtemiy Kzr, 09:41

Data Apps Design

Screenshot 2021-12-14 at 12.31.22.png

158.1 KB

Screenshot 2021-12-14 at 12.36.58.png

89.4 KB

412 viewsArtemiy Kzr, 09:41

Data Apps Design

This media is not supported in your browser

VIEW IN TELEGRAM

430 viewsArtemiy Kzr, 09:41

Data Apps Design

[RU] Привет!

Сегодня 14 декабря онлайн-митап пользователей dbt в 19.00

Приходите, если уже работаете с dbt или планируете/рассматриваете использование dbt у себя в компании.

В программе 4 интересных доклада и ответы на вопросы:

- Почему вашей компании нужен dbt?
- Опыт использования dbt cloud в modern data stack
- Макросы dbt как единая версия правды
- Сбор статистики по запускам dbt и поиск узких мест в графе

https://space307.team/dbtmeetup

501 viewsArtemiy Kzr, 11:44

Data Apps Design

[RU] Привет! Сегодня 14 декабря онлайн-митап пользователей dbt в 19.00 Приходите, если уже работаете с dbt или планируете/рассматриваете использование dbt у себя в компании. В программе 4 интересных доклада и ответы на вопросы: - Почему вашей компании…

Трансляция на YouTube, начинаем!
https://www.youtube.com/watch?v=10H45iYaCc8

YouTube

Dbt Meetup 2021-12-14

Митап для специалистов, использующих инструмент dbt для решения своих задач.

Таймкоды:
00:00 Приветствие
05:08–28:55 Артемий Козырь, Analytics engineer at Wheely — Почему вашей компании нужен dbt?
35:15–51:35 Никита Баканчев, Senior data engineer at NabuMinds…

👍1

826 viewsArtemiy Kzr, 16:00

Data Apps Design

Трансляция на YouTube, начинаем! https://www.youtube.com/watch?v=10H45iYaCc8

[RU] Слайды с митапа:
– [dbt meetup] Почему вашей компании нужен dbt?
– [dbt meetup] Статистика запусков dbt и поиск узких мест

#meetup

Google Docs

[dbt meetup] Почему вашей компании нужен dbt?

5.94K viewsArtemiy Kzr, 19:16

Data Apps Design

В эту субботу (18 декабря) в Москве с 12:00 до 17:00 в рамках DevsCamp мы снимаем живые подкасты (это значит, что можно прийти и посмотреть съемки, задать вопросы спикерам при желании, понетворкаться, покушать и т.д. Всё как на неформальных митапах)

Я буду участвовать в одном из подкастов.
Также будет ряд других интересных тем.

Трансляция будет вот здесь, а живое обсуждение - в чате DevsCamp в ТГ.

Подробности: https://news.1rj.ru/str/teamleadcampchat/2307

#meetup

618 viewsArtemiy Kzr, 15:31

Data Apps Design

Forwarded from DADADATA

Если кто был со мной на собесах разработчиков DWH, то знают, что я люблю задавать вопрос "знаете ли что такое dbt"? И пока никто из кандидатов не ответил "да")

А знать эту штуку хорошо бы, потому что она по сути реализует подход "DWH as a Code" в том смысле, что добавляет возможности работать со структурой DWH как с кодом обычного приложения. Появляется версионирование, генерация SQL, макросы, тестирование, управление зависимостями и т д. Правильность этого подхода демонстрирует то, что крупные компании, работающие с данными, пишут свои внутренние решения для генерации SQL (пример - Яндекс.Go).

Ниже запись митапа на эту тему от моего коллеги Артемия Козыря. Рекомендую к просмотру.

691 viewsArtemiy Kzr, 15:54

Data Apps Design

The world ain't all sunshine and rainbows. It's a very mean and nasty place.

Especially when you use

select *

When a base table changes, all the downstream dependencies might break down.
Please don't deploy such things to production.

⬇️⬇️⬇️

#bugs

649 viewsArtemiy Kzr, edited 10:15

Data Apps Design

Screenshot 2021-12-24 at 13.13.07.png

148.5 KB

Screenshot 2021-12-24 at 13.11.15.png

445.7 KB

737 viewsArtemiy Kzr, 10:15

Data Apps Design

AWS denounces its own error logs

Your post may include a non-inclusive word (master)

😭😂

610 viewsArtemiy Kzr, 06:42

Data Apps Design

Hey guys,.png

153.3 KB

rePost has detected your post may.png

36 KB

676 viewsArtemiy Kzr, 06:42

Data Apps Design

Hey, long time no see 🙂

We have just started our engagement with dbtLabs at Wheely.

Guys will try to conduct audit and help us improve our dbt deployment even further.

They have already access to:
– dbtCloud (jobs)
– Github repo (code)
– Redshift (database)
– Looker (bi + monitoring)
– Slack (communicating)

And yesterday was the Kick-off call. Overall great impressions.

What is going to happen:
– Audit: Deployment + Performance
– Audit: Project Structure
– Features/Fix's

I will keep you posted.

520 viewsArtemiy Kzr, 05:23

Data Apps Design

Airbyte Clickhouse destination

Airbyte deployed Clickhouse destination which I already use to gather data from multiple sources.

By default it replicates all the data as JSON blobs (all the attributes inside one String field)

To get it flattened you either have to do it yourself or use Airbyte normalization.

1. Flattening manually with JSON functions

JSONExtract(_airbyte_data, 'id', 'UInt64') as id

➕ Could be tricky and exhausting if you have a lot of attributes.

➖ Works extremely fast

2. Airbyte normalization (= dbt underneath 😉)

➕ It will flatten all your data automatically

Technically it is auto-generated dbt project

➖ Still a little bit buggy and looks like a work in progress.

I almost managed to get it done, but I use Yandex’ Managed Clickhouse which demands you use SSL / Secure connection.

Unfortunately, Airbyte’s dbt profiles.yml is hard-configured to secure: False at the moment.

I might create a PR to fix this when I have some time.

#airbyte #clickhouse #dbt

560 viewsArtemiy Kzr, 15:55

About

Blog

Apps

Platform