NEW BOT Телеграм, страница

LEFT JOIN

Оцените по 10-балльной шкале насколько, на ваш взгляд, полученный в инструменте дашборд позволяет ответить на исходные вопросы в задаче?

Anonymous Poll

32%

18%

22 voters1.64K views10:32

LEFT JOIN

Оцените по 10-балльной шкале свой опыт использования данного дашборда (элементы управления, визуализация)?

Anonymous Poll

42%

17%

24 voters1.75K views10:32

LEFT JOIN

Команда dbt запустила собственный курс по изучению, как ни странно, dbt. Курс бесплатный.

Прошел этот курс, делюсь своими впечатлениями.
Курс классный, в нем много практики. Я использовал Google BigQuery и публичные датасеты от dbt для решения описанных примеров, а в обучающих материалах все построено на Snowflake.

В целом, узнал много нового и полезного о dbt, кратко summary:
* Во введении ребята объясняют роль Analytics Engineer, о котором так много разговоров и ссылаются на их пост блога
* Дается исчерпывающая информация о том, как подключить dbt к вашему хранилищу и .git
* В dbt довольно тривиальными запросами реализовано тестирование данных на предмет уникальности, соответстия значениям (это реально базовые SQL-запросы, которые проверяют наличие / отсутствия поля или значений)
И тут интересно следующее: когда пишешь самостоятельно похожие запросы иногда думаешь, что во всем остальном мире так никто не делает, ну, к примеру:

SELECT sum(amount) FROM ... HAVING sum(amount)>0

А оказывается еще как делают, вот даже публично внутри dbt все эти тесты так и реализованы.
И, кстати, крайне удобно, что SQL-код каждого теста можно изучить (скомпилировать)
* Круто и удобно формируется документация и DAG (directed acyclic graph), который показывает все шаги преобразований модели
* Поскольку dbt построен на Liquid и использовании Jinja (движок шаблонов в python), то можно делать всякие невероятные вещи вроде написания внутреннего макроса (читай, условный операторы, циклы или создание функций) и применять этот макрос для автоматизации однотипных частей запроса.
Это прям вау 🙂
* Многие вещи уже придуманы и разработаны коммьюнити, поэтому существует dbt hub, через который можно подключить интересующие пакеты и не изобретать велосипед.
* Отдельного упоминания достойны алгоритмы формирования инкрементального наполнения таблиц и создания снэпшотов. Для одного из проектов абсолютно такой же алгоритм по созданию снэпшотов с date_form / date_to мне доводилось проектировать самостоятельно.
Было приятно увидеть, что у ребят из dbt это работает абсолютно аналогичным образом.
* Разумеется, используя Jinja и dbt, можно автоматизировать построение аналитических запросов, это так и называется Analyses. Скомпилированный код запроса, можно имплементировать в любимую BI-систему и наслаждаться результатами.

Общие впечатления очень положительные: dbt ждет большое будущее и развитие, т.к. коммьюнити растет вместе с возможностями и ресурсами компании.
Ждем коннекторов к другим СУБД помимо PostgreSQL, BigQuery, Snowflake, Redshift.

4.35K views13:12

LEFT JOIN

В новом видео цикла гайдов по BI-системам поговорим о Redash. Это SQL-консоль, которую можно подключить к множеству различных источников данных, писать запросы и составлять по результатам отчёты-визуализации.

Посмотрите на полученный результат в материале блога и ответьте на два небольших вопроса.

YouTube

Как создать дашборд в Redash? | ЛУЧШИЙ Гайд по BI

✔️Получить гайд по BI-системам от команды LEFT JOIN: https://news.1rj.ru/str/leftjoin_helper_bot?start=YouTube-ApacheSuperset

В этом видео рассмотрим Redash: open source инструмент, представляющий собой SQL-консоль, который можно совершенно бесплатно развернуть у себя…

👍1

1.86K views10:40

Anonymous Poll

27 voters1.77K views10:40

LEFT JOIN

Оцените по 10-балльной шкале свой опыт использования данного дашборда (элементы управления, визуализация)?

Anonymous Poll

38%

13%

24 voters1.96K views10:41

LEFT JOIN

Бытует мнение, что аналитик в наше время может обойтись без уверенной математической базы (об этом гласят многие программы подготовки аналитиков). С моей же точки зрения тяжело рассуждать о вероятности оттока, не понимая теории вероятностей, сложно говорить о медиане и нормальности распределения, не зная математическую статистику, и точно не рассчитать градиент функции, не понимая математического анализа: список можно продолжать долго.

Но есть спасение — море бесплатных курсов от ведущих американских вузов! Собрал подборку по всему курсу математики и приложил дополнительный курс по R для анализа данных. Внутри курсы от Harvard, MIT и Georgia Tech. Даже если вы, как и я, уже изучили всё это 15 лет назад — повторение пройденного материала крайне полезно.

https://leftjoin.ru/all/free-education-for-analysts/

leftjoin.ru

Бесплатные курсы математики для аналитиков и инженеров данных

2.67K views10:55

LEFT JOIN

Конференция Coalesce от dbt: что посмотреть?

С 7 по 11 декабря проходила конференция Coalesce, о которой я рассказывал ранее. В этом году все организаторы решили проводить конференции по 5 дней с кучей докладов.
С одной стороны это плюс — ощущение, что информации много и можно выбрать, что интересно. С другой стороны такое количество информации несколько изматывает, потому что часто по названию доклада не очень понятно насколько он окажется полезным и интересным. Мне все же кажется, что более трех дней для конференции это много, т.к. интерес аудитории теряется, да и необходимость заниматься своими личными и профессиональными делами не может испариться из-за события, которое хоть и в онлайне, но занимает твое внимание.

Однако мне удалось посмотреть большую часть докладов, кое-что пролистывая. Для начала коротко в целом о впечатлениях: очень круто изучать доклады с подобной конференции как Coalesce, потому что речь идет в основном о современных инструментах и облачных решениях. Почти в каждом докладе можно услышать про Redshift / BigQuery / Snowflake, а с точки зрения BI: Mode / Tableau / Looker / Metabase. В центре всего, разумеется, dbt.

Мой шорт-лист докладов, которые рекомендую изучить:

* dbt 101 — вводный доклад и интро в то, что такое dbt и как его используют
* Kimball in the context of the modern data warehouse: what's worth keeping, and what's not — интересный и очень-очень спорный доклад, который вызвал массу вопросов в slack dbt. В кратце, автор предлагает перейти на "широкие" аналитические таблицы и отказаться от нормальных форм всюду.
* Building a robust data pipeline with dbt, Airflow, and Great Expectations — в докладе про небезынтересный инструмент greatexpectations, суть которого в валидации данных
* Orchestrating dbt with Dagster — мне было несколько скучновато слушать, но если хочется познакомиться с Dagster - самое то
* Supercharging your data team — ребята сделали обертку к dbt, назвали dbt executor 9000 и рассказывают о нем
* Presenting: SQLFluff — про очень классную штуку SQLFluff, которая автоматически редактирует SQL-код согласно канонам
* Quickstart your analytics with Fivetran dbt packages— из доклада можно узнать, что такое Fivetran и как его используют совместно с dbt
* Perfect complements: Using dbt with Looker for effective data governance — про взаимодействие dbt и looker, про различия и схожие части инструментов

@leftjoin

👍1

8.63K viewsedited 09:56

LEFT JOIN

И книжка, действительно, очень хорошая, рекомендую.

1.41K views06:00

LEFT JOIN

Forwarded from Инжиниринг Данных (Dmitry Anoshin)

Самое сложно при построении аналитического решения, это не построить решение, а сделать так, чтобы его использовали. Можно наделать много дашбордов, моделей и витрин данных, но никто не будет их использовать.

Когда мы, что-то строим, мы думаем - “какая полезная информация, как она будет полезна бизнесу”. Но это лишь у нас в голове. Это называется bias, мы рисуем оптимистичную картинку. Но я не про bias, сейчас, хотя считаю, что знание типо bias и вообще, что это такое, это очень важно. Про это хорошо написано в книге “Думай медленно, решай быстро”.

Пост, про необходимость использовании метаданных о данных или по простому - Data /Bi/Analytics portal. То есть это место, куда может зайти бизнес пользователь, и ввести в поисковой строке название показателя или измерения и найти, нужный отчет или таблицу + логику трансформаций. А если в компании (крупной) используются многие решения, то нужно сделать универсальный портал, а это уже как отдельный проект. Самый главный критерий здесь - это избежать ручной работы - Copy Paste. Так как все очень быстро устаревает.

В комментариях люди могут поделиться про свои успешные или неуспешные кейсы.

А вот от взрослых компаний:
Democratizing Data at Airbnb
Metacat: Making Big Data Discoverable and Meaningful at Netflix
Databook: Turning Big Data into Knowledge with Metadata at Uber
Turning Metadata Into Insights with Databook
DataHub: Popular metadata architectures explained
The journey of metadata at PayPal
Nemo: Data discovery at Facebook

1.37K views06:00

LEFT JOIN

Forwarded from Reveal the Data

This media is not supported in your browser

VIEW IN TELEGRAM

Вышла новая версия Табло 2020.4 🎉
Много новых фич. Для меня самые важные такие:

Multiple marks layer support for maps
Будет можно выводить множество слоев на карты с разными типами объектов. Табло становится серьёзным конкурентом по гео-аналитике. В купе с гео-функциями, что выходили пару релизов назад, должна быть бомба. Ещё это открывает огромную возможность для костылей и накладывания графиков друг на друга. =)

Custom views tab
На сервере будет можно более удобно смотреть список сохранённых вью для отчета. Ура! Надеюсь, будет ещё какая-то аналитика когда эти вью ломаются при изменении книги.

Dynamic parameter improvements
Более тонкие настройки динамических параметров — можно будет настроить ограничения для значений, которые записываются в параметр при открытии книги.

#ссылка

1.45K views09:05

LEFT JOIN

В новом видео по BI-системам говорим о дашборде, построенном в Google DataStudio: как подключить к дашборду датасорс из гугл-таблиц или из других источников, добавить новые фактоиды и настроить данные и визуализации.

Посмотрите на полученный результат, на оценки нашей команды в материале блога и ответьте на два небольших вопроса.

YouTube

Обзор дашборда в Gooogle DataStudio | Гайд по BI

✔️Получить гайд по BI-системам от команды LEFT JOIN: https://news.1rj.ru/str/leftjoin_helper_bot?start=YouTube-ApacheSuperset

Обзор дашборда, созданного в Google DataStudio на основе датасета Superstore.

Автор дашборда: Регина Шайдуллина, Аналитик LEFT JOIN

Полезные…

4.3K views10:45

Anonymous Poll

21 voters1.64K views10:45

LEFT JOIN

Оцените по 10-балльной шкале свой опыт использования данного дашборда (элементы управления, визуализация)?

Anonymous Poll

44%

12%

16%

25 voters1.79K views10:45

LEFT JOIN

Действительно классный туториал и интересный канал

1.61K views09:55

LEFT JOIN

Forwarded from Reveal the Data

Наташа Степанова, канал — @visualize_it, начала писать туториалы по библиотеке d3.js. Это отличная инициатива — хороших материалов по d3 на русском очень мало. Туториалы подойдут для тех кто знает основы html, css и js, но не работал с библиотекой и хочет не просто «копировать кусочки кода», а более глубоко разобраться как работает d3.

#ссылка

Визуализируй это!

Привет, я Наташа (@gnykka) и это мой канал про программирование визуализаций данных и не только.
———
🕸️ slaylines.io | gnykka.io

1.79K views09:55

LEFT JOIN

В рекламном кабинете ВКонтакте при публикации объявления есть функция автоматического подбора целевой аудитории, но можно пойти и другим путём –– загрузить файл с идентификаторами конкретных людей, которым нужно показать рекламу. В новом материале рассказываем, как написать парсер участников сообществ конкурентов для VK API и загрузить полученную аудиторию в рекламный кабинет.

Мы попробовали запускать объявления обоими способами: бонусом в конце материала сравниваем результаты и отвечаем на вопрос, какой метод подбора аудитории оказался выгоднее.

5.34K viewsedited 11:00

LEFT JOIN

Периодически рассказываю о новых каналах, которые меня заинтересовывают, сегодня хочу порекомендовать канал @R4marketing.
Автор канала — Алексей Селезнёв, руководитель отдела аналитики в Netpeak.

Ранее большую часть анализа данных я делал на языке R и буквально пару лет назад перешел на Python, однако R - очень важный язык программирования для анализа данных. И канал Алексея как раз посвящен зыку R. На данный момент там собрано огромное количество русскоязычных материалов по изучения R:
- Статьи
- Видео уроки
- Вебинары и доклады с конференций
- Заметки по R
- Книги
- Новости и релизы из мира R

В канале опубликовано более 450 ссылок на русскоязычные материалы по R.

Если вам интересна и актуальна тема языка R, обязательно подписывайтесь!

1.79K views12:00

LEFT JOIN

Любопытный способ работы в Excel. А я на следующей неделе расскажу, как собирал дашборд в Excel на основе Superset без какого-либо Python и даже почти без макросов 🙂

1.64K views10:04

LEFT JOIN

Forwarded from Я у мамы аналитик (Stas Valuev)

Пропусти я такую новость - плакал бы потом горькими слезами.

Ребятки запилили Jupiter Notebook в Excel'ке. Действительно, зачем выбирать между Python и аналитикой в уютных таблицах (не будем никому рассказывать, что есть еще BI), давайте "замочим" VBA и совместим все в один инструмент (а что, а вдруг).

Если серьёзно, это, конечно, на грани добра и зла, но может стать подспорьем для тех, кто только начинает переходить на сторону питона. Можно даже придумать пару боевых кейсов, когда может потребоваться экспорт графиков из ноутбука на лист Excel - для редких визуализаций или прогнозирования, к примеру (если вкусы весьма специфичны).

🔗 Ссылка

PyXLL

Python Jupyter Notebooks in Excel

Use Python Jupyter Notebooks right in Excel. Python Excel integration with Jupyter is a massive leap forwards for data analysis, modelling and dashboards.

1.58K views10:04

LEFT JOIN

Для прохождения сертификации Tableau Desktop Associate я наткнулся на курсы elearning от Tableau. А получив сертификацию, подумал — какие программы обучения предлагают другие BI-инструменты?

Так как первым делом мне под руку попались обучающие гайды по PowerBI, в новом материале хочу поделиться собственным опытом сравнения программ обучения Tableau и PowerBI: какие отличия в оформлении и структуре материалов, какой дизайн отчётов получается в гайдах обоих систем и как проверяются полученные знания.

Читайте результаты сравнения в новом материале блога.

leftjoin.ru

Сравнение программ обучения Tableau и PowerBI

2.1K views11:31

About

Blog

Apps

Platform