LEFT JOIN – Telegram
LEFT JOIN
45K subscribers
944 photos
28 videos
6 files
1.2K links
Понятно про анализ данных, технологии, нейросети и, конечно, SQL.

Услуги — leftjoin.ru
Курсы по аналитике — https://stepik.org/users/431992492

Автор — @valiotti
Реклама — @valiotti

Перечень РКН: https://tapthe.link/PpkTHavwS
Download Telegram
А о том, как правильно пользоваться данными и принимать верные решения лучше всего узнавать от профессионалов своего дела. Ранее я уже писал о Матемаркетинге, но повторю для тех, кто пропустил.

В этом году Матемаркетинг-2020 это огромное количество крутых спикеров, которые в рамках паралелльных сессий за 4 дня выдадут максимум полезного контента.
Мне посчастливилось стать одним из поставщиков такого контента: буду рассказывать о современном облачном data стэке и о сравнении дашбордов в разных BI-инструментах.

Ребята сделали крутую LMS, на которой уже сейчас доступен прошлогодний контент и появится контент этого года, доступ в чаты и прочие приятности.

Рекомендую прямо сейчас купить билет, если вы еще не сделали, так как Матемаркетинг начнется 9го ноября (завтра!) и продлится до 13го ноября.

У подписчиков LEFT JOIN эксклюзивная скидка 15% по промокоду VALIOTTI.
👍1
Интересная статья о планируемых нововведениях в Google Analytics 4 и переходе на event-based data model: https://ken-williams.com/guide/what-is-google-analytics-4/
В последнем видео был обзор дашборда на Tableau, а сегодня нам помог и записал видео главный разработчик QlikSense в компании «Евроцемент груп» Алексей Гриненко — публикуем новую часть гайда по BI-системам: обзор дашборда на QlikSense.

Как и в прошлый раз, мы просим вас ознакомиться с результатом, приведённым в материале блога и ответить на два небольших вопроса.
Оцените по 10-балльной шкале насколько, на ваш взгляд, полученный в инструменте дашборд позволяет ответить на исходные вопросы в задаче?
Anonymous Poll
16%
1
5%
2
3%
3
5%
4
11%
5
3%
6
5%
7
16%
8
11%
9
26%
10
Оцените по 10-балльной шкале свой опыт использования данного дашборда (элементы управления, визуализация)?
Anonymous Poll
23%
1
5%
2
10%
3
5%
4
3%
5
13%
6
10%
7
8%
8
3%
9
21%
10
📌Ключевые темы сегодняшнего дня:

Алексей Чернобровов - Как архитектура DWH влияет на Data Quality

Петр Ермаков, Lamoda - Open Source BI: почему стоит выбрать Apache Superset

Сергей Галактионов, JetStat - Как маркетологу настроить и автоматизировать отчетность когда нет аналитика

Николай Валиотти, Valiotti Analytics - Современный облачный Data Stack

Роман Бунин, Яндекс.Go - Развитие BI-системы компании с помощью продуктовых подходов

Екатерина Колпакова, Head of DWH Ситимобил - Хочешь построить DWH? Спроси меня как!

Яна Манухина и Алексей Ростоцкий, Bookmate - Как устроить архитектуру DWH и контролировать изменения в ней

Начало в 11:00

FREE: matemarketing.ru

FULL: https://lms.matemarketing.ru

@internetanalytics
Классный инструмент для примеривания цветовой гаммы диаграммы. Думаю, можно использовать и не только для D3.js 🙂
Forwarded from 🗞 Виз Ньюз
This media is not supported in your browser
VIEW IN TELEGRAM
Инструмент, который поможет правильно выбрать и настроить scale в D3 для вашего датасета.

https://martingonzalez.net/mr-scale-maker/
Опубликован список докладов конференции Coalesce (да-да, от тех самых создателей dbt, которые недавно вновь привлекли инвестиции).

Самое время зарегистрироваться и добавить интересующие доклады в свой календарь.

Среди наименований встречаются интересные вещи типа: «Cleaning the fish: A sushi-inspired approach to clean datasets» 🍣🧹📁
Оцените по 10-балльной шкале насколько, на ваш взгляд, полученный в инструменте дашборд позволяет ответить на исходные вопросы в задаче?
Anonymous Poll
16%
1
7%
2
5%
3
2%
4
5%
5
7%
6
9%
7
16%
8
0%
9
33%
10
Оцените по 10-балльной шкале свой опыт использования данного дашборда (элементы управления, визуализация)?
Anonymous Poll
24%
1
5%
2
3%
3
5%
4
5%
5
13%
6
5%
7
16%
8
8%
9
16%
10
Рома записал классный выпуск лайфхаков, в котором рассказывает как сделать удобную легенду, которая адаптируется в размерах, рекомендую.

Вдогонку, таким же способом можно организовать фильтрацию дашборда в целом (на видео сейчас используется привычный хайлайт на графике).
Forwarded from Reveal the Data
Подготовил новый выпуск «Лайфхаков в Табло».

0:00 — Как сделать удобную цветовую легенду
3:00 — Как подписать точки на графике по условию
7:12 — Как избежать проблем при работе с Табло на Windows

⚠️ Про последний пункт даже написал заметку. Он очень важен для тех, кто работает с Windows и с размером шрифта в системе больше 100%.

#лайфхаки
Внутри сервиса Тинькофф Инвестиции расположилась целая социальная сеть инвесторов «Пульс», где люди делятся своими прогнозами, мыслями и планами. В материале рассказываем, как спарсить частотный словарь и построить биграммы по постам пользователей, разделив их по объёму инвестиционного портфеля.

https://leftjoin.ru/all/tinkoff-pulse-frequency-dict/
Оцените по 10-балльной шкале насколько, на ваш взгляд, полученный в инструменте дашборд позволяет ответить на исходные вопросы в задаче?
Anonymous Poll
32%
1
9%
2
9%
3
0%
4
9%
5
5%
6
18%
7
0%
8
9%
9
9%
10
Оцените по 10-балльной шкале свой опыт использования данного дашборда (элементы управления, визуализация)?
Anonymous Poll
42%
1
0%
2
8%
3
0%
4
17%
5
8%
6
8%
7
4%
8
4%
9
8%
10
LEFT JOIN
Команда dbt запустила собственный курс по изучению, как ни странно, dbt. Курс бесплатный.
Прошел этот курс, делюсь своими впечатлениями.
Курс классный, в нем много практики. Я использовал Google BigQuery и публичные датасеты от dbt для решения описанных примеров, а в обучающих материалах все построено на Snowflake.

В целом, узнал много нового и полезного о dbt, кратко summary:
* Во введении ребята объясняют роль Analytics Engineer, о котором так много разговоров и ссылаются на их пост блога
* Дается исчерпывающая информация о том, как подключить dbt к вашему хранилищу и .git
* В dbt довольно тривиальными запросами реализовано тестирование данных на предмет уникальности, соответстия значениям (это реально базовые SQL-запросы, которые проверяют наличие / отсутствия поля или значений)
И тут интересно следующее: когда пишешь самостоятельно похожие запросы иногда думаешь, что во всем остальном мире так никто не делает, ну, к примеру:
SELECT sum(amount) FROM ... HAVING sum(amount)>0

А оказывается еще как делают, вот даже публично внутри dbt все эти тесты так и реализованы.
И, кстати, крайне удобно, что SQL-код каждого теста можно изучить (скомпилировать)
* Круто и удобно формируется документация и DAG (directed acyclic graph), который показывает все шаги преобразований модели
* Поскольку dbt построен на Liquid и использовании Jinja (движок шаблонов в python), то можно делать всякие невероятные вещи вроде написания внутреннего макроса (читай, условный операторы, циклы или создание функций) и применять этот макрос для автоматизации однотипных частей запроса.
Это прям вау 🙂
* Многие вещи уже придуманы и разработаны коммьюнити, поэтому существует dbt hub, через который можно подключить интересующие пакеты и не изобретать велосипед.
* Отдельного упоминания достойны алгоритмы формирования инкрементального наполнения таблиц и создания снэпшотов. Для одного из проектов абсолютно такой же алгоритм по созданию снэпшотов с date_form / date_to мне доводилось проектировать самостоятельно.
Было приятно увидеть, что у ребят из dbt это работает абсолютно аналогичным образом.
* Разумеется, используя Jinja и dbt, можно автоматизировать построение аналитических запросов, это так и называется Analyses. Скомпилированный код запроса, можно имплементировать в любимую BI-систему и наслаждаться результатами.

Общие впечатления очень положительные: dbt ждет большое будущее и развитие, т.к. коммьюнити растет вместе с возможностями и ресурсами компании.
Ждем коннекторов к другим СУБД помимо PostgreSQL, BigQuery, Snowflake, Redshift.
В новом видео цикла гайдов по BI-системам поговорим о Redash. Это SQL-консоль, которую можно подключить к множеству различных источников данных, писать запросы и составлять по результатам отчёты-визуализации.

Посмотрите на полученный результат в материале блога и ответьте на два небольших вопроса.
👍1