LEFT JOIN – Telegram
LEFT JOIN
45K subscribers
944 photos
28 videos
6 files
1.2K links
Понятно про анализ данных, технологии, нейросети и, конечно, SQL.

Услуги — leftjoin.ru
Курсы по аналитике — https://stepik.org/users/431992492

Автор — @valiotti
Реклама — @valiotti

Перечень РКН: https://tapthe.link/PpkTHavwS
Download Telegram
📊 Визуализация — важнейшая составляющая при использовании данных для принятий управленческих решений.
Несколько полезных ссылок, чтобы прокачать свои навыки в ней:
- Онлайн-книга Claus O. Wilke — Fundamentals of Data Visualisation
Довольно подробно разобраны do и don't в вопросе отображения данных
- Color for data visualization от Adobe Spectrum
Действительно рабочие палитры для графиков, правила применения для категориальных переменных.

#visualisation #links
Краткий отчет о Kazahstan Marketing Conference 2020, на которую был приглашен в качестве спикера.
Пост наполнен полезными материалами (моя презентация + шаблон технического задания на аналитику) 💥
Продолжаем изучать интерфейс Redash. Сегодня пост об использовании параметров инструмента 🎚.
Визуализация и отчеты всегда строятся на аналитической архитектуре. В сегодняшней заметке много технических деталей о Clickhouse и проблемах его подключения к Kafka Cluster на Amazon MSK.
Спойлер: все технические проблемы решены с большой помощью гуру Clickhouse. Как? Подробности в заметке 🔧
Февраль и март выдаются достаточно насыщенными месяцами: например, я участвую в школе наставников от Яндекс.Практикум по направлению данных, поэтому только сейчас восполняю пробел в постах.
Сегодня о когортном анализе в Redash.
Сегодня посмотрим, как выгруженные из Facebook данные по рекламным кампаниям передать в Redash, используя формат json и сервер на aiohttp.

http://leftjoin.ru/all/give-json-data-to-redash/
Смотрим, как арендовать бесплатную машину под управлением Ubuntu с Amazon Web Services и установить туда колоночную СУБД от Яндекса Clickhouse:

http://leftjoin.ru/all/stavim-clickhouse-na-aws/
В новом материале модернизируем наш скрипт, получающий данные рекламных кампаний с Facebook: теперь он будет отправлять их в Clickhouse и собирать в материализованное представление.

http://leftjoin.ru/all/materialized-view-in-clickhouse/
В далёком 2011 году для отчёта одной телеком-компании мы строили диаграмму «Градусник» — эта диаграмма показывает, насколько фактические данные соответствуют ожиданиям. Сегодня разберём, как построить такую диаграмму в Python при помощи библиотеки matplotlib.

http://leftjoin.ru/all/postroenie-diagrammy-gradusnik/
Интересовались когда-нибудь, сколько в месяц тратите на молочные продукты или на сладкое? К сожалению, в чеках категории товаров не указываются, а обрабатывать вручную еженедельные покупки — неудобно. В новом пятничном лонгриде обучим модель машинного обучения на Python, которая сама классифицирует товары на категории!

http://leftjoin.ru/all/stroim-model-predskazaniya-kategorii-produktov/
Перевели шпаргалку по оконным функциям от learnsql.com: вспоминаем их синтаксис, отличие от агрегатных функций, а также функции ранжирования, распределения и немного теории о рамках. За cheatsheet спасибо Telegram-каналу @dataeng!

http://leftjoin.ru/all/window-functions-cheatsheet/
Не всегда QR-сканер способен различить код на изображении. Разбираемся, как средствами библиотеки scikit-image провести предобработку изображения так, чтобы выделить на нём QR-код.

http://leftjoin.ru/all/obrabotka-izobrazheniya-s-chekom-dlya-poiska-qr-koda/
Сегодня научимся работать с API социальной сети Untappd, создавать внешние словари для Clickhouse и подключаться к AWS по SFTP:

http://leftjoin.ru/all/untappd-clickhouse-dictionaries/
В одном из прошлых материалов мы показали, как при помощи библиотеки matplotlib в Python построить диаграмму Градусник: сегодня разбираемся, как уже с библиотекой plotly сделать интерактивную диаграмму Водопад, которую затем можно будет встроить к себе на сайт.

http://leftjoin.ru/all/waterfall-chart/