LEFT JOIN – Telegram
LEFT JOIN
45K subscribers
944 photos
28 videos
6 files
1.2K links
Понятно про анализ данных, технологии, нейросети и, конечно, SQL.

Услуги — leftjoin.ru
Курсы по аналитике — https://stepik.org/users/431992492

Автор — @valiotti
Реклама — @valiotti

Перечень РКН: https://tapthe.link/PpkTHavwS
Download Telegram
Если вдруг когда-то хотели подучить регулярные выражения, RegexOne отлично с этим поможет.
👍1
Иногда возникает необходимость потренироваться на каком-нибудь датасете, на этот случай в интернете имеется библиотека датасетов упакованных в SQLite базы данных.
Кайфовый интерактивный датавиз про популярность Байдена на выборах (а ранее Трампа и других президентов)

#link
Про Looker ранее я уже писал несколько раз, а вот есть Lightdash — opensource версия Looker (github), которая использует dbt в основе.

Краткое описание от создателей:
Lightdash removes the gap between your data transformation layer and your data visualization layer. It enables data analysts and engineers to control all of their business intelligence (data transformations/business logic as well as data visualization) in a single place.

Lightdash integrates with your dbt project and gives a framework for defining metrics and specifying joins between models all within your existing dbt YAML files. The data output from your dbt project is then available for exploring and sharing in Lightdash.


Есть доступная онлайн демка. Можно установить на свой хост через Docker.

Визуально это выглядит пока не восторг, но функционально, кажется, большую часть удалось воссоздать.
Когда-то давно на первом и втором курсе мы изучали пакет Wolfram Research Mathematica. В рамках курса мы писали алгоритмы, работали со структурами данных, считали перестановки и так далее. Отличным сопровждением была книга от моих преподавателей Mathematica для нематематика, это совершенно потрясающее чтиво для тех, кто интересуется компьютерной алгеброй.

И несмотря на то, что сама Mathematica, возможно, уже не так актуальна, книга от докторов наук Вавилова Н.А., Халина В.Г. и Юркова А.В. была совершенно бесплатно издана онлайн, и я всячески ее рекомендую к прочтению, всем кто интересуется темой. 📔
Шикарная погода в Санкт-Петербурге ☀️, летняя сессия в Georgia Tech 👨‍🎓и активные трудовые будни 🧑‍🏭 не позволяли публиковать материалы в последнее время, но исправляю эту оплошность.

Спешу познакомить вас с нашим новым трудом, опубликованным в Tableau Public: дашборд с анализом семи альбомов Земфиры. Это продолжение нашего предыдущего материала про анализ текстов альбома "бордерлайн", но без технических деталей, а с интерактивноcтью Tableau.
Классный ресурс от Victor Powell, в котором визуально и понятно объяснены такие темы как PCA, цепи Маркова, OLS Regression, собственные числа и вектора, условные вероятности.

#viz
Подборки каналов
Никак не доберусь до составления собственного списка, поэтому по просьбе ребят из @it_resume делюсь подборкой авторских телеграмм-каналов для аналитиков. В подборке 20 каналов: про анализ данных, программирование, data engineering, data science и так далее. На большинство каналов подписан лично, поэтому согласен и могу рекомендовать 🙂
Детали в посте на хабре.
Рома записал отличный полезный выпуск лайфхаков в Табло
Forwarded from Reveal the Data
Записал новый выпуск «Лайфхаков в Табло». Этот выпуск пока самый долгий из всех благодаря последнему пункту, который скорее относится к костылям и находится на грани добра и зла. Если что, я вас плохому не учил. 😈

0:00 — Пагинация в таблице
4:45 — Сравнение метрики по разрезам
11:23 — Кастомная подсветка строк в таблице

Ещё я веду реестр лайфхаков, чтобы не терялись и было проще искать. Пока только свои, но хотелось бы сделать отдельно и сборную библиотеку из интернета. Если кто-то хочет помочь поискать лайфхаки на просторах и сделать для них короткие описания с таймингами — приходите. Сами научитесь, поможете другим и будет что положить в портфолио.
#лайфхаки
Из учебного: в этом семестре взял курс CSE 6040, который про алгоритмы анализа данных на Python, курс очень круто подготовлен, обязательно поделюсь более детально.
Иногда просто потрясают датасеты и кейсы внутри. Вот, например, один из них для построения линейной регрессии:
In 1968, Wagner Agahajanian, and Bing conducted a study to determine whether you could improve a student's math test scores using lysergic acid diethylamide, also known as "LSD." (raw data, data file denoscription)
👍1
Актуальная вещь в духе недавно выпущенного Github Copilot.
This media is not supported in your browser
VIEW IN TELEGRAM
Искуственный интеллект (модель машинного обучения) переводит просьбы на английском языке в питон-код для обработки и представления данных.

Срочно нужен такой же для перевода с русского на 1С.

https://github.com/deepklarity/jupyter-text2code
Возвращаем рубрику гайдов по BI-инструментам!

Всем известно, что наш любимый инструмент для визуализации данных на Python – plotly. Наши исследования подкрепляют диаграммы, сделанные при помощи этой библиотеки, а в блоге неоднократно выходили материалы об интересных визуализациях, которые можно реализовать вместе с plotly: анимированных Motion Chart, Waterfall Chart, Map Chart на российской карте и другие.

Но диаграммы plotly можно объединять в целые дашборды – для этого компания выпустила специальный инструмент Dash, о котором мы подробно рассказываем в новом видео цикла гайдов по BI-системам.

Посмотрите на полученный результат в материале блога и ответьте на два небольших вопроса.

Все наши материалы о plotly.

Автор дашборда, член команды Valiotti Analytics — Елизавета Мазурова
Оцените по 10-балльной шкале насколько, на ваш взгляд, полученный в инструменте дашборд позволяет ответить на исходные вопросы в задаче?
Anonymous Poll
22%
1
3%
2
3%
3
8%
4
14%
5
3%
6
3%
7
8%
8
24%
9
14%
10
Оцените по 10-балльной шкале свой опыт использования данного дашборда (элементы управления, визуализация)?
Anonymous Poll
26%
1
0%
2
9%
3
6%
4
20%
5
0%
6
9%
7
11%
8
9%
9
11%
10