NEW BOT Телеграм, страница

LEFT JOIN

Вместо итогов года

Очень скоро настанет момент, когда салат Оливье уже не лезет, все выпуски ЧБД пересмотрены, Дудь надоел, пить не хочется и вот эти все комедии по ТВ дико утомили. Есть предложение! Го учиться и развиваться в 2021ом году?

📺 ЧТО ПОСМОТРЕТЬ?
Моя небольшая подборка профессионального контента из нашего аналитического коммьюнити, которое рекомендую посмотреть на новогодних каникулах:
• Интервью Толи Карпова, реально классный контент с интересными людьми из рынка
• Видеоподкасты Ромы Бунина, эксперты рынка разговаривают о визуализации данных, об аналитике
• Бесплатный видеокурс DataLearn Димы Аношина, зачастую встречаются интересные темы и эксперты рынка, да и сам Дима в формате модулей рассказывает довольно много об инжиниринге данных и об инструментах
• Записи с Матемаркетинга — постепенно появляется контент 2020го года, а также доступен более старый контент
• Рома Нестер, с которым мы достаточно давно знакомы еще по Юлмарту, берет интервью у экспертов индустрии в рамках магистерской программы ВШЭ
• Наш YouTube-канал LEFTJOIN, в рамках которого обозреваем сейчас BI-инструменты

🇺🇸 Если все хорошо с английским, то можно еще изучить:
◦ Видео с конференции FutureData, рассказывал о ней в отдельном посте блога
◦ Записи с недавней конференции Coalesce о dbt, о которой писал отдельный пост с саммари
◦ В конце концов, я писал отдельный пост на тему бесплатного англоязычного фундаментального образования.

🎧 ЧТО ПОСЛУШАТЬ?
Если смотреть не хочется, но хочется послушать, то:
• Аудиоверсии видеоподкастов Ромы Бунина
• Подкаст про технологии «Запуск завтра»
• Подкаст от Geekbrains «Выхожу с понедельника» — несколько раз натыкался на этот подкаст, но, к сожалению, прослушать еще не успел, поэтому не знаю можно ли рекомендовать 🤷‍♂️

🇺🇸 Если хочется послушать на английском языке, то:
◦ Data Engineering podcast
◦ Digital Analytics Powerhour

@leftjoin

YouTube

Интервью

Share your videos with friends, family, and the world

3.27K viewsedited 10:59

LEFT JOIN

Что делать, если в датасете понадобилось трансформировать данные в реляционный вид, но он построен на Custom SQL Query из базы данных, у которой в арсенале нет подходящей функции, а конструкций с множеством UNION ALL и повторяющимися подзапросами хочется избежать? Делимся в новом материале найденным рецептом, который делает UNPIVOT данных при помощи CROSS JOIN:

https://leftjoin.ru/all/unpivot-with-cross-join/

leftjoin.ru

UNPIVOT данных с использованием CROSS JOIN

3.07K views13:38

LEFT JOIN

Статья про то, как управлять временем, работая удаленно. Как находить время на свою семью, хобби, и полезные дела, как организовать свой день, используя простейшее приложение Календарь.
В целом, все довольно известно, но актуально напомнить себе о такой опции.

About Time

Time Awareness or How I Found Time for Life While Working Remotely

Since the last March, like a lot of other people, I was forced to work remotely. It was not the first time, but somehow it went different. I quickly found out that not having a context switch between the office and home forced me into non-healthy behaviors…

3.21K views08:00

LEFT JOIN

В прошлом году я делал подборку хороших бесплатных курсов фундаментального математического образования доступного бесплатно и онлайн (на английском языке).

А вчера наткнулся на очень интересную подборку полной программы бесплатного образования в Computer Science. Программа разбита на годы и семестры и состоит из видео и плейлистов на Youtube.

LEFT JOIN

Бытует мнение, что аналитик в наше время может обойтись без уверенной математической базы (об этом гласят многие программы подготовки аналитиков). С моей же точки зрения тяжело рассуждать о вероятности оттока, не понимая теории вероятностей, сложно говорить…

4.74K views06:54

LEFT JOIN

Диаграмма в виде воронки позволяет визуализировать достижение целей по ряду этапов: например, конверсию пользователей. В новом материале блога рассказываем, как построить такую воронку в Tableau:

https://leftjoin.ru/all/funnel-chart-v-tableau/

LEFT JOIN

Funnel chart в Tableau

Диаграмма в виде воронки — хороший выбор визуализации, если стоит задача отобразить достижение целей по ряду этапов. Сегодня мы посмотрим, как получить такую диаграмму в Tableau. Таблица из примера доступна в нашем репозитории на GitHub Данные должны быть…

5.15K views14:00

LEFT JOIN

Запись моего первого выступления на Матемаркетинг в прошлом году (всего выступлений было два)

2.59K views11:11

LEFT JOIN

Forwarded from Интернет-аналитика // Алексей Никушин

Какой он - современный облачный data-стек?

Николай Валиотти ( @leftjoin) объясняет подход к проектированию аналитической инфраструктуры, обосновывает использование Clickhouse при построении облачной аналитики и рассказывает о его же нюансах и говорит про Redash с точки зрения инструмента для визуализации.

Смотреть видео - YouTube, ~20 минут

@internetanalytics

YouTube

Николай Валиотти, Valiotti Analytics - Облачный datastack

Совсем скоро Матемаркетинг-22, 17-18 ноября
Подробности: https://matemarketing.ru/
Программа: https://clck.ru/y6jEV
Купить билет: https://matemarketing.ru/

Доклад Николая Валиотти на конференции "Матемаркетинг-2020".
Полный доступ ко всем докладам: http…

2.56K views11:11

LEFT JOIN

На днях Денис Соловьев (@ds_im) из канала Smart Data взял мини-интервью о том, чем и как занимается наша компания, какие роли в нашей команде. Рассказываю об этом Денису и его подписчикам в соответствующем посте (ниже сделаю репост).

А вообще у Дениса аж три мини-интервью получилось сразу, поэтому можно их все и прочитать.

Smart Data

Канал про Data Engineering, аналитику и данные.

По всем вопросам: @ds_im

2.57K views17:23

LEFT JOIN

Вот тут рассказываю:

2.54K views17:23

LEFT JOIN

Forwarded from Smart Data (Denis Solovyov)

Николай Валиотти:
"В основном мы работаем с различными digital и мобильными стартапами, помогаем им выстроить end-to-end аналитику.
Другими словами, мы работаем со спектром задач от проектирования хранилища / озера данных, построения процессов инжиниринга данных до построения отчетности и иногда даже некоторых моделей машинного обучения.
Персонально я успел поработать в ряде крупных организаций и занимался анализом данных с разнообразным стеком решений, однако в последние годы перед стартом своей компании работал в стартапе, который уже тогда начал работать с так называемым modern data stack. Меня это невероятно увлекло и вдохновило на то, чтобы и другие компании могли компетентно использовать современные облачные решения и получать максимальную пользу от собственных данных.
Мы в некотором смысле стартап (по духу), хотя, конечно, больше развиваемся как традиционная консалтинговая компания. У нас небольшой штат сотрудников и соответствующих ролей, о которых речь пойдет дальше.
Поскольку работаем параллельно с несколькими проектами одновременно бОльшая часть команд кросс-функциональна, что означает, что в каждом проекте есть выделенный сотрудник, который лидирует по проекту, а другие коллеги функционально помогают ему в достижении поставленной цели.

Среди наших сотрудников имеются:
Data Engineer - работы с построением архитектуры хранилища, среди инструментов Kafka, Airflow, среди СУБД: BigQuery, Redshift, Clickhouse, Redshift, Vertica, MySQL, разумеется, SQL и Pythoh.
Analytics Engineer - работы с инструментов dbt, построение моделей данных в Looker, работа с Python для обработки данных, естественно, SQL
2x Data Analyst - мы используем ряд инструментов в зависимости от потребностей и возможностей заказчика: Tableau, Looker, Redash, PowerBI и Metabase, ребята умеют работать в этих инструментах и естественно используют SQL. Ряд задач, например, построение классификационных моделей мы строим с использованием Python, используем Jupyter, в некоторых случаях Collab.
2x Junior Data Analyst - помогают более старшим аналитикам и решают более маленькие кусочки задач с тем же стеком технологий.

В будущем планирую выстраивать организационную структуру, поскольку найм сотрудников горизонтально все-таки невозможен бесконечно и система из более 7 человек будет работать неэффективно"

3.1K views17:23

LEFT JOIN

Интересный тул для любителей PowerBI

2.72K views10:35

LEFT JOIN

Forwarded from Дашбордец

В рамках задач self-service возможности Tableau, на мой субъективный взгляд, выше Power BI, но ненадолго. Charticulator позволяет создавать практически любой шаблон диаграммы, который затем можно импортировать в PowerBI.
https://charticulator.com/
Видеоуроки:
https://charticulator.com/docs/video-tutorials.html
Практический пример:
https://youtu.be/xS6GyVpt7lY

2.85K views10:35

LEFT JOIN

Интересное комбо в статье по ссылке: построение моделей машинного обучения на движке BigQuery с использованием dbt

2.9K views10:20

LEFT JOIN

Forwarded from BigQuery Insights

Пошаговое руководство запуска моделей машинного обучения в dbt и BigQuery ML без проблем, связанных с управлением инфраструктурой.

@BigQuery

2.97K views10:20

LEFT JOIN

Как-то раз на YouTube мы нашли гайд по Radial Pie Gauge Chart в Tableau. Нам он очень понравился — диаграмма сильно напоминает кольца активности Apple Watch. Но по задумке автора кольца графика останавливаются на 270 градусах, а все цели сравниваются только между собой. Мы доработали график — показываем, как сделать масимально приближенную к кольцам активности реализацию в Tableau:

https://leftjoin.ru/all/radial-pie-v-tableau/

leftjoin.ru

Radial pie в Tableau

5.24K views15:27

LEFT JOIN

Среди резюме иногда можно встретить совершенно любопытные названия должностей у кандидатов. Вот, например, интересный образец.

2.6K views13:43

LEFT JOIN

Недавно мы завели аккаунт в Instagram (подпишитесь!). В новом материале расскажем о том, как с использованием Python и Selenium можно автоматизировать часть действий в социальной сети.

Что с этим делать — на усмотрение читателя. Решения для масслайкинга и массфоловинга решили не описывать в силу их сомнительной легитимности и эффективности.

https://leftjoin.ru/all/instagram-python-selenium-bot/

leftjoin.ru

Робот для автоматизированного просмотра Instagram на Python и Selenium

2.58K views08:00

LEFT JOIN

Один из самых популярных и известных алгоритмов кластеризации — k-means, его знает каждый, кто хоть как-то начинал работу с методами машинного обучения.
Совершенно понятно, что про k-means уже написано огромное количество материалов, что на R, что на Python, но мне попалась интересная ссылка-визуализация того, как работает алгоритм.

Если только начинаете знакомиться, то можно довольно быстро понять принцип обновления центроидов в кластерах.

2.72K views10:28

LEFT JOIN

Из поста особенно понравилась табличка сравнения (отправлю ниже). Но, кажется, что ошиблись c Redash и not query centric.

2.29K views09:32

LEFT JOIN

Forwarded from DataEng

Кейс Dropbox по использованию Apache Superset: https://dropbox.tech/application/why-we-chose-apache-superset-as-our-data-exploration-platform

dropbox.tech

Why we chose Apache Superset as our data exploration platform

2.29K views09:32

LEFT JOIN

2.41K views09:33

About

Blog

Apps

Platform