LEFT JOIN – Telegram
LEFT JOIN
45K subscribers
944 photos
28 videos
6 files
1.2K links
Понятно про анализ данных, технологии, нейросети и, конечно, SQL.

Услуги — leftjoin.ru
Курсы по аналитике — https://stepik.org/users/431992492

Автор — @valiotti
Реклама — @valiotti

Перечень РКН: https://tapthe.link/PpkTHavwS
Download Telegram
7 BI-платформ за 7 недель
Вторая часть челленджа — если не лежит душа к БД, можно углубиться в BI-платформы. Ниже 7 инструментов, с которыми мы сами работаем чаще всего.

Первые 3 сейчас недоступны в России, и если для вас это блокирующий фактор, переходите к 4 пункту — там начинается open source.

🔵Tableau. Стандарт индустрии, который не нуждается в представлении, с богатым функционалом и возможностями для кастомизации. В нем можно сделать почти все, что угодно, любые графики и любые расчеты, и это делает его идеальным вариантом для сложной аналитики и отчетности.
🔵 Power BI. Не менее известный инструмент, который лишь немного уступает Tableau в широте возможностей для кастомизации. При этом он дешевле и прекрасно интегрируется с другими компонентами экосистемы Microsoft.
🔵 Looker Studio. Простая в освоении облачная платформа, которая подойдет тем, кому важна интеграция с сервисами Google — их можно подключить к Looker бесплатно. Большинство других датасорсов доступны только по подписке за 9$ в месяц.
🔵 DataLens. BI от Яндекса. Достойный аналог ушедших из РФ платформ, который не только быстро развивается и наращивает мощности, но и помогает с миграцией.
🔵 Metabase. Простой, понятный и бесплатный open source инструмент, который подойдет тем, кому надо быстро и не заморачиваясь сделать простую аналитику.
🔵 Superset. Почти Tableau от мира бесплатных BI-платформ, который может похвастаться впечатляющим количеством встроенных графиков и фич вроде гибких настроек доступ или автоматических email-рассылок с актуальными данными с дашборда.
🔵Redash. Еще один относительно простой в освоении инструмент, который выделяется широким списком поддерживаемых датасорсов и умением работать с большими объемами данных.

Если интересно узнать про каждый инструмент чуть подробнее, то у нас есть шпаргалка со сравнением — там больше внимания уделено плюсам и минусам инструментов, есть примеры дашбордов и цены.

🔜 Получить шпаргалку у бота

Как вам этот список? Какие BI-тулы вы бы включили в него?
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥163👍3😱1🏆1
Вебинар про карьеру в аналитике уже сегодня!
Сегодня в 19:00 по Москве Николай Валиотти расскажет, за какие скиллы бизнес готов платить аналитикам их немаленькие зарплаты.
🔵 Как вырасти из джуна до миддла, а из миддла — до сеньора?
🔵 Какие еще есть пути, кроме роста по грейдам?
🔵 Что надо знать, прежде чем устраиваться аналитиком в штат или уходить на аутсорс?

Вебинар пройдет на площадке онлайн-школы Karpov.Courses. Всем, кто пройдет регистрацию, после окончания эфира отправят запись и расширенный карьерный гайд. Рекомендуем не ждать записи, а все-таки прийти лично, чтобы задать вопросы Николаю или команде Karpov.Courses и не упустить промокод со скидкой на курсы школы.

🔜 Зарегистрироваться
Please open Telegram to view this post
VIEW IN TELEGRAM
👍11😍32
Media is too big
VIEW IN TELEGRAM
От ритейла до Smart City: как геоаналитика меняет бизнес
Как найти яму на дороге?

Наверное, самый простой способ — подойти и посмотреть, есть яма или нет. Но что, если ям много? Если вам надо просмотреть все дороги в городе и найти максимум аварийноопасных ям? 👀

А если вам надо оценить распространение облака вулканического пепла на Камчатке?

А если — вот сейчас будет очень сложно — выбрать лучшую локацию для булочной в городе, где булочные на каждом углу?

Ответы есть у гостя нового выпуска LEFT JOIN Partners, Дениса Струкова. Он генеральный директор компании «Геоинтеллект», которая больше 20 лет занимается геоаналитикой для частных компаний и государственных заказчиков.
🔵 Чем отличается геотаргетинг от геомаркетинга, а ГИС — от BI-системы?
🔵 Какие инсайты можно получить из геоданных и обязательно ли платить за это много денег?
🔵 Используются ли в геоаналитике данные из слитых баз?

🔜 Смотрите на YouTube и в VK, слушайте на Spotify, Apple Podcasts и Яндекс Музыке.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥586😁4🤩1
This media is not supported in your browser
VIEW IN TELEGRAM
Valiotti Analytics → LEFT JOIN
Те, кто с нами давно, знают, что канал LEFT JOIN — проект Николая Валиотти, фаундера дата-консалтинга Valiotti Analytics, основанного в 2019 году.

Valiotti Analytics занимается аутсорсингом аналитики и аутстаффом дата-экспертов в компании из диджитал-сфер — эдтехов, финтхеов, разработчиков игр и мобильных приложений, телекомов и так далее. За эти 5 лет у VA накопилось 40+ кейсов в портфолио, экспертиза и отличная репутация.

Тем временем LEFT JOIN из авторского проекта вырос в целый большой бренд, который объединяет блог, каналы в TG и на Youtube и несколько курсов по аналитике. У нас много подписчиков на всех площадках, и поэтому это название стало хорошо узнаваемым именно в русскоязычной среде.

💙 Значит, нужно развивать бренд и дальше, так что представляем вам дата-консалтинг LEFT JOIN 💙

Суть услуг остается та же → разрабатываем инфраструктуру, разворачиваем хранилище, настраиваем процессы, собираем дашборды, проводим аналитические исследования — в общем, все, что заказчик попросит.

Хотите узнать больше или заказать разработку? 🔜 Welcome на наш новый сайт!
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥13👍64🤩3🥰1
LEFT JOIN pinned a video
Вебинар про карьеру в аналитике пройдет 6 февраля
Назначили новую дату вебинара, который проведет Николай Валиотти — 6 февраля, 19:00 по Москве.

Напоминаем, что вебинар будет посвящен тому, как построить карьеру в сфере аналитики:
🔵 Как вырасти из джуна до миддла, а из миддла — до сеньора?
🔵 Какие еще есть пути, кроме роста по грейдам?
🔵 Что надо знать, прежде чем устраиваться аналитиком в штат или уходить на аутсорс?

Пройдите регистрацию по ссылке в конце поста (если не сделали это в прошлый раз), чтобы получить запись эфира, карьерный гайд и промокод на курсы школы karpov.courses.

🔜 Зарегистрироваться
Please open Telegram to view this post
VIEW IN TELEGRAM
9🔥6👍5👾2
Можно ли украсть украденные данные?
Давненько мы не писали про OpenAI, а ведь они с самого начала года нагенерировали новостей: уже успели выпустить новые «думающие» модели o3-mini и o3-mini-high и обвинить китайскую компанию DeepSeek в воровстве.

Вот про DeepSeek и поговорим
Если пропустили, то DeepSeek представила AI-ассистента с доступом к двум моделям: «обычной» DeepSeek-V3 и «думающей» DeepThink R1 (аналог o1). Доступ к обеим версиям бесплатный (пока), API дешевый, а еще весь проект опенсорсный. В общем, серьезный конкурент OpenAI.

Вскоре после релиза OpenAI заявила, что подозревает DeepSeek в краже данных для обучения своей модели. Поэтому она и получилась такой умной так быстро — вся в ChatGPT.

💬 Ситуация для разработчиков неприятная, но, если посмотреть со стороны, скорее ироничная. OpenAI неоднократно обвиняли в том, что она для обучения своих моделей собрала все, что не прибито, по всему интернету, не спрашивая ни у кого разрешения. Судебные иски против нее подавали New Your Times и Гильдия Авторов США.

А теперь компания сама заявляет, что стала жертвой несанкционированного использования ее данных, и очень этим недовольна.

💬 Конечно, еще нужно доказать воровство и со стороны OpenAI, и со стороны DeepSeek. Но если это правда, то как вы к этому относитесь?

Насколько правомерны претензии OpenAI, если она сама таким же образом собрала свои данные? Или это две разные ситуации, и предполагаемое «темное прошлое» OpenAI не оправдывает действия DeepSeek?

Для тех, кто не хочет писать коммент, ниже опрос. 👇🏻
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔7🥰32👍2🔥2
Вебинар про карьеру в аналитике — сегодня!
А вы уже записались на вебинар Николая Валиотти?

Он пройдет в 19:00 по Москве и будет посвящен карьерному развитию в аналитике. Вы узнаете про:
🔵 рост по грейдам,
🔵 ожидания бизнеса от джунов, миддлов и сеньоров,
🔵 возможности для перехода в смежные области,
🔵 сложности и преимущества работы в штате и на аутсорсе.

🔜 Зарегистрироваться
За регистрацию еще дают запись вебинара, карьерный гайд и промокоды karpov.courses!
Please open Telegram to view this post
VIEW IN TELEGRAM
😱4👍2🔥2🤣1
Вакансии в нашу компанию теперь публикуем в корпоративном Telegram-канале @leftjoin_insider

P.S. А еще рассказываем про внутрянку работы в дата-консалтинге, наши проекты и ценности 🙂

Приходите знакомиться 👀
Please open Telegram to view this post
VIEW IN TELEGRAM
2👍2😍1
Forwarded from LEFT JOIN Insider
Ищем Middle Data Analyst, чтобы SQL не простаивал, Python не пылился, а клиенты были довольны
Заниматься надо будет ad-hoc аналитикой, разработкой отчетов в BI-системах (у нас в основном Tableau, Redash, Superset, Metabase, Datalens) и витрин данных.

Что нужно
🔵 2+ года опыта. Знаешь, что такое данные, зачем они бизнесу и как их приручить.
🔵 Английский от уровня B2. Мы много работаем с зарубежными клиентами, нужно не просто понимать, но и коммуницировать.
🔵SQL — на уровне «встал ночью, написал запрос и снова спать». Серьезно, это проверим.
🔵 Python — pandas, matplotlib, numpy — все наше, все родное.

Будет круто

🔵 Знакомство с dbt — за это отдельно пожмем руку.

Что даем
🔵 Удаленку, гибкий график, крутые проекты и команду, которая знает, что делает.
🔵 Бюрократии нет, отпуск и больничные есть.

🔜 Здесь можно получить подробности и откликнуться
Please open Telegram to view this post
VIEW IN TELEGRAM
👍85🔥1🙈1
Как добавить сторителлинг в свой датавиз
Магия датавиза не только в том, чтобы показать данные на графиках, но и в том, чтобы правильно расставить акценты и подчеркнуть важное.

Разбираем на примере из блога Datawrapper, как с помощью нескольких небольших правок сделать обычные линейные графики информативнее.

💬 Автор хотел показать, как изменилась Индия за 75 лет и для этого нарисовал 4 чарта с данными о рождаемости, детской смертности, продолжительности жизни и росте населения. Они и сами по себе уже выглядят внушительно: уже без всяких правок по ним можно судить, что жизнь в Индии за 75 лет стала лучше.

Но сравните, насколько красноречивее они стали, когда:
🔵 к ним добавили более говорящие заголовки и пояснения к каждому графику;
🔵 расположили их рядом, так чтобы вместе с пояснениями они рассказывали цельную историю: «Хотя рождаемость снизилась, упала и детская смертность, а продолжительность жизни выросла, что привело к росту населения»;
🔵 изменили цветовую гамму и подкрутили дизайн, чтобы расставить акценты.

Такую же логику — говорящие заголовки, цветовые акценты, сторителлинг — можно применить и в других областях, чтобы усилить свои отчеты и презентации.

Нравится такой редизайн?
🔥 — Да, стало лучше
🙈 — Нет, стало слишком много визуального шума
🌚 — Третий вариант
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥29🙈6🌚31👍1
Пусть ваши графики говорят за вас
Бывало такое, что вы подготовили прекрасный, информативный отчет с наглядными графиками, а коллеги и руководство его не оценили?

Или сделали дашборд, а юзер так и считает в экселе, потому что не понял куда смотреть?

🔜 Тогда рекомендуем курс «Говорящие графики» Натальи Киселевой. Он стартует 10-го февраля, и на нем вы узнаете:
🔵 как визуализировать данные так, чтобы было не только красиво, но и понятно,
🔵 как и зачем добавлять сторителлинг в свои графики,
🔵 чем отличаются инструмент для визуализации и как с ними работать.

Курс пройдет онлайн, все подробности про тарифы и программу — на сайте и в TG-канале.

Бонус — дата-комикс от автора курса.☝🏻
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥114😁3😍3👍2
Итоги розыгрыша мерча LEFT JOIN

На календаре 10 февраля, а это значит, что пришло время выбрать 5 счастливчиков, к которым отправятся наши футболки.

🔵 @basiliopmartinez
🔵 @Alexey_Krutov
🔵 @skaradub
🔵 @Nastasiakpt
🔵 @skol4356

Поздравляем! Мы скоро свяжемся с вами для уточнения условий доставки 👀

Важно: на первом скриншоте с результатами вы можете увидеть еще один никнейм, но одно из условий участия, которое не было им выполнено — поделиться своими целями. Поэтому для честности результатов мы решили перевыбрать комментарий.

Можете вернуться к посту с условиями, чтобы посмотреть, каких целей намерены достигнуть наши победители в 2025 году.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥11👍84
Как работает конкурентность?
Если спросить, что такое конкурентность, скорее всего, большинство наших подписчиков смогут ответить достаточно точно. Это понятие, знакомое всем, кто так или иначе связан с ИТ-сферой.

🔜 Для тех, кто пока с ним не сталкивался, поясним максимально простыми словами:
Конкурентность — способность системы в заданный промежуток времени выполнять несколько процессов, переключаясь между ними.

Конкурентность не надо путать с параллелизмом, но это тема для отдельного материала.

Зато если попросить объяснить, как работает конкурентность, у многих могут возникнуть затруднения. За явлением, которое на первым взгляд кажется довольно понятным, стоит очень сложный процесс.

К счастью, нашелся человек, который детально разобрался сам и нарисовал визуальный гайд для остальных. Гайд в какой-то момент превращается в мем «как нарисовать сову», но так и надо.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6🔥3😍1
Про Avito Data Tech и Redash

Я достаточно давно слежу за ребятами из Avito Data Tech, в основном, потому что несколько раз в разных источниках натыкался на то, что они переделали близкий моему сердцу Redash и довели его до уровня корпоративной BI.

Парни круто рассказывают об этом у себя в канале в этих двух постах: 1, 2
Обе статьи я читал достаточно давно, и вот недавно в очередной раз на них наткнулся. Меня не покидало желание увидеть, как же выглядит этот самый кастомизированный авитовский Redash, и я написал Илье из команды Avito Data Tech.

Мой низкий поклон Илье, Олегу и Анару за то, что с легкостью договорились созвониться и показать, что у них получилось.
Признаться, был поражен тем, как ребята смогли допилить open source продукт до уровня корпоративной BI с внедрением self-service подхода. Практически ничего от старого доброго Redash там не осталось (в хорошем смысле). На лицо заметное ускорение производительности, мощный подход к системе разграничения прав, чарты, которые позволяют динамически фильтровать дашборд, экстракты, как в Tableau.

Мой главный вопрос к ребятам — будет ли решение доступно для внешних пользователей в опенсорсе или в коммерческом формате?

И мы, как минимум, начали обсуждение по этой теме!
🔥227❤‍🔥3🙈2
Media is too big
VIEW IN TELEGRAM
ИИ для скоринга клиентов — за и против
Представьте себе мир, где искусственный интеллект следит за каждым вашим шагом и выносит свой вердикт — хороший вы человек или какой-то подозрительный.

А нам и представлять не надо.

Окей, про мир мы преувеличили, но в отдельно взятом «Самокате» уже есть такая программа, которая направлена на предотвращение мошенничества. ИИ отслеживает поведение пользователей и тем, кто заслуживает доверие, может предложить дополнительный сервис — например, оплату через несколько часов после доставки товара.

Про это рассказывал Петр Лукьянченко из ecom.tech на подкасте Data Heroes — кусочек с этим моментом мы прикрепили к посту, а ознакомиться с выпуском целиком можно по этим ссылкам:
Смотреть: YouTube, VK Видео
Слушать: Spotify, Apple Podcasts


🔜 Если взглянуть с одной стороны, то получается, что ИИ лишает часть клиентов доступа к услугам по каким-то своим внутренним соображениям.

🔜 А с другой стороны — он, наоборот, дает возможность предоставить услугу, на которую компания иначе не решилась бы из-за риска потерять деньги.

Что скажете? Какая точка зрения вам ближе?
👾 — Я за использование ИИ
🙈 — Я против
🤔 — Третий вариант
Please open Telegram to view this post
VIEW IN TELEGRAM
👾31🤔14🙈102👍1
Доказательство теоремы CAP — теперь с картинками!
Теорема CAP гласит, что распределенная система может отвечать только двум требованиям из трех: согласованная, доступная и устойчивая к фрагментации.

Почему так? Ответы в коротком иллюстрированном гайде по ссылке — ну, или у нас в посте, но без иллюстраций. Гайд не углубляется в тонкости, но знакомит с основными  понятиями.

🔜 Представим простую распределенную систему — два сервера, которые обмениваются данными друг с другом и с внешним клиентом. На них хранятся данные о значении некой переменной V.

У этой системы могут быть следующие свойства:
🔵 Согласованность (Consistency) — если клиент отправляет запись V = 1 на один сервер, то второй при чтении должен вернуть такое же значение. Если на одном сервере V = 1, а на втором все еще V = 0, то система не согласована.
🔵 Доступность (Availability) — оба сервера, если только никто не пролил на один из них чай, отвечают на запросы клиента на запись и чтение данных.
🔵 Устойчивость к фрагментации (Partition tolerance) — система продолжает работу, даже если какое-то количество сообщений от одного сервера не доходят до второго.

🔜 Наконец-то подходим к доказательству.
🔵 Если система устойчива к фрагментации и доступна, она не может гарантировать согласованность — рано или поздно возникнет ситуация, когда клиент отправит запись на один сервер, а до второго она не дойдет. Тогда один выдаст V = 1, а второй V = 0.
🔵 Чтобы обеспечить устойчивость и согласованность, системе придется пожертвовать доступностью — то есть отказаться вносить данные, если она не может гарантировать, что все ее узлы получат обновление.
🔵 Практически в любой реальной распределенной системе неизбежны потери данных между нодами. При этом, она, скорее всего, не упадет — то есть она будет устойчива к фрагментации. А если она устойчива к фрагментации, то мы возвращаемся к пункту 1.

🔜 Все так просто?
На самом деле нет. К каждому пункту из поста можно добавить звездочку и написать дополнение, которое все усложняет, но это уже не влезет в пост.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍10🔥731
Когда пришел на новый проект, где заказчик уже пытался сам построить какую-то аналитику с кучей табличек и Божьей помощью

#мем
😁54👍12🔥611