LEFT JOIN – Telegram
LEFT JOIN
45K subscribers
944 photos
28 videos
6 files
1.2K links
Понятно про анализ данных, технологии, нейросети и, конечно, SQL.

Услуги — leftjoin.ru
Курсы по аналитике — https://stepik.org/users/431992492

Автор — @valiotti
Реклама — @valiotti

Перечень РКН: https://tapthe.link/PpkTHavwS
Download Telegram
ChatGPT Pulse: новая парадигма взаимодействия с ИИ?
Кстати, пока мы тут обсуждаем пагубные последствия от повсеместного внедрения ИИ, OpenAI представила ChatGPT Pulse.

Это новая фича, пока доступная только на смартфонах пользователям с подпиской Pro. С ней ChatGPT сможет анализировать ваши переписки с ним, данные из календаря и почты (если они подключены) и первым начинать разговор. Например, он предложить продолжить обсуждение какой-то темы, подкинуть идею, что приготовить на ужин, или напомнить про важную дату.

Пользователь, в свою очередь, может регулировать, какие именно сообщения от Pulse он хочет получать. И хочет ли вообще — по умолчанию функция отключена, и ее надо включить в настройках. OpenAI подчеркивает инсайт от студентов, которые участвовали в ранних тестах Pulse:
Многие почувствовали ее полезность, когда начали говорить ChatGPT, что они хотят видеть.


🔜 Также OpenAI называет Pulse первым шагом к «новой парадигме взаимодействия с ИИ»: ChatGPT из простого чатбота, отвечающего на вопросы, превращается в проактивного ассистента.

Как вам такой апдейт? 👀 Будете пользоваться?
Please open Telegram to view this post
VIEW IN TELEGRAM
❤‍🔥11🔥93🙈2👾1
sqlite-vector: простой и удобный векторный поиск в SQLite
SQLite тоже умеет в векторный поиск — для этого уже есть несколько расширений. Но их главная проблема в том, что в основном они либо медленные, либо неудобные.

А ведь, наверное, главное, чего хотят от SQLite — чтобы он был легким, простым и быстрым. И, конечно, нашлись люди, которые попробовали разработать свое решение, отвечающее этим требованиям.

🔜 sqlite-vector — бесплатное кросс-платформенное расширение, которое обходится 30 МБ памяти, складывает векторы в обычные таблицы (без возни с виртуальными и сложными SQL-запросами), хранит данные локально и работает оффлайн. Ему не нужен дополнительный сервер и долгая нудная подготовка, настройка и преиндексиование.

Разработчики сравнили свое решение с популярными аналогами (точнее только с одним по факту) — если очень захотеть, то sqlite-vector может быть аж в 17 раз быстрее sqlite-vec. Да, названия у них не очень креативные и перепутать легко. С libsql сравнить не удалось, потому что он так долго возился с созданием индекса, что всем надоело ждать.

Расширение распространяется по Elastic License 2.0. Скачать можно с гитхаба.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6🔥2👌2
Состоялся релиз Claude Sonnet 4.5
Новую версию Claude Anthropic представила нескромно:
Claude Sonnet 4.5 — лучшая модель для кодинга в мире. Это самая сильная модель для создания сложных агентов. Она лучше всех работает с компьютерами.


🔵Свое заявление компания подтверждает бенчмарками — их результаты на картинке выше. ☝🏻
🔵Еще Claude теперь намного лучше разбирается в финансах, юриспруденции, медицине и точных науках.
🔵Не считая того, что он поумнел, он стал менее склонен к галлюцинациям, обману, лести и другим нежелательным моделям поведения.

Апгрейд получил и Claude Code: добавились нативное расширение VS Code и чек-поинты для сохранения прогресса. Но если даже после этого Claude Code вам все равно не нравится, вы можете собрать свою версию: Anthropic выкатила Claude Agent SDK, с помощью которого пользователи теперь сами могут создавать ИИ-агентов.

В общем, пока ChatGPT все глубже проникает в повседневную жизнь пользователей со своим Pulse и новой возможностью совершать покупки прямо в чате, Claude совершенствуется в кодинге и уходит в науку.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍85😍21
Стартовал первый детский конкурс датавиза!
В программе: диаграммы из конфет и графики, нарисованные цветными карандашами.

Если у вас есть дети от 6 до 11 лет и вы хотите привить им любовь к данным и помочь развить аналитическое мышление — присоединяйтесь!

Вас ждут:

🔵Образовательные эфиры, где дети узнают, что такое данные, и познакомятся с основами датавиза.
🔵Подарки для всех участников, а для победителей — iPad, набор LEGO и другие крутые призы,
🔵Бонусы и полезные материалы.

Конкурс пройдет с 1 по 30 октября — в это время участники как раз будут смотреть эфиры и смогут подать свою работу в одной из трех номинаций: поделка, рисунок или диджитал. 15 ноября организаторы подведут итоги и наградят победителей.

🔜 Участие бесплатное, главное — зарегистрироваться!
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥7👍3🥰3👌1😍1
Как подружить ClickHouse с процессором на 100+ ядер
Ядер в процессорах все больше, и в теории это прекрасно: больше ядер — больше производительности. На практике это тоже хорошо, но есть нюанс.

Чтобы на 100% использовать мощности железа, софт нужно под него оптимизировать — и базы тоже. ClickHouses выложили в своем блоге статью, написанную инженерами Intel Shanghai, о том, как преодолеть ограничения БД и «научить» ее использовать вычислительные мощности их процессоров с 100+ ядер.

💬 Всего они выявили 5 ключевых областей, где ClickHouse можно (и нужно) докрутить, чтобы увеличить производительность: прекратить тормозящую всю базу конкуренцию за блокировки, оптимизировать работу с памятью, распараллелить процессы на множество потоков и разобраться с false sharing'ом. Если этого не делать, то вся мощность и многоядерность процессора пойдут только во вред и насоздают боттлнеков на пустом месте.

Сделать это будет совсем непросто — авторы в статье неоднократно предупреждают, что чтобы получить результат, нужно глубоко разобраться в том, как работает база, и некоторые процессы фундаментально пересмотреть.

💬 Хотя статья про ClickHouse, описанные в ней подходы могут быть применимы и к другим базам. По мере того, как мощность процессоров будет расти, будет расти и важность умения оптимизировать софт под них.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍73👌2😍2
Почему Text 2 SQL не работает?
Ко мне иногда приходят разные знакомые и говорят, что у них есть концепция Text 2 SQL или LLM-генератора SQL-кода — мол, классная идея для бизнеса, можно ее попродавать.

И вот наконец я понял, почему идея «пусть бизнес пишет запросы на естественном языке» не взлетает и не взлетит.

На бумаге все красиво. Даешь ИИшке команду: «Покажи выручку за август по городам», получаешь результат.

На практике же имеем несколько иной сетап: никто из бизнес-менеджеров не хочет и не может задавать правильные вопросы к данным.

Причина кроется в подмене понятий, за которую сами бизнес-менеджеры обычно аналитика и ругают. Так вот, написание SQL — это не основная работа аналитика. На самом деле аналитик занимается мыслительным трудом: как раз пытается разобраться, какие вопросы вообще стоит задать, чтобы понять, что там у бизнеса пошло не так. SQL — лишь удобный интерфейс для формулировки гипотез. Его просто изучить, но логика за пределами SQL.

И, соответственно, вторая часть проблемы: многие бизнес-менеджеры в большинстве случаев не обучены мыслить аналитически, эту часть работы они делегировали аналитику, чтобы он за них подумал. Они сами не думают в контексте данных, структур или понимания взаимосвязей. Именно поэтому LLM-промпты в виде «SQLGPT для маркетологов» и не взлетают.

🔜 AI может перевести вопрос в SQL, но не может придумать сам вопрос, который имеет смысл для бизнеса.

Сейчас мы на этапе следующего шага — передать LLM формирование вопросов и гипотез, а затем уже написание необходимого кода и SQL-запросов для решения аналитической задачи.

А пока просто осознаем, что произошла гиперинфляция хардскиллов. А вот мыслить и генерировать ценные инсайты — тот самый навык, который был и есть востребован в аналитиках.
Please open Telegram to view this post
VIEW IN TELEGRAM
25👍15🔥12🤣2
Амбассадоры Tableau 2025
Tableau регулярно обновляет список своих амбассадоров— людей, которые делают большой вклад в сообщество, делятся своими знаниями и навыками и вообще всячески популяризуют этот тул. В 2025 году звания удостоились 386 человек из 48 стран.

🔜 Список можно увидеть на сайте, но намного интереснее — потыкать в кнопки на дашборде. Он позволяет отфильтровать людей по странам, городам и специализациям.

Пишут, что в этом году получился самый разнообразный состав амбассадоров с точки зрения географии, и это нагляднее видно на другом дашборде. Он не такой удобный, как первый, зато с картой.

В списке, кстати, вы наверняка заметите какие-нибудь знакомые лица. Возможно, на кого-то из них вы даже подписаны. 👀
Please open Telegram to view this post
VIEW IN TELEGRAM
11👍5😁3🙈3
Всем привет!

Я уже раньше упоминал, что решил выпустить адаптацию книги «Аналитика для руководителей» на английском языке.

Мы уже на финишной прямой — все перевели, отредактировали (кстати, спасибо нашим бета-ридерами и всем, кто поделился фидбеком!), верстаем и готовимся выпускать. Сейчас самое сложное испытание для любого автора — выбрать обложку. Мы решили сменить название и концепт, отсмотрели сотню книг из той же ниши и собрали три весьма разные версии. Все кажутся по-своему классными, но выпустить книгу с тремя обложками — не вариант.

Скажите, какая из трех нравится вам больше?
7👍5🔥41
Вы аналитик? Расскажите, как вам работается
Старые добрые осенние традиции: готовиться к Хеллоуину (если отмечаете), пересматривать «Сумерки» (если любите такое), участвовать в опросе NEWHR про рынок труда аналитиков (если вы аналитик).

Ребята каждый год проводят исследование, чтобы выяснить:
🔵уровень зарплат,
🔵лучшие места для работы,
🔵какие требования к аналитикам предъявляют работодатели,
🔵каких экспертов читают и смотрят те, кто работает с данными.
А когда они собирают все эти данные вместе с сравнивают с предыдущими годами, это позволяет посмотреть на изменения в динамике и увидеть главные тренды на рынке дата-труда.

Ну а мы их с радостью поддерживаем в этом начинании и приглашаем наших читателей принять участие в опросе. Он займет около 20 минут, а в награду вы получите ранний доступ к промежуточным результатам исследования, инвайт на закрытый стрим сс организаторами и чувство, что сделали хорошее дело.

🔜 Опрос
Please open Telegram to view this post
VIEW IN TELEGRAM
12🔥11👍4🙈1
Догадаетесь, что на этих картинках?
А это работы участников первого российского конкурса датавиза Data Kids. ❤️

Напоминаем, что он уже в самом разгаре: участники смотрят обучающие вебинары и присылают свои работы. Но присоединиться все еще можно и даже нужно: мало того, что это полезно и весело, так еще и бесплатно. В общем, ноль минусов, сплошные плюсы и даже шанс выиграть какой-нибудь крутой приз.

🔜 Регистрируйтесь на сайте конкурса.
А если нет детей или не хотите участвовать, то просто заходите посмотреть на галерею работ.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
20🔥16😁7🥰3
Valiotti Analytics — 6 лет! 🥳
Наш канал существует не сам по себе — это один из проектов дата-консалтинга Valiotti Analytics.
Мы, конечно, уже про это писали, но вдруг вы пропустили или забыли

🔜 И вот сегодня Valiotti Analytics исполняется 6 лет. За эти годы мы успели поработать над десятками проектов для заказчиков со всего мира, строили системы аналитики с нуля и разбирали тысячи строк legacy кода, радовались успехам и учились на ошибках.

В общем, это были насыщенные 6 лет, за которые компания выросла и сильно изменилась, но суть осталась та же — делать данные ближе и понятнее для бизнеса. Намерены продолжать делать это и дальше, только еще лучше. ❤️
Please open Telegram to view this post
VIEW IN TELEGRAM
53🔥23😍4👌1🤣1
Вайб-кодинг против вайб-инжиниринга
Все мы уже поняли, что такое «вайб-кодинг» — это человек генерирует код с помощью нейросетей, иногда даже не особо вникая, что они ему там пишут. Код работает, и ладно. Быстро, просто, но результат может быть непредсказуем.

Но ведь есть и альтернативный подход — не сваливать на нейросеть всю работу, а использовать ее как помощника. При этом человек все еще руководит процессом и отвечает за качество работы. Получается быстрее, чем все делать руками, уже не так просто, зато за результат не стыдно. Это уже не вайб-кодинг — но что тогда?

Есть вариант называть это «вайб-инжиниринг».

В чем суть?
🔵Чтобы от ИИ получать реальную пользу (а не только едва жизнеспособный код), надо хорошо разбираться, как он работает, понимать его ограничения и выстраивать процесс.
🔵Под «выстраиванием» процесса мы понимаем использование старых добрых практик, которые применяются в нормальной, «безвайбовой» разработке. Составление грамотного плана работы и документации, настройка автоматических тестов, вдумчивое тестирование вручную, код-ревью — это все помогает не только людям, но и ИИ.
🔵Вайб-инженеру также важно реально оценивать возможности ИИ: что ему можно доверить, а что лучше сделать самому, как корректно поставить задачу и проверить качество выполнения. Человек в каком-то смысле занимает роль лида или менеджера, контролирующего своего ИИ-подчиненного.

В общем, слагаемые те же, что при вайб-кодинге, — есть человек, ИИ и какая-то работа, которую этим двоим надо выполнить. Но подход и конечный результат совсем другие.

Вопрос только в названии — как вам оно? Как думаете, пойдет «вайб-инжиниринг» в народ?
Please open Telegram to view this post
VIEW IN TELEGRAM
😁13🔥96🌚4👍3
OpenAI представила ChatGPT Atlas
Вы никогда не думали, как было бы удобно, если бы кто-то за вас покидал покупки в корзину в онлайн-магазине, а перед этим еще сравнил, чем отличаются два на первый взгляд идентичных товара? Прочитал длинную статью и пересказал содержание? Придумал остроумный ответ в дискуссии в соцсети?

В общем, взял на себя эту сложную, нудную задачу сидения в интернете?

🔜 Что ж, если вы пользуетесь Mac’ом (остальным придется подождать), то теперь можете обзавестись таким помощником. OpenAI представила браузер ChatGPT Atlas, с прикрученным к нему ИИ-ассистентом. На картинке выше вы можете увидеть пример задачи для него — выбрать товары для похода на пляж с семьей.

Пользователь может ограничить доступ ИИ к отдельным сайтам, попросить сделать саммари написанного на экране или «покопаться» в истории браузера и найти там ссылку, которую посещал ранее.

Владельцам платных подписок доступен еще и агентский режим, в котором ИИ может совершать какие-то действия на сайте. Например, не только придумать остроумный ответ, но и отправить его, а потом еще наставить оппоненту дизлайков.

Ну что скажете — будете пользоваться Atlas’ом? Или может уже пользуетесь каким-то другими ИИ-браузерами? 👀
Please open Telegram to view this post
VIEW IN TELEGRAM
5👍54
«Мало получить инсайт — надо еще донести его понятным языком»
И другие вызовы в работе аналитика в большой компании.

В подкасте «Потом доделаю» вышел выпуск как раз для нас с вами: Роман Халкечев, руководитель аналитики Яндекс Поиска и Рекламы, рассказал, как в корпорации работают с данными. Многие компании об этом либо ничего не рассказывают, либо говорят насколько общими фразами, что лучше бы ничего не говорили. Что-то реально интересное и полезное на эту тему — как этот подкаст — появляется не так уж и часто.

Про что говорили?
🔵С какими сложностями приходится сталкиваться, как доносить ценность данных до коллег и что делать, если ваши инсайты идут вразрез с решениями бизнеса.
🔵Как ИИ влияет на работу, меняет и продукты Яндекса, и рабочие процессы внутри.
🔵Сколько у него сотрудников в управлении (спойлер: 400), чем все эти люди занимаются и как управлять такой БОЛЬШОЙ командой.
🔵Как в реальности выглядит тот самый data-driven подход, к которому все так стремятся: как принимать решения, когда данных недостаточно (да, и у Яндекса такое бывает) или слишком много.

Для аналитиков, дата-инженеров и всех остальных, кто «про данные», в выпуске много прикладных советов, как работать с бизнес-заказчиками и развиваться в профессии. Для тех, кто с данными связан «косвенно» — например, продактов — это возможность взглянуть на «внутреннюю» кухню аналитики и узнать, почему она так часто не дает однозначных ответов на вопросы бизнеса, но прислушиваться к ней все равно надо.

🔜 Слушаем на Яндекс Музыке.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6👍42😍1🌚1
dbt 101: что нужно знать на старте и лучшие практики
dbt — отличный тул для трансформации данных и заслуженный стандарт индустрии. Мы его часто используем, потому что он сильно упрощает работу на проектах со сложной аналитикой и множеством SQL-скриптов.

Кое-что из своего опыта собрали в новой статье. Это не инструкция, как настроить dbt и начать работу, а вводный материал, где мы решили поделиться, а что это вообще такое: зачем нужно, какие функции выполняет, какие задачи решает.

Ну и заодно добавили парочку лучших практик, которые хорошо показывают себя на проектах. Кстати, один реальный проект тоже чуть-чуть показали.

🔜 Статья уже на Хабре!
Please open Telegram to view this post
VIEW IN TELEGRAM
👍12🔥53😍1🤣1