Повеяло тонкой поэзией от коллег по опасному дата бизнесу
Сочиню хокку и я в тему круглого стола в воскресенье
Упала неймнода -
Данные стали фаршем.
Горит мой хадуп!
Сочиню хокку и я в тему круглого стола в воскресенье
Упала неймнода -
Данные стали фаршем.
Горит мой хадуп!
Telegram
дневник Бриджит Джунс (de)👩💻💅
Хокку про DE
Когда я заводила канал, нужно было придумать к нему описание. И я почти сразу подумала про хокку - короткое и лаконичное
А сейчас мне захотелось погенерить хокку на тему де, и вот что получилось) По-моему, очень поэтично 📒
Когда я заводила канал, нужно было придумать к нему описание. И я почти сразу подумала про хокку - короткое и лаконичное
А сейчас мне захотелось погенерить хокку на тему де, и вот что получилось) По-моему, очень поэтично 📒
😁9❤4🔥4
Forwarded from VK Team
Обсуждаем данные на умном 🧐
Встречаемся в Санкт-Петербурге и онлайн на самой технической тусовке года по инженерии данных — SmartData 2025. Погружаемся на глубину: от отказоустойчивости до MLOps, BI и разбора внутреннего устройства баз данных.
Ищите наших спикеров в центре офлайн-нетворкинга: только честные обсуждения без записи и без купюр — сверяйтесь с расписанием.
И ждём в гости на стенд VK Tech, обещаем дата-понг, архитектурные игры и техногадалку.
Подробная программа и билеты 👉 тут.
Встречаемся в Санкт-Петербурге и онлайн на самой технической тусовке года по инженерии данных — SmartData 2025. Погружаемся на глубину: от отказоустойчивости до MLOps, BI и разбора внутреннего устройства баз данных.
Ищите наших спикеров в центре офлайн-нетворкинга: только честные обсуждения без записи и без купюр — сверяйтесь с расписанием.
И ждём в гости на стенд VK Tech, обещаем дата-понг, архитектурные игры и техногадалку.
Подробная программа и билеты 👉 тут.
❤5👍3 2
О поездках на конференции
Интересно, почему на рынке нет до сих пор предложений по поездке на конференцию или другое событие (концерт, фестиваль, симпозиум) под ключ? То есть: 1) билеты на конфу, 2) поезд/самолет, 3) проживание, 4) еще какие-то интересные допы
Сейчас много тревел-теха, у банков, у маркетплейсов, у традиционных игроков вроде tutu, Островок, S7 -- можно и билеты разные заказать, и отель снять. Но нет комплексного бандла, который соберет это вместе, уже вбив нужные даты, подобрав гостиницу в пешей доступности к точке!
Равно как и организаторы конференций очень редко предлагают комплекс поездки, а не только билеты, и теряют на этом лояльность посетителей и маржу.
Думаю, такому продукту обрадуются как простые пользователи, так и B2B, где сидят сотрудники в тревел-отделах и вбивают руками билеты и отели.
Ставьте 🔥, если тоже считаете, что не хватает такой услуги.
Интересно, почему на рынке нет до сих пор предложений по поездке на конференцию или другое событие (концерт, фестиваль, симпозиум) под ключ? То есть: 1) билеты на конфу, 2) поезд/самолет, 3) проживание, 4) еще какие-то интересные допы
Сейчас много тревел-теха, у банков, у маркетплейсов, у традиционных игроков вроде tutu, Островок, S7 -- можно и билеты разные заказать, и отель снять. Но нет комплексного бандла, который соберет это вместе, уже вбив нужные даты, подобрав гостиницу в пешей доступности к точке!
Равно как и организаторы конференций очень редко предлагают комплекс поездки, а не только билеты, и теряют на этом лояльность посетителей и маржу.
Думаю, такому продукту обрадуются как простые пользователи, так и B2B, где сидят сотрудники в тревел-отделах и вбивают руками билеты и отели.
Ставьте 🔥, если тоже считаете, что не хватает такой услуги.
🔥20👍3😎3❤1 1
Forwarded from Лингвошутки
Зачем-то узнала, как могут называться функции и переменные у всяких там _компьютерщиков_:
#сегодняяузнал
Camel Case:
lowerCamelCase: Первый символ в нижнем регистре, последующие слова начинаются с заглавной буквы. Пример: camelCaseExample.
UpperCamelCase (PascalCase): Все слова начинаются с заглавной буквы. Пример: CamelCaseExample
Snake Case:
Все слова разделяются подчеркиванием и пишутся в нижнем регистре. Пример: snake_case_example.
Screaming Snake Case: Все слова разделяются подчеркиванием и пишутся в верхнем регистре. Пример: SCREAMING_SNAKE_CASE.
Kebab Case:
Все слова разделяются дефисом и пишутся в нижнем регистре. Пример: kebab-case-example.
Train Case:
Все слова разделяются дефисом и пишутся с заглавной буквы. Пример: Train-Case-Example.
#сегодняяузнал
❤5
Лингвошутки
Зачем-то узнала, как могут называться функции и переменные у всяких там _компьютерщиков_: Camel Case: lowerCamelCase: Первый символ в нижнем регистре, последующие слова начинаются с заглавной буквы. Пример: camelCaseExample. UpperCamelCase (PascalCase):…
А вот в 🔤 🔤 🔤 никаких вариантов нет.
Оно и к лучшему
Оно и к лучшему
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9😁5🔥3😱1
Forwarded from Chief Philosophy Officer
Часто можно услышать мысль: «ChatGPT скоро заменит джунов». Не согласен.
Джун работает за похлёпку супа. А производство похлёпки всегда дешевле, чем включение в розетку новой технологии. Потому что похлёпку варят с помощью старых технологий. Короче, задачи джуна слишком простые, чтобы их было выгодно отдавать машине.
Под нож пойдут мидлы. Ремесленники, которые каждый день делают одно и то же, пытаясь достичь максимальной эффективности. Все измеряют, стандартизируют. Спорят о правильных границах своей профессии, сгорают в вечных дискуссиях, отравляют воздух вокруг и доказывают, что именно их подход самый правильный. Верят в объективную реальность, и по удивительному совпадению эта реальность всегда совпадает с их мнением.
Именно они и окажутся лишними в новом бодрийяровском мире.
Потому что LLM куда честнее: он хотя бы не требует называть свою генерацию текстов мышлением, не выгорает и не токсичит, когда чувствует, что рынок не нуждается в его «уникальных» знаниях и умениях.
Джун работает за похлёпку супа. А производство похлёпки всегда дешевле, чем включение в розетку новой технологии. Потому что похлёпку варят с помощью старых технологий. Короче, задачи джуна слишком простые, чтобы их было выгодно отдавать машине.
Под нож пойдут мидлы. Ремесленники, которые каждый день делают одно и то же, пытаясь достичь максимальной эффективности. Все измеряют, стандартизируют. Спорят о правильных границах своей профессии, сгорают в вечных дискуссиях, отравляют воздух вокруг и доказывают, что именно их подход самый правильный. Верят в объективную реальность, и по удивительному совпадению эта реальность всегда совпадает с их мнением.
Именно они и окажутся лишними в новом бодрийяровском мире.
Потому что LLM куда честнее: он хотя бы не требует называть свою генерацию текстов мышлением, не выгорает и не токсичит, когда чувствует, что рынок не нуждается в его «уникальных» знаниях и умениях.
1😁18🤡5❤4👌3
Архитектор Данных
Под конец первого дня SmartData - приходите прослушать про Hadoop. Записи не будет )
Через час стартует дискуссия про "смерть" Халупа.
Зал 2 smart data.
Без записи :)
Зал 2 smart data.
Без записи :)
🔥6❤2✍1👌1
Forwarded from Data Engineer
Проблемы дата-специалистов с неймингом общеизвестны. На мой взгляд, круглый стол на тему смерти Hadoop должен был называться “DEти хоронят коня (не вышло) Hadoop”.
😁7🔥6👍2
Кратко - основные инсайты с круглого стола «Хадуп мертв»
1️⃣ HDFS сам по себе мало кому нужен, если есть S3.
2️⃣ Даже YARN уже не так необходим.
3️⃣ Современная BigData признана начинающейся от 10 Петабайт. Эта планка постепенно растет.
4️⃣ Приходится делать много ухищрений, чтобы получить в он-преме S3. И принимать множество компромиссов.
5️⃣ Hadoop (HDFS) - все еще хороший, надежный, понятный и предсказуемый способ получить скалированное хранилище для бигдаты
6️⃣ Но с нуля Hadoop сейчас мало кто решится разворачивать для GreenField проектов
7️⃣ Apache Ozone - перспективный способ получить S3 (+HDFS) на сегодня - признано 60% участниками дискуссии.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥17❤4😎3😁2🫡2 2
Forwarded from Влад Каменский | Юниверс Дата
Вчера в Санкт-Петербурге записал потрясающий эфир с Алексеем Белозерским — руководителем Big Data Services VK Cloud, VK Tech и автором канала Архитектор данных. Говорили о самых передовых темах современного управления данными:
- Lakehouse и его роль в управлении данными, заменит ли он DWH?
- ИИ в Data Governance — как найти правильную комбинацию
- Парадокс self-service аналитики — почему не всё так просто
- Концепция "chat with your data" и её практическое применение
- Open Source vs Commercial — вечная дилемма, что выбрать. Плюсы и минусы.
- Образование — онлайн курсы vs фундаментальные знания
Думаю, сегодня закончим монтаж и завтра эфир уже будет доступен. Алексей очень глубоко погружён в тему, так что будет интересно!
А пока — продолжаю рубрику #закулисами
Как и обещал, делюсь новыми возможностями наших релизов. Сегодня на очереди крутая фича DG — создание активов без черновика.
Казалось бы, мелочь, а на практике серьёзно ускоряет работу дата-аналитиков и steward'ов.
Следите за обновлениями — завтра эфир, а релизы продолжаем готовить!
#мыслиCEOвслух #закулисамиl
Please open Telegram to view this post
VIEW IN TELEGRAM
1👍16❤7 5🔥2
Появилась запись огненного интервью с Владом Каменским, CEO Юниверс Дата.
Из разобранных тем:
- LakeHouse против DWH (или нет).
- ИИ и классический Data Governance: друзья или враги?
- Пара слов о построении КХД для небольшой компании
И много других интересных вопросов.
Видео доступно по ссылке.
Обязательно подпишитесь на канал Влада
Отдельная благодарность - за подеренную книгу.
Из разобранных тем:
- LakeHouse против DWH (или нет).
- ИИ и классический Data Governance: друзья или враги?
- Пара слов о построении КХД для небольшой компании
И много других интересных вопросов.
Видео доступно по ссылке.
Обязательно подпишитесь на канал Влада
Отдельная благодарность - за подеренную книгу.
❤9 5👍4👏3
Text to SQL (не) работает
Согласен с коллегами (см репост)
Мы хотим решить режимом аналитического диалога. В процессе работы белковый аналитик также задает бизнесу уточняющие вопросы и действует в зависимости от этих уточнений.
Эту часть также можно во многом автоматизировать.
Пример: на вопрос «как вывести на рынок новый продукт» предложить проанализировать примеры успешных запусков. А дальше продолжить раскапыванием особенностей динамики продаж успешных кейсов.
Удержание контекста, примеры успешных диалогов, понимание структуры компании, чем конкретно занимается заказчик и какая у него внутренняя терминология включая жаргонизмы. Задача сильно сложнее чем просто «эй, чат, напиши мне запрос», но в совокупности взлетабельно.
Согласен с коллегами (см репост)
Мы хотим решить режимом аналитического диалога. В процессе работы белковый аналитик также задает бизнесу уточняющие вопросы и действует в зависимости от этих уточнений.
Эту часть также можно во многом автоматизировать.
Пример: на вопрос «как вывести на рынок новый продукт» предложить проанализировать примеры успешных запусков. А дальше продолжить раскапыванием особенностей динамики продаж успешных кейсов.
Удержание контекста, примеры успешных диалогов, понимание структуры компании, чем конкретно занимается заказчик и какая у него внутренняя терминология включая жаргонизмы. Задача сильно сложнее чем просто «эй, чат, напиши мне запрос», но в совокупности взлетабельно.
Forwarded from LEFT JOIN
Почему Text 2 SQL не работает?
Ко мне иногда приходят разные знакомые и говорят, что у них есть концепция Text 2 SQL или LLM-генератора SQL-кода — мол, классная идея для бизнеса, можно ее попродавать.
И вот наконец я понял, почему идея «пусть бизнес пишет запросы на естественном языке» не взлетает и не взлетит.
На бумаге все красиво. Даешь ИИшке команду: «Покажи выручку за август по городам», получаешь результат.
На практике же имеем несколько иной сетап: никто из бизнес-менеджеров не хочет и не может задавать правильные вопросы к данным.
Причина кроется в подмене понятий, за которую сами бизнес-менеджеры обычно аналитика и ругают. Так вот, написание SQL — это не основная работа аналитика. На самом деле аналитик занимается мыслительным трудом: как раз пытается разобраться, какие вопросы вообще стоит задать, чтобы понять, что там у бизнеса пошло не так. SQL — лишь удобный интерфейс для формулировки гипотез. Его просто изучить, но логика за пределами SQL.
И, соответственно, вторая часть проблемы: многие бизнес-менеджеры в большинстве случаев не обучены мыслить аналитически, эту часть работы они делегировали аналитику, чтобы он за них подумал. Они сами не думают в контексте данных, структур или понимания взаимосвязей. Именно поэтому LLM-промпты в виде «SQLGPT для маркетологов» и не взлетают.
🔜 AI может перевести вопрос в SQL, но не может придумать сам вопрос, который имеет смысл для бизнеса.
Сейчас мы на этапе следующего шага — передать LLM формирование вопросов и гипотез, а затем уже написание необходимого кода и SQL-запросов для решения аналитической задачи.
А пока просто осознаем, что произошла гиперинфляция хардскиллов. А вот мыслить и генерировать ценные инсайты — тот самый навык, который был и есть востребован в аналитиках.
Ко мне иногда приходят разные знакомые и говорят, что у них есть концепция Text 2 SQL или LLM-генератора SQL-кода — мол, классная идея для бизнеса, можно ее попродавать.
И вот наконец я понял, почему идея «пусть бизнес пишет запросы на естественном языке» не взлетает и не взлетит.
На бумаге все красиво. Даешь ИИшке команду: «Покажи выручку за август по городам», получаешь результат.
На практике же имеем несколько иной сетап: никто из бизнес-менеджеров не хочет и не может задавать правильные вопросы к данным.
Причина кроется в подмене понятий, за которую сами бизнес-менеджеры обычно аналитика и ругают. Так вот, написание SQL — это не основная работа аналитика. На самом деле аналитик занимается мыслительным трудом: как раз пытается разобраться, какие вопросы вообще стоит задать, чтобы понять, что там у бизнеса пошло не так. SQL — лишь удобный интерфейс для формулировки гипотез. Его просто изучить, но логика за пределами SQL.
И, соответственно, вторая часть проблемы: многие бизнес-менеджеры в большинстве случаев не обучены мыслить аналитически, эту часть работы они делегировали аналитику, чтобы он за них подумал. Они сами не думают в контексте данных, структур или понимания взаимосвязей. Именно поэтому LLM-промпты в виде «SQLGPT для маркетологов» и не взлетают.
Сейчас мы на этапе следующего шага — передать LLM формирование вопросов и гипотез, а затем уже написание необходимого кода и SQL-запросов для решения аналитической задачи.
А пока просто осознаем, что произошла гиперинфляция хардскиллов. А вот мыслить и генерировать ценные инсайты — тот самый навык, который был и есть востребован в аналитиках.
Please open Telegram to view this post
VIEW IN TELEGRAM
💯14👍3❤2 2
Forwarded from topdatalab (Roman Zykov)
Две плохие новости за последний месяц: Fivetran купила SQLMesh и dbt.
Почему это плохо.
SQLMesh относительно молодая компания, ей около трех лет. То, что ее продали, означает, что они не смогли сделать выручку или не хватило амбиций фаундеров.
Думаю, что сейчас фаундеры SQLmesh ходят грустные.
Про dbt не скажу, но SQLMesh наступала ей на пятки.
И такая консолидация плохо повлияет на развитие инструментов.
Почему это плохо.
SQLMesh относительно молодая компания, ей около трех лет. То, что ее продали, означает, что они не смогли сделать выручку или не хватило амбиций фаундеров.
Думаю, что сейчас фаундеры SQLmesh ходят грустные.
Про dbt не скажу, но SQLMesh наступала ей на пятки.
И такая консолидация плохо повлияет на развитие инструментов.
💯8 4🤔2
topdatalab
Две плохие новости за последний месяц: Fivetran купила SQLMesh и dbt. Почему это плохо. SQLMesh относительно молодая компания, ей около трех лет. То, что ее продали, означает, что они не смогли сделать выручку или не хватило амбиций фаундеров. Думаю, что…
DBT - один из самых полезных инструментов для инжиниринга данных.
Видимо, пришло время сделать свой аналог, свободный от окукливания большими жадными корпорациями. Заодно проделать работу над ошибками, потому как некоторые вещи ужас как неудобно делать.
Расскажите, что для вас удобно и неудобно в DBT и SQL Mesh.
Видимо, пришло время сделать свой аналог, свободный от окукливания большими жадными корпорациями. Заодно проделать работу над ошибками, потому как некоторые вещи ужас как неудобно делать.
Расскажите, что для вас удобно и неудобно в DBT и SQL Mesh.
Следующее пристанице самурая данных - Форум "Открытые Данные", Казань 30-31 октября.
Докладываю о современных подходах к построению облаков данных.
https://opendataforum.ru/
Докладываю о современных подходах к построению облаков данных.
https://opendataforum.ru/
👍11 3❤2