https://www.sqlnoir.com
Прикольный интерактив по изучению SQL - вы детектив и расследуете криминальные дела.
У вас есть датасет и возможность делать к нему запросы.
Прикольный интерактив по изучению SQL - вы детектив и расследуете криминальные дела.
У вас есть датасет и возможность делать к нему запросы.
SQLNoir
Interactive SQL Game | Learn SQL by Solving Detective Cases | SQLNoir
SQLNoir is an interactive SQL game where you solve crimes and mysteries using SQL queries. Learn SQL by playing detective in this engaging SQL learning game.
🔥25❤1👍1
@ohmydataengineer - канал "🕯 Труба Данных" и Вьетнамские флешбеки!
Please open Telegram to view this post
VIEW IN TELEGRAM
😢21👍10💩4❤3
Жаба, гадюка, литкод...
Следите за руками:
- Челик сделал тулзу, чтобы хакать литкод интервью (на самом деле таких много уже, отличаются подходами, где-то опираются на голос и распознавание речи, где-то на видео-поток или скриншоты)
- Прошел с ее помощью в Амазон, снял всё на видео и выложил в Ютуб.
- Амазон обиделся и требует отчисления чувака из универа
Ссылку на конкретно эту тулзу увидите на скриншоте.
Еще пара похожих: ParakeetAI и Final Round AI
Что с этим делать - решать вам =)
А еще…
https://x.com/im_roy_lee/status/1895726775185129555
Правда чел говорит, что получил еще кучку офферов, но не планирует ни один принимать и вообще планировал это все давно и литкод интервью это зло. И так как история взорвала твиттур, тут же начали отзывать свои офферы все остальные компании.
@ohmydataengineer - канал "🕯 Труба Данных" верил, что время литкода пройдет!
Следите за руками:
- Челик сделал тулзу, чтобы хакать литкод интервью (на самом деле таких много уже, отличаются подходами, где-то опираются на голос и распознавание речи, где-то на видео-поток или скриншоты)
- Прошел с ее помощью в Амазон, снял всё на видео и выложил в Ютуб.
- Амазон обиделся и требует отчисления чувака из универа
Ссылку на конкретно эту тулзу увидите на скриншоте.
Еще пара похожих: ParakeetAI и Final Round AI
Что с этим делать - решать вам =)
А еще…
https://x.com/im_roy_lee/status/1895726775185129555
Правда чел говорит, что получил еще кучку офферов, но не планирует ни один принимать и вообще планировал это все давно и литкод интервью это зло. И так как история взорвала твиттур, тут же начали отзывать свои офферы все остальные компании.
@ohmydataengineer - канал "
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥27❤5🥱5💩2
https://debezium.io/blog/2025/02/01/real-time-data-replication-with-debezium-and-python/
Говорим Debezium, подразумеваем Kafka как точка, в которую у нас льются эвенты CDC. Казалось бы, самое стандартное и классическое решение, проверенное сотнями разных сетапов.
А вот нет, оказывается можно и без Kafka.
Debezium + CDC + Python + dlt → Real-time PostgreSQL replication
@ohmydataengineer - канал "🕯 Труба Данных" удивлен новым подходам!
Говорим Debezium, подразумеваем Kafka как точка, в которую у нас льются эвенты CDC. Казалось бы, самое стандартное и классическое решение, проверенное сотнями разных сетапов.
А вот нет, оказывается можно и без Kafka.
Debezium + CDC + Python + dlt → Real-time PostgreSQL replication
@ohmydataengineer - канал "
Please open Telegram to view this post
VIEW IN TELEGRAM
Debezium
Real-time Data Replication with Debezium and Python
Debezium is an open source distributed platform for change data capture. Start it up, point it at your databases, and your apps can start responding to all of the inserts, updates, and deletes that other apps commit to your databases. Debezium is durable…
👍23❤1💩1
https://stackoverflow.blog/2025/02/27/our-next-phase-q-and-a-was-just-the-beginning/
SO, хоть и был источником ответов на вопросы (я прекрасно помню что буквально 3 года назад мы первым делом делали поиск в нем, когда пытались исправить баг), но медленно помирал из-за токсичности, gate-keeping и налета элитизма местных бородачей.
А с появлением LLM траффик туда вообще упал до минимума.
Так вот ребята затеяли изменение своей модели и вообще смысла в своем проекте:
Что из этого получится?
@ohmydataengineer - канал "🕯 Труба Данных", который чуть не забанили за первый вопрос на SO!
SO, хоть и был источником ответов на вопросы (я прекрасно помню что буквально 3 года назад мы первым делом делали поиск в нем, когда пытались исправить баг), но медленно помирал из-за токсичности, gate-keeping и налета элитизма местных бородачей.
А с появлением LLM траффик туда вообще упал до минимума.
Так вот ребята затеяли изменение своей модели и вообще смысла в своем проекте:
The new Stack Overflow will be one built to feel like a personalized homepage—your own technical aggregator. It might collect videos, blogs, Q&A, war stories, jokes, educational materials, jobs, all these formats (or maybe others, we would love to hear your ideas!), and fold them together into one personalized destination. We want this place to be your “third screen”—your entry point to your own neighborhood on the internet.
Что из этого получится?
@ohmydataengineer - канал "
Please open Telegram to view this post
VIEW IN TELEGRAM
stackoverflow.blog
Our next phase—Q&A was just the beginning - Stack Overflow
👍9💩8😢1🥱1
https://newsletter.pragmaticengineer.com/p/trimodal
Обновленная версия той самой известной статьи про три-модальную категоризацию компаний и зарплат в них.
Теперь дополнена данными из levels.fyi
Огромное и наглядное чтиво!
@ohmydataengineer - канал "🕯 Труба Данных" подсказывает про зарплаты!
Обновленная версия той самой известной статьи про три-модальную категоризацию компаний и зарплат в них.
Теперь дополнена данными из levels.fyi
Огромное и наглядное чтиво!
@ohmydataengineer - канал "
Please open Telegram to view this post
VIEW IN TELEGRAM
Pragmaticengineer
Trimodal Nature of Tech Compensation in the US, UK and India
Deepdive into the distribution of software engineering compensation, based on more than 20,000 data points from Levels.fyi
👍14💩2
Мы выяснили много классных инсайтов, например:
👉 Главные выводы
👉 Какие задачи решают аналитики
👉 Что с релокацией у аналитиков
👉 Где работают и как работают (удалёнка/офис)
👉 ЗАРПЛАТЫ: как менялись за год и сколько получают аналитики + мы дополнили исследование нашей экспертизой: что повышает или снижает стоимость аналитиков
👉 Откуда пришли в профессию и куда идут дальше
👉 Как ищут работу
👉 ТОП и Анти-ТОП компаний для аналитиков
👉 Что ценят в аналитической культуре
👉 Каких экспертов котируют и за кем следят
Вот такое вот большое исследование у NewHR вышло по аналитикам данных, которое я когда-то вас давно просил помочь заполнить.
▶️ Ссылка на сайт с полными результатами
https://newhr.org/data/research-analysts-2024
С удовольствием делюсь всеми результатами (и безбожно скопировав текст, который мне ребята прислали с важными фактами) 😁
@ohmydataengineer - канал "🕯 Труба Данных" сегодня про аналитиков!
👉 Главные выводы
👉 Какие задачи решают аналитики
👉 Что с релокацией у аналитиков
👉 Где работают и как работают (удалёнка/офис)
👉 ЗАРПЛАТЫ: как менялись за год и сколько получают аналитики + мы дополнили исследование нашей экспертизой: что повышает или снижает стоимость аналитиков
👉 Откуда пришли в профессию и куда идут дальше
👉 Как ищут работу
👉 ТОП и Анти-ТОП компаний для аналитиков
👉 Что ценят в аналитической культуре
👉 Каких экспертов котируют и за кем следят
Вот такое вот большое исследование у NewHR вышло по аналитикам данных, которое я когда-то вас давно просил помочь заполнить.
▶️ Ссылка на сайт с полными результатами
https://newhr.org/data/research-analysts-2024
С удовольствием делюсь всеми результатами (и безбожно скопировав текст, который мне ребята прислали с важными фактами) 😁
@ohmydataengineer - канал "
Please open Telegram to view this post
VIEW IN TELEGRAM
newhr.org
Исследование рынка аналитиков в 2024 году
Динамика зарплат, рейтинг работодателей, популярные рынки и скорость поиска работы
👍9💩6
Это что за новый зверь?
Были Data Engineers, потом MDS популяризировал лычку Analytics Engineer. А это что за зверь?
https://efds.fa.em5.oraclecloud.com/hcmUI/CandidateExperience/en/sites/CX_1/job/42523
@ohmydataengineer - канал "🕯 Труба Данных" говорит об Data Software Developers!
Были Data Engineers, потом MDS популяризировал лычку Analytics Engineer. А это что за зверь?
https://efds.fa.em5.oraclecloud.com/hcmUI/CandidateExperience/en/sites/CX_1/job/42523
@ohmydataengineer - канал "
Please open Telegram to view this post
VIEW IN TELEGRAM
💩21🔥5😢4
https://github.com/deepseek-ai/smallpond
Там из каждого утюга уже написали про новый фреймворк который использовал DeepSeek для себя, где они сделали мультинодовый DuckDB и какие-то фантастические цифры якобы показали по обработке (https://github.com/deepseek-ai/3FS?tab=readme-ov-file#2-graysort)
Ну и я тоже напишу об этом 😁
@ohmydataengineer - канал "🕯 Труба Данных" почти вовремя пишет новости!
Там из каждого утюга уже написали про новый фреймворк который использовал DeepSeek для себя, где они сделали мультинодовый DuckDB и какие-то фантастические цифры якобы показали по обработке (https://github.com/deepseek-ai/3FS?tab=readme-ov-file#2-graysort)
Ну и я тоже напишу об этом 😁
@ohmydataengineer - канал "
Please open Telegram to view this post
VIEW IN TELEGRAM
GitHub
GitHub - deepseek-ai/smallpond: A lightweight data processing framework built on DuckDB and 3FS.
A lightweight data processing framework built on DuckDB and 3FS. - deepseek-ai/smallpond
💩7👍4
https://arrow.apache.org/blog/2025/01/10/arrow-result-transfer/. и https://arrow.apache.org/blog/2025/02/28/data-wants-to-be-free/
Хорошая парочка технических статей (и будет потом еще несколько) про Apache Arrow и вообще как оно там под капотом.
@ohmydataengineer - канал "🕯 Труба Данных" про Apache, но не Airflow!
Хорошая парочка технических статей (и будет потом еще несколько) про Apache Arrow и вообще как оно там под капотом.
@ohmydataengineer - канал "
Please open Telegram to view this post
VIEW IN TELEGRAM
Apache Arrow
How the Apache Arrow Format Accelerates Query Result Transfer
Arrow speeds up query result transfer by slashing (de)serialization overheads. We outline five key attributes of the Arrow format that enable this.
👍12💩2
@ohmydataengineer - канал "🕯 Труба Данных" и очередной пятничный юмор!
Please open Telegram to view this post
VIEW IN TELEGRAM
👍13😢6💩4
ZooKeeper Deprecation
With the release of Apache Kafka 3.5, Zookeeper is now marked deprecated. Removal of ZooKeeper is planned in the next major release of Apache Kafka (version 4.0), which is scheduled to happen no sooner than April 2024. During the deprecation phase, ZooKeeper is still supported for metadata management of Kafka clusters, but it is not recommended for new deployments.
Пересаживаемся на KRaft. И слава богу. https://kafka.apache.org/documentation/#kraft
P.S. Зукипер был главнюком 14(!!) лет в деплойментах Кафки.
@ohmydataengineer - канал "🕯 Труба Данных" никогда не любил зукипер!
With the release of Apache Kafka 3.5, Zookeeper is now marked deprecated. Removal of ZooKeeper is planned in the next major release of Apache Kafka (version 4.0), which is scheduled to happen no sooner than April 2024. During the deprecation phase, ZooKeeper is still supported for metadata management of Kafka clusters, but it is not recommended for new deployments.
Пересаживаемся на KRaft. И слава богу. https://kafka.apache.org/documentation/#kraft
P.S. Зукипер был главнюком 14(!!) лет в деплойментах Кафки.
@ohmydataengineer - канал "
Please open Telegram to view this post
VIEW IN TELEGRAM
👍12❤4🔥3
https://blog.2minutestreaming.com/p/apache-kafka-4-0-release
Что касается изменений в 4.0 у Кафки (релиз состоялся), уход на покой Zookeeper не самый горячий пирожочек.
А вот это - да.
KIP-932: Queues (EA) 🚇
Perhaps the hottest new feature, Queues introduces a new type of consumer group - the Share Consumer - that gives you queue-like semantics:
1. per-message acknowledgement/retries
2. ability to have many consumers collaboratively share progress reading from the same partition (previously, only one consumer per consumer group could read a partition at any time)
@ohmydataengineer - канал "🕯 Труба Данных"
Что касается изменений в 4.0 у Кафки (релиз состоялся), уход на покой Zookeeper не самый горячий пирожочек.
А вот это - да.
KIP-932: Queues (EA) 🚇
Perhaps the hottest new feature, Queues introduces a new type of consumer group - the Share Consumer - that gives you queue-like semantics:
1. per-message acknowledgement/retries
2. ability to have many consumers collaboratively share progress reading from the same partition (previously, only one consumer per consumer group could read a partition at any time)
@ohmydataengineer - канал "
Please open Telegram to view this post
VIEW IN TELEGRAM
2 Minute Streaming
Announcing Apache Kafka 4.0
see the top 3 features, and some trivia around other major releases
👍12🔥5❤2
https://x-x.codes/posts/100-tips-on-how-to-use-me/
Если вам удалось попробовать заниматься разработкой с агентами, то вот прекрасный набор советов о том, как этот процесс ускорить и улучшить.
По себе могу заметить, как изменился flow разработки, в очень интересном мире мы живем 🤪
@ohmydataengineer - канал "🕯 Труба Данных"
Если вам удалось попробовать заниматься разработкой с агентами, то вот прекрасный набор советов о том, как этот процесс ускорить и улучшить.
По себе могу заметить, как изменился flow разработки, в очень интересном мире мы живем 🤪
@ohmydataengineer - канал "
Please open Telegram to view this post
VIEW IN TELEGRAM
x-x.codes
100 tips on how to use me (from ai agent)
100 Tips on How to Use Me (From AI Agent)
Getting Started
Start with clear, specific goals rather than vague requests.
Do: Specify the exact problem, component, file location, and expected behavior.
Don’t: Ask for general solutions like “Fix my app” without…
Getting Started
Start with clear, specific goals rather than vague requests.
Do: Specify the exact problem, component, file location, and expected behavior.
Don’t: Ask for general solutions like “Fix my app” without…
👍12💩2
In most businesses, data producers have no idea who their consumers are or why they need the data in the first place. They are unaware of which data is important for AI/BI, nor do they understand what it should look like. Platform teams are rarely informed about how their infrastructure is being leveraged and have little knowledge of the business context surrounding data, while consumers have business context but don't know where the data is coming from or whether or not it's quality.
Is it any wonder that data management programs are a complete, disjointed mess?
Читаешь иногда статьи, а там режут как по живому...
👍24😢5💩2🥱2
Forwarded from Клуб CDO
Команда ClickHouse наконец-то выпустила официальный коннектор к Tableau!
Проверено - работает! Правда не верьте тексту в официльном блоге (ниже), коннектор работает только с JDBC драйвером версии v0.4.6, а не с последней версией, как указано в инструкции ниже.
https://clickhouse.com/blog/announcing-clickhouse-connector-tableau#what-about-tableau-cloud
Проверено - работает! Правда не верьте тексту в официльном блоге (ниже), коннектор работает только с JDBC драйвером версии v0.4.6, а не с последней версией, как указано в инструкции ниже.
https://clickhouse.com/blog/announcing-clickhouse-connector-tableau#what-about-tableau-cloud
ClickHouse
Announcing the official ClickHouse Connector for Tableau
Have you been looking to visualize data stored in ClickHouse with Tableau? Today, you can with the launch of the official ClickHouse Tableau Connector!
🔥12💩5
Astronomer (это который главный контрибуток в Airflow) заопенсорсил новые декораторы:
➡️ @task.llm: Define a task that calls an LLM
➡️ @task.agent: Define a task that calls an agent
➡️ @task.llm_branch: Control flow of a DAG based on LLM outputs.
По ссылке в репе https://github.com/astronomer/airflow-ai-sdk есть примеры
1️⃣ Deep research: Use duckdb to generate a research report
2️⃣ Email generation: Generates personalized email prospects
3️⃣ Github changelog: Summarize the commits to the Airflow project
4️⃣ Product Feedback Summarization: The project's name says it all
5️⃣ Support Ticket Routing: Routes support tickets to the correct department
@ohmydataengineer - канал "🕯 Труба Данных"
➡️ @task.llm: Define a task that calls an LLM
➡️ @task.agent: Define a task that calls an agent
➡️ @task.llm_branch: Control flow of a DAG based on LLM outputs.
По ссылке в репе https://github.com/astronomer/airflow-ai-sdk есть примеры
1️⃣ Deep research: Use duckdb to generate a research report
2️⃣ Email generation: Generates personalized email prospects
3️⃣ Github changelog: Summarize the commits to the Airflow project
4️⃣ Product Feedback Summarization: The project's name says it all
5️⃣ Support Ticket Routing: Routes support tickets to the correct department
@ohmydataengineer - канал "
Please open Telegram to view this post
VIEW IN TELEGRAM
GitHub
GitHub - astronomer/airflow-ai-sdk: An SDK for working with LLMs and AI Agents from Apache Airflow, based on Pydantic AI
An SDK for working with LLMs and AI Agents from Apache Airflow, based on Pydantic AI - astronomer/airflow-ai-sdk
🔥14👍8💩4❤1👎1
https://news.1rj.ru/str/ohmydataengineer/636
Помните, недавно рассказывал про парня, который сделал тулзу чтобы хакать литкод интервью и все завиралилось?
По его словам, Амазон пригрозил университету "Или исключайте челика, или мы больше не нанимаем из вашего вуза". И его исключили.
https://www.linkedin.com/posts/roy-lee-goat_i-just-got-kicked-out-of-columbia-for-taking-activity-7310834407433453568-tqAm
@ohmydataengineer - канал "🕯 Труба Данных"
Помните, недавно рассказывал про парня, который сделал тулзу чтобы хакать литкод интервью и все завиралилось?
По его словам, Амазон пригрозил университету "Или исключайте челика, или мы больше не нанимаем из вашего вуза". И его исключили.
https://www.linkedin.com/posts/roy-lee-goat_i-just-got-kicked-out-of-columbia-for-taking-activity-7310834407433453568-tqAm
@ohmydataengineer - канал "
Please open Telegram to view this post
VIEW IN TELEGRAM
💩31😢8🔥4👍2
https://buf.build/product/bufstream
Какое-то время назад говорил про "немного медленней и сильно дешевле" альтернативу Kafka - Warpstream. Потому что данные в объектном хранилище.
Так вот еще одно похожее решение, еще и с Iceberg - Bufstream.
@ohmydataengineer - канал "🕯 Труба Данных" опять радуется прикольным незнакомым инструментам!
Какое-то время назад говорил про "немного медленней и сильно дешевле" альтернативу Kafka - Warpstream. Потому что данные в объектном хранилище.
Так вот еще одно похожее решение, еще и с Iceberg - Bufstream.
@ohmydataengineer - канал "
Please open Telegram to view this post
VIEW IN TELEGRAM
buf.build
Bufstream - Buf
Guarantee streaming data quality and slash cloud costs 10x with Bufstream, a drop-in replacement for Apache Kafka®.
💩17👍1
Две важные новости в канале:
- с сегодняшнего дня в нем появится реклама, мне надо ипотеку в России закрыть
- это последний пост, на который можно будет поставить💩
- с сегодняшнего дня в нем появится реклама, мне надо ипотеку в России закрыть
- это последний пост, на который можно будет поставить
Please open Telegram to view this post
VIEW IN TELEGRAM
💩176👍14😢6🔥5🥱5❤2👎2