https://www.answer.ai/posts/2025-01-08-devin.html
Помните, какое-то время назад, в интернете появился Devin, AI программист, который должен был нас всех заменить? Тогда в демо этого AI Agent компания показывала, что он от и до смог решить какую-то задачу с Upwork без какого-либо вмешательства.
Так вот пока это все пустые обещания, все очень так себе.
@ohmydataengineer - канал "🕯 Труба Данных" говорит что нас заменят, но не скоро
Помните, какое-то время назад, в интернете появился Devin, AI программист, который должен был нас всех заменить? Тогда в демо этого AI Agent компания показывала, что он от и до смог решить какую-то задачу с Upwork без какого-либо вмешательства.
Так вот пока это все пустые обещания, все очень так себе.
@ohmydataengineer - канал "
Please open Telegram to view this post
VIEW IN TELEGRAM
❤1👍1💩1
Рекрутеры используют AI, чтобы отсеивать нерелевантные отклики.
А можно просто фильтровать по словам и сразу всех "автоматизаторов откликов" выявить 😂
@ohmydataengineer - канал "🕯 Труба Данных" и пятничный юмор!
А можно просто фильтровать по словам и сразу всех "автоматизаторов откликов" выявить 😂
@ohmydataengineer - канал "
Please open Telegram to view this post
VIEW IN TELEGRAM
❤13💩4👍1😢1
https://www.astronomer.io/ebooks/apache-airflow-best-practices-etl-elt-pipelines/
Астрономер (главный контрибьютор Airflow) раздает книжку по best practices в Airflow. Ничего сверхестественного, но кажется вполне себе годным чтивом, обновить знания.
@ohmydataengineer - канал "🕯 Труба Данных" любит Airflow, как бы его не хейтили
Астрономер (главный контрибьютор Airflow) раздает книжку по best practices в Airflow. Ничего сверхестественного, но кажется вполне себе годным чтивом, обновить знания.
@ohmydataengineer - канал "
Please open Telegram to view this post
VIEW IN TELEGRAM
www.astronomer.io
Best Practices for ETL and ELT Pipelines in Apache Airflow® 3
This eBook covers key architectural decisions and Airflow features to help you write best practice pipelines.
❤15👍7🔥2💩2
https://www.warpstream.com
Warpstream
Кстати, забыл рассказать, что я наткнулся на прикольный продукт от Confluent: Kafka, только вместо памяти на машинах - датка лежит в бакетах.
Да, скорость будет поменьше, но и ценник сильно меньше 😏
@ohmydataengineer - канал "🕯 Труба Данных" радуется прикольным незнакомым инструментам!
Warpstream
Кстати, забыл рассказать, что я наткнулся на прикольный продукт от Confluent: Kafka, только вместо памяти на машинах - датка лежит в бакетах.
Да, скорость будет поменьше, но и ценник сильно меньше 😏
@ohmydataengineer - канал "
Please open Telegram to view this post
VIEW IN TELEGRAM
Warpstream
WarpStream - The Diskless, Kafka-Compatible Data Streaming Platform
WarpStream is the original diskless, Kafka compatible data streaming platform built directly on top of object storage: zero disks, zero inter-AZ costs, zero cross-account IAM access required.
🔥7💩2
https://medium.com/strava-engineering/rain-a-key-value-store-for-stravas-scale-7f580f5b4848
У меня love / hate relationships с бегом: когда-то я его любил, бегал марафоны, потом ненавидел, потом снова любил, потом снова ненавидел, ну вы поняли =)
И каждый раз я продолжал загружать свои пробежки в Strava.
Наткнулся тут на их инженерный блог и прикольную статью о том, что они там изобрели в качестве хранилищ для определенного типа данных и вообще как там у них устроено.
@ohmydataengineer - канал "🕯 Труба Данных" про технологии в продуктах, которыми пользуемся ежедневно!
У меня love / hate relationships с бегом: когда-то я его любил, бегал марафоны, потом ненавидел, потом снова любил, потом снова ненавидел, ну вы поняли =)
И каждый раз я продолжал загружать свои пробежки в Strava.
Наткнулся тут на их инженерный блог и прикольную статью о том, что они там изобрели в качестве хранилищ для определенного типа данных и вообще как там у них устроено.
@ohmydataengineer - канал "
Please open Telegram to view this post
VIEW IN TELEGRAM
Medium
Rain: A key-value store for Strava’s scale
At Strava, we love maps — some of our most loved features are nestled on map surfaces. My team, the Geo team, is focused on building and…
👍9❤6💩3
https://clickhouse.com/blog/json-bench-clickhouse-vs-mongodb-elasticsearch-duckdb-postgresql
Вы будете кидать💩 , но я опять про Clickhouse
Огромная статья с технической мяготкой про 1 Billion JSON Challenge и насколько новый нативный тип JSON в клике работает быстрей и эффективней по памяти и стораджу по сравнению с другими базами данных.
@ohmydataengineer - канал "🕯 Труба Данных" в очередной раз про одно и то же!
Вы будете кидать
Огромная статья с технической мяготкой про 1 Billion JSON Challenge и насколько новый нативный тип JSON в клике работает быстрей и эффективней по памяти и стораджу по сравнению с другими базами данных.
@ohmydataengineer - канал "
Please open Telegram to view this post
VIEW IN TELEGRAM
ClickHouse
The billion docs JSON Challenge: ClickHouse vs. MongoDB, Elasticsearch, and more
Explore how ClickHouse’s new JSON data type outperforms leading JSON databases with unmatched storage efficiency and lightning-fast query speed—all while storing JSON data in a single field and staying true to the promise of JSON databases
💩18👍12❤1🔥1
Нам тут обещают, что скоро AI agents нас всех заменят.
Так вроде бы уже такие системы работают....
@ohmydataengineer - канал "🕯 Труба Данных" и пятничный юмор!
Так вроде бы уже такие системы работают....
@ohmydataengineer - канал "
Please open Telegram to view this post
VIEW IN TELEGRAM
😢7👍2💩2🔥1🥱1
https://www.gable.ai/data-contracts-book
ГигаЧад и O'Reilly выкатывают в открытый доступ (правда надо оставить емейл) первую версию книжки про дата контракты.
Как по мне, хайп на эту штуку прошел и чет даже не сильно зудит это применять. Но, возможно, вы что-то подчерпнете для себя!
@ohmydataengineer - канал "🕯 Труба Данных" в сомнения про дата контракты
ГигаЧад и O'Reilly выкатывают в открытый доступ (правда надо оставить емейл) первую версию книжки про дата контракты.
Как по мне, хайп на эту штуку прошел и чет даже не сильно зудит это применять. Но, возможно, вы что-то подчерпнете для себя!
@ohmydataengineer - канал "
Please open Telegram to view this post
VIEW IN TELEGRAM
www.gable.ai
Gable | Data Contracts: Developing Production Grade Pipelines at Scale
Download the Data Contracts: Developing Production Grade Pipelines at Scale Book
💩6👍5❤2
https://vutr.substack.com/p/8-minutes-to-understand-presto
Большая пояснительная статья про работу Presto (ну и в целом Trino работает похожим образом). Все еще сильно советую подписаться на этого парня, он хорошие статьи пишет
@ohmydataengineer - канал "🕯 Труба Данных", который ничего умного в этот раз не придумал.
Большая пояснительная статья про работу Presto (ну и в целом Trino работает похожим образом). Все еще сильно советую подписаться на этого парня, он хорошие статьи пишет
@ohmydataengineer - канал "
Please open Telegram to view this post
VIEW IN TELEGRAM
Substack
8 minutes to understand Presto
Uber, Netflix, Airbnb, and LinkedIn uses this query engine.
👍16❤2💩1
https://www.latent.space/p/2025-papers
Если вы угораете по white-papers и хорошим техническим статьям и публикациям (а не постам в блогах), вот отличный список из 50 статей пол AI Engineering.
Читать не перечитать!
@ohmydataengineer - канал "🕯 Труба Данных" набрал себе чтива на недели вперед!
Если вы угораете по white-papers и хорошим техническим статьям и публикациям (а не постам в блогах), вот отличный список из 50 статей пол AI Engineering.
Читать не перечитать!
@ohmydataengineer - канал "
Please open Telegram to view this post
VIEW IN TELEGRAM
www.latent.space
The 2025 AI Engineering Reading List
We picked 50 paper/models/blogs across 10 fields in AI Eng: LLMs, Benchmarks, Prompting, RAG, Agents, CodeGen, Vision, Voice, Diffusion, Finetuning. If you're starting from scratch, start here.
🔥7💩4
@ohmydataengineer - канал "🕯 Труба Данных" и пятничный юмор!
Please open Telegram to view this post
VIEW IN TELEGRAM
1👍24🔥5😢2💩1
https://www.pracdata.io/p/open-source-data-engineering-landscape-2025
Все вы помните огромные картинки, на которых 17 миллионов логотипов сервисов для данных. Вот эта статья - одна из таких, но тут главная особенность - здесь ТОЛЬКО open source решения, и причем в адекватном количестве. С понятными пояснениями, почему тот или иной инструмент попал в список.
Как всегда, читать эту картинку нужно следующим образом "А что еще есть на рынке в этой сфере кроме X?"
@ohmydataengineer - канал "🕯 Труба Данных" и ставшие уже классическими landscapes картинки!
Все вы помните огромные картинки, на которых 17 миллионов логотипов сервисов для данных. Вот эта статья - одна из таких, но тут главная особенность - здесь ТОЛЬКО open source решения, и причем в адекватном количестве. С понятными пояснениями, почему тот или иной инструмент попал в список.
Как всегда, читать эту картинку нужно следующим образом "А что еще есть на рынке в этой сфере кроме X?"
@ohmydataengineer - канал "
Please open Telegram to view this post
VIEW IN TELEGRAM
www.pracdata.io
Open Source Data Engineering Landscape 2025
A comprehensive view of active open source tools and emerging trends in data engineering ecosystem in 2024-2025
1👍23💩5❤2
Когда я отправлял в календарь этот пост, DeepSeek и Mistral еще не взрывали пуканы обычных обывателей интернета.
@ohmydataengineer - канал "🕯 Труба Данных" и пятничный юмор!
@ohmydataengineer - канал "
Please open Telegram to view this post
VIEW IN TELEGRAM
2💩13
Всегда рад помочь хорошим и интересным проектам, чтобы про них узнала аудитория. Сегодня - один из таких случаев!
Привет, это Артемий @onepx, я создатель rushdb.com - передовой базы данных, построенной на базе Neo4j, не требующей конфигурации, моделирования данных и какой-либо нормализации данных.
Это позволяет использовать ее для быстрого прототипирования и разработки agentic решений и приложений без привлечения дорогостоящей backend экспертизы. Вы просто отправляете любые JSON / CSV данные, а RushDB берет на себя всю рутину по нормализации, лэйблингу, установке связей между сущностями и типизации входных данных.
Сегодня у нас случился публичный запуск и мы опубликовали краткий анонс всех возможностей и преимуществ нашего решения.
https://rushdb.com/blog/rushdb-the-zero-config-database-for-modern-apps-and-ai-solutions
RushDB доступен в open-source и в cloud managed варианте.
@ohmydataengineer - канал "🕯 Труба Данных" рассказывает про новые базы данных!
Привет, это Артемий @onepx, я создатель rushdb.com - передовой базы данных, построенной на базе Neo4j, не требующей конфигурации, моделирования данных и какой-либо нормализации данных.
Это позволяет использовать ее для быстрого прототипирования и разработки agentic решений и приложений без привлечения дорогостоящей backend экспертизы. Вы просто отправляете любые JSON / CSV данные, а RushDB берет на себя всю рутину по нормализации, лэйблингу, установке связей между сущностями и типизации входных данных.
Сегодня у нас случился публичный запуск и мы опубликовали краткий анонс всех возможностей и преимуществ нашего решения.
https://rushdb.com/blog/rushdb-the-zero-config-database-for-modern-apps-and-ai-solutions
RushDB доступен в open-source и в cloud managed варианте.
@ohmydataengineer - канал "
Please open Telegram to view this post
VIEW IN TELEGRAM
Rushdb
RushDB – Instant Graph Database for AI & Modern Apps
RushDB is a zero-config, graph-powered database built for AI, SaaS, and ML. Fast queries, seamless scaling, no setup. Try it now!
1❤12
А помните нашумевшую историю, в которой Klarna сократила на 80% штат customer support, потому что заменила всех своим AI?
Все инфлюенсеры предрекали смерть customer support позиций, каждый сервис на своем сайте чат-ботов повнедрял, вся фигня.
Так вот Klarna откатывает это решение и снова набирает персонал🐻❄️
(скриншот и новость подсмотрел у сами знаете кого)
@ohmydataengineer - канал "🕯 Труба Данных" все еще не заменен на AI
Все инфлюенсеры предрекали смерть customer support позиций, каждый сервис на своем сайте чат-ботов повнедрял, вся фигня.
Так вот Klarna откатывает это решение и снова набирает персонал🐻❄️
(скриншот и новость подсмотрел у сами знаете кого)
@ohmydataengineer - канал "
Please open Telegram to view this post
VIEW IN TELEGRAM
👍21💩3❤2🔥1😢1
https://github.com/sinaptik-ai/pandas-ai
Удивительная вещь, которая прошла мимо меня (а существует аж с апреля 2023 года)
Pandas + LLM + BI в одной опенсорс коробке, главное датасет отдай нормальный!🙂
@ohmydataengineer - канал "🕯 Труба Данных" немного меньше недолюбливает Pandas
Удивительная вещь, которая прошла мимо меня (а существует аж с апреля 2023 года)
Pandas + LLM + BI в одной опенсорс коробке, главное датасет отдай нормальный!
@ohmydataengineer - канал "
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
💩13🔥6
https://www.sqlnoir.com
Прикольный интерактив по изучению SQL - вы детектив и расследуете криминальные дела.
У вас есть датасет и возможность делать к нему запросы.
Прикольный интерактив по изучению SQL - вы детектив и расследуете криминальные дела.
У вас есть датасет и возможность делать к нему запросы.
SQLNoir
Interactive SQL Game | Learn SQL by Solving Detective Cases | SQLNoir
SQLNoir is an interactive SQL game where you solve crimes and mysteries using SQL queries. Learn SQL by playing detective in this engaging SQL learning game.
🔥25❤1👍1
@ohmydataengineer - канал "🕯 Труба Данных" и Вьетнамские флешбеки!
Please open Telegram to view this post
VIEW IN TELEGRAM
😢21👍10💩4❤3
Жаба, гадюка, литкод...
Следите за руками:
- Челик сделал тулзу, чтобы хакать литкод интервью (на самом деле таких много уже, отличаются подходами, где-то опираются на голос и распознавание речи, где-то на видео-поток или скриншоты)
- Прошел с ее помощью в Амазон, снял всё на видео и выложил в Ютуб.
- Амазон обиделся и требует отчисления чувака из универа
Ссылку на конкретно эту тулзу увидите на скриншоте.
Еще пара похожих: ParakeetAI и Final Round AI
Что с этим делать - решать вам =)
А еще…
https://x.com/im_roy_lee/status/1895726775185129555
Правда чел говорит, что получил еще кучку офферов, но не планирует ни один принимать и вообще планировал это все давно и литкод интервью это зло. И так как история взорвала твиттур, тут же начали отзывать свои офферы все остальные компании.
@ohmydataengineer - канал "🕯 Труба Данных" верил, что время литкода пройдет!
Следите за руками:
- Челик сделал тулзу, чтобы хакать литкод интервью (на самом деле таких много уже, отличаются подходами, где-то опираются на голос и распознавание речи, где-то на видео-поток или скриншоты)
- Прошел с ее помощью в Амазон, снял всё на видео и выложил в Ютуб.
- Амазон обиделся и требует отчисления чувака из универа
Ссылку на конкретно эту тулзу увидите на скриншоте.
Еще пара похожих: ParakeetAI и Final Round AI
Что с этим делать - решать вам =)
А еще…
https://x.com/im_roy_lee/status/1895726775185129555
Правда чел говорит, что получил еще кучку офферов, но не планирует ни один принимать и вообще планировал это все давно и литкод интервью это зло. И так как история взорвала твиттур, тут же начали отзывать свои офферы все остальные компании.
@ohmydataengineer - канал "
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥27❤5🥱5💩2