Пятничный юмор
Кажется, технические конференции и презентации свернули куда-то не туда.
Первое видео с презентации Canva, второе - Google I/O.
(дед кричит на облако: дурацкое GenZ)
@ohmydataengineer
Кажется, технические конференции и презентации свернули куда-то не туда.
Первое видео с презентации Canva, второе - Google I/O.
(дед кричит на облако: дурацкое GenZ)
@ohmydataengineer
💩10😢7❤2👎1
https://www.bbc.com/news/articles/c6ppv06e3n8o
Santander, Ticketmaster и еще у кучки других компаний украли данные из-за Snowflake. Последние, конечно, многое отрицают, но также есть и официальное заявление про всякое. https://medium.com/snowflake/detecting-and-preventing-unauthorized-user-access-d67be8bd66f6
Не говоря уже про то, что всем админам разослали уведомление про включение MFA.
P.S. Больше подробностей по ссылке тут https://doublepulsar.com/snowflake-at-central-of-worlds-largest-data-breach-939fc400912e
@ohmydataengineer
Santander, Ticketmaster и еще у кучки других компаний украли данные из-за Snowflake. Последние, конечно, многое отрицают, но также есть и официальное заявление про всякое. https://medium.com/snowflake/detecting-and-preventing-unauthorized-user-access-d67be8bd66f6
Не говоря уже про то, что всем админам разослали уведомление про включение MFA.
P.S. Больше подробностей по ссылке тут https://doublepulsar.com/snowflake-at-central-of-worlds-largest-data-breach-939fc400912e
@ohmydataengineer
Bbc
Santander staff and '30 million' customers hacked
Their data is being sold online by the same gang who this week claimed to have hacked Ticketmaster.
😢9💩4🥱2👍1
https://www.wsj.com/articles/sorry-ai-old-school-spreadsheets-are-still-king-cbb99936
WSJ повторяет примерно тоже самое, о чем я думал последние N-месяцев: Excel никуда не исчезнет и если вы думаете, что натравив LLM на эксельки и вы получите супермозг, вы ошибаетесь.
Вы же помните, сколько экселек было нагенерированно, как они меняются, как они поддерживаются и так далее?
@ohmydataengineer
WSJ повторяет примерно тоже самое, о чем я думал последние N-месяцев: Excel никуда не исчезнет и если вы думаете, что натравив LLM на эксельки и вы получите супермозг, вы ошибаетесь.
Вы же помните, сколько экселек было нагенерированно, как они меняются, как они поддерживаются и так далее?
@ohmydataengineer
The Wall Street Journal
Sorry AI, Old-School Spreadsheets Are Still King
Organizations aren’t moving away from decades-old tools like Microsoft Excel anytime soon. Some say that hampers their ability to make the most of AI.
👍12💩6❤1
https://www.cnews.ru/news/line/2024-05-31_situatsiya_s_greenplum_ne_okazhet
Ну и вот еще из новостей - Broadcom сделала все репозитории с Greenplum архивными и, кажется, что развитие GP теперь будет происходить за пределами Open Source.
Например, у Arenadata остался свой форк.
@ohmydataengineer
Ну и вот еще из новостей - Broadcom сделала все репозитории с Greenplum архивными и, кажется, что развитие GP теперь будет происходить за пределами Open Source.
Например, у Arenadata остался свой форк.
@ohmydataengineer
CNews.ru
Ситуация с Greenplum не окажет негативного влияния на развитие Arenadata DB - CNews
Статус всех публичных репозиториев GPDB (международный проект с открытым исходным кодом Greenplum) на GitHub изменен...
😢17💩6❤2👍1🔥1
https://www.databricks.com/blog/databricks-tabular
Databricks to acquire Tabulario, a data platform from the original creators of Apache Iceberg.
Какой вывод из этой новости сделать - я не знаю, честно, чего ожидать от Бриксов. Но, кажется, в связи с последними событиями у Snowflake, их позиция на рынке стала посильней.
@ohmydataengineer
Databricks to acquire Tabulario, a data platform from the original creators of Apache Iceberg.
Какой вывод из этой новости сделать - я не знаю, честно, чего ожидать от Бриксов. Но, кажется, в связи с последними событиями у Snowflake, их позиция на рынке стала посильней.
@ohmydataengineer
💩6👍2
https://www.youtube.com/watch?v=Ik0voaZmf5A&t=30316s (видео с PyCon Italia 2024) и расшифровка https://vickiboykis.com/2024/05/20/dont-worry-about-llms/
Don't Worry About LLM.
Одновременно смешной и технически фундаментальный доклад про то, что происходит с LLM и стоит ли сильно переживать и испытывать FOMO из-за происходящего
@ohmydataengineer
Don't Worry About LLM.
Одновременно смешной и технически фундаментальный доклад про то, что происходит с LLM и стоит ли сильно переживать и испытывать FOMO из-за происходящего
@ohmydataengineer
YouTube
PyCon Italia 2024 - Lasagna - Saturday
💩3👍2
https://www.definite.app/blog/duckdb-datawarehouse
А какой был заголовок!
Я уже приготовился ко всякой вкусняшке внутри, про плюсы и минусы, ну и DuckDB, распиаренный не меньше Snowflake...
Но ларчик просто открывался, достаточно смотреть детали: Size of data: 1TB
Ну и, конечно же, DuckDB is designed for single-user workloads and becomes locked and un-queryable during data writes or table edits. To work around this issue, we set up two DuckDB instances, a write-to database and a read-only database...
Как сказали у меня в ленте в твитторе, "Это не Warehouse, это кладовка какая-то"
@ohmydataengineer
А какой был заголовок!
Я уже приготовился ко всякой вкусняшке внутри, про плюсы и минусы, ну и DuckDB, распиаренный не меньше Snowflake...
Но ларчик просто открывался, достаточно смотреть детали: Size of data: 1TB
Ну и, конечно же, DuckDB is designed for single-user workloads and becomes locked and un-queryable during data writes or table edits. To work around this issue, we set up two DuckDB instances, a write-to database and a read-only database...
Как сказали у меня в ленте в твитторе, "Это не Warehouse, это кладовка какая-то"
@ohmydataengineer
Definite.app
How We Migrated Our Data Warehouse from Snowflake to DuckDB | Definite
👍9🥱9❤2🔥2💩1
Что там по Apache Iceberg?
Несколько новостей, связанных с этим популярным форматом:
- Dremio и REST Catalog - https://www.youtube.com/watch?v=Bkpj7M6yVdQ&list=PL-gIUf9e9CCtmCcXDWkZJob7SLdgEm3ia&index=5
- Snowflake и Polaris Catalog - https://www.snowflake.com/blog/introducing-polaris-catalog/
- Databrics купили Tabular - https://tabular.io/blog/tabular-is-joining-databricks (писал про это ранее)
- Microsoft Fabric добавят Iceberg Support в рамках партнерства с Snowflake - https://www.microsoft.com/en-us/microsoft-fabric/blog/2024/05/22/snowflake-and-microsoft-announce-expansion-of-their-partnership
Собственно, если вы все пропустили и не поняли, а что этот Iceberg такое, то вот прекрасная книжка от O'Reilly, еще и бесплатно - https://hello.dremio.com/wp-apache-iceberg-the-definitive-guide-reg.html
@ohmydataengineer
Несколько новостей, связанных с этим популярным форматом:
- Dremio и REST Catalog - https://www.youtube.com/watch?v=Bkpj7M6yVdQ&list=PL-gIUf9e9CCtmCcXDWkZJob7SLdgEm3ia&index=5
- Snowflake и Polaris Catalog - https://www.snowflake.com/blog/introducing-polaris-catalog/
- Databrics купили Tabular - https://tabular.io/blog/tabular-is-joining-databricks (писал про это ранее)
- Microsoft Fabric добавят Iceberg Support в рамках партнерства с Snowflake - https://www.microsoft.com/en-us/microsoft-fabric/blog/2024/05/22/snowflake-and-microsoft-announce-expansion-of-their-partnership
Собственно, если вы все пропустили и не поняли, а что этот Iceberg такое, то вот прекрасная книжка от O'Reilly, еще и бесплатно - https://hello.dremio.com/wp-apache-iceberg-the-definitive-guide-reg.html
@ohmydataengineer
❤7💩5🔥2👍1
https://medium.com/@kywe665/unity-catalog-oss-with-hudi-delta-iceberg-and-emr-duckdb-710ab8f8a7dc
Databricks выложил свой Unity Catalog в open-source (https://www.databricks.com/blog/open-sourcing-unity-catalog) и народ уже начал к нему всякое подключать.
@ohmydataengineer
Databricks выложил свой Unity Catalog в open-source (https://www.databricks.com/blog/open-sourcing-unity-catalog) и народ уже начал к нему всякое подключать.
@ohmydataengineer
Medium
Unity Catalog OSS with Hudi, Delta, Iceberg, and EMR + DuckDB
The Data + AI summit 2024 was jam packed with many exhilarating announcements including AI/BI, Clean Rooms, Serverless everything, and one…
🔥9💩1
https://www.wired.com/story/epam-snowflake-ticketmaster-breach-shinyhunters/
Тут подкинули деталей про утечку у Snowflake. Все просто и банально, установил малварь себе на компуктер.
@ohmydataengineer
Тут подкинули деталей про утечку у Snowflake. Все просто и банально, установил малварь себе на компуктер.
@ohmydataengineer
WIRED
Hackers Detail How They Allegedly Stole Ticketmaster Data From Snowflake
A ShinyHunters hacker tells WIRED that they gained access to Ticketmaster’s Snowflake cloud account—and others—by first breaching a third-party contractor.
😢7💩2🥱1
https://medium.com/walmartglobaltech/reliably-processing-trillions-of-kafka-messages-per-day-23494f553ef9
Неплохая статья из инженерного блога Wallmart о том, как они процессят over9000 сообщений в Kafka.
@ohmydataengineer
Неплохая статья из инженерного блога Wallmart о том, как они процессят over9000 сообщений в Kafka.
@ohmydataengineer
Medium
Reliably Processing Trillions of Kafka Messages Per Day
Authors: Vilas Athavale, Ravinder Matte, Sid Anand, Shrity Verma, Naresh Gopalani, Bhaven Avalani
👍5💩4
Сколько их уже было: Pandas, Dask, Ray, Polars. Вот еще прибыло - Daft
https://www.getdaft.io/
@ohmydataengineer
https://www.getdaft.io/
@ohmydataengineer
🥱21👍7💩4🔥2
Журнал "Зарплатник" @zarplatnik_media
Вот это название, конечно 😄
Ко мне пришел Тагир с канала @tagir_analyzes, попросил рассказать про его канал "Зарплатник" @zarplatnik_media
И раз уж у меня канал на русскоговорящую аудиторию, знания про рынок РФ (условия работы, зарплаты и так далее) - штука актуальная. В канале описываются анонимно позиции в компаниях, бенефиты, условия работы и так далее. Какое-то представление о текущем рынке можно составить.
НО помните, что любая смена работы - штука индивидуальная и ваша компенсация может сильно отличаться (в обе стороны).
@ohmydataengineer
Вот это название, конечно 😄
Ко мне пришел Тагир с канала @tagir_analyzes, попросил рассказать про его канал "Зарплатник" @zarplatnik_media
И раз уж у меня канал на русскоговорящую аудиторию, знания про рынок РФ (условия работы, зарплаты и так далее) - штука актуальная. В канале описываются анонимно позиции в компаниях, бенефиты, условия работы и так далее. Какое-то представление о текущем рынке можно составить.
НО помните, что любая смена работы - штука индивидуальная и ваша компенсация может сильно отличаться (в обе стороны).
@ohmydataengineer
❤18💩8👍7👎2🔥2
https://medium.com/@fengruohang/database-in-kubernetes-is-that-a-good-idea-daf5775b5c1f
Оч большое внятное чтиво про то, хорошо ли пихать базы данных в кубирнетис (с) или нет.
@ohmydataengineer
Оч большое внятное чтиво про то, хорошо ли пихать базы данных в кубирнетис (с) или нет.
@ohmydataengineer
Medium
Database in Kubernetes: Is that a good idea?
WeChat Column
👍7💩5❤1🔥1
https://www.notion.so/blog/building-and-scaling-notions-data-lake
О том как Notion стоил свой data lake. Спойлер: начинали также, как Figma, с одного большого Postgres. Потом много шардов Postgres, и только потом Snowflake.
А потом их он заколебал 💩
@ohmydataengineer
О том как Notion стоил свой data lake. Спойлер: начинали также, как Figma, с одного большого Postgres. Потом много шардов Postgres, и только потом Snowflake.
А потом их он заколебал 💩
@ohmydataengineer
Notion
How Notion build and grew our data lake to keep up with rapid growth
🔥15💩4
https://www.canva.dev/blog/engineering/product-analytics-event-collection/
Небольшая статья с поверхностным описанием того, как у Canva (ага, той самой которая жила с одним большим кликом) ведется работа с эвентами.
@ohmydataengineer
Небольшая статья с поверхностным описанием того, как у Canva (ага, той самой которая жила с одним большим кликом) ведется работа с эвентами.
@ohmydataengineer
canva.dev
How Canva collects 25 billion events per day - Canva Engineering Blog
The architecture of our product analytics event delivery pipeline.
💩5👍1