NEW BOT Телеграм, страница

DATABASE DESIGN

Гид по Cloudberry ч.2: advanced-возможности, дорожная карта и планы развития

В прошлый раз, в первой части нашего гида по Apache Cloudberry™, мы поговорили об истории проекта, его архитектуре, ядре СУБД и функциях платформы.

Но помимо ядра СУБД, мы также хотим использовать data‑lakehouse‑запросы. В Data Lakehouse есть некоторые проблемы: мы не можем получать данные оттуда напрямую. В Cloudberry разработана технология, с помощью которой можно это делать, так что поговорим об этом подробнее. А также рассмотрим ещё несколько интересных возможностей и расскажем о планах проекта.

Читать: https://habr.com/ru/companies/yandex_cloud_and_infra/articles/957662/

#ru

@database_design | Другие наши каналы

86 views09:10

DATABASE DESIGN

86 views09:15

DATABASE DESIGN

Что выгоднее и безопаснее для хранения фото, видео и других данных: облако или собственный NAS

Думаю, не будет большой ошибкой предположить, что ваш смартфон имеет накопитель минимум на 128 ГБ, больше половины из которых почти наверняка занимают фотографии, какие-то случайные видео и, конечно, скриншоты. Держать это все во встроенной памяти, конечно, можно. Но тогда есть риск, что оставшегося пространства банально не хватит для новых приложений и Телеграма с Ватсапом, которые имеют свойство разрастаться очень и очень сильно. Значит, все это добро надо куда-то деть. Вопрос в том – куда. Облако – ненадежно. Свое железо – надежно, но дорого. Или наоборот… В общем, давайте посмотрим на вещи объективно и постараемся понять, где лучше всего хранить свои данные.

Читать: https://habr.com/ru/companies/finops_ru/articles/958198/

#ru

@database_design | Другие наши каналы

93 views09:23

DATABASE DESIGN

Я выполнил реверс-инжиниринг веб-обфускации Amazon, потому что приложением Kindle пользоваться невозможно

TL;DR

• Я впервые купил на Amazon электронную книгу

• Android-приложение Kindle самой компании Amazon было очень забагованным и часто вылетало

• Попробовал скачать мою книгу, чтобы читать её в реально работающем приложении для чтения

• Осознал, что Amazon больше не позволяет этого делать

• Решил назло выполнить реверс-инжиниринг её системы обфускации

• Обнаружил множество слоёв защиты, в том числе рандомизированные алфавиты

• Победил их все при помощи колдунства с сопоставлением шрифтов

Читать: https://habr.com/ru/articles/958132/

#ru

@database_design | Другие наши каналы

98 views12:21

DATABASE DESIGN

Представляем XBRL-CSV — машиночитаемую отчетность в формате для людей

Примечание: Статья посвящена формату XBRL-CSV2 (тэг "@context":"www.cbr.ru/xbrl_csv2").

Авторство формата принадлежит Банку России.
Автор статьи — архитектор, принимавший участие в разработке формата в качестве технического специалиста.

Введение.

Банк России использует стандарт XBRL для сбора отчетности от некредитных финансовых организаций. Несмотря на всю продуманность XBRL, при формировании и обработке отчетности возникает проблема, связанная с реестровыми формами.

Эти формы содержат гиперкубы с открытыми осями. При большой вариативности значений таких осей реестровые отчеты становятся чрезвычайно объемными.

Решение этой проблемы — создание производного от XBRL-XML формата: XBRL-CSV.

Основная предпосылка: CSV органически приспособлен для хранения реестровых форм. Открытые оси выносятся в начальные колонки, а комбинации значений ячеек открытых осей в каждой строке образуют составной открытый ключ, однозначно идентифицирующий запись.

Остальные колонки — это данные, которые определяют три аспекта показателя:

Читать: https://habr.com/ru/articles/958356/

#ru

@database_design | Другие наши каналы

101 views14:25

DATABASE DESIGN

Postgres 18 async IO – шаг к «взрослым» нагрузкам?

Давайте честно – пока что Postgres редко используется для действительно больших и нагруженных баз. Этому множество причин, но главная формулируется просто: «не тянет».

У каждого есть своя граница, где Postgres ещё применим, а дальше —уже нет. Обычно это где-то между одним и пятью терабайтами, дальше жить с этим «больно».

База просто не может обработать большой объем данных с той скоростью, которую способны выдать диски.

И вот — Postgres 18, впервые за долгое время, предлагает не косметическую, а фундаментальную новинку. То, что в Oracle есть уже 20+ лет — асинхронный ввод-вывод (аsync IO).

Попробуем посмотреть async IO и ответить на вопрос - стал ли Postgres ближе к «взрослым» нагрузкам?

Читать: https://habr.com/ru/articles/958382/

#ru

@database_design | Другие наши каналы

111 views15:30

DATABASE DESIGN

Документный хаос? RAG-система придёт на помощь

Статья описывает практическую реализацию системы Retrieval-Augmented Generation (RAG) для превращения документов в интерактивную базу знаний. Показано, как хранение эмбеддингов в Qdrant и интеграция с языковой моделью (LLM) позволяют быстро получать точные ответы на вопросы. Рассматриваются архитектура, ключевые компоненты и внутренние механизмы работы системы, полезные для разработчиков и новичков в области RAG.

Читать: https://habr.com/ru/articles/955768/

#ru

@database_design | Другие наши каналы

95 views05:30

DATABASE DESIGN

Решение проблемы двойного букинга: паттерны проектирования систем

Давно прошло то время, когда люди стояли в длинных очередях для покупки билетов на концерты, авиарейсы, фильмы, матчи и другие события.

Технологические компании наподобие Ticketmaster, BookMyShow, Airbnb, Delta Airlines и так далее сделали бронирование делом одного клика, позволившим покупать билеты из дома.

Эта простота стала возможной благодаря технологическим платформам и сервисам, которые прячут от пользователей всю сложность и решают неординарные инженерные задачи. Одна из таких задач — предотвращение бронирования одного места несколькими пользователями.

Представьте, в каком положении окажутся два пользователя, купивших одно и то же место на мероприятие и осознавших это только перед его началом. Из-за этого организатор теряет доверие покупателей, а пользователи дважды задумаются, прежде чем покупать билеты на следующее мероприятие.

Поэтому важно создать надёжное решение классической задачи — двойного букинга.

Из этой статьи вы узнаете, как эту задачу решают разные технологические компании. У каждой компании свои особенности, поэтому единого универсального решения нет.

Мы рассмотрим различные архитектурные паттерны и разберёмся в их плюсах и минусах. Статья поможет вам обрести глубокое понимание и наработать знания в системном мышлении.

Читать: https://habr.com/ru/articles/957954/

#ru

@database_design | Другие наши каналы

100 views05:32

DATABASE DESIGN

Упрощаем Spark через Catalog API

Говоря о серьезных кластерах в компаниях, нам часто приходится взаимодействовать со сторонними отделами и их данными. И зачастую, когда речь идет об ad-hoc, самый эффективный инструмент - Trino. Он удобен тем, что в платформе данных можно добавить каталог, который позволит по сути избежать настройки коннекшена для конечного пользователя. Просто в запросе указываешь название каталога данных и трино сам понимает, что нужно взять данные со сторонней базы данных. Но все меняется, когда выразительности SQL нам перестает хватать для выполнения поставленных задач и мы переходим в Spark. Точнее, менялось. С релизом Spark 3.0 появилась возможность взаимодействовать с внешними источниками так же просто, как в Trino.

Читать: https://habr.com/ru/articles/958478/

#ru

@database_design | Другие наши каналы

103 views06:13

DATABASE DESIGN

Шпаргалка по работе с PostgreSQL для бэкенд-разработчиков

Лайфхаки для миграций, оптимизации и избегания граблей

Реальные лайфхаки и проверенные практики по миграциям, оптимизации запросов, управлению индексами и обратной совместимости кода. Узнайте, как:
- Не сломать прод при миграции.
- Избежать N+1 и других проблем SQL-запросов.
- Планировать откаты и работать безопасно на высоконагруженных БД.

Читать: https://habr.com/ru/companies/beget/articles/920772/

#ru

@database_design | Другие наши каналы

116 views07:17

DATABASE DESIGN

Интеграции без иллюзий: интервью с Владимиром Гантуриным, техническим директором Compo Soft

Интеграции и обмен данными сегодня — это не просто техническая задача, а фундамент цифровой зрелости бизнеса. Российский рынок переживает быстрые изменения: уход западных вендоров, рост требований к надёжности и безопасности, распространение микросервисных архитектур. Как компании справляются с вызовами, когда стоит менять старую интеграционную платформу, зачем бизнесу API Gateway и брокеры сообщений, и можно ли обойтись без интеграционной шины?

Читать: https://habr.com/ru/companies/compo/articles/958584/

#ru

@database_design | Другие наши каналы

96 views08:30

DATABASE DESIGN

Где до сих пор используют дискеты и другие устаревшие носители, которые не умирают даже в 2025 году

В это может быть непросто поверить, на наших глазах уже выросло целое поколение, которое дискету не то что не использовало, а даже в глаза не видело. В целом, все логично. Технология давно умерла и предана забвению. Так, по крайней мере, принято считать. Но есть категория людей, которым об этом почему-то не рассказали, и они продолжают полагаться в своей работе даже не на диски DVD-RW, а на старые добрые дискеты. Разных форматов, конечно, но все-таки дискеты. И таких историй больше, чем кажется.

Читать: https://habr.com/ru/companies/x-com/articles/958624/

#ru

@database_design | Другие наши каналы

89 views09:41

DATABASE DESIGN

Непопулярный вариант развертывания хранилища Nextcloud

Привет, Хабр. У меня тут такая история случилась: накопился массив фотографий с путешествий, всяких документов, семейных архивов и учебных материалов по всяких курсам — всего где-то гигов 300. Все важное, ценное, и, конечно, это все очень не хочется потерять.

Я почитал статьи здесь на Хабре, погуглил и понял, что многие покупают себе физические серверы с дисками и на них устраивают хранилища, например, Nextcloud. Звучит удобно: можно настроить синхронизацию со всех устройств, не надо переживать за безопасность, потому что на сервере уже есть защита, и я полностью управляю своими данными. Одно «но» — для меня это дороговато. Получается, что на средний вариант такого сервера и пары дисков, чтобы настроить рейд-массив, нужна приличная сумма. Плюс по комментариям к статьям понял, что придется заморочиться с установкой Nextcloud на сервер. Не уверен, что хочу ввязываться в такие сложности.

Пока изучал тему, увидел, что есть и другой вариант — более дешевый и вроде такой же простой по установке и настройке. Решил протестировать и рассказать, что же у меня в итоге получилось.

Читать: https://habr.com/ru/companies/cloud_ru/articles/957612/

#ru

@database_design | Другие наши каналы

81 views10:46

DATABASE DESIGN

Миграции Postgres с использованием логической репликации

Миграция PostgreSQL — редкий проект, где «быстро и безболезненно» почти никогда не совпадают. Дамп/восстановление годится для сотен гигабайт, потоковая репликация по WAL — для тех, у кого есть к ней доступ. Но когда простоя не хочется, а WAL недоступен, остаётся третий путь — логическая репликация.

В этом материале — практический сценарий: как заранее перенести схему, обеспечить уникальную идентификацию строк (PK/уникальный индекс/REPLICA IDENTITY FULL), настроить публикации и подписки, следить за первичной загрузкой через pg_stat_subnoscription, корректно остановить запись на источнике и синхронизировать последовательности.
Старт миграции

Читать: https://habr.com/ru/companies/otus/articles/958718/

#ru

@database_design | Другие наши каналы

110 views13:54

DATABASE DESIGN

Как использовать Clickhouse без боли

ClickHouse — одна из самых популярных систем для анализа данных. По информации TheirStack, этот инструмент использует более 3 700 компаний по всему миру.

У ClickHouse быстрая аналитика, эффективное сжатие и отличное масштабирование. Но у системы есть и недостатки — ограниченная поддержка UPDATE и DELETE, а также сложная миграция.

Привет, Хабр! Меня зовут Михаил Филимонов, я руковожу разработкой хранилища данных в группе Магнит OMNI. В этой статье я расскажу о проблемах работы с ClickHouse, как их решать и какие инструменты для этого потребуются.

Читать: https://habr.com/ru/companies/magnit/articles/955312/

#ru

@database_design | Другие наши каналы

110 views09:34

DATABASE DESIGN

Как мы в Skyeng построили свою мультитач-атрибуцию, чтобы больше не ругаться из-за заявок

Всем привет! Меня зовут Анастасия Козлова, я Senior BI Analyst в маркетинге Skyeng. Сегодня хочу рассказать, как мы научились справедливо оценивать вклад каждого рекламного канала с помощью кастомной мультиканальной модели атрибуции, что нас к этому подтолкнуло и как мы её настроили технически.

Читать: https://habr.com/ru/companies/skyeng/articles/954572/

#ru

@database_design | Другие наши каналы

99 views10:55

DATABASE DESIGN

Масштабирование кластера Valkey до 1 миллиарда запросов в секунду

Предстоящий релиз Valkey 9.0 несёт в себе значительные улучшения в отказоустойчивости больших кластеров, позволяя масштабироваться до 2000 узлов и достигать производительности свыше 1 миллиарда запросов в секунду, и всё это с гарантированно ограниченным временем восстановления. В этой статье мы рассмотрим, как работает система кластеризации Valkey, а также архитектурные усовершенствования и тщательное тестирование, которые сделали возможным такой уровень масштабирования.

Читать: https://habr.com/ru/articles/958998/

#ru

@database_design | Другие наши каналы

100 views12:16

DATABASE DESIGN

MariaDB Enterprise Platform 2026 — единая платформа для интеллектуальных AI‑приложений

MariaDB объявила релиз Enterprise Platform 2026, который объединяет транзакционный, аналитический и векторный AI-движки в одной системе, чтобы снизить архитектурное трение и ускорить инновации.

Читать подробнее

#en

@database_design | Другие наши каналы

MariaDB

Announcing the Release of MariaDB Enterprise Platform 2026 | MariaDB

MariaDB Enterprise Platform 2026 is a major release that addresses the challenges of data silos that slow innovation and inflate costs.

92 views13:02

DATABASE DESIGN

Write. Review. Commit. Repeat. Как документируют в Postgres Professional

Как вы думаете, сколько человек документирует продукты в Postgres Professional? 50? 100? А вот и нет — всего десять. Рассказываем, как команде техписателей удается управлять сотнями файлов, почему их работа — это квест, и как они успевают контрибьютить в ванильный PostgreSQL.

Читать: https://habr.com/ru/companies/postgrespro/articles/924718/

#ru

@database_design | Другие наши каналы

97 views13:13

DATABASE DESIGN

MariaDB и Exasol — мгновенная аналитика на живых данных
В статье сообщается о партнёрстве, которое обещает устранить барьер между операционными данными и аналитикой, упростить стек данных и дать пользователям мгновенные аналитические инсайты. Подробнее — в исходной статье.

Читать подробнее

#en

@database_design | Другие наши каналы

MariaDB

Introducing MariaDB Exa: 1,000x Faster Analytics on Live Data | MariaDB

MariaDB partners with Exasol to create MariaDB Exa, delivering real-time insights from operational to petabyte-scale AI data.

85 views21:53

DATABASE DESIGN

Exadata — платформа не только для крупнейших
В статье говорится, что за 15+ лет Exadata стала ведущей платформой для Oracle Database и подходит не только для критичных и сверхбольших баз, но и для более широкого круга задач.

Читать подробнее

#en

@database_design | Другие наши каналы

Oracle

Exadata for Everyone: Extreme Performance Meets Extreme Low Cost

For over 15 years, Exadata has been the premier platform for Oracle Database workloads. Now, you may have thought that Exadata was only for mission critical workloads and the largest databases or is targeted only for large enterprise customers. Well, think…

71 views01:24

About

Blog

Apps

Platform