DATABASE DESIGN – Telegram
DATABASE DESIGN
1.41K subscribers
2.09K photos
3 videos
5.35K links
Лучшие материалы по работе с хранилищами данных на русском и английском языке

Разместить рекламу: @tproger_sales_bot

Правила общения: https://tprg.ru/rules

Другие каналы: @tproger_channels

Другие наши проекты: https://tprg.ru/media
Download Telegram
Новые возможности MongoDB Atlas на Azure и Google Cloud

MongoDB Atlas теперь предлагает улучшенные возможности безопасности и масштабируемости на Azure и Google Cloud. С помощью Azure Private Link разработчики могут обеспечивать приватное подключение, минимизируя риски. На Google Cloud доступны функции Data Federation и Online Archive, что упрощает хранение и анализ данных. Узнайте больше об этих нововведениях! MongoDB усиливает защиту данных

MongoDB продолжает улучшать безопасность для корпоративных пользователей. Благодаря новым возможностям управления ключами шифрования, поддержке TLS 1.3 и выбору шифровальных наборов, компании получают большую защиту на всех этапах жизненного цикла данных. Узнайте больше о новых функциях шифрования на сайте MongoDB.

Читать подробнее

#en

@database_design | Другие наши каналы
10 подсказок юриста для стабильной работы бизнеса в 2025 году

2025-й в самом разгаре, но это не значит, что предупреждать бизнес о том, что его ждет в этом году, поздно. Под таким предлогом мне задали 10 вопросов, и я не смогла отказать в ответах. Делюсь с вами, потому что знаю, что эти рекомендации точно пригодятся, на каком этапе развития ни находился бы ваш бизнес.
Узнать, что ждет бизнес в 2025 году

Читать: https://habr.com/ru/articles/888552/

#ru

@database_design | Другие наши каналы
Почему Redis работает так быстро, несмотря на то, что он однопоточный?

Redis — это высокопроизводительное хранилище «ключ-значение» в оперативной памяти, известное своей невероятной скоростью. Фактически, один сервер Redis может обрабатывать до 100 000 запросов в секунду (QPS). Такая скорость часто удивляет, особенно если учесть, что Redis в основном работает по однопоточной модели обработки запросов. Так почему же Redis работает так быстро, несмотря на однопоточный подход? Давайте рассмотрим ключевые факторы, влияющие на производительность Redis.


Читать: https://habr.com/ru/articles/888404/

#ru

@database_design | Другие наши каналы
OpenDJ: Доступ к LDAP каталогу через REST интерфейс

В статье мы настроим доступ к LDAP каталогу с открытым исходным кодом OpenDJ через REST интерфейс и настроим права доступа к нему


Читать: https://habr.com/ru/articles/888062/

#ru

@database_design | Другие наши каналы
Бизнес-сериал: формируем BI-систему в строительстве почти в прямом эфире. Часть III

Привет, Хабр!

Продолжаем серию статей о создании BI-системы в компании Sminex. Сегодня поговорим об автоматизации и оптимизации работы инженеров данных и BI-разработчиков. Работа с данными всегда требует поиска баланса между удобством, скоростью и качеством. В этой статье мы сосредоточимся на удобстве.


Читать: https://habr.com/ru/companies/sminex_developer/articles/888920/

#ru

@database_design | Другие наши каналы
Зачем бизнесу нужно DWH и как обосновать необходимость проекта? Можно ли оценить окупаемость хранилища?

Проекты внедрения DWH относятся к трудоемким и всегда требуют вложений, стоимость проектов начинается от 1,5 млн руб.

К проекту необходимо привлекать системных аналитиков, архитекторов DWH, разработчиков, DevOps, дата-инженеров. Кроме затрат на ФОТ, нужны бюджеты на инфраструктуру и технологии, так как готового решения DWH из "коробки" не существует.

Как при таких затратах аргументировать для бизнеса необходимость внедрения DWH? Какие бизнес-задачи может решить хранилище данных? Можно ли оценить окупаемость и эффективность внедрения? Читайте в статье.


Читать: https://habr.com/ru/articles/888952/

#ru

@database_design | Другие наши каналы
ClickHouse в мире IoT

В этой статье мы рассмотрим использование ClickHouse для хранения данных, поступающих по протоколу MQTT. Данный протокол был специально разработан для приложений IoT и предназначен для обеспечения эффективной и надежной связи между устройствами. В MQTT используется облегченная модель публикации‑подписки, обеспечивающая бесперебойную передачу данных даже в условиях ограниченных ресурсов. Низкие накладные расходы и поддержка потоковой передачи данных в реальном времени делают протокол MQTT идеальным выбором для сбора и передачи данных IoT с различных конечных устройств на платформы обработки данных.


Читать: https://habr.com/ru/companies/otus/articles/888252/

#ru

@database_design | Другие наши каналы
Блокчейн-технологии: архитектура, принципы работы и перспективы развития

В данной статье рассматриваются ключевые аспекты блокчейн-технологий, их архитектура, механизмы функционирования и перспективы развития. Особое внимание уделяется принципам работы распределенного реестра, роли криптографических методов защиты данных и алгоритмам консенсуса, обеспечивающим надежность и безопасность сети. Рассматриваются возможности использования умных контрактов для автоматизации бизнес-процессов и управления цифровыми активами. Анализируются существующие вызовы, такие как масштабируемость, энергопотребление и регуляторные барьеры, а также предлагаются перспективные решения для их преодоления. В заключении обсуждаются инновационные направления развития блокчейна, включая квантово-устойчивую криптографию, интеграцию с искусственным интеллектом и концепцию децентрализованных автономных организаций (DAO).


Читать: https://habr.com/ru/articles/889282/

#ru

@database_design | Другие наши каналы
Автоматизированное управление расширенной статистикой в PostgreSQL

Здесь я описываю результаты разработки одного расширения Postgres, которое сделал просто ради любопытства. Суть его состоит в автоматическом управлении расширенной статистикой по колонкам таблицы. Идея родилась в момент, когда заканчивая работу над очередным "умным" query-driven продуктом улучшения качества планирования Postgres я осознал, что архитектура этой СУБД пока ещё не готова к полностью автономной работе - автоматическому детектированию плохих планов и подстройки оптимизатора. Так может быть зайти с другой стороны, и попробовать сделать автономный data-driven помогатор?


Читать: https://habr.com/ru/articles/856952/

#ru

@database_design | Другие наши каналы
Влияние источника времени на результат explain в PostgreSQL

При выполнении тестов периодически сталкивался с неожиданными изменениями результатов тестов после рестарта linux и при обновлении версии linux. Причиной оказался источник времени. В статье рассмотрен как влияет источник времени на выполнение команды explain analyze


Читать: https://habr.com/ru/articles/889368/

#ru

@database_design | Другие наши каналы
Развенчиваем мифы о MongoDB: безопасность, масштабируемость и производительность

Многие стереотипы о MongoDB устарели. Сегодня платформа обеспечивает надежную защиту данных, эффективное масштабирование и непревзойденную производительность. MongoDB Atlas поддерживает мультиоблачные развертывания и шифрование запросов. Узнайте больше, чтобы не оставаться в прошлом! Новые возможности шифрования в MongoDB Atlas

MongoDB Atlas улучшает безопасность данных с помощью ключей управления (CMK) и TLS 1.3. Теперь пользователи могут управлять ключами в частной сети, исключая риски, связанные с публичным доступом. Пусть ваши данные будут защищены на всех стадиях их обработки! Узнать больше о нововведениях можно в документации MongoDB.

Читать подробнее

#en

@database_design | Другие наши каналы
Техника TOAST (The Oversized-Attribute Storage Technique) в PostgreSQL

Если строка не помещается в блок (страницу), то в PostgreSQL применяется техника выноса полей в отдельную таблицу, называемую TOAST-таблица. Техника выноса и хранения называется TOAST (The Oversized-Attribute Storage Technique, техника хранения атрибутов большого размера). В статье достаточно детально рассматривается алгоритм работы TOAST. Знание алгорима и его граничные значения полезно, чтобы понимать каким образом хранятся данные в таблицах.


Читать: https://habr.com/ru/articles/888926/

#ru

@database_design | Другие наши каналы
Кэширование значений последовательностей в PostgreSQL

У последовательностей есть параметр cache, который определяет сколько значений из последовательности будет кэшировать серверный процесс в своей локальной памяти для будущих вставок в течение сессии. Последовательности используются первичными и уникальными ключами. По умолчанию значения последовательностей не кэшируются. Кэширование может снизить произвдительность и сделать структуру индекса не оптимальной.

Быстрый путь вставки в индексы

В PostgreSQL есть оптимизация вставки в индекс типа btree, позволяющая не спускаться с корня дерева индекса. Серверный процесс, который выполнил вставку в правый листовой блок, запоминает ссылку на него и при последующей вставке, если новое значение больше предыдущего (или пусто) и не проходит путь от корня до листового блока. Оптимизация используется при числе уровней в индексе начиная со второго (макрос BTREE_FASTPATH_MIN_LEVEL).


Читать: https://habr.com/ru/articles/889156/

#ru

@database_design | Другие наши каналы
Новый уровень работы с Oracle E-Business Suite

Oracle представила возможность использовать Natural Language Query с помощью генеративного ИИ в E-Business Suite Release 12.2. Теперь пользователи могут задавать вопросы на естественном языке, что упрощает взаимодействие с системой и ускоряет получение нужных данных.

Читать подробнее

#en

@database_design | Другие наши каналы
Переход ZEE5 на MongoDB Atlas: опыт миграции

ZEE5, ведущая индийская платформа для потокового видео, успешно перенесла более 40 микросервисов на MongoDB Atlas, обеспечив непрерывную работу для 119,5 миллионов пользователей. Благодаря тщательному планированию и поддержке MongoDB, миграция прошла без простоев и нарушений в обслуживании. Развенчиваем мифы о MongoDB: безопасность и масштабирование

MongoDB часто недооценивают из-за мифов о его безопасности и сложности масштабирования. Однако, современные функции, такие как шифрование на всех этапах, поддержка кросс-облачных развертываний и автоматическое масштабирование в Atlas, обеспечивают надежность и производительность. Узнайте больше о возможностях MongoDB!

Читать подробнее

#en

@database_design | Другие наши каналы
Новый подход к ML с помощью ORiGAMi от MongoDB

MongoDB предлагает архитектуру ORiGAMi для работы с полуструктурированными данными. Она использует трансформеры для обучения на JSON-документах, устраняя необходимость в их преобразовании в табличную форму. Эта инновация позволяет проводить машинное обучение непосредственно на документы. Подробности на GitHub и arXiv. Масштабная миграция ZEE5 на MongoDB Atlas: как это удалось без простоя

ZEE5, ведущая индийская платформа потокового видео, успешно перевела более 40 микросервисов на MongoDB Atlas, сохранив непрерывность сервиса для 119.5 млн пользователей. Проект, поддерживаемый MongoDB Professional Services, включал сложные тестирования и использование инструментов для исключения простоя. Полная автоматизация и гибкость MongoDB Atlas обеспечивают ZEE5 готовность справляться с пиковыми нагрузками.

Читать подробнее

#en

@database_design | Другие наши каналы
Влияние удержания горизонта базы данных PostgreSQL на производительность теста pgbench

По умолчанию pgbench запускает тест TPC-B (sort of) и используется для быстрой оценки производительности PostgreSQL. В статье рассматривается насколько удержание горизонта базы данных (vacuum cleanup horizon) уменьшает прозводительность (значение tps теста). Горизонт удерживается на время выполнения любого запроса или транзакции. Приводится запрос для наблюдения за горизонтом баз данных и параметры, которые используются для защиты от долгих транзакций и запросов.


Читать: https://habr.com/ru/articles/890044/

#ru

@database_design | Другие наши каналы
1
Новый диск в облаке Selectel — настройте IOPS под свои задачи

Если вы работаете с облачными ресурсами и управляете инфраструктурой, то наверняка знаете, как важно правильно настроить дисковую подсистему. В Selectel появилась новая возможность: теперь в облаке можно самостоятельно регулировать производительность дисков, не привязываясь к фиксированным конфигурациям.

Это значит, что больше не нужно заранее выбирать «с запасом» или рисковать нехваткой производительности в пиковые моменты. Вы просто настраиваете параметры диска под свою нагрузку — и меняете их на лету. Без даунтайма, сложных миграций или дополнительных настроек.

Читать: https://habr.com/ru/companies/selectel/articles/890120/

#ru

@database_design | Другие наши каналы
Жизненный цикл данных под контролем: знакомство с ILM на примере расширения для Postgres Pro Enterprise 17

Если данные в БД растут как на дрожжах, а вместе с ними и расходы на хранение, то пора познакомиться с концепцией управления жизненным циклом информации (ILM). Мы уже внедрили в Postgres Pro Enterprise 17 возможность для внедрения автоматического переноса редко используемых данных в более дешёвые хранилища. Подробности в статье.


Читать: https://habr.com/ru/companies/postgrespro/articles/890238/

#ru

@database_design | Другие наши каналы
Жизненный цикл данных под контролем: знакомство с ILM на примере расширения для Postgres Pro Enterprise 17

Если данные в БД растут как на дрожжах, а вместе с ними и расходы на хранение, то пора познакомиться с концепцией управления жизненным циклом информации (ILM). Мы уже внедрили в Postgres Pro Enterprise 17 возможность для внедрения автоматического переноса редко используемых данных в более дешёвые хранилища. Подробности в статье.


Читать: https://habr.com/ru/companies/postgrespro/articles/890238/

#ru

@database_design | Другие наши каналы
Сжатые структуры данных



Введение

Несколько месяцев назад в поисках идей по ускорению кода я изучал множество научных статей по computer science. Не буду притворяться, что хорошо их понимал, но меня не пугает непонятное, и я готов признать своё невежество1. Я обнаружил статью, написанную пятнадцать лет назад2, в которой было множество новых для меня концепций. Мне никак не удавалось в них разобраться.

Что же делать дальше? Можно искать другие статьи, чтобы они заполнили мои пробелы. Это рискованное предприятие, потому что они могут запутать ещё больше, но избежать этого нельзя. Я нашёл статью с нужной структурой данных, в которой упоминался исходный код с веб-сайта. Код был написан на C++, а я работаю на Rust, но решил, что всё равно стоит на него взглянуть. Однако зайдя на сайт, я не обнаружил там ресурс, поэтому я написал владельцу веб-сайта, который оказался преподавателем computer science.

Этот преподаватель (Гонсало Наварро) очень тепло меня принял и сразу же ответил мне3 4. И только в процессе общения с ним я осознал, что видел его фамилию на множестве статей в этой области. Оказалось, я познакомился с одним из специалистов мирового уровня в области сжатых структур данных (succinct data structure). Невежество может завести очень далеко.

Что же такое сжатые структуры данных? Если вы изучали в последние десятилетия computer science, то могли сталкиваться с ними, но мне не доводилось встречаться с ними в процессе работы программистом, а если и доводилось, то я сразу же о них забыл. Но я считаю, что эти структуры данных обладают потрясающими свойствами.

Все мы пользуемся массивами и хэш-таблицами5, популярны также различные деревья. Нам не нужно полностью понимать их устройство, чтобы эффективно пользоваться их свойствами. А теперь я задаюсь вопросом, почему же люди не используют сжатые структуры данных чаще.

Я решил, что стоит немного о них рассказать.

Читать: https://habr.com/ru/companies/ruvds/articles/890232/

#ru

@database_design | Другие наши каналы