DATABASE DESIGN – Telegram
DATABASE DESIGN
1.41K subscribers
2.09K photos
3 videos
5.35K links
Лучшие материалы по работе с хранилищами данных на русском и английском языке

Разместить рекламу: @tproger_sales_bot

Правила общения: https://tprg.ru/rules

Другие каналы: @tproger_channels

Другие наши проекты: https://tprg.ru/media
Download Telegram
100+ ТБ на одном диске: как HAMR, HDMR и другие технологии изменят хранение данных

Первый жесткий диск, появившийся в 1956 году, весил тонну и мог хранить всего 5 МБ данных — этого хватило бы для одной песни в формате MP3. Сегодня мы легко помещаем на флешку размером с палец тысячи таких песен, а жесткие диски вмещают десятки терабайт. Но даже этого уже недостаточно: объем данных в мире растет экспоненциально и в этом году составит 181 зеттабайт.

Прорывные технологии уже на этапе тестирования — скоро на рынке появятся первые HAMR- и HDMR-диски, которые используют тепло и нанотехнологии, чтобы преодолеть физические ограничения современных носителей. Эти технологии обещают жесткие диски емкостью до 120 ТБ и выше.

На горизонте еще более смелые решения: хранение данных в молекулах ДНК, кварцевые носители, способные сохранять информацию миллиарды лет, и многое другое. Давайте разберемся, что будет в ближайшее время происходить в этой сфере.


Читать: https://habr.com/ru/companies/mclouds/articles/887530/

#ru

@database_design | Другие наши каналы
OpenDJ: Использование реляционной СУБД в качестве LDAP каталога

В данной статье мы настроим службу каталогов LDAP OpenDJ таким образом, чтобы она использовала базу данных PostgreSQL в качестве хранилища данных.


Читать: https://habr.com/ru/articles/887636/

#ru

@database_design | Другие наши каналы
Мультипарт-загрузка в объектное хранилище Selectel: пишем тривиальный пример на Python

Объектные хранилища с доступом на базе S3 API — это, возможно, лучшее решение для хранения больших объемов данных. Однако при загрузке крупных файлов могут возникнуть проблемы. Например, долгая передача данных из-за сетевых ограничений или таймауты и обрывы соединения. Как ни крути, а интернет даже здесь диктует свои условия. Попробуем их обойти с помощью мультипарт-загрузки.

Привет! Меня зовут Гришин Александр, я продакт-менеджер в Selectel и отвечаю за развитие объектного хранилища и облачных баз данных. В этой статье я расскажу, как загружать большие файлы в S3 с помощью мультипарт-загрузки, используя Python и boto3. Под катом вы узнаете, как работает этот механизм и как его настроить для эффективной работы.

Читать: https://habr.com/ru/companies/selectel/articles/887698/

#ru

@database_design | Другие наши каналы
👎1
​​Интеграция MongoDB и LangChain4j: Революция в Java AI

MongoDB анонсировала интеграцию с LangChain4j, упрощая создание AI-приложений на Java. Теперь разработчики смогут внедрять Vector Search от MongoDB Atlas и интегрировать большие языковые модели. Это открывает новые горизонты для создания инновационных AI решений в Java. Неудачи и успехи: опыт обновления баз данных в MongoDB

Текст: Команда MongoDB рассказала о сложностях обновления своих внутренних кластеров до версии 8.0. Обнаружены уникальные баги, решены проблемы с индексами и достигнуто ускорение операций. Этот опыт помогает улучшать продукт до релиза для клиентов. Присоединяйтесь к сообществу MongoDB для новостей и событий.

Читать подробнее

#en

@database_design | Другие наши каналы
Резинка, постепенно ломающая старые жёсткие диски



В рамках моей работы над будущим постом об утерянном и наконец-то найденном фрагменте истории Mac я экспериментировал со старыми жёсткими дисками SCSI под брендом Apple, выпускавшимися Quantum и Conner в 1990-х. В этой статье я расскажу о хорошо известном в мире винтажных компьютеров факте, который, думаю, будет интересен читателям.

Дело в том, что многие из этих жёстких дисков уже отказываются работать. Это очень распространённая проблема у старых моделей Quantum ProDrive, например, LPS и ELS. Шпиндель раскручивается, но мы не слышим ожидаемого паттерна щёлкающих звуков запуска, а спустя несколько секунд он снова останавливается.

Читать: https://habr.com/ru/companies/ruvds/articles/888154/

#ru

@database_design | Другие наши каналы
Яндекс 360 для бизнеса: как единая платформа спасает от цифрового хаоса

«Ребята, так больше нельзя! Пора переходить на что-то, не зависящее от внешних обстоятельств и всегда доступное», — подобные речи я, как сотрудник компании-интегратора, слышу постоянно. Кто-то переехал уже несколько раз, кто-то сидит на VPN, постепенно перебирая неблокируемые протоколы, однако многие ищут и находят отечественные альтернативные платформы.

Меня зовут Рустам Еникеев, я работаю системным администратором в интеграторе, переводящем бизнес на онлайн-офис. Проекты, с которыми я чаще всего работаю, — небольшие и средние компании численностью от 50 до 250 человек. И сегодня хочу рассказать о проверенном на практике решении для переезда.
Далее

Читать: https://habr.com/ru/companies/business_migration/articles/888192/

#ru

@database_design | Другие наши каналы
Новое поколение шифрования в MongoDB Atlas

MongoDB объявила о важнейших обновлениях в системе шифрования платформы Atlas. Они включают в себя улучшенную функциональность управления ключами клиентами (CMK) и поддержку TLS 1.3, что значительно укрепляет защиту данных. Эти инновации обеспечивают больше контроля и гибкости для предприятий, адаптируясь к современным требованиям безопасности и законодательства. Интеграция MongoDB и LangChain4j упрощает создание AI приложений на Java

MongoDB объявила о сотрудничестве с LangChain4j, позволяющем легко интегрировать возможности MongoDB Atlas Vector Search в Java приложения. Это облегчает разработку AI систем, включая создание RAG и агентных систем с использованием единого API и общих абстракций. Узнайте больше в документации LangChain4j.

Читать подробнее

#en

@database_design | Другие наши каналы
Новые функции MariaDB: перемотка времени в прошлом

MariaDB Enterprise Server 11.4 предлагает функции системного и прикладного времени, которые позволяют легко "перематывать" данные назад, чтобы увидеть их состояние в любой момент прошлого. Благодаря улучшенной версии, управление временными данными стало более доступным и эффективным.

Читать подробнее

#en

@database_design | Другие наши каналы
Новые возможности MongoDB Atlas на Azure и Google Cloud

MongoDB Atlas теперь предлагает улучшенные возможности безопасности и масштабируемости на Azure и Google Cloud. С помощью Azure Private Link разработчики могут обеспечивать приватное подключение, минимизируя риски. На Google Cloud доступны функции Data Federation и Online Archive, что упрощает хранение и анализ данных. Узнайте больше об этих нововведениях! MongoDB усиливает защиту данных

MongoDB продолжает улучшать безопасность для корпоративных пользователей. Благодаря новым возможностям управления ключами шифрования, поддержке TLS 1.3 и выбору шифровальных наборов, компании получают большую защиту на всех этапах жизненного цикла данных. Узнайте больше о новых функциях шифрования на сайте MongoDB.

Читать подробнее

#en

@database_design | Другие наши каналы
10 подсказок юриста для стабильной работы бизнеса в 2025 году

2025-й в самом разгаре, но это не значит, что предупреждать бизнес о том, что его ждет в этом году, поздно. Под таким предлогом мне задали 10 вопросов, и я не смогла отказать в ответах. Делюсь с вами, потому что знаю, что эти рекомендации точно пригодятся, на каком этапе развития ни находился бы ваш бизнес.
Узнать, что ждет бизнес в 2025 году

Читать: https://habr.com/ru/articles/888552/

#ru

@database_design | Другие наши каналы
Почему Redis работает так быстро, несмотря на то, что он однопоточный?

Redis — это высокопроизводительное хранилище «ключ-значение» в оперативной памяти, известное своей невероятной скоростью. Фактически, один сервер Redis может обрабатывать до 100 000 запросов в секунду (QPS). Такая скорость часто удивляет, особенно если учесть, что Redis в основном работает по однопоточной модели обработки запросов. Так почему же Redis работает так быстро, несмотря на однопоточный подход? Давайте рассмотрим ключевые факторы, влияющие на производительность Redis.


Читать: https://habr.com/ru/articles/888404/

#ru

@database_design | Другие наши каналы
OpenDJ: Доступ к LDAP каталогу через REST интерфейс

В статье мы настроим доступ к LDAP каталогу с открытым исходным кодом OpenDJ через REST интерфейс и настроим права доступа к нему


Читать: https://habr.com/ru/articles/888062/

#ru

@database_design | Другие наши каналы
Бизнес-сериал: формируем BI-систему в строительстве почти в прямом эфире. Часть III

Привет, Хабр!

Продолжаем серию статей о создании BI-системы в компании Sminex. Сегодня поговорим об автоматизации и оптимизации работы инженеров данных и BI-разработчиков. Работа с данными всегда требует поиска баланса между удобством, скоростью и качеством. В этой статье мы сосредоточимся на удобстве.


Читать: https://habr.com/ru/companies/sminex_developer/articles/888920/

#ru

@database_design | Другие наши каналы
Зачем бизнесу нужно DWH и как обосновать необходимость проекта? Можно ли оценить окупаемость хранилища?

Проекты внедрения DWH относятся к трудоемким и всегда требуют вложений, стоимость проектов начинается от 1,5 млн руб.

К проекту необходимо привлекать системных аналитиков, архитекторов DWH, разработчиков, DevOps, дата-инженеров. Кроме затрат на ФОТ, нужны бюджеты на инфраструктуру и технологии, так как готового решения DWH из "коробки" не существует.

Как при таких затратах аргументировать для бизнеса необходимость внедрения DWH? Какие бизнес-задачи может решить хранилище данных? Можно ли оценить окупаемость и эффективность внедрения? Читайте в статье.


Читать: https://habr.com/ru/articles/888952/

#ru

@database_design | Другие наши каналы
ClickHouse в мире IoT

В этой статье мы рассмотрим использование ClickHouse для хранения данных, поступающих по протоколу MQTT. Данный протокол был специально разработан для приложений IoT и предназначен для обеспечения эффективной и надежной связи между устройствами. В MQTT используется облегченная модель публикации‑подписки, обеспечивающая бесперебойную передачу данных даже в условиях ограниченных ресурсов. Низкие накладные расходы и поддержка потоковой передачи данных в реальном времени делают протокол MQTT идеальным выбором для сбора и передачи данных IoT с различных конечных устройств на платформы обработки данных.


Читать: https://habr.com/ru/companies/otus/articles/888252/

#ru

@database_design | Другие наши каналы
Блокчейн-технологии: архитектура, принципы работы и перспективы развития

В данной статье рассматриваются ключевые аспекты блокчейн-технологий, их архитектура, механизмы функционирования и перспективы развития. Особое внимание уделяется принципам работы распределенного реестра, роли криптографических методов защиты данных и алгоритмам консенсуса, обеспечивающим надежность и безопасность сети. Рассматриваются возможности использования умных контрактов для автоматизации бизнес-процессов и управления цифровыми активами. Анализируются существующие вызовы, такие как масштабируемость, энергопотребление и регуляторные барьеры, а также предлагаются перспективные решения для их преодоления. В заключении обсуждаются инновационные направления развития блокчейна, включая квантово-устойчивую криптографию, интеграцию с искусственным интеллектом и концепцию децентрализованных автономных организаций (DAO).


Читать: https://habr.com/ru/articles/889282/

#ru

@database_design | Другие наши каналы
Автоматизированное управление расширенной статистикой в PostgreSQL

Здесь я описываю результаты разработки одного расширения Postgres, которое сделал просто ради любопытства. Суть его состоит в автоматическом управлении расширенной статистикой по колонкам таблицы. Идея родилась в момент, когда заканчивая работу над очередным "умным" query-driven продуктом улучшения качества планирования Postgres я осознал, что архитектура этой СУБД пока ещё не готова к полностью автономной работе - автоматическому детектированию плохих планов и подстройки оптимизатора. Так может быть зайти с другой стороны, и попробовать сделать автономный data-driven помогатор?


Читать: https://habr.com/ru/articles/856952/

#ru

@database_design | Другие наши каналы
Влияние источника времени на результат explain в PostgreSQL

При выполнении тестов периодически сталкивался с неожиданными изменениями результатов тестов после рестарта linux и при обновлении версии linux. Причиной оказался источник времени. В статье рассмотрен как влияет источник времени на выполнение команды explain analyze


Читать: https://habr.com/ru/articles/889368/

#ru

@database_design | Другие наши каналы
Развенчиваем мифы о MongoDB: безопасность, масштабируемость и производительность

Многие стереотипы о MongoDB устарели. Сегодня платформа обеспечивает надежную защиту данных, эффективное масштабирование и непревзойденную производительность. MongoDB Atlas поддерживает мультиоблачные развертывания и шифрование запросов. Узнайте больше, чтобы не оставаться в прошлом! Новые возможности шифрования в MongoDB Atlas

MongoDB Atlas улучшает безопасность данных с помощью ключей управления (CMK) и TLS 1.3. Теперь пользователи могут управлять ключами в частной сети, исключая риски, связанные с публичным доступом. Пусть ваши данные будут защищены на всех стадиях их обработки! Узнать больше о нововведениях можно в документации MongoDB.

Читать подробнее

#en

@database_design | Другие наши каналы
Техника TOAST (The Oversized-Attribute Storage Technique) в PostgreSQL

Если строка не помещается в блок (страницу), то в PostgreSQL применяется техника выноса полей в отдельную таблицу, называемую TOAST-таблица. Техника выноса и хранения называется TOAST (The Oversized-Attribute Storage Technique, техника хранения атрибутов большого размера). В статье достаточно детально рассматривается алгоритм работы TOAST. Знание алгорима и его граничные значения полезно, чтобы понимать каким образом хранятся данные в таблицах.


Читать: https://habr.com/ru/articles/888926/

#ru

@database_design | Другие наши каналы
Кэширование значений последовательностей в PostgreSQL

У последовательностей есть параметр cache, который определяет сколько значений из последовательности будет кэшировать серверный процесс в своей локальной памяти для будущих вставок в течение сессии. Последовательности используются первичными и уникальными ключами. По умолчанию значения последовательностей не кэшируются. Кэширование может снизить произвдительность и сделать структуру индекса не оптимальной.

Быстрый путь вставки в индексы

В PostgreSQL есть оптимизация вставки в индекс типа btree, позволяющая не спускаться с корня дерева индекса. Серверный процесс, который выполнил вставку в правый листовой блок, запоминает ссылку на него и при последующей вставке, если новое значение больше предыдущего (или пусто) и не проходит путь от корня до листового блока. Оптимизация используется при числе уровней в индексе начиная со второго (макрос BTREE_FASTPATH_MIN_LEVEL).


Читать: https://habr.com/ru/articles/889156/

#ru

@database_design | Другие наши каналы