DATABASE DESIGN – Telegram
DATABASE DESIGN
1.41K subscribers
2.08K photos
3 videos
5.35K links
Лучшие материалы по работе с хранилищами данных на русском и английском языке

Разместить рекламу: @tproger_sales_bot

Правила общения: https://tprg.ru/rules

Другие каналы: @tproger_channels

Другие наши проекты: https://tprg.ru/media
Download Telegram
Большой гайд по миграциям в Django: полезные советы и обход типичных подводных камней

Привет! Меня зовут Макс, я backend-разработчик в компании ИдаПроджект и автор YouTube-канала PyLounge.

Эта вторая часть большой статьи по Django-миграциям для начинающих. Если вы пропустили или потеряли первую часть — держите ссылку.

Что здесь будет? Разберем фиктивное применение, миграции данных, «сухую проверку» и основные проблемы, которые возникают у начинающих. Также поделюсь полезными советами и подсвечу детали работы. Примеры из практики — обязательно будут.

Дисклеймер (как и в первой части, чтобы не было недопониманий): все примеры специально упрощены, чтобы неокрепший ум выцепил концепции, а не детали реализации. Не бейте, или бейте там, где синяков не видно :)


Читать: https://habr.com/ru/companies/idaproject/articles/865036/

#ru

@database_design | Другие наши каналы
Партиционированный Postgres: немного о проблемах с лимитами

В то время, как пользователи видят позитивные стороны технологий, мы, разработчики, обычно сталкиваемся с ограничениями/недоработками/багами и видим наш продукт с совсем другой стороны. Вот и в этот раз: после публикации результатов сравнительного тестирования где я прогонял запросы теста Join-Order-Benchmark на базе с партициями и без, меня не отпускало ощущение, что всё-таки что-то я не досмотрел и при наличии партиций постгрес должен строить план хуже, чем без них. И это должен быть не просто баг, а технологическое ограничение. И вот, методом разглядывания потолка удалось-таки найти тонкое место - запросы с лимитами.


Читать: https://habr.com/ru/companies/postgrespro/articles/864910/

#ru

@database_design | Другие наши каналы
Дедупликация в OpenZFS теперь хороша, но использовать её не стоит

Вот-вот выйдет релиз OpenZFS 2.3.0 с новой функцией Fast Dedup. Это огромный шаг вперёд по сравнению со старой дедупликацией и отличный фундамент для будущих доработок.

Контрибьютор OpenZFS @gmelikov и команда VK Cloud совместно перевели статью об этом релизе, в которой новая функция сравнивается со старой дедупликацией и описывается максимально подробно с практическими примерами. В 2023–2024 коллеги из Klara много работали над этой функцией, и мы согласны с ними, что она весьма хороша!

После релиза Fast dedup на многих ресурсах в обсуждениях продолжили писать, что «новый дедуп всё так же плох, он требует столько же ОЗУ и также убивает производительность». Но эта информация лишь отчасти близка к правде и повторяет всё тот же мотив, который когда-то кто-то озвучивал на форумах.

Винить в этом никого не хочется. И не стоит, так как дедупликация в OpenZFS и правда была очень требовательной к правильному применению. Найти качественные гайды тоже не просто, ответ по умолчанию — «не используйте её» — был и (в целом) остаётся правильным. Но, по прошествии почти 20 лет жизни дедупа в OpenZFS, настало время вернуться к этому вопросу.

Посмотрим на свежую информацию об имплементации дедупа в OpenZFS, как он работал до улучшений, в чём была его проблема, что поменяли в fast dedup, и почему же это всё ещё не дефолт.


Читать: https://habr.com/ru/companies/vk/articles/863904/

#ru

@database_design | Другие наши каналы
Оптимизация поиска в MongoDB: быстрая и экономичная работа с векторами

MongoDB объявила о новых функциях бинарной и скалярной квантизации в Atlas Vector Search. Эти улучшения позволяют сократить память на 96% и ускорить обработку запросов, оставаясь точными на 95%. Теперь разработчики могут эффективно применять поиск по векторам и generative AI. Инновации в AI с использованием MongoDB Atlas

Инновационная платформа IntellectAI, разработанная на базе MongoDB Atlas, резко ускоряет принятие решений в сфере финансов и страхования. С интеграцией AI и аналитики, система достигает более 90% точности, обрабатывая данные из 8000+ компаний, что в разы увеличивает масштаб и эффективность бизнес-процессов.

Читать подробнее

#en

@database_design | Другие наши каналы
Oracle EBS 12.2 и DB 23ai: Новое обновление

Oracle объявила о сертификации EBS Release 12.2 с Oracle Database 23ai для Exadata. Клиенты, соблюдающие все требования, могут обновиться до версии 23.5 на Exadata Software 24.1 или позже. Это улучшение поможет оптимизировать работу систем.

Читать подробнее

#en

@database_design | Другие наши каналы
MongoDB и AI: Новые горизонты на re:Invent 2024

На AWS re:Invent 2024 MongoDB укрепило свои позиции в сфере AI, представив программу MongoDB AI Application Program. Среди партнеров — Capgemini, IBM и другие лидеры индустрии. Совместно с Meta, MongoDB помогает разработчикам использовать модели Meta и технологии MAAP, продвигая инновации и сотрудничество в AI. Оптимизация поиска с помощью двоичной квантизации

Снижение затрат на память с помощью двоичной квантизации в Atlas Vector Search может ухудшить точность поиска. Однако добавление этапа пересчета возвращает высокую точность, сохраняя до 95% эффективности. Это позволяет обрабатывать данные быстрее и дешевле без снижения качества.

Читать подробнее

#en

@database_design | Другие наши каналы
Путешествие внутрь YADRO. Часть 2: распаковка и тест-драйв TATLIN.BACKUP

Хабр, привет! На связи Алексей Зотов из К2Тех. Поиск надежных альтернатив западным системам хранения по-прежнему актуален для нас и наших клиентов. Не так давно в инфраструктурную лабораторию К2Тех приехало железо от ведущего российского разработчика и производителя YADRO, которому я решил посвятить небольшой цикл статей. В первой части я рассказывал об универсальной СХД начального уровня TATLIN.FLEX. А сегодня, как и обещал, поделюсь результатами тестов специализированной СХД для резервного копирования с поддержкой глобальной дедупликации — TATLIN.BACKUP. Эта система позиционируется как отечественная альтернатива популярным решениям Dell DataDomain и HPE StoreOnce.

Мы проверили ее производительность, отказоустойчивость и эффективность оптимизации данных. Уделили внимание сравнению с западными аналогами и тестированию новой версии 1.1 с поддержкой T-Boost. Давайте узнаем, насколько эффективна TATLIN.BACKUP в реальных условиях.


Читать: https://habr.com/ru/companies/k2tech/articles/866134/

#ru

@database_design | Другие наши каналы
Новая версия Oracle Key Vault 21.10 уже доступна!

Oracle представила обновление Key Vault 21.10, которое предлагает улучшенные возможности безопасности и упрощенные операционные процессы. Это обновление помогает максимально эффективно использовать ваши вложения в Key Vault. Узнайте больше о всех новшествах!

Читать подробнее

#en

@database_design | Другие наши каналы
Знакомство со слоем абстракции Netflix для хранения временных рядов

Netflix продолжает расширять бизнес и диверсифицироваться в различных направлениях, вроде доставки видео по запросу и гейминга. В результате всё важнее становятся технологии, обеспечивающие загрузку временных (темпоральных) данных в системы компании и их хранение. Речь идёт об огромных объёмах данных, измеряемых петабайтами. А задержки доступа к этим данным должны укладываться в миллисекунду. В предыдущих материалах мы рассказывали о нашем слое абстракции для хранения данных типа «ключ-значение», и о платформе, реализующий возможности шлюза данных. И то и другое — это неотъемлемые части подсистемы, отвечающей в Netflix за работу с данными. Система хранения данных типа «ключ-значение» — это гибкое и хорошо масштабируемое решение для работы со структурированными данными соответствующего формата. А шлюз данных — это платформа, которая даёт компании базовую инфраструктуру, обеспечивающую защиту, настройку, развёртывание компонентов, ориентированных на работу с данными.


Читать: https://habr.com/ru/companies/wunderfund/articles/866912/

#ru

@database_design | Другие наши каналы
🔥 Новые функции LangChain и MongoDB: что нового?

LangChain и MongoDB представили два улучшения: чекпойнтеры и нативные ретриверы "родитель-дитя". Эти новинки помогают разработчикам более эффективно управлять состоянием приложений и улучшать производительность дорогостоящих методов извлечения данных. Следите за новостями, ведь это только начало! Ускорение разработки RAG-функций с MongoDB

Langtrace AI объединяется с MongoDB для улучшения разработки RAG-функций. Благодаря интеграции компании смогут быстрее выводить продукты на рынок и повышать точность их работы. Подробности о возможностях и партнёрствах представлены в AI Resources Hub.

Читать подробнее

#en

@database_design | Другие наши каналы
Восстановление MariaDB до определенного момента

В статье рассмотрена техника восстановления базы данных MariaDB до определенного момента в прошлом. Описаны шаги, начиная с создания резервной копии и до применения бинарных логов. Подходит для тестовой среды, с подробными инструкциями по настройке и выполнению. Как восстановить данные из бинарного лога в MariaDB

В статье описан процесс восстановления данных в MariaDB, используя бинарные логи. Рассматривается задача возврата базы данных к состоянию, предшествующему определенной транзакции. Приведены шаги для идентификации нужного лога и инструкции по их применению. Полезно для администраторов БД! Восстановление базы данных в MariaDB до точки во времени

Как восстановить базу данных MariaDB до конкретного момента времени? Статья рассказывает о процессе применения бинарных логов и важных шагах для выполнения восстановления до заданной точки, включая редактирование SQL-файла и использование параметра остановки по времени.

Читать подробнее

#en

@database_design | Другие наши каналы
Новые возможности для DBA и администраторов

В 2024 году команда AHF сконцентрировалась на помощи администраторам баз данных и флота. Новые функции позволяют предотвратить критические проблемы, решать возникающие задачи и лучше понимать конфигурации и события в базе данных. Узнайте больше о новых возможностях!

Читать подробнее

#en

@database_design | Другие наши каналы
Новая эра Exadata от Oracle

Oracle объявила о появлении Exadata Database на масштабе Exascale, что обеспечит глобальную доступность мощной вычислительной инфраструктуры. Это прорыв в обработке больших данных и повышении производительности баз данных для компаний по всему миру.

Читать подробнее

#en

@database_design | Другие наши каналы
Zepto сокращает задержку на 40% с MongoDB

Индийский стартап Zepto использует MongoDB Atlas для оптимизации инфраструктуры, что позволило сократить задержку API на 40% и улучшить клиентский опыт. Переход на NoSQL помог Zepto справляться с шестикратным увеличением трафика без потерь в производительности. Обновления MongoDB и LangChain для AI-разработчиков

MongoDB теперь поддерживает хранение родительских и дочерних документов в одной коллекции, что упрощает использование векторов. Новый класс MongoDBDocStore облегчает управление документами. Сотрудничество MongoDB и LangChain делает разработку ИИ более удобной и эффективной.

Читать подробнее

#en

@database_design | Другие наши каналы
Как обновить PostgreSQL и не потерять данные: метод минимизации простоя

Мы успешно обновили кластер PostgreSQL с версии 13 до 16, обеспечив минимальный простой и высокую производительность. Процесс включал в себя создание новой реплики через логическую репликацию, перенос роли мастера на обновлённую реплику и настройку потоковой репликации. Несмотря на некоторые сложности, такие как управление LSN и проблемы с подписками, нам удалось сохранить данные и обеспечить синхронизацию.

Подробности читайте в статье.


Читать: https://habr.com/ru/companies/flant/articles/866250/

#ru

@database_design | Другие наши каналы
Как честно распределить вычислительные ресурсы? Показываем на примере YTsaurus

YTsaurus — платформа для распределённого хранения и обработки данных. С помощью неё пользователи могут производить вычисления с данными, которые хранятся на кластере. За запуск этих вычислений отвечает один из центральных компонентов системы — планировщик. Зачастую ресурсов кластера не хватает, чтобы одновременно запустить все желаемые вычислительные задачи. Поэтому одна из важных задач планировщика — умение грамотно распределять вычислительные ресурсы между пользователями.

Меня зовут Егор Щербин, я работаю в Yandex Infrastructure, в команде планировщика YTsaurus. О нём и расскажу в этой статье. А также о запуске вычислений в кластере YTsaurus, распределении ресурсов между вычислениями и о том, как управлять распределением, чтобы все операции получали ровно столько, сколько требуется.


Читать: https://habr.com/ru/companies/yandex/articles/860562/

#ru

@database_design | Другие наши каналы
Низкоресурсный блокчейн для Интернета вещей: как с пользой «скрестить ежа с ужом»

Приветствую, Хабр! Хотелось бы этой статьей продолжить обзор нефинансовых применений блокчейн-технологий, начатый мной ранее на примере использования блокчейна для хранения идентификационных данных. Рассмотрим здесь существующие подходы по применению блокчейна в системах Интернета вещей различного назначения.

Казалось бы, между ресурсоемким по своей природе блокчейном и Интернетом вещей, построенном на использовании устройств с ограниченными ресурсами, лежит огромная пропасть. Однако многие из свойств блокчейна оказались настолько востребованными в Интернете вещей, что появилось целое направление блокчейн-технологий – низкоресурсный блокчейн (Lightweight Blockchain, LWB), в рамках которого было предложено множество подходов к созданию блокчейнов с пониженными требованиями к ресурсам и, следовательно, к их адаптации для реализации в системах Интернета вещей и, в частности, в устройствах с низкими вычислительными ресурсами.

Опишем далее, какие же свойства блокчейна оказались полезными для Интернета вещей, по каким направлениям идет создание низкоресурсных блокчейнов и как они впоследствии применяются.


Читать: https://habr.com/ru/companies/aktiv-company/articles/867238/

#ru

@database_design | Другие наши каналы
Отход от Airflow: почему Dagster — это оркестратор данных следующего поколения

Мы запустили Dagster, потому что в мире данных наблюдается кризис инструментов и инженерии. Существует драматическое несоответствие между сложностью и критичностью данных и инструментами и процессами, которые существуют для их поддержки.


Читать: https://habr.com/ru/articles/867132/

#ru

@database_design | Другие наши каналы
Новый уровень защиты данных с Enterprise Manager 24ai

Enterprise Manager 24ai предлагает обновлённую функцию Oracle Data Masking и Subsetting. Новый интерфейс и оптимизированные процессы ускоряют обнаружение и маскировку чувствительных данных. Улучшения делают управление безопасностью данных проще и эффективнее.

Читать подробнее

#en

@database_design | Другие наши каналы
Всё про конфиги (лекция)

Материалы лекции про конфигурационные файлы — все основные аспекты написания и использования конфигов для самых маленьких, примеры кода на python.
Узнать страшную правду

Читать: https://habr.com/ru/articles/866468/

#ru

@database_design | Другие наши каналы
Упрощенный перенос данных MongoDB в BigQuery через JSON

Google Cloud представил обновление для Dataflow шаблонов MongoDB Atlas. Поддержка JSON позволяет загружать данные без преобразований прямо в BigQuery, что снижает затраты и улучшает производительность запросов. Это значительно упрощает анализ больших данных и обучение машин. Успешное масштабирование с MongoDB

Zepto увеличила трафик и улучшила время загрузки страниц на 14% благодаря MongoDB. Это позволило компании расти без узких мест и повысить конверсии. Разделение нагрузок на MongoDB обеспечило клиентам стабильную работу без влияния аналитических запросов. Узнайте больше на нашем сайте.

Читать подробнее

#en

@database_design | Другие наши каналы