NEW BOT Телеграм, страница

DATABASE DESIGN

Документный хаос? RAG-система придёт на помощь

Статья описывает практическую реализацию системы Retrieval-Augmented Generation (RAG) для превращения документов в интерактивную базу знаний. Показано, как хранение эмбеддингов в Qdrant и интеграция с языковой моделью (LLM) позволяют быстро получать точные ответы на вопросы. Рассматриваются архитектура, ключевые компоненты и внутренние механизмы работы системы, полезные для разработчиков и новичков в области RAG.

Читать: https://habr.com/ru/articles/955768/

#ru

@database_design | Другие наши каналы

95 views05:30

DATABASE DESIGN

Решение проблемы двойного букинга: паттерны проектирования систем

Давно прошло то время, когда люди стояли в длинных очередях для покупки билетов на концерты, авиарейсы, фильмы, матчи и другие события.

Технологические компании наподобие Ticketmaster, BookMyShow, Airbnb, Delta Airlines и так далее сделали бронирование делом одного клика, позволившим покупать билеты из дома.

Эта простота стала возможной благодаря технологическим платформам и сервисам, которые прячут от пользователей всю сложность и решают неординарные инженерные задачи. Одна из таких задач — предотвращение бронирования одного места несколькими пользователями.

Представьте, в каком положении окажутся два пользователя, купивших одно и то же место на мероприятие и осознавших это только перед его началом. Из-за этого организатор теряет доверие покупателей, а пользователи дважды задумаются, прежде чем покупать билеты на следующее мероприятие.

Поэтому важно создать надёжное решение классической задачи — двойного букинга.

Из этой статьи вы узнаете, как эту задачу решают разные технологические компании. У каждой компании свои особенности, поэтому единого универсального решения нет.

Мы рассмотрим различные архитектурные паттерны и разберёмся в их плюсах и минусах. Статья поможет вам обрести глубокое понимание и наработать знания в системном мышлении.

Читать: https://habr.com/ru/articles/957954/

#ru

@database_design | Другие наши каналы

100 views05:32

DATABASE DESIGN

Упрощаем Spark через Catalog API

Говоря о серьезных кластерах в компаниях, нам часто приходится взаимодействовать со сторонними отделами и их данными. И зачастую, когда речь идет об ad-hoc, самый эффективный инструмент - Trino. Он удобен тем, что в платформе данных можно добавить каталог, который позволит по сути избежать настройки коннекшена для конечного пользователя. Просто в запросе указываешь название каталога данных и трино сам понимает, что нужно взять данные со сторонней базы данных. Но все меняется, когда выразительности SQL нам перестает хватать для выполнения поставленных задач и мы переходим в Spark. Точнее, менялось. С релизом Spark 3.0 появилась возможность взаимодействовать с внешними источниками так же просто, как в Trino.

Читать: https://habr.com/ru/articles/958478/

#ru

@database_design | Другие наши каналы

103 views06:13

DATABASE DESIGN

Шпаргалка по работе с PostgreSQL для бэкенд-разработчиков

Лайфхаки для миграций, оптимизации и избегания граблей

Реальные лайфхаки и проверенные практики по миграциям, оптимизации запросов, управлению индексами и обратной совместимости кода. Узнайте, как:
- Не сломать прод при миграции.
- Избежать N+1 и других проблем SQL-запросов.
- Планировать откаты и работать безопасно на высоконагруженных БД.

Читать: https://habr.com/ru/companies/beget/articles/920772/

#ru

@database_design | Другие наши каналы

116 views07:17

DATABASE DESIGN

Интеграции без иллюзий: интервью с Владимиром Гантуриным, техническим директором Compo Soft

Интеграции и обмен данными сегодня — это не просто техническая задача, а фундамент цифровой зрелости бизнеса. Российский рынок переживает быстрые изменения: уход западных вендоров, рост требований к надёжности и безопасности, распространение микросервисных архитектур. Как компании справляются с вызовами, когда стоит менять старую интеграционную платформу, зачем бизнесу API Gateway и брокеры сообщений, и можно ли обойтись без интеграционной шины?

Читать: https://habr.com/ru/companies/compo/articles/958584/

#ru

@database_design | Другие наши каналы

96 views08:30

DATABASE DESIGN

Где до сих пор используют дискеты и другие устаревшие носители, которые не умирают даже в 2025 году

В это может быть непросто поверить, на наших глазах уже выросло целое поколение, которое дискету не то что не использовало, а даже в глаза не видело. В целом, все логично. Технология давно умерла и предана забвению. Так, по крайней мере, принято считать. Но есть категория людей, которым об этом почему-то не рассказали, и они продолжают полагаться в своей работе даже не на диски DVD-RW, а на старые добрые дискеты. Разных форматов, конечно, но все-таки дискеты. И таких историй больше, чем кажется.

Читать: https://habr.com/ru/companies/x-com/articles/958624/

#ru

@database_design | Другие наши каналы

89 views09:41

DATABASE DESIGN

Непопулярный вариант развертывания хранилища Nextcloud

Привет, Хабр. У меня тут такая история случилась: накопился массив фотографий с путешествий, всяких документов, семейных архивов и учебных материалов по всяких курсам — всего где-то гигов 300. Все важное, ценное, и, конечно, это все очень не хочется потерять.

Я почитал статьи здесь на Хабре, погуглил и понял, что многие покупают себе физические серверы с дисками и на них устраивают хранилища, например, Nextcloud. Звучит удобно: можно настроить синхронизацию со всех устройств, не надо переживать за безопасность, потому что на сервере уже есть защита, и я полностью управляю своими данными. Одно «но» — для меня это дороговато. Получается, что на средний вариант такого сервера и пары дисков, чтобы настроить рейд-массив, нужна приличная сумма. Плюс по комментариям к статьям понял, что придется заморочиться с установкой Nextcloud на сервер. Не уверен, что хочу ввязываться в такие сложности.

Пока изучал тему, увидел, что есть и другой вариант — более дешевый и вроде такой же простой по установке и настройке. Решил протестировать и рассказать, что же у меня в итоге получилось.

Читать: https://habr.com/ru/companies/cloud_ru/articles/957612/

#ru

@database_design | Другие наши каналы

81 views10:46

DATABASE DESIGN

Миграции Postgres с использованием логической репликации

Миграция PostgreSQL — редкий проект, где «быстро и безболезненно» почти никогда не совпадают. Дамп/восстановление годится для сотен гигабайт, потоковая репликация по WAL — для тех, у кого есть к ней доступ. Но когда простоя не хочется, а WAL недоступен, остаётся третий путь — логическая репликация.

В этом материале — практический сценарий: как заранее перенести схему, обеспечить уникальную идентификацию строк (PK/уникальный индекс/REPLICA IDENTITY FULL), настроить публикации и подписки, следить за первичной загрузкой через pg_stat_subnoscription, корректно остановить запись на источнике и синхронизировать последовательности.
Старт миграции

Читать: https://habr.com/ru/companies/otus/articles/958718/

#ru

@database_design | Другие наши каналы

110 views13:54

DATABASE DESIGN

Как использовать Clickhouse без боли

ClickHouse — одна из самых популярных систем для анализа данных. По информации TheirStack, этот инструмент использует более 3 700 компаний по всему миру.

У ClickHouse быстрая аналитика, эффективное сжатие и отличное масштабирование. Но у системы есть и недостатки — ограниченная поддержка UPDATE и DELETE, а также сложная миграция.

Привет, Хабр! Меня зовут Михаил Филимонов, я руковожу разработкой хранилища данных в группе Магнит OMNI. В этой статье я расскажу о проблемах работы с ClickHouse, как их решать и какие инструменты для этого потребуются.

Читать: https://habr.com/ru/companies/magnit/articles/955312/

#ru

@database_design | Другие наши каналы

110 views09:34

DATABASE DESIGN

Как мы в Skyeng построили свою мультитач-атрибуцию, чтобы больше не ругаться из-за заявок

Всем привет! Меня зовут Анастасия Козлова, я Senior BI Analyst в маркетинге Skyeng. Сегодня хочу рассказать, как мы научились справедливо оценивать вклад каждого рекламного канала с помощью кастомной мультиканальной модели атрибуции, что нас к этому подтолкнуло и как мы её настроили технически.

Читать: https://habr.com/ru/companies/skyeng/articles/954572/

#ru

@database_design | Другие наши каналы

99 views10:55

DATABASE DESIGN

Масштабирование кластера Valkey до 1 миллиарда запросов в секунду

Предстоящий релиз Valkey 9.0 несёт в себе значительные улучшения в отказоустойчивости больших кластеров, позволяя масштабироваться до 2000 узлов и достигать производительности свыше 1 миллиарда запросов в секунду, и всё это с гарантированно ограниченным временем восстановления. В этой статье мы рассмотрим, как работает система кластеризации Valkey, а также архитектурные усовершенствования и тщательное тестирование, которые сделали возможным такой уровень масштабирования.

Читать: https://habr.com/ru/articles/958998/

#ru

@database_design | Другие наши каналы

100 views12:16

DATABASE DESIGN

MariaDB Enterprise Platform 2026 — единая платформа для интеллектуальных AI‑приложений

MariaDB объявила релиз Enterprise Platform 2026, который объединяет транзакционный, аналитический и векторный AI-движки в одной системе, чтобы снизить архитектурное трение и ускорить инновации.

Читать подробнее

#en

@database_design | Другие наши каналы

MariaDB

Announcing the Release of MariaDB Enterprise Platform 2026 | MariaDB

MariaDB Enterprise Platform 2026 is a major release that addresses the challenges of data silos that slow innovation and inflate costs.

92 views13:02

DATABASE DESIGN

Write. Review. Commit. Repeat. Как документируют в Postgres Professional

Как вы думаете, сколько человек документирует продукты в Postgres Professional? 50? 100? А вот и нет — всего десять. Рассказываем, как команде техписателей удается управлять сотнями файлов, почему их работа — это квест, и как они успевают контрибьютить в ванильный PostgreSQL.

Читать: https://habr.com/ru/companies/postgrespro/articles/924718/

#ru

@database_design | Другие наши каналы

97 views13:13

DATABASE DESIGN

MariaDB и Exasol — мгновенная аналитика на живых данных
В статье сообщается о партнёрстве, которое обещает устранить барьер между операционными данными и аналитикой, упростить стек данных и дать пользователям мгновенные аналитические инсайты. Подробнее — в исходной статье.

Читать подробнее

#en

@database_design | Другие наши каналы

MariaDB

Introducing MariaDB Exa: 1,000x Faster Analytics on Live Data | MariaDB

MariaDB partners with Exasol to create MariaDB Exa, delivering real-time insights from operational to petabyte-scale AI data.

85 views21:53

DATABASE DESIGN

Exadata — платформа не только для крупнейших
В статье говорится, что за 15+ лет Exadata стала ведущей платформой для Oracle Database и подходит не только для критичных и сверхбольших баз, но и для более широкого круга задач.

Читать подробнее

#en

@database_design | Другие наши каналы

Oracle

Exadata for Everyone: Extreme Performance Meets Extreme Low Cost

For over 15 years, Exadata has been the premier platform for Oracle Database workloads. Now, you may have thought that Exadata was only for mission critical workloads and the largest databases or is targeted only for large enterprise customers. Well, think…

71 views01:24

DATABASE DESIGN

Oracle RAC в облаке: масштабирование и доступность
Как использовать Oracle RAC в облачных средах — разбирают преимущества, варианты развёртывания и практические рекомендации по масштабированию и повышению отказоустойчивости баз данных.

Читать подробнее

#en

@database_design | Другие наши каналы

Oracle

Using Oracle Real Application Clusters in the Public Cloud

Oracle RAC was designed to allow a single Oracle Database to run across multiple servers to maximize availability and enable horizontal scalability. So, how can users nowadays take advantage of Oracle RAC in the cloud?

71 views01:24

DATABASE DESIGN

Итоги 2024: ключевые анонсы Oracle Database в облаке
В статье подведены главные нововведения Oracle Database в облаке за 2024 год и прогнозы на 2025-й. Краткий обзор ключевых анонсов и направлений развития сервисов.

Читать подробнее

#en

@database_design | Другие наши каналы

Oracle

2024 Year in Review – Exadata Database Service and Base Database Service Announcements You Might Have Missed

2024 has seen many groundbreaking new announcements for Oracle Database services in the cloud. As we wrap up the year, it’s a great time to look back and recap these key announcements as we prepare for even more innovative advances in 2025.

75 views01:25

DATABASE DESIGN

Новинки Oracle Database в облаке — 2024

Oracle в 2024 году запустила Database@Google Cloud и Database@AWS, представила Exadata Exascale с интеллектуальной архитектурой и Oracle Database 23ai с нативным Vector search — ключевые обновления для ADB‑D и AI‑решений.

Читать подробнее

#en

@database_design | Другие наши каналы

Oracle

2024 Year in Review for Autonomous Database on Dedicated Exadata Infrastructure

2024 was a landmark year for Oracle Database services in the cloud. We expanded our multicloud initiatives with the launch of Oracle Database@Google Cloud, followed by the exciting introduction of Oracle Database@AWS. We also unveiled Exadata Exascale, introducing…

90 views01:26

DATABASE DESIGN

Когда база данных становится открытой книгой

Базы данных превращаются в «открытую книгу», когда конфиденциальная информация из них становится доступна злоумышленникам или широкой публике из-за утечек. К сожалению, 2024-2025 годы принесли множество таких утечек – в самых разных отраслях. Согласно данным Роскомнадзора, только в России за 2024 год было зафиксировано 135 утечек баз данных, затронувших более 710 млн записей о россиянах. Лидерами по количеству утечек стали торговый сектор и государственные организации. В мире тенденция схожая: глобально число утечек и скомпрометированных записей бьёт рекорды. В этой статье будут разобраны недавние громкие кейсы утечек по секторам (энергетика, госсектор, e-commerce и др.), проанализируем технические причины: от открытых портов NoSQL и слитых резервных копий до уязвимых CI/CD-пайплайнов, а также практические рекомендации, как не допустить, чтобы ваша база данных стала общедоступной библиотекой. Мы в Security Vision также рассматриваем эти задачи как ключевые в разработке решений нового поколения, в том числе в области автоматизации защиты баз данных и безопасной разработки.

Читать: https://habr.com/ru/companies/securityvison/articles/959320/

#ru

@database_design | Другие наши каналы

99 views07:50

DATABASE DESIGN

Тестирование движков массивно-параллельных вычислений: StarRocks, Trino, Spark. Spark – с DataFusion Comet и Impala

В сегодняшней, уже третьей по счету, публикации я продолжу делится результатами нагрузочных испытаний вычислительных технологий массивных параллельных вычислений (на Habr уже представлены мои материалы, посвященные сравнению Impala, Trino и Greenplum, в том числе по методике TPC-DS). В этот раз в список решений добавляется Spark, включая работающий с технологией нативных вычислений DataFusion Comet, и набирающий популярность StarRocks.

Читать: https://habr.com/ru/companies/datasapience/articles/959496/

#ru

@database_design | Другие наши каналы

89 views12:16

DATABASE DESIGN

93 views12:17

About

Blog

Apps

Platform