DATABASE DESIGN – Telegram
DATABASE DESIGN
1.41K subscribers
2.09K photos
3 videos
5.35K links
Лучшие материалы по работе с хранилищами данных на русском и английском языке

Разместить рекламу: @tproger_sales_bot

Правила общения: https://tprg.ru/rules

Другие каналы: @tproger_channels

Другие наши проекты: https://tprg.ru/media
Download Telegram
BookStack: мой опыт настройки и использования open-source базы знаний

Как я поднял базу знаний за 15 минут — без бюджета и опыта

Почему я выбрал именно BookStack

Мы в команде давно искали удобный инструмент для хранения технической документации и инструкций. Пробовали всё подряд — от Wiki.js до Confluence. Но то санкции, то интерфейс перегружен, то кастомизация страдает. В какой-то момент я наткнулся на BookStack — лёгкую, симпатичную open-source платформу на Laravel. Решил попробовать. В итоге — развернул, настроил, и теперь она у нас в проде.


Читать: https://habr.com/ru/articles/909222/

#ru

@database_design | Другие наши каналы
Защищенное хранение резервных копий

В этом обзоре расскажем о проблематике защиты резервных копий, возможных вариантах реализации такой защиты, а также о совместном решении компаний Киберпротект и АМТ‑ГРУП, позволяющем обеспечить защищенное хранение резервных копий, создаваемых СРК Кибер Бэкап, используя аппаратно‑программный комплекс InfoDiode.


Читать: https://habr.com/ru/articles/909058/

#ru

@database_design | Другие наши каналы
Jellyfin Web на своём сервере. Фронтенд для медиастриминга

Многие из нас первым медиасервером устанавливали Plex. Но это коммерческое решение. Некоторые считают, что в последних версиях он изменился к худшему: например, заставляет регистрировать аккаунт, логиниться через центральный веб-портал, передвигает пользовательский контент в подменю, рекламирует собственные продукты и сервисы, выкатывает ненужные функции.

Поэтому для медиасервера лучше выбрать опенсорсную программу, как Jellyfin.

Читать: https://habr.com/ru/companies/ruvds/articles/909074/

#ru

@database_design | Другие наши каналы
Биометрия, 1С и информатика или небольшая история о модернизации систем безопасности промышленного предприятия

Масштабирование — это «серый кардинал» проектирования сложных систем: все знают, что без нее не обойтись, но всерьез задумываются только тогда, когда инфраструктура начинает трещать по швам. А мануалы? Их, как правило, открывают уже постфактум — когда что-то ломается, зависает или отказывается работать вопреки всем ожиданиям. В этой статье мы не будем учить вас теории — вместо этого поделимся реальным опытом модернизации системы видеонаблюдения (СВН) и системы контроля управления доступом (СКУД) на одном из промышленных предприятий.

Здесь не будет идеальных решений и глянцевых кейсов — только честный разбор проблем, с которыми мы столкнулись, неочевидные ловушки масштабирования и примеры того, как даже продуманная архитектура может дать сбой при столкновении с человеческим фактором. Если вы хотите узнать, как превратить хаос устаревшей инфраструктуры в отлаженный механизм, — добро пожаловать под кат.


Читать: https://habr.com/ru/companies/lure_it/articles/909076/

#ru

@database_design | Другие наши каналы
👍1
Разбираем древо ArangoDB «по веточкам». Подробный гайд по графовой БД

Давайте честно: совместный доступ к документам — одна из главных «болей» для всех, кто хоть как-то связан с базами данных. Вроде бы оба пользователя могут работать с файлом, но есть один нюанс: например, количество предоставленных доступов может быть больше, чем их есть на самом деле. Или у документа и вовсе появляется несколько владельцев. Для всего этого требуется решение – и мы его нашли!

Меня зовут Владимир Ревякин, я старший инженер-программист компании «МойОфис», и вместе с QA-инженером Анной Рукавицыной мы подготовили этот материал, чтобы поделиться опытом реализации функции шаринга данных через графовую базу ArangoDB в рамках разработки платформы «Документы Онлайн». Если коротко — это продукт для совместной работы и хранения документов в рамках единой мультипродуктовой экосистемы.

В российских источниках не так много полезной информации по ArangoDB, и наша задача — исправить это недоразумение. Разберем главные нюансы работы с этой системой БД в разработке и тестировании, вспомним ее плюсы, минусы и потенциальные баги. Текст будет полезен как инженерам любых грейдов, которые связаны с работой над базами данных (сил вам...), так и классическим разработчикам продуктов.
Поехали!

Читать: https://habr.com/ru/companies/ncloudtech/articles/905598/

#ru

@database_design | Другие наши каналы
👍1
MongoDB Atlas теперь интегрирован напрямую с Microsoft Azure

Это упрощает управление и оплату, ускоряет запуск приложений с AI и аналитикой, а также позволяет компаниям легко масштабировать проекты, используя мощь обеих платформ в едином интерфейсе. OrderOnline: как MongoDB Atlas помогает масштабировать социальную коммерцию в Индонезии. Платформа справляется с миллионами заказов, улучшает точность данных и повышает успех доставки до 98,4%. Внедрение AI и векторного поиска увеличило конверсию в WhatsApp до 78%.

Читать подробнее

#en

@database_design | Другие наши каналы
OLAP-системы: многомерная модель данных и её применение. Правила Кодда: библия для разработчиков реляционных баз данных

Для анализа и обработки больших объёмов данных применяются специальные системы — OLAP (Online Analytical Processing). Мы разберём основные принципы их работы, преимущества и примеры использования.

Определение OLAP-систем

OLAP-системы — это инструменты для анализа данных, которые позволяют быстро и эффективно находить ответы на сложные вопросы.

Они находят применение в разных сферах, таких как финансы, производство, розничная торговля и другие.

Пример использования OLAP-технологии

«В компании, занимающейся продажей цифровых товаров и программного обеспечения, многомерный куб помогает анализировать данные».


Читать: https://habr.com/ru/articles/909618/

#ru

@database_design | Другие наши каналы
OLAP-системы: многомерная модель данных и её применение. Правила Кодда: библия для разработчиков реляционных баз данных

Для анализа и обработки больших объёмов данных применяются специальные системы — OLAP (Online Analytical Processing). Мы разберём основные принципы их работы, преимущества и примеры использования.

Определение OLAP-систем

OLAP-системы — это инструменты для анализа данных, которые позволяют быстро и эффективно находить ответы на сложные вопросы.

Они находят применение в разных сферах, таких как финансы, производство, розничная торговля и другие.

Пример использования OLAP-технологии

«В компании, занимающейся продажей цифровых товаров и программного обеспечения, многомерный куб помогает анализировать данные».


Читать: https://habr.com/ru/articles/909618/

#ru

@database_design | Другие наши каналы
Как работает Sharding в базах данных?

Что такое Sharding. Показываем, как работает шардинг в базах данных. Рассматриваем пошаговую инструкцию и основные нюансы Tproger

Читать: «Как работает Sharding в базах данных?»

#ru

@database_design | Другие наши каналы
Как работает Sharding в базах данных?

Что такое Sharding. Показываем, как работает шардинг в базах данных. Рассматриваем пошаговую инструкцию и основные нюансы Tproger

Читать: «Как работает Sharding в базах данных?»

#ru

@database_design | Другие наши каналы
Как работает Sharding в базах данных?

Что такое Sharding. Показываем, как работает шардинг в базах данных. Рассматриваем пошаговую инструкцию и основные нюансы Tproger

Читать: «Как работает Sharding в базах данных?»

#ru

@database_design | Другие наши каналы
Как работает Sharding в базах данных?

Что такое Sharding. Показываем, как работает шардинг в базах данных. Рассматриваем пошаговую инструкцию и основные нюансы Tproger

Читать: «Как работает Sharding в базах данных?»

#ru

@database_design | Другие наши каналы
Новая эра грамотности: стартап Ojje с помощью MongoDB создает адаптивную платформу для обучения чтению. Ojje предлагает персонализированные материалы с 15 уровнями сложности и поддержкой нескольких языков, помогая детям преодолеть кризис грамотности и увлечься чтением. MongoDB Atlas теперь интегрирован в Azure как нативный сервис. Это упрощает управление базами данных, объединяет биллинг и ускоряет запуск AI-проектов с помощью Azure. Компаниям становится проще масштабировать и защищать свои данные в облаке.

Читать подробнее

#en

@database_design | Другие наши каналы
Зачем нужен fillfactor в PostgreSQL

Привет, Хабр!

Один параметр PostgreSQL может похоронить вашу производительность, если вы о нём забудете — это fillfactor. Почему однократная настройка числа приводит к неожиданным page split, bloat и мучительному откату запросов? Давайте разбираться.


Читать: https://habr.com/ru/companies/otus/articles/905882/

#ru

@database_design | Другие наши каналы
Почему SCD Type 2 медленно работает в DWH, и как это чинится через Merge + Hash

Привет, Хабр!

В этом статье рассмотрим, почему классическая реализация SCD Type 2 в DWH начинает жутко тормозить на миллионах строк и как с этим бороться при помощи комбинации MERGE + hash-diff.


Читать: https://habr.com/ru/companies/otus/articles/905844/

#ru

@database_design | Другие наши каналы
Как LLM могут помочь аналитикам баз данных в работе с SQL-запросами

В современных компаниях корпоративные хранилища данных (Data Warehouse) играют критически важную роль, обеспечивая централизованное хранение и обработку больших объёмов информации. Данные поступают из разнообразных источников: операционных систем, CRM, ERP, IoT-устройств, веб-аналитики, мобильных приложений и других платформ, отражая все аспекты деятельности организации. На основе этой информации компании формируют разного рода отчётность, отслеживают ключевые показатели эффективности (KPI), оптимизируют бизнес-процессы, прогнозируют рыночные тенденции и принимают стратегические решения.

Эффективная работа с хранилищем невозможна без участия бизнес- и системных аналитиков, которые проектируют структуры данных, очищают и объединяют информацию, адаптируя решения под меняющиеся задачи. С ростом объёмов данных и требований к скорости анализа даже опытные команды сталкиваются с вызовами. Рутинные операции — проектирование схем, поиск таблиц, проверка качества данных — требуют не только технических навыков, но и глубокого понимания бизнес-контекста. Большую часть времени занимает написание и оптимизация SQL-запросов, что становится «узким местом» в условиях динамично меняющихся требований.

Ошибки в SQL-запросах или недостаточное знание структуры данных приводит к потерям времени и снижению точности аналитики. Для решения этих проблем на помощь приходят технологии на основе больших языковых моделей (LLM), таких как GigaChat, GPT, BERT или DeepSeek. Обученные на исторических данных и журналах запросов, они способны автоматизировать подбор таблиц, JOIN-условий и шаблонов SQL.


Читать: https://habr.com/ru/companies/sberbank/articles/909730/

#ru

@database_design | Другие наши каналы
Идеальный NAS на 8 NVME дисков. Обзор Terramaster F8 Pro

У меня как и, наверное, у любого айтишника есть какое-то огромное количество файлов, которое надо бэкапить. И у меня уже есть NAS с обычными HDD дисками для моих бэкапов. Но для себя я решил, что NAS c HDD хорошо подходит для хранения чего-то к чему не очень то и часто обращается. А вот если нужно хранить что-то что иногда нужно скачать или закачать, то значительно приятнее работать с NAS на NVME дисках.

Таких девайсов на самом деле не так уж и много. Есть некоторые модели на 4 диска. А вот на 8 дисков я даже и конкурентов не знаю. Поэтому сегодня будет обзор на уникальную по-своему штуковину - NAS на 8 быстрых NVME дисков. Да еще и с 10 гигабитным ethernet портом.


Читать: https://habr.com/ru/articles/910138/

#ru

@database_design | Другие наши каналы
Внедрение программного обеспечения Экстрактор 1С в компании Level Group: результаты и перспективы

Компания обратилась к нам для решения задачи по сокращению времени получения данных и оптимизации работы команды разработки 1С.

Level Group – один из ведущих застройщиков бизнес-класса в Москве.

За три года компания утроила свои масштабы, достигнув оборота в 100 миллиардов рублей в 2024 году.

Отличительные черты Level Group – это современные и стильные жилые комплексы, продуманные планировки квартир и оригинальные дизайнерские решения.


Читать: https://habr.com/ru/articles/910256/

#ru

@database_design | Другие наши каналы
ИИ в Data Governance: как мы ускорили маркировку персональных данных

Перед нашей командой встала задача сделать продукт управления данными удобнее, добавив алгоритмы искусственного интеллекта. Но какое решение выбрать? Какой процесс нуждался в автоматизации больше всего? С какими ограничениями и сложностями мы столкнулись? Какой бизнес-эффект мы получили в результате? На эти вопросы ответит статья.


Читать: https://habr.com/ru/companies/rostelecom/articles/909976/

#ru

@database_design | Другие наши каналы
Ошибки, которые можно избежать в SQL: грабли начинающего аналитика

Эта статья — ваш чеклист по самым распространённым ошибкам в SQL: с примерами, пояснениями и советами, как не попасть в ловушку из-за забытого WHERE или неправильного JOIN.

Читать: «Ошибки, которые можно избежать в SQL: грабли начинающего аналитика»

#ru

@database_design | Другие наши каналы
Мой адрес — не дом и не улица: как создать нужную бизнесу адресную модель

Приходит заказчик и говорит: «Мы новую систему строим, проконсультируйте нас, пожалуйста. Вы же адресами занимаетесь. Нам нужно сделать универсальную адресную модель. Вот у вас «Единый адрес» есть, какая там модель? Мы примем ее за эталонную и будем в своих системах использовать».

Ребята, я вас сейчас разочарую. В «Едином адресе» не одна адресная модель, а несколько. И ни одну из них копировать просто так не нужно.

Эта статья для архитекторов, аналитиков и разработчиков. В ней я расскажу, в чем подводные камни в работе с адресами и что нужно учитывать при проектировании адресных моделей.


Читать: https://habr.com/ru/companies/hflabs/articles/909750/

#ru

@database_design | Другие наши каналы