DATABASE DESIGN – Telegram
DATABASE DESIGN
1.41K subscribers
2.08K photos
3 videos
5.31K links
Лучшие материалы по работе с хранилищами данных на русском и английском языке

Разместить рекламу: @tproger_sales_bot

Правила общения: https://tprg.ru/rules

Другие каналы: @tproger_channels

Другие наши проекты: https://tprg.ru/media
Download Telegram
Выпущены MariaDB Connector/C++ 1.1.7 и 1.0.6

MariaDB выпустила стабильные версии Connector/C++ 1.1.7 и 1.0.6 с исправлениями и улучшенной совместимостью. Доступны для загрузки на официальном сайте; в исходной статье приведён подробный список изменений и ссылки.

Читать подробнее

#en

@database_design | Другие наши каналы
Пользователь не дал согласие на использование cookie и метрических программ, но информация о нём получена: что делать

Ситуация: пользователь зашёл на сайт. Фактически его данные уже обрабатываются метрическими программами (файлами cookie), хотя согласия на это он не давал. Пользователь не хочет, чтобы его данные собирались и обрабатывались, поэтому покидает сайт. Но данные уже получены. Что делать в этой ситуации? На каком  основании можно обрабатывать данные пользователя сразу при входе на сайт?
Узнать, как не нарушать закон

Читать: https://habr.com/ru/articles/952998/

#ru

@database_design | Другие наши каналы
Пользователь не дал согласие на использование cookie и метрических программ, но информация о нём получена: что делать

Ситуация: пользователь зашёл на сайт. Фактически его данные уже обрабатываются метрическими программами (файлами cookie), хотя согласия на это он не давал. Пользователь не хочет, чтобы его данные собирались и обрабатывались, поэтому покидает сайт. Но данные уже получены. Что делать в этой ситуации? На каком  основании можно обрабатывать данные пользователя сразу при входе на сайт?
Узнать, как не нарушать закон

Читать: https://habr.com/ru/articles/952998/

#ru

@database_design | Другие наши каналы
Разница между блокировками и защёлками в базах данных

Сейчас уже не вспомню, какого черта я полез искать разницу между "lock" и "latch" — кажется, кто-то из студентов при переводе на английский использовал эти слова взаимозаменяемо. Как бы то ни было, я положил в закладки себе эту статью, чтобы обязательно  подготовить ее для ИТ-переводчиков (т.е. с указанием английских терминов). Собственно, вот, ее перевод ниже. Статья небольшая и базовая, спецы по СУБД в ней ничего нового для себя не найдут.


Читать: https://habr.com/ru/articles/953016/

#ru

@database_design | Другие наши каналы
Почему не стоит заменять пустые значения нулями в Power BI

Вас просили заменить пустые значения нулями в отчетах? Возможно, стоит дважды подумать, прежде чем это делать!


Читать: https://habr.com/ru/articles/951458/

#ru

@database_design | Другие наши каналы
Что такое DWH и зачем оно нужно бизнесу?

Всем привет! Сегодня рассмотрим, что из себя представляет Data Warehouse и зачем оно нужно вашему бизнесу.

Статья рассчитана на то, чтобы дать общее представление широкой аудитории, так что возможны упрощения и небольшие неточности – буду рада подискутировать о них в комментариях, если вы заметите их.
Подробнее о DWH

Читать: https://habr.com/ru/companies/otus/articles/950328/

#ru

@database_design | Другие наши каналы
PostgreSQL против 10 миллионов записей: оптимизация запросов, которая спасла наш проект

Это был обычный понедельник. Я пил кофе, проверял почту, и вдруг — волна уведомлений в Slack. «Сайт не грузится!», «Отчеты зависли!», «Что происходит?».

Наш проект, который успешно работал с несколькими сотнями тысяч записей, перешагнул психологически важный рубеж — 10 миллионов строк в таблице заказов. И PostgreSQL, который раньше летал, внезапно начал ползти как улитка.


Читать: https://habr.com/ru/articles/953264/

#ru

@database_design | Другие наши каналы
Поиск собственных файлов как в браузере (Google поисковике)

Поиск собственных файлов как в браузере (Google поисковике).

Даже при аккуратной структуре папок и нейминге найти нужный файл часто было непросто. Рано или поздно все превращалось в большой хаос из набора файлов и папок.

Я пробовал программы по типу Everything, которые ищут по названию файла, пробовал obsidian и xyplorer, которые дают возможность добавлять теги, но хотелось простой возможности описать то, что ищешь, и получить результат - как в браузер поисковике. Затем я подумал - ведь все может быть контекстом...


Читать: https://habr.com/ru/articles/953342/

#ru

@database_design | Другие наши каналы
Экспериментальный селф-хостинг — материалы для начинающих, личный опыт, DIY-гайды и домашние лабы

Многие энтузиасты разворачивают open source-инструменты у себя дома и экспериментируют с «домашним облаком», решая личные задачи.

Мы в Beeline Cloud подобрали примечательные материалы, которые помогут погрузиться в тему, познакомиться с кастомными сборками.


Читать: https://habr.com/ru/companies/beeline_cloud/articles/953456/

#ru

@database_design | Другие наши каналы
Хранение временных данных в PostgreSQL

Временные (промежуточные) данные - те, которые нужны для обработки в течение транзакции, сессии или ограниченное время. После истечения срока такие данные не нужны. Причина использования временных данных в том, что в одном запросе не всегда можно обработать все данные. Логика приложения может предусматривать обработку данных по частям - разными запросами. В статье рассматриваются и сравниваются способы хранения временных данных в:
1) обычных таблицах;
2) нежурналируемых таблицах;
3) материализованных представлениях;
4) временных таблицах;
5) в памяти серверного процесса, используя расширение pg_variables


Читать: https://habr.com/ru/articles/953546/

#ru

@database_design | Другие наши каналы
Как мы в Циане готовим Data Vault на GreenPlum

Привет! Меня зовут Влад, я DWH-инженер в Циан. Занимаюсь проектированием витрин и пайплайнов для доставки данных в корпоративное хранилище. В этой статье хочу поделиться опытом применения методологии Data Vault на Greenplum.

Data Vault часто упоминают рядом с Kimball и Inmon, но практических материалов по его внедрению заметно меньше. Для инженеров, которые только начинают строить DWH или думают о переходе на Data Vault, я собрал практический разбор: на каких задачах методология действительно помогает, с какими трудностями можно столкнуться и как это выглядит в реальном проекте.


Читать: https://habr.com/ru/articles/953750/

#ru

@database_design | Другие наши каналы
Хранение временных данных в PostgreSQL

Временные, или промежуточные данные — это данные, которые необходимы для обработки в рамках одной транзакции, сессии или в течение ограниченного периода, и удаляются после его завершения. Использование временных данных применяется в случаях, когда обработка всей информации за один запрос невозможна или нецелесообразна. Поэтому приложение может выполнять обработку по частям, используя несколько запросов.

В статье будут рассмотрены основные методы хранения временных данных в PostgreSQL: обычные таблицы, нежурналируемые таблицы, материализованные преставления, временные таблицы и память серверного процесса с использованием расширения pg_variables.


Читать: https://habr.com/ru/companies/tantor/articles/953546/

#ru

@database_design | Другие наши каналы
2
Как я сдал экзамен AWS DEA-C01 Data Engineering Associate в 2025 году

Всем привет! Меня зовут Роман, и я хочу поделиться своим опытом сдачи экзамена AWS DEA-C01: Data Engineer Associate. Когда сам готовился, то много искал реальных отзывов и заметок о том, как проходит экзамен, как лучше всего готовиться и на что обращать внимание. Поэтому надеюсь, что мой опыт будет полезен.

Немного о себе: сейчас я учусь на дата-инженера, и уже через несколько месяцев завершаю программу обучения. Параллельно начал задумываться о будущем трудоустройстве и изучал доступные вакансии. Довольно быстро стало очевидно, что учебная программа и реальные ожидания компаний пересекаются не во всём: последние делают большой упор на облака.

В IT у меня почти не нет опыта, так как вся моя предыдущая деятельность связана с аналитическим маркетингом: построение моделей работы рынка, прогнозирование цен, решение разных оптимизационных задач. То есть, по-хорошему, будущему работодателю надо показать как знания, так и практические результаты их применения, а именно пет-проекты.

Так у меня и появилась первая цель — подготовиться и успешно сдать экзамен DEA-C01.


Читать: https://habr.com/ru/articles/953820/

#ru

@database_design | Другие наши каналы
Бесплатные лицензии Oracle для разработчиков

В статье говорится, что Oracle Exadata и Oracle Base Database Service для разработчиков предоставляют лицензии Oracle бесплатно. На той же платформе можно строить AI-приложения с Enterprise Edition и большинством опций.

Читать подробнее

#en

@database_design | Другие наши каналы
Как банки Индии держат UPI всегда в строю с распределённой БД Oracle

Материал объясняет, как ведущие индийские банки используют распределённую базу данных Oracle для обеспечения высокой доступности, масштабируемости и низкой задержки UPI, повышая устойчивость и непрерывность платежей.

Читать подробнее

#en

@database_design | Другие наши каналы
Oracle AI World — новые обновления Exadata и Database Cloud

Oracle приглашает на Oracle AI World в Лас-Вегасе 13-16 октября 2025. На конференции представят последние продуктовые и технологические обновления Exadata и облачной базы данных — шанс узнать о ключевых новинках и перспективах.

Читать подробнее

#en

@database_design | Другие наши каналы
Oracle AI World 2025: как IoT и ИИ меняют медицину

Wim Coeakerts, EVP по разработке ПО в Oracle, расскажет, как IoT и искусственный интеллект трансформируют оказание медицинской помощи: удалённый мониторинг, персонализированное лечение и новые сервисы. Анонс доклада на Oracle AI World 2025.

Читать подробнее

#en

@database_design | Другие наши каналы
Как мы захотели контролировать SPILL’ы в Greenplum и сделали “Демократизатор”

Представьте: Один неоптимизированный запрос от неопытного коллеги - и вот уже 40 ТБ SPILL-файлов парализуют систему.

Срабатывает лимит на уровне Greenplum, запрос завершён. Никто ничего не знает.

Создаются заявки, пишутся письма, пользователь недоволен.

Это не какая-то выдуманная история, а обычный будний день в большом Greenplum. Вернее, так было раньше.


Читать: https://habr.com/ru/companies/rostelecom/articles/954164/

#ru

@database_design | Другие наши каналы
Миф о «едином источнике правды»: почему консолидация данных — это не про технологию, а про процессы

Единый источник правды (SSOT) давно стал модным термином в области управления данными. При этом многие компании сводят его смысл к покупке хранилища данных или BI-платформы.

На практике успех SSOT зависит не столько от хранилища данных или ETL-процессов, сколько от внутриорганизационных регламентов, закрепленной ответственности и согласованных методик расчета показателей. В статье разберем, что такое SSOT на самом деле, в чём основные заблуждения относительно него и как избежать разочарования в BI.


Читать: https://habr.com/ru/companies/modusbi/articles/952072/

#ru

@database_design | Другие наши каналы
Дорожная карта Java backend-разработчика: c Junior до Middle

Привет! Меня зовут Бромбин Андрей. За последние годы у меня накопилось достаточно материалов, практик и ошибок — иногда красивых, но всё же ошибок. Этого хватило, чтобы собрать маршрут до грейда Middle.

Это не «большая книга всего на свете для джуна» и не выдуманный субъективный маршрут. Мне удалось привлечь к созданию этой статьи ведущих разработчиков крупных российских компаний — от каждого я получил честный фидбэк: где перегнул, где недосказал, чего не хватает на практике. Приоритеты были сверены, лишнее вычищено и оставлено только то, что реально двигает.

Признаться, честно: тут и для меня нашлось, что подтянуть.
Выстроить маршрут

Читать: https://habr.com/ru/companies/ruvds/articles/949170/

#ru

@database_design | Другие наши каналы
858 терабайт государственных данных Южной Кореи сгорели к чёртовой матери. Бэкапа просто не было

Один из специалистов по восстановлению данных покончил с собой. Катастрофа случилась из-за чудовищной халатности.


Читать: https://habr.com/ru/articles/954512/

#ru

@database_design | Другие наши каналы