DATABASE DESIGN – Telegram
DATABASE DESIGN
1.41K subscribers
2.09K photos
3 videos
5.35K links
Лучшие материалы по работе с хранилищами данных на русском и английском языке

Разместить рекламу: @tproger_sales_bot

Правила общения: https://tprg.ru/rules

Другие каналы: @tproger_channels

Другие наши проекты: https://tprg.ru/media
Download Telegram
Новая интеграция MongoDB Atlas и Enkrypt AI усиливает защиту данных в AI-приложениях. Вместе они предотвращают угрозы и обеспечивают безопасность генеративного AI, позволяя компаниям внедрять технологии без риска и с соблюдением нормативов. MongoDB усиливает безопасность: бесплатный уровень Atlas теперь включён в программу bug bounty, а компания присоединилась к GitHub secret scanning. Это помогает быстрее выявлять уязвимости и предотвращать утечки данных, повышая защиту пользователей и разработчиков.

Читать подробнее

#en

@database_design | Другие наши каналы
PondPilot: как мы сделали локальный SQL-редактор в браузере на DuckDB и WASM

Любой, кто хоть раз пытался «по-быстрому» проанализировать CSV-файл или прототип БД, сталкивался с выбором из неудобств: открывать в Excel, запускать Jupyter, возиться с pandas, или поднимать Postgres/ClickHouse ради пары запросов. Мне показалось странным, что в 2025 году до сих пор нет удобной zero-setup SQL-песочницы для локальных данных.

Так родился PondPilot - open-source инструмент для анализа данных, работающий прямо в браузере, без серверов и настройки.


Читать: https://habr.com/ru/articles/913682/

#ru

@database_design | Другие наши каналы
S3 в мире Kubernetes: как объектное хранилище сделать частью контейнеров (подоход от команды Deckhouse)

Статья рассказывает о том, как облачное объектное хранилище S3 можно интегрировать с Kubernetes с помощью решений от Deckhouse и файловой системы GeeseFS. Автор объясняет, зачем вообще подключать S3 как том для контейнерных приложений, какие задачи это решает и почему для этого выбран именно GeeseFS. А ещё честно указывает на подводные камни — ограничения по скорости, отсутствие привычных файловых атрибутов, особенности кэширования и диагностику.


Читать: https://habr.com/ru/companies/flant/articles/910938/

#ru

@database_design | Другие наши каналы
Как мы храним 20000+ метрик и миллиарды комбинаций разрезов в одной таблице

Привет! Меня зовут Влад Божьев, я старший разработчик юнита АБ-тестирования Авито. Один из наших ключевых инструментов – M42, сервис для визуализации метрик. Он позволяет быстро проверять гипотезы, анализировать отклонения и оценивать инициативы.

В этой статье мы с вами погружаемся в самое сердце M42 и разбираем, как же там хранятся отчеты по метрикам. Это не просто рассказ, это почти детективная история о том, как мы искали оптимальное решение.

В нашем семантическом слое данных больше  20 000 метрик, и есть десятки разрезов для каждой из них. Под катом рассказываю, как мы храним терабайты данных и автоматизируем добавление новых разрезов в отчёт M42.


Читать: https://habr.com/ru/companies/avito/articles/913694/

#ru

@database_design | Другие наши каналы
Цель — ваша компания: как защитить данные от кибератак

Алексей Власов, партнер и коммерческий директор ИТ-интегратора Notamedia, рассказывает, с какими киберугрозами сталкиваются B2B- и B2G-сектора и как организациям защитить свои данные.

Читать: «Цель — ваша компания: как защитить данные от кибератак»

#ru

@database_design | Другие наши каналы
Как оптимизировать PostgreSQL и не лишиться сна: разбор для разработчиков

Когда вы разворачиваете веб-приложение, чаще всего у вас веб-сервер, бэкенд, база данных и авторизация оказываются на одном сервере. Первые пользователи, обычно тестировщики и менеджер, счастливы — все летает. Но потом приложение выходит в продакшн и начинается боль. Запросы тормозят и отвечают по пять секунд, CPU не загружен даже на треть, веб-сервер швыряет 504 Gateway Timeout и т. д. И вот вы сидите ночью и чините прод, потому что PostgreSQL — не просто «табличка с данными», а сложный инструмент с кэшем, индексами, буферами и планировщиком запросов.

Привет, Хабр! Меня зовут Александр Гришин, я продакт-менеджер в Selectel и отвечаю за развитие облачных баз данных и объектного S3 хранилища. В работе я часто сталкиваюсь с вопросами о производительности PostgreSQL, поэтому собрал практические советы для разработчиков, инженеров и архитекторов облачной инфраструктуры. В статье рассмотрим, как правильно использовать индексы, анализировать планы выполнения запросов и избегать типичных ошибок при проектировании схемы. Погнали!

Читать: https://habr.com/ru/companies/selectel/articles/913572/

#ru

@database_design | Другие наши каналы
Новый подход к анализу потоковых данных в MongoDB Atlas: поддержка Session Windows! Эта функция группирует события в сессии на основе активности пользователя, позволяя точнее отслеживать поведение и улучшать рекомендации в реальном времени. Подробнее в официальном объявлении.

Читать подробнее

#en

@database_design | Другие наши каналы
Новая версия AVDF 20.14 — важное обновление с улучшенной производительностью и новыми функциями. Обновление направлено на повышение стабильности и безопасности системы. Подробности и основные изменения доступны в свежем анонсе.

Читать подробнее

#en

@database_design | Другие наши каналы
Как европейская ИТ-компания повысила отказоустойчивость баз данных с помощью Oracle Global Data Services. В статье рассказывается, как внедрение решения обеспечило надежность и непрерывность работы критичных систем. Узнайте подробности о реальном опыте и преимуществах.

Читать подробнее

#en

@database_design | Другие наши каналы
Как я создал Telegram-бота Favie и решил проблему «Избранного»

В современном мире мы ежедневно сталкиваемся с потоком информации: ссылки, фото, видео, документы — всё это быстро накапливается и теряется в хаосе закладок, медиатеки или чатов. Я устал от этой проблемы и решил её раз и навсегда, создав Telegram-бота Favie. Это инструмент, который упрощает хранение данных, предлагает умный поиск по тегам и работает на любом устройстве, и в этой статье я расскажу о нём и как он появился.
про Favie

Читать: https://habr.com/ru/articles/914142/

#ru

@database_design | Другие наши каналы
🏆1
Как провести нагрузочное тестирование БД PostgreSQL и ничего не забыть

При нагрузочном тестировании баз данных Tantor Postgres или других на базе PostgreSQL с использованием стандартного инструмента pgbench отсутствие фиксации деталей окружения (таких как конфигурация СУБД, характеристики сервера, версии ПО) часто приводит к нерепрезентативным результатам и необходимости повторных тестов. В статье рассматривается разработанный автором инструмент pg_perfbench, который призван решить эту проблему.


Читать: https://habr.com/ru/companies/tantor/articles/914320/

#ru

@database_design | Другие наши каналы
7 самых распространенных ошибок при внесении ПО и ПАК в Минцифры и как этого избежать

Регистрация программного обеспечения (ПО) и программно-аппаратных комплексов (ПАК) в реестре отечественного программного обеспечения — важный шаг для отечественных разработчиков. Она дает компаниям ряд преимуществ. Однако ошибки на каждом этапе могут привести к задержкам, дополнительным затратам и даже к отказу в регистрации. Рассмотрим подробнее, что это за ошибки и как их избежать.


Читать: https://habr.com/ru/articles/914342/

#ru

@database_design | Другие наши каналы
Новое обновление MariaDB Connector/ODBC 3.2.4 уже доступно. В версии улучшена стабильность и исправлены ошибки, что обеспечивает более надежное подключение к базам данных MariaDB. Подробнее об изменениях можно узнать в официальных заметках к релизу.

Читать подробнее

#en

@database_design | Другие наши каналы
Как пройти… к третьей нормальной форме?

Как преподаватель, могу сказать, что студентам непросто бывает привести базу данных к какому‑то осмысленному виду (не говоря уже про третью нормальную форму). Во‑первых, нередко «всё связано со всем», во‑вторых, в мало‑мальски сложной (в смысле, комплексной) задаче бывает трудно правильно спроектировать таблицы (то есть определить, какие таблицы должны быть в базе, как они должны быть связаны друг с другом, где и какая информация должна в них храниться). Помогает ли им в этом теория? И да, и нет. Дело в том, что нормализация данных говорит о желаемом виде каждой таблицы, и, преобразуя отдельно взятую таблицу к нормальной форме, мы также что‑то делаем со всей базой данных (добавляем новые таблицы, перемещаем между ними поля, и так далее) — это как сборка кубика Рубика. Второй проблемой здесь является то, что даже база данных, состоящая из единственной таблицы, не приведенной к первой нормальной форме, внезапно, тоже будет работать — криво‑косо, но будет! Теория — штука хорошая, но кое‑чего ей не хватает, а именно — задания точки отсчёта. Ведь для того, чтобы пройти к библиотеке третьей нормальной форме, для начала нужно понимать, где мы находимся.
Пройдёмте, товарищи!

Читать: https://habr.com/ru/articles/914654/

#ru

@database_design | Другие наши каналы
С помощью чего выучить SQL в 2025 году?

Как выучить SQL с нуля в 2025? Сравниваем 6 платформ: SYNC STUDY, SQL Academy, Karpov Courses и другие. Бесплатные и платные курсы, задачи из реальной аналитики, поддержка PostgreSQL. Советы по выбору для новичков и профессионалов.

Читать: «С помощью чего выучить SQL в 2025 году?»

#ru

@database_design | Другие наши каналы
Какие начать осваивать профессии сегодня, чтобы завтра работать с моделями искусственного интеллекта?

Собрал для вас профессии и навыки, которые надо осваивать уже сегодня, чтобы завтра не стоять в очереди в службу занятости, где тётеньки с искусственным интеллектом будут предлагать вам мыло и веревку, вместо свободных человеческих вакансий.


Читать: https://habr.com/ru/articles/914860/

#ru

@database_design | Другие наши каналы
Соединение SortMergeJoin в Apache Spark

Рассмотрим, как реализован SortMergeJoin в Apache Spark, и заодно заглянем в исходный код на GitHub. Spark написан на языке Scala, и вся логика работы оператора доступна в открытом репозитории проекта. Вот здесь :)

Первое, что рассмотрим - это конструктор кейс-класса

1. Конструктор SortMergeJoinExec


Читать: https://habr.com/ru/companies/gnivc/articles/914932/

#ru

@database_design | Другие наши каналы
Mongoose 8.15.0 теперь поддерживает нативное шифрование данных с Queryable Encryption и Client-Side Field Encryption от MongoDB. Это значительно упрощает защиту данных в приложениях на Node.js, позволяя задавать шифрование прямо в схемах без сложной настройки. Новые Session Windows в MongoDB Atlas позволяют группировать события по реальным активностям пользователей, автоматически закрывая сессии после паузы. Это помогает анализировать поведение клиентов и улучшать рекомендации в режиме реального времени. Узнайте, как использовать эту функцию для своих потоков данных.

Читать подробнее

#en

@database_design | Другие наши каналы
Сломал ногу — выучил Python: как ИИ помог экс-консультанту стать программистом за 100 дней

Экс-консультант стал программистом за 100 дней с помощью ChatGPT и Python — собрал портфолио, прошел собеседование и получил работу без курсов и Leetcode

Читать: «Сломал ногу — выучил Python: как ИИ помог экс-консультанту стать программистом за 100 дней»

#ru

@database_design | Другие наши каналы
Проверка кода MongoDB с помощью спецификаций TLA+ показала, что идеальное совпадение реализаций с формальными моделями даётся нелегко. Опыт выявил сложности и важные уроки для развития надёжности систем в будущем. Новые методы тестирования продолжают совершенствоваться.

Читать подробнее

#en

@database_design | Другие наши каналы
Вся мощь открытого исходного кода в PostgreSQL

PostgreSQL — одна из самых популярных СУБД, и это во многом благодаря открытому исходному коду. В статье рассказывается о том, как открытость кода влияет на развитие PostgreSQL и создание сообщества вокруг неё.


Читать: https://habr.com/ru/companies/flant/articles/901622/

#ru

@database_design | Другие наши каналы