DATABASE DESIGN – Telegram
DATABASE DESIGN
1.41K subscribers
2.09K photos
3 videos
5.35K links
Лучшие материалы по работе с хранилищами данных на русском и английском языке

Разместить рекламу: @tproger_sales_bot

Правила общения: https://tprg.ru/rules

Другие каналы: @tproger_channels

Другие наши проекты: https://tprg.ru/media
Download Telegram
Семь API, которые сократят вам недели разработки

В этом списке — семь мощных API, которые помогут вам ускорить разработку, автоматизировать рутинные задачи и без лишних усилий добавить крутые функции. От баз данных книг до парсинга сайтов и анализа пользовательских данных

Читать: «Семь API, которые сократят вам недели разработки»

#ru

@database_design | Другие наши каналы
Новая эра мобильности с Agentic AI и MongoDB Atlas

Автомобильная индустрия стремительно трансформируется благодаря подключенным системам и ИИ. MongoDB Atlas и Agentic AI предлагают эффективные решения для управления данными в этой среде, оптимизируя маршруты и повышая безопасность водителей. Узнайте, как эти технологии меняют будущее мобильности.

Читать подробнее

#en

@database_design | Другие наши каналы
Где заканчивается наука и начинается маркетинг: сравниваю генетические тесты на происхождение

Всем привет! Меня зовут Павел, я главный редактор блога “Онлайн патента” на Хабре. Сегодня я расскажу  о своем опыте взаимодействия с генетическими тестами.

Но перед этим небольшое лирическое отступление. Компания 23andMe, один из лидеров рынка ДНК-тестирования, подала заявление о банкротстве по главе 11 (реорганизация). Это решение связано с многомиллионными убытками и последствиями масштабной утечки данных в конце 2023 года, когда хакеры получили доступ к информации 6,9 млн пользователей.

Подозреваю, что одним из них был я.


Читать: https://habr.com/ru/companies/onlinepatent/articles/897874/

#ru

@database_design | Другие наши каналы
Общие подходы к классическому PostgreSQL в Kubernetes

Хабр, привет! Меня зовут Алексей Быков, и я занимаюсь развитием Cloud-native платформы для обработки данных Arenadata One в компании Arenadata. Современные высоконагруженные системы требуют гибкого масштабирования и отказоустойчивости для обеспечения стабильной производительности в условиях постоянно растущих объёмов данных. Когда речь идёт о PostgreSQL, развёрнутом в Kubernetes, перед инженерами встают особые вопросы: как упорядочить реплики для отказоустойчивости, каким образом настроить бэкапы и мониторинг, а главное — как корректно масштабироваться в облачной среде.

В этой статье мы рассмотрим, почему «ванильный» PostgreSQL в контейнерной среде может работать ненадёжно и какие механизмы применяются сегодня, чтобы сделать базу данных по-настоящему Cloud Native. Разберём ключевые аспекты классических инсталляций Postgres, проанализируем, в чём заключаются основные сложности их переноса в Kubernetes.
Монолит в облаке?!

Читать: https://habr.com/ru/companies/arenadata/articles/894610/

#ru

@database_design | Другие наши каналы
Асинхронный флаг без мистики

Многие элементы процессов и кейсов в Flowable имеют свойство под названием «Асинхронность». Хотя это свойство сильно влияет на производительность, надежность и даже на пользовательский опыт, его часто игнорируют или недооценивают. Эта статья предназначена для того, чтобы помочь аналитикам и разработчикам понять его значимость.


Читать: https://habr.com/ru/articles/898274/

#ru

@database_design | Другие наши каналы
Как понять партиционирование: DWH для гуманитариев

Вместе с Никитой Егоровым, ведущим аналитиком в МТС Диджитал, объясняем принципы партиционирования простыми аналогиями, сравниваем с шардированием, разбираем стратегии разбиения данных и популярные инструменты (PostgreSQL, BigQuery, ClickHouse).

Читать: «Как понять партиционирование: DWH для гуманитариев»

#ru

@database_design | Другие наши каналы
Новый релиз Oracle Spatial Studio 24.1

Oracle выпустила обновление для Spatial Studio 24.1, представляющее собой безкодовый веб-инструмент для работы с пространственными функциями Oracle Database. Среди новшеств: улучшенная интеграция, поддержка 3D-тайлов для Cesium и инкрементное геокодирование. Узнайте больше!

Читать подробнее

#en

@database_design | Другие наши каналы
Новый релиз DMU 23.1 от Oracle

Oracle анонсировала выпуск версии 23.1 своего инструмента Database Migration Assistant for Unicode (DMU). Последнее обновление обещает улучшенные функции для миграции баз данных в формат Unicode, обеспечивая более эффективную работу и упрощение процессов для пользователей.

Читать подробнее

#en

@database_design | Другие наши каналы
Новая возможность в Oracle Machine Learning

Oracle Machine Learning для Python теперь поддерживает пространственные алгоритмы в среде Autonomous Database Serverless. Эти алгоритмы улучшают качество моделей, учитывая местоположение, и способны выявлять географические кластеры и аномалии.

Читать подробнее

#en

@database_design | Другие наши каналы
Поддержка AI в Autonomous Database Dedicated

Oracle расширяет возможности Dedicated Autonomous Database, внедряя современные AI функции. Новые технологии предназначены для упрощения обработки данных и повышения эффективности управления базами. Узнайте, как это повлияет на бизнес и упростит аналитику.

Читать подробнее

#en

@database_design | Другие наши каналы
Графы и RAG: Улучшение генеративного ИИ

Как улучшить генеративный ИИ? Система RAG может внести значительный вклад благодаря добавлению данных, а графы играют ключевую роль, предоставляя контекст и моделируя отношения между концепциями. Узнайте, как это работает, в статье о графах и их влиянии на genAI.

Читать подробнее

#en

@database_design | Другие наши каналы
Как Oracle поможет масштабировать финтех
Текст: В статье обсуждается, как американская финтех-компания использует возможности Oracle Globally Distributed Database для достижения гипер-мастерства в масштабировании своей архитектуры. Узнайте, как такие технологии могут трансформировать будущее финансовых сервисов.

Читать подробнее

#en

@database_design | Другие наши каналы
Облака под Европейским законом о данных

Несмотря на недавние объявления, утверждающие об отмене плат за перемещение и экспорт данных у крупных облачных провайдеров, для компаний, работающих с облачными сервисами, это не совсем так. Многие сборы все еще остаются в силе, что важно учитывать при планировании бизнеса.

Читать подробнее

#en

@database_design | Другие наши каналы
Новые возможности с Oracle Exadata System Software 24

Oracle представила Exadata System Software 24, улучшая производительность и управляемость своих систем. Обновление включает более эффективные алгоритмы хранения и расширенные функции безопасности. Передовые технологии открывают новые горизонты для пользователей.

Читать подробнее

#en

@database_design | Другие наши каналы
Обзор Oracle Graph: с чего начать

Пост: Ознакомьтесь с обучающим путём по Oracle Graph, начиная с вводных материалов и переходя к более сложным темам. Статья предлагает структурированный подход к изучению технологии, учитывая различные среды и типы графов. Узнайте, где вам лучше всего начать свой путь в Oracle Graph.

Читать подробнее

#en

@database_design | Другие наши каналы
Облачная миграция MongoDB с Google Cloud

Перемещение инфраструктуры в облако может улучшить производительность и снизить затраты, но требует тщательного планирования. Google Cloud Migration Center облегчает процесс, включая оценку кластеров MongoDB, чтобы упростить переход и минимизировать риски. Подробнее на сайте MongoDB.

Читать подробнее

#en

@database_design | Другие наши каналы
Обновлённая навигация в MongoDB Atlas и Cloud Manager

MongoDB представила новое обновление для платформ Atlas и Cloud Manager, улучшив навигацию и рабочий процесс. Новый дизайн упрощает доступ к сервисам, сохраняя интуитивную навигацию и повышая эффективность. Изменения внедряются поэтапно и будут завершены к июню 2025 года. Подробнее на сайте MongoDB.

Читать подробнее

#en

@database_design | Другие наши каналы
По следам PgConf: обзор проблемы #1 из доклада «Как PostgreSQL может сделать больно, когда не ожидаешь»

На PgConf 2025 было три зала, в которых параллельно шли доклады. Поэтому охватить своим присутствием все доклады не представлялось возможным. В часть залов было не попасть, так как толпа участников толпилась на входе. Такое произошло и с докладом Михаила Жилина "Как PostgreSQL может сделать больно, когда не ожидаешь". В докладе описывалось 6 актуальных проблем. Проблема "#1: Глобальные счетчики" затрагивает почти все приложения, обновляющие строки в таблицах баз данных PostgreSQL. В этой статье рассматривают детали проблемы.


Читать: https://habr.com/ru/articles/898872/

#ru

@database_design | Другие наши каналы
Data Governance и Бизнес: как найти общий язык

«Data Governance — это дополнительная надстройка, которая увеличивает сложность и длительность процессов. Это тормозит бизнес!»

«Нам нужны качественные данные, а вы все про свои процессы!»

«Data Governance – это IT-шная история, пусть они и занимаются. Причем здесь бизнес?!»

Эти фразы часто звучат, когда речь заходит о внедрении Data Governance. Бизнес и Data \ IT могут по-разному смотреть на роль DG: для команды управления данными это фундамент прозрачности и управления, а для бизнеса — дополнительные шаги, которые могут замедлять процессы.

Но ведь цель Data Governance (DG) — не процесс ради процесса, а создание ценности для бизнеса за счёт качественных, управляемых данных. Почему же возникают разногласия? Из моего опыта можно выделить несколько ключевых факторов, которые влияют на восприятие DG в бизнесе:

1.Неочевидная связь между DG и бизнес-результатами. Если Data Governance не подкреплён показателями, влияющими на прибыль (P&L, снижение затрат, ускорение процессов), для бизнеса его сложно воспринимать как приоритетную задачу.

2.Бизнес хочет скорость, а не контроль. Как правило новые процессы и роли означают изменение привычных моделей работы, а это что требует времени и затраты энергии на адаптацию. Поэтому новые процессы начинают казаться бизнесу фактором, замедляющим их работу.

3.Долгий цикл внедрения. Когда DG запускается с прицелом на долгосрочную выгоду, интерес к DG снижается, так как  бизнесу нужны быстрые результаты, бизнесу нужно решать задачи уже сегодня.

Как же выстроить эффективный диалог между DG и бизнесом?


Читать: https://habr.com/ru/articles/899080/

#ru

@database_design | Другие наши каналы
Сравниваем Pandas, Polars и PySpark: что выбрать аналитику?

Pandas, Polars или PySpark — что выбрать для работы с данными? Вместе с Никитой Егоровым, ведущим аналитиком в МТС Диджитал, разбираем отличия, плюсы и минусы каждого инструмента.

Читать: «Сравниваем Pandas, Polars и PySpark: что выбрать аналитику?»

#ru

@database_design | Другие наши каналы
Почему сложно разработать OLAP-базу данных, если у тебя уже есть OLTP

Это адаптированная для Хабра расшифровка доклада Алексея Дмитриева, директора аналитической платформы YDB DWH, которую создаёт команда Yandex Cloud, — компонента нашей гибридной базы данных YDB для обработки аналитических нагрузок. Когда проект только начинался, у нас было много наработок, которые мы успешно переиспользовали в других проектах. Но оказалось, что OLAP‑нагрузка так сильно отличается от OLTP, что за три года пришлось практически написать по ещё одной реализации многих частей системы. Под катом история о том, почему на рынке так мало гибридных баз данных класса Hybrid Transactional and Analytical Processing (HTAP) и какие сложности стоят на пути их разработки.


Читать: https://habr.com/ru/companies/ydb/articles/898716/

#ru

@database_design | Другие наши каналы