DATABASE DESIGN – Telegram
DATABASE DESIGN
1.41K subscribers
2.08K photos
3 videos
5.32K links
Лучшие материалы по работе с хранилищами данных на русском и английском языке

Разместить рекламу: @tproger_sales_bot

Правила общения: https://tprg.ru/rules

Другие каналы: @tproger_channels

Другие наши проекты: https://tprg.ru/media
Download Telegram
Oracle Sharding: Enterprise-Grade Distributed Database

Oracle Sharding distributes segments of a data set across many databases (shards) on different computers, on-premises, or in the cloud, allowing for horizontal scaling, improved performance, and fault tolerance. It enables globally distributed, linearly scalable, multi-model databases.

Read: https://blogs.oracle.com/database/post/oracle-shardingenterprisegrade-distributed-database
Impactive Makes ESG Integration and Stewardship Reporting Easier for Investment Firms

Read: https://www.mongodb.com/blog/post/impactive-makes-esg-integration-stewardship-reporting-easier-investment-firms
MongoDB Partners with NCS to Drive Transformation for ASEAN Businesses and Build Innovative AI Tools

Read: https://www.mongodb.com/blog/post/mongodb-partners-ncs-drive-transformation-asean-businesses-build-innovative-ai-tools
Visma Proceedo Migrates to MariaDB unlocking more than 2x better response times and cost savings

Read: https://mariadb.com/?p=36870
Японский SSD (sardine state disk)

В декабре 2018 японский студент-химик с ником ni28_xp опубликовал фотографию USB-накопителя, сделанной из анчоуса. Звучит максимально странно даже для Японии, не так ли?


Читать: https://habr.com/ru/companies/cloud4y/articles/746514/
BI по-русски: что умеют BI-решения, доступные отечественному бизнесу

Мы в beeline cloud постоянно изучаем тренды рынка BI: как он меняется с развитием ИИ и ростом спроса на отечественный софт. А сегодня хотим рассказать о том, кто и зачем использует системы бизнес-аналитики, а также посмотреть на возможности ключевых игроков, представленных в России.


Читать: https://habr.com/ru/companies/beeline_cloud/articles/746720/
How Telcos Drive Mission-Critical Innovation and Cost Savings Through Automation

Read: https://www.mongodb.com/blog/post/telcos-drive-mission-critical-innovation-cost-savings-automation
Из цикла ETL: Python для аналитики ad hoc из BigQuery

Рассказали, как создавать запросы с помощью BigQuery API – библиотеки, упрощающей обращение с хранилищем, как записывать и читать данные.

Читать: «Из цикла ETL: Python для аналитики ad hoc из BigQuery»
[recovery mode] Какие технологии использует Российская медицина? (ручка/клей/оборотка) Часть первая

Я врач хирург, работаю в одной из гос клиник России, и попробую Вам изложить, есть ли электронные карты пациентов, базы данных с мкб, есть ли клинические рекомендации, и как помогает компьютер в жизни штатного врача стационара и поликлиники.


Читать: https://habr.com/ru/articles/747158/
Многомерные базы данных

Многомерные базы данных (МБД) представляют собой эффективные инструменты для организации и анализа больших объемов данных в сфере аналитики. Они представляют данные в форме кубов, где каждая ось представляет собой отдельное измерение, а значения представляются в виде ячеек. Концепция МБД зародилась в конце 1970-х годов.

Многомерные базы данных отличаются от обычных реляционных баз данных тем, что они специально оптимизированы для работы с аналитическими запросами и агрегированными данными. В отличие от традиционных баз данных, где данные хранятся в виде таблиц, в МБД основное внимание уделяется анализу данных и созданию быстрых и эффективных запросов.

Читать: https://habr.com/ru/companies/otus/articles/747204/
Мониторинг PostgreSQL. Необходимость в информативных счётчиках ресурсов и трассировки

В данной статье хочу поднять тему, которая представляет собой одну большую боль для администраторов, разработчиков и тестировщиков высоконагруженных (и не очень) систем под управлением PostgreSQL. Даже не «боль», а «БОЛЬ»!

Удивительно, что за почти 30 лет существования PostgreSQL не появилось нормальных инструментов для получения вменяемых счетчиков и трассировок. Все, кто работают с MS SQL Server используют профайлер. Это обязательный и привычный инструмент, который позволяет вылавливать запросы, интересные нам в рамках исследования. Вылавливать как все запросы без разбора, так и какие-то единичные запросы, которые удовлетворяют правилам отбора. Кроме того, можно настроить не одну трассу, а столько сколько нужно, с разными фильтрами. Эти трассы содержат очень богатый набор измерений для анализа: – Reads физические и логические; Writes; SPID, Процессорное время; план запроса (хэш плана), количество строк и т.д.

Многие компании стали всерьез рассматривать СУБД PostgreSQL как замену MSSQL и сталкиваются с тем, что возможностей для ее мониторинга просто нет – она как черный ящик, в котором наощупь вылавливаешь какую-ту информацию и пытаешься систематизировать ее хоть как-то.


Читать: https://habr.com/ru/companies/softpoint/articles/747322/
Real-Time Energy Monitoring for Smart Buildings with MongoDB and HiveMQ

Read: https://www.mongodb.com/blog/post/real-time-energy-monitoring-smart-buildings-mongodb-hivemq
Boosting Developer Productivity with MongoDB Compass Settings

Read: https://www.mongodb.com/blog/post/boosting-developer-productivity-compass-settings
Lleva al siguiente nivel tu estrategia de fijación de precios con MongoDB y Databricks

Read: https://www.mongodb.com/blog/post/fueling-pricing-strategies-mongodb-databricks-esp
July edition of newsletter for Autonomous Database Serverless

We are continually adding new features to Autonomous Database Serverless. Over the LAST 12 MONTHS, over 200 NEW FEATURES have been added, and the latest updates include the following:

Read: https://blogs.oracle.com/datawarehousing/post/july-edition-of-newsletter-for-autonomous-database-serverless
Архитектура аналитической платформы Modus BI: ETL

Начинаем цикл статей об архитектуре аналитических платформ. Поговорим об общем устройстве и подробнее остановимся на анатомии ETL на примере Modus. Вы узнаете, из каких компонентов состоит аналитическая система, откуда она получает и как работает с данными, и что мы в Modus делаем такого, чтобы оптимизировать эти процессы.


Читать: https://habr.com/ru/companies/modusbi/articles/747866/
Переоткрывая хэш-индексы в PostgreSQL

Если вы работает с базами данных, то, скорее всего, знакомы с B-tree индексами. У них множество применений и они являются дефолтными типа индекса в большинстве движков баз данных. Если вы работаете с полнотекстовым поиском или пространственными данными, то скорее всего вы знакомы еще и с GIN и GIST индексами. Если вы работаете с массивными временными рядами, то слышали еще и о BRIN индексах.

Однако, есть еще один менее популярный тип, о котором большинство даже ничего не слышало. Пару версий PostgreSQL назад он был не то что даже непопулярен, но и строго не рекомендован к использованию. Однако в некоторых случаях он может обойти даже B-tree в плане производительности.

Сейчас мы переоткроем хэш-индекс!


Читать: https://habr.com/ru/articles/747910/
Highload-приложения: технологии для обработки больших объемов данных и запросов

Рассказали, что такое highload-система, как она справляется с большими нагрузками на сервер и о других важных аспектах данной области.

Читать: «Highload-приложения: технологии для обработки больших объемов данных и запросов»
Переезд c PostgreSQL на YDB. Кейс сервиса Яндекс Игры

Привет! Меня зовут Александр Смолин. Я бэкенд-разработчик в команде Яндекс Игр. Уже два года мы используем YDB для задач сервиса. В статье расскажу, как мы в Яндекс Играх внедряли YDB, зачем это было нужно, с какими сложностями столкнулись и какие результаты у нас сейчас.


Читать: https://habr.com/ru/companies/yandex_cloud_and_infra/articles/747998/