DATABASE DESIGN – Telegram
DATABASE DESIGN
1.41K subscribers
2.08K photos
3 videos
5.32K links
Лучшие материалы по работе с хранилищами данных на русском и английском языке

Разместить рекламу: @tproger_sales_bot

Правила общения: https://tprg.ru/rules

Другие каналы: @tproger_channels

Другие наши проекты: https://tprg.ru/media
Download Telegram
New Online Archive with Performance Improvements and Enhanced Metrics

Read: https://www.mongodb.com/blog/post/new-online-archive-performance-improvements-enhanced-metrics
Infrastructure Automation and CloudOps with the MariaDB SkySQL Terraform Provider

Read: https://mariadb.com/?p=36561
Как эффективно настроить autovacuum в Postgres для 1С

Кто не любит убирать мусор? Думаю практически все, а вот в Postgres это обязательный ритуал для эффективной работы. Как эффективно настроить уборку за 1С в Postgres можно прочитать в этой статье и еще раз задуматься о бесплатности Postgres.
Навести порядок

Читать: https://habr.com/ru/articles/741566/
MongoDB University Expands Education Outreach With New Partnerships

Read: https://www.mongodb.com/blog/post/mongodb-university-expands-education-outreach-new-partnerships
Unleashing Innovation in the Start-Up Nation: Inside MongoDB Israel

Read: https://www.mongodb.com/blog/post/unleashing-innovation-start-up-nation-inside-mongodb-israel
Организация хранения исторических данных в Oracle

Привет! Сегодня поговорим о разных способах организации хранения исторических данных в Oracle. Если вам известно более двух способов, то вы молодец и уже почти всё знаете, в чём вам и остаётся убедиться, просмотрев разделы статьи.


Читать: https://habr.com/ru/companies/sportmaster_lab/articles/741828/
Альтернатива есть! Обзор 6 российских СУБД для миграции

Привет, Хабр! Сегодня хочу коснуться наболевшей для многих российских компаний темы — замена зарубежного софта на доступное альтернативное. Так как я специализируюсь на системном ПО, все чаще я сталкиваюсь с подобными запросами по части СУБД.

Эта статья — мой обзор 6 СУБД из реестра отечественного ПО, которые можно использовать вместо MS SQL, Oracle и других. Каждую из них мы с командой К2Тех устанавливали и настраивали ручками. И в итоге убедились, что все они представляют собой действительно качественные продукты, на которых можно работать с большими объемами данных. Итак, представляем вам альтернативную «шестерку» СУБД под катом!
Будь как дома, путник!

Читать: https://habr.com/ru/companies/k2tech/articles/741980/
👍2
Improved Developer Experience with the Atlas Admin API

Read: https://www.mongodb.com/blog/post/improved-developer-experience-with-atlas-admin-api
Как извлечь больше данных о посетителях сайта через «Яндекс.Метрику» при помощи Python и с минимумом библиотек

Меня зовут Андрей Устьянцев, я ведущий аналитик направления Big Data в Лиге Цифровой Экономики. Эту статью я задумал как вторую в цикле материалов (первую об улучшении лендинга на основе метрик вы можете прочитать здесь). Сам текст будет полезен аналитикам, которым необходим более глубокий анализ данных о посетителях сайта, чем предоставляет стандартный интерфейс «Яндекс.Метрики». Или тем, кто хочет объединить данные из «Метрики» с другими источниками (например, из CRM) для визуализации, поиска инсайтов, проверки продуктовых гипотез etc.


Читать: https://habr.com/ru/companies/digitalleague/articles/742156/
ViTalk GPT: генератор DAX-запросов для Visiology 3

Привет, Хабр! Сегодня я хочу рассказать о нашем новом чат-боте ViTalk GPT. Он использует ИИ для генерации запросов на языке DAX, которые можно использовать в Visiology 3, причем учитывает не только особенности нашей платформы, но и контекст ваших запросов. О том как это работает, почему ViTalk GPT помогает переносить экспертизу не только из Power BI, в чем секрет создания “готовых” скриптов, которые можно просто вставлять в нужное поле в Visiology 3, и зачем вообще это нужно — читайте под катом.


Читать: https://habr.com/ru/companies/visiology/articles/742152/
Как использовать клиентские данные для машинного обучения

Рассказываем, как правильно подобрать данные для машинного обучения, какие данные подойдут и как использовать данные клиентов для ML.

Читать: «Как использовать клиентские данные для машинного обучения»
Picodata: простое масштабирование Tarantool

Привет! Сегодня я хочу познакомить вас с ПО, которое мы разрабатываем в нашей компанией — кластерной СУБД и сервером приложений на языке Rust. Мы профессионально занимаемся созданием и эксплуатацией решений на основе Tarantool и с некоторых пор начали разработку своего ПО, о котором и пойдёт речь.

Picodata — это дальнейшее развитие истории Tarantool, в которой учтен опыт эксплуатации этой СУБД и предложены решения как архитектурных, так и функциональных недостатков открытой версии Tarantool. Также, наше ПО проще запускать, настраивать и поддерживать в рабочем состоянии благодаря единой точке входа и интеграции всего инструментария в одном исполняемом файле. Мы создавали Picodata как изначально кластерную СУБД, которой удобно пользоваться. Если не верите, что российская СУБД может быть удобной, попробуйте — в конце этой статьи есть раздел Практикум, где можно сразу же попробовать собрать кластер самому на паре-тройке виртуальных машин или на вашем локальном компьютере. Сейчас же будет немного теории о том, как вообще работает распределенный кластер, что именно не так в “ванильном” Tarantool и что нам пришлось сделать чтобы это исправить.
Погрузиться в детали

Читать: https://habr.com/ru/articles/742244/
🔥1
How MariaDB Helps Specialized Media Dashboard Save 7x its Database Cost

Read: https://mariadb.com/?p=36658
Dedup Windows vs Linux, MS снова “удивит”?

Меня давно заинтриговала тема дедупликации данных. Это произошло в далеком 2016 году, когда передо мной встала задача впихнуть не впихуемое, на продакшн-серверах. Но обнаружить доступное решение оказалось невероятно сложно (на тот момент не возможно). Со временем у меня возникли и личные задачи, когда я хотел уменьшить объем третьей или четвертой копии данных, чтобы сэкономить место на диске. Но, возможно, я просто одержим датахордингом, и это тоже не исключено.


Читать: https://habr.com/ru/articles/742286/
Fueling Pricing Strategies with MongoDB and Databricks

Read: https://www.mongodb.com/blog/post/fueling-pricing-strategies-mongodb-databricks
How to Build Advanced GraphQL-based APIs With MongoDB Atlas and AWS AppSync Merged APIs

Read: https://www.mongodb.com/blog/post/how-build-advanced-graphql-based-apis-mongodb-atlas-aws-appsync-merged-apis
Кто управляет информацией — тот владеет миром: как сделать так, чтобы данные генерировали прибыль, а не убытки?

У всех компаний есть разнообразные данные: о клиентах, транзакциях, закупках, оборудовании, доходах и расходах. Но для одних компаний данные – драйвер роста, а другие несут убытки, полагаясь на них. Разница в том, что первые управляют информацией: знают, как и в какой форме она поступает, как ее внести в корпоративные системы, обогатить, и главное - как использовать, а вторые пускают эту работу на самотек и живут в зоопарке информационных систем без единой версии правды.

Это обзорный материал, я расскажу в нем об объектах основных данных, о том, по каким причинам часто возникают ошибки, какими инструментами улучшить качество данных и рассмотрю шаги конкретного проекта по внедрению НСИ.


Читать: https://habr.com/ru/articles/742910/
Кто управляет информацией — тот владеет миром: как сделать так, чтобы данные генерировали прибыль, а не убытки?

У всех компаний есть разнообразные данные: о клиентах, транзакциях, закупках, оборудовании, доходах и расходах. Но для одних компаний данные – драйвер роста, а другие несут убытки, полагаясь на них. Разница в том, что первые управляют информацией: знают, как и в какой форме она поступает, как ее внести в корпоративные системы, обогатить, и главное - как использовать, а вторые пускают эту работу на самотек и живут в зоопарке информационных систем без единой версии правды.

Это обзорный материал, я расскажу в нем об объектах основных данных, о том, по каким причинам часто возникают ошибки, какими инструментами улучшить качество данных и рассмотрю шаги конкретного проекта по внедрению НСИ.


Читать: https://habr.com/ru/articles/742910/
Правильные и простые бэкапы. Инструменты Veeam для резервного копирования — в чем разница?

Чем сильнее бизнес зависит от IT-систем, тем большие убытки он понесет в случае потери данных и простоев из-за восстановления работоспособности. Поэтому важно настроить регулярное резервное копирование систем и данных.

Но какое решение для этого выбрать? И если Veeam, то что использовать — Backup & Replications, Agent или Сloud Connect? В тексте постарались объяснить, в чем разница между сервисами Veeam для резервного копирования.


Читать: https://habr.com/ru/companies/selectel/articles/743046/
MongoDB and BigID Delivering Scalable Data Privacy Compliance for Financial Services

Read: https://www.mongodb.com/blog/post/mongodb-bigid-delivering-scalable-data-privacy-compliance-financial-services