Семантические базы данных: RDF, SPARQL и Linked Data
Семантические базы данных представляют собой специально организованные хранилища данных, где информация не только описывает факты, но и содержит семантические связи между ними. В отличие от традиционных баз данных, которые ограничиваются хранением и извлечением данных, семантические базы данных исследуют глубинные связи и значения, лежащие в основе этих данных.
Основными строительными блоками семантических баз данных являются RDF (Resource Denoscription Framework) – формальный язык для описания ресурсов и их отношений, SPARQL – язык запросов к RDF данным, и Linked Data – концепция объединения данных разных источников через общие семантические структуры.
Следует отметить, что применение семантических баз данных также имеет свои сложности и вызовы, связанные с проектированием семантических моделей, производительностью и масштабируемостью. Однако, в совокупности, их потенциал и перспективы предоставления более глубокого понимания данных и разнообразных приложений делают их одной из наиболее захватывающих технологических областей нашего времени.
Читать: https://habr.com/ru/companies/otus/articles/755440/
Семантические базы данных представляют собой специально организованные хранилища данных, где информация не только описывает факты, но и содержит семантические связи между ними. В отличие от традиционных баз данных, которые ограничиваются хранением и извлечением данных, семантические базы данных исследуют глубинные связи и значения, лежащие в основе этих данных.
Основными строительными блоками семантических баз данных являются RDF (Resource Denoscription Framework) – формальный язык для описания ресурсов и их отношений, SPARQL – язык запросов к RDF данным, и Linked Data – концепция объединения данных разных источников через общие семантические структуры.
Следует отметить, что применение семантических баз данных также имеет свои сложности и вызовы, связанные с проектированием семантических моделей, производительностью и масштабируемостью. Однако, в совокупности, их потенциал и перспективы предоставления более глубокого понимания данных и разнообразных приложений делают их одной из наиболее захватывающих технологических областей нашего времени.
Читать: https://habr.com/ru/companies/otus/articles/755440/
DATABASE DESIGN
Photo
What's New in Atlas Charts: Summer 2023 Release Roundup
Atlas Charts, a data visualization tool for MongoDB Atlas, has announced several updates in its summer 2023 release. These updates include expanded customization options in the Charts Embedding SDK, an out-of-the-box billing dashboard, support for candlestick charts, and query execution improvements for larger datasets. The Charts Embedding SDK now allows for greater customization of embedded charts and dashboards. The new billing dashboard simplifies monitoring Atlas billing data. Candlestick charts have been added to support financial data visualization. Query execution has been improved to handle more complex queries and longer rendering times. These updates aim to make Atlas Charts more powerful and user-friendly. Alongside these updates, the Talent Sourcing team at MongoDB, which is responsible for sourcing talent for the company, is highlighted with interviews from team members. MongoDB.local Auckland, an event showcasing MongoDB and its community in New Zealand, was also held recently, with announcements of MongoDB's support for the cloud regions of Microsoft, Amazon, and Google in New Zealand. The text informs the reader about the availability of a MongoDB.local event and encourages them to check if there will be one happening in their city. The specific date mentioned is August 17, 2023.
Read: https://www.mongodb.com/blog/post/whats-new-atlas-charts-summer-2023-release-roundup
Atlas Charts, a data visualization tool for MongoDB Atlas, has announced several updates in its summer 2023 release. These updates include expanded customization options in the Charts Embedding SDK, an out-of-the-box billing dashboard, support for candlestick charts, and query execution improvements for larger datasets. The Charts Embedding SDK now allows for greater customization of embedded charts and dashboards. The new billing dashboard simplifies monitoring Atlas billing data. Candlestick charts have been added to support financial data visualization. Query execution has been improved to handle more complex queries and longer rendering times. These updates aim to make Atlas Charts more powerful and user-friendly. Alongside these updates, the Talent Sourcing team at MongoDB, which is responsible for sourcing talent for the company, is highlighted with interviews from team members. MongoDB.local Auckland, an event showcasing MongoDB and its community in New Zealand, was also held recently, with announcements of MongoDB's support for the cloud regions of Microsoft, Amazon, and Google in New Zealand. The text informs the reader about the availability of a MongoDB.local event and encourages them to check if there will be one happening in their city. The specific date mentioned is August 17, 2023.
Read: https://www.mongodb.com/blog/post/whats-new-atlas-charts-summer-2023-release-roundup
Jira для HR-отдела: база данных о сотрудниках и автоматизации управления персоналом
Погрешности в учете рабочего времени и оплате труда, несистематизированный подход к онбордингу и развитию сотрудников, недостаток контроля за выполнением задач и сроками, неудовлетворительное взаимодействие с сотрудниками и отсутствие обратной связи, отсутствие инструментов для анализа продуктивности работы сотрудников — это самые неочевидные ошибки в управлении персоналом, но при этом они оказывают прямое влияние на бизнес.
В данной статье приведу пример организации досок Jira с использованием автоматизаций, который помогает сэкономить прорву времени HR-специалисту.
Читать: https://habr.com/ru/articles/755978/
Погрешности в учете рабочего времени и оплате труда, несистематизированный подход к онбордингу и развитию сотрудников, недостаток контроля за выполнением задач и сроками, неудовлетворительное взаимодействие с сотрудниками и отсутствие обратной связи, отсутствие инструментов для анализа продуктивности работы сотрудников — это самые неочевидные ошибки в управлении персоналом, но при этом они оказывают прямое влияние на бизнес.
В данной статье приведу пример организации досок Jira с использованием автоматизаций, который помогает сэкономить прорву времени HR-специалисту.
Читать: https://habr.com/ru/articles/755978/
TimescaleDB против всех: как база данных справляется с рядом сложных задач
В фильме «Отряд самоубийц: Миссия навылет», когда персонажи Идриса Эльбы (Бладспот) и Джона Сины (Миротворец) знакомятся при участии Аманды Уоллер, звучит следующая фраза:
– Ты сказала, что у всех в отряде уникальные навыки, а он — это тот же я.
Источник
Казалось бы, при чем здесь базы данных? На самом деле, отношения между PostgreSQL и TimescaleDB напоминают эту пару героев. PostgreSQL — одна из самых популярных СУБД в мире. Вокруг решения давно существует комьюнити, а за годы в коммерческой разработке набралось достаточно документации. TimescaleDB, будучи расширением PostgreSQL, умеет многое из ее арсенала, но применяется более точечно. В основном в проектах, где нужно работать с временными рядами или собирать данные с IoT-устройств.
В этом материале мы рассмотрим особенности работы TimescaleDB, а также покажем, как ее использует клиент Selectel — сервис DwarfByte.
Читать: https://habr.com/ru/companies/selectel/articles/756146/
В фильме «Отряд самоубийц: Миссия навылет», когда персонажи Идриса Эльбы (Бладспот) и Джона Сины (Миротворец) знакомятся при участии Аманды Уоллер, звучит следующая фраза:
– Ты сказала, что у всех в отряде уникальные навыки, а он — это тот же я.
Источник
Казалось бы, при чем здесь базы данных? На самом деле, отношения между PostgreSQL и TimescaleDB напоминают эту пару героев. PostgreSQL — одна из самых популярных СУБД в мире. Вокруг решения давно существует комьюнити, а за годы в коммерческой разработке набралось достаточно документации. TimescaleDB, будучи расширением PostgreSQL, умеет многое из ее арсенала, но применяется более точечно. В основном в проектах, где нужно работать с временными рядами или собирать данные с IoT-устройств.
В этом материале мы рассмотрим особенности работы TimescaleDB, а также покажем, как ее использует клиент Selectel — сервис DwarfByte.
Читать: https://habr.com/ru/companies/selectel/articles/756146/
Crafting Precision: Query Enhancements in MongoDB 7.0
Read: https://www.mongodb.com/blog/post/query-enhancement-mongodb-7-0
Read: https://www.mongodb.com/blog/post/query-enhancement-mongodb-7-0
Из цикла ETL: настройка первого отчета в Google Looker
Показали, как построить дашборд в Google Looker на базе логов Dialogflow.
Читать: «Из цикла ETL: настройка первого отчета в Google Looker»
Показали, как построить дашборд в Google Looker на базе логов Dialogflow.
Читать: «Из цикла ETL: настройка первого отчета в Google Looker»
Tproger
Из цикла ETL: настройка первого отчета в Google Looker
Показали, как построить дашборд в Google Looker на базе логов Dialogflow.
Многоступенчатый фильтр: как очистить огромный массив данных от дубликатов
Рассказали, как удалить дубликаты в огромной базе данных, и о том, как обработать большой объем данных невысокого качества.
Читать: «Многоступенчатый фильтр: как очистить огромный массив данных от дубликатов»
Рассказали, как удалить дубликаты в огромной базе данных, и о том, как обработать большой объем данных невысокого качества.
Читать: «Многоступенчатый фильтр: как очистить огромный массив данных от дубликатов»
Tproger
Многоступенчатый фильтр: как очистить огромный массив данных от дубликатов
Рассказали, как удалить дубликаты в огромной базе данных, и о том, как обработать большой объем данных невысокого качества.
Из цикла ETL: Создаем Tripwire-бота на aiogram, часть 1
Рассказали, как создать привлекающего на курс по управлению проектами Telegram-бота на aiogram, с полным разбором кода.
Читать: «Из цикла ETL: Создаем Tripwire-бота на aiogram, часть 1»
Рассказали, как создать привлекающего на курс по управлению проектами Telegram-бота на aiogram, с полным разбором кода.
Читать: «Из цикла ETL: Создаем Tripwire-бота на aiogram, часть 1»
Tproger
Из цикла ETL: Создаем Telegram-бота на aiogram, часть 1
Рассказали, как создать привлекающего на курс по управлению проектами Telegram-бота на aiogram, с полным разбором кода.
Empowering Automotive Developers for the Road Ahead
Read: https://www.mongodb.com/blog/post/empowering-automotive-developers-road-ahead
Read: https://www.mongodb.com/blog/post/empowering-automotive-developers-road-ahead
❤1
Наполняем до краев: влияние порядка столбцов в таблицах на размеры баз данных PostgresQL
При оценке требований базы данных к оборудованию требуется учет многих факторов. И здесь у Postgres есть одна интересная особенность, которая почти всегда ускользает от внимания разработчиков, потому что она искусно спрятана между столбцами таблиц.
И что же там прячется?
Читать: https://habr.com/ru/articles/756074/
При оценке требований базы данных к оборудованию требуется учет многих факторов. И здесь у Postgres есть одна интересная особенность, которая почти всегда ускользает от внимания разработчиков, потому что она искусно спрятана между столбцами таблиц.
И что же там прячется?
Читать: https://habr.com/ru/articles/756074/
DATABASE DESIGN
Photo
How to Enhance Inventory Management with Real-Time Data Strategies
Summary:
This text discusses the importance of real-time data strategies in enhancing inventory management in the retail industry. The article highlights the challenges faced by retailers in terms of unsold stock and the need to have a single view of inventory for effective competition. It emphasizes that modern retail consumers expect seamless omnichannel experiences and that retailers need to prioritize convenience and speed. The article also explains how MongoDB's document data model can be used to track inventory in real-time, improve visibility and consistency across multiple channels, and enable real-time analytics and AI in stock management. Additionally, the text discusses the use of event-driven architectures to boost workforce efficiency and automate inventory operations. It concludes by discussing MongoDB's new features and capabilities specifically designed for the automotive industry, such as real-time data insights, rapid responses to critical events, vector search for unstructured data, and the migration from relational databases to MongoDB. The text is about the industry sharing scenarios, experiences, and effectiveness of using MongoDB products. MongoDB is a database vendor that has a distributed infrastructure suitable for internet applications, with a focus on AI in recent product business strategies. The Beijing and Shenzhen user conferences are important events in MongoDB's global series. Previously, at the MongoDB user conference in New York, MongoDB introduced a series of new products and plans, including new features for MongoDB Atlas, MongoDB Relational Migrator, and an AI plan in collaboration with Google Cloud. MongoDB also released the MongoDB Atlas Industry Plan and launched a solution for the financial industry. Each major technological innovation in the IT industry takes applications to a new level, and AI brings unlimited possibilities to the application field. For AI applications, MongoDB's product advantage is storing data close together, greatly reducing development complexity. MongoDB allows AI-driven applications to run where the data is, bringing the application closer to the data instead of bringing the data closer to the application. The text ends by inviting readers to attend the technical and industry events in Beijing and Shenzhen to innovate and win together in the AI era.
Read: https://www.mongodb.com/blog/post/how-enhance-inventory-management-real-time-data-strategies
Summary:
This text discusses the importance of real-time data strategies in enhancing inventory management in the retail industry. The article highlights the challenges faced by retailers in terms of unsold stock and the need to have a single view of inventory for effective competition. It emphasizes that modern retail consumers expect seamless omnichannel experiences and that retailers need to prioritize convenience and speed. The article also explains how MongoDB's document data model can be used to track inventory in real-time, improve visibility and consistency across multiple channels, and enable real-time analytics and AI in stock management. Additionally, the text discusses the use of event-driven architectures to boost workforce efficiency and automate inventory operations. It concludes by discussing MongoDB's new features and capabilities specifically designed for the automotive industry, such as real-time data insights, rapid responses to critical events, vector search for unstructured data, and the migration from relational databases to MongoDB. The text is about the industry sharing scenarios, experiences, and effectiveness of using MongoDB products. MongoDB is a database vendor that has a distributed infrastructure suitable for internet applications, with a focus on AI in recent product business strategies. The Beijing and Shenzhen user conferences are important events in MongoDB's global series. Previously, at the MongoDB user conference in New York, MongoDB introduced a series of new products and plans, including new features for MongoDB Atlas, MongoDB Relational Migrator, and an AI plan in collaboration with Google Cloud. MongoDB also released the MongoDB Atlas Industry Plan and launched a solution for the financial industry. Each major technological innovation in the IT industry takes applications to a new level, and AI brings unlimited possibilities to the application field. For AI applications, MongoDB's product advantage is storing data close together, greatly reducing development complexity. MongoDB allows AI-driven applications to run where the data is, bringing the application closer to the data instead of bringing the data closer to the application. The text ends by inviting readers to attend the technical and industry events in Beijing and Shenzhen to innovate and win together in the AI era.
Read: https://www.mongodb.com/blog/post/how-enhance-inventory-management-real-time-data-strategies
August edition of newsletter for Autonomous Database Serverless
We are continually adding new features to Autonomous Database Serverless. Over the LAST 12 MONTHS, over 200 NEW FEATURES have been added, and the latest updates include the following...
Read: https://blogs.oracle.com/datawarehousing/post/august-edition-of-newsletter-for-autonomous-database-serverless
We are continually adding new features to Autonomous Database Serverless. Over the LAST 12 MONTHS, over 200 NEW FEATURES have been added, and the latest updates include the following...
Read: https://blogs.oracle.com/datawarehousing/post/august-edition-of-newsletter-for-autonomous-database-serverless
Oracle
August edition of newsletter for Autonomous Database Serverless
We are continually adding new features to Autonomous Database Serverless. Over the LAST 12 MONTHS, over 200 NEW FEATURES have been added, and the latest updates include the following...
Database In-Memory now supported on Autonomous Database on Dedicated Exadata Infrastructure!
Blog on Database In-Memory support on Autonomous Database on Exadata Cloud@Customer and Dedicated Infrastructure
Read: https://blogs.oracle.com/database/post/database-inmemory-now-supported-on-autonomous-database-on-dedicated-exadata-infrastructure
Blog on Database In-Memory support on Autonomous Database on Exadata Cloud@Customer and Dedicated Infrastructure
Read: https://blogs.oracle.com/database/post/database-inmemory-now-supported-on-autonomous-database-on-dedicated-exadata-infrastructure
Oracle
Database In-Memory now supported on Autonomous Database on Dedicated Exadata Infrastructure!
Blog on Database In-Memory support on Autonomous Database on Exadata Cloud@Customer and Dedicated Infrastructure
Отличия MySQL от PostgreSQL. Выбираем что лучше, PostgreSQL или MySQL
PostgreSQL и MySQL являются самыми популярными Open Source реляционными базами данных. И часто возникает вопрос - чем отличается PostgreSQL от MySQL? Ответ на этот вопрос позволит понять, какая из баз данных лучше подойдет вашему проекту.
В данной статье мы сравним PostgreSQL и MySQL по различным параметрам и запишем их в сравнительную таблицу.
Читать: https://habr.com/ru/companies/amvera/articles/756592/
PostgreSQL и MySQL являются самыми популярными Open Source реляционными базами данных. И часто возникает вопрос - чем отличается PostgreSQL от MySQL? Ответ на этот вопрос позволит понять, какая из баз данных лучше подойдет вашему проекту.
В данной статье мы сравним PostgreSQL и MySQL по различным параметрам и запишем их в сравнительную таблицу.
Читать: https://habr.com/ru/companies/amvera/articles/756592/
Change Data Capture (CDC) в Yandex Data Transfer: гид по технологии с примерами
В современных микросервисных архитектурах регулярно встречаются потребности в кешах, индексах полнотекстового поиска, репликах, а также в реактивном взаимодействии компонентов. Решать все эти задачи по отдельности — тот ещё вызов, но оказывается все эти задачи могут быть решены одним механизмом, и имя ему: Change Data Capture.
Меня зовут Тимофей Брунько, я разработчик Yandex Cloud. В этой статье я расскажу о том, как в теории и на практике работает CDC — Change Data Capture, или буквально «захват изменения данных», — и как наш сервис Yandex Data Transfer с поддержкой формата Debezium помогает пользователям решать задачи поставки данных, связанные с CDC. В конце статьи покажу реальные кейсы. Поехали.
Читать: https://habr.com/ru/companies/yandex_cloud_and_infra/articles/754802/
В современных микросервисных архитектурах регулярно встречаются потребности в кешах, индексах полнотекстового поиска, репликах, а также в реактивном взаимодействии компонентов. Решать все эти задачи по отдельности — тот ещё вызов, но оказывается все эти задачи могут быть решены одним механизмом, и имя ему: Change Data Capture.
Меня зовут Тимофей Брунько, я разработчик Yandex Cloud. В этой статье я расскажу о том, как в теории и на практике работает CDC — Change Data Capture, или буквально «захват изменения данных», — и как наш сервис Yandex Data Transfer с поддержкой формата Debezium помогает пользователям решать задачи поставки данных, связанные с CDC. В конце статьи покажу реальные кейсы. Поехали.
Читать: https://habr.com/ru/companies/yandex_cloud_and_infra/articles/754802/
Point-in-time Recovery. Как уменьшить RPO для базы данных
Падение любой информационной системы — это по умолчанию больно и неприятно. На Хабре вы найдете много статей о том, как этого избежать. Но что делать, если все-таки случилась одна из тех историй, которыми пугают джунов? Уборщица разлила ведро воды в ЦОДе или злосчастный экскаватор перерубил оптоволокно?
Меня зовут Андрей Белый, я старший разработчик VK Cloud в команде DBaaS. В этой статье мы на примере PostgreSQL разберем принципы работы баз данных и поговорим о том, как минимизировать последствия инцидентов с помощью оптимизации RPO (Recovery point objective).
Материал подготовлен по мотивам моего выступления на VK Databases Meetup «Point-in-time Recovery. Как уменьшить RPO для базы данных».
Читать: https://habr.com/ru/companies/vk/articles/755922/
Падение любой информационной системы — это по умолчанию больно и неприятно. На Хабре вы найдете много статей о том, как этого избежать. Но что делать, если все-таки случилась одна из тех историй, которыми пугают джунов? Уборщица разлила ведро воды в ЦОДе или злосчастный экскаватор перерубил оптоволокно?
Меня зовут Андрей Белый, я старший разработчик VK Cloud в команде DBaaS. В этой статье мы на примере PostgreSQL разберем принципы работы баз данных и поговорим о том, как минимизировать последствия инцидентов с помощью оптимизации RPO (Recovery point objective).
Материал подготовлен по мотивам моего выступления на VK Databases Meetup «Point-in-time Recovery. Как уменьшить RPO для базы данных».
Читать: https://habr.com/ru/companies/vk/articles/755922/
Вам в хранилище или к озеру? Чем занимаются специалисты по работе с данными и как стать Data-инженером
Привет, Хабр! Сегодня рассказываем, чем отличаются подходы к построению распределённых хранилищ данных Data Warehouse (DWH) и Data Lake и в чём специфика задач специалистов, работающих с данными.
В статье сначала опишем паттерны построения распределённых хранилищ, чтобы понимать, через какие процессы проходят данные. А после поговорим о задачах специалистов по работе с данными и необходимых для каждой позиции навыках.
Читать: https://habr.com/ru/companies/southbridge/articles/756652/
Привет, Хабр! Сегодня рассказываем, чем отличаются подходы к построению распределённых хранилищ данных Data Warehouse (DWH) и Data Lake и в чём специфика задач специалистов, работающих с данными.
В статье сначала опишем паттерны построения распределённых хранилищ, чтобы понимать, через какие процессы проходят данные. А после поговорим о задачах специалистов по работе с данными и необходимых для каждой позиции навыках.
Читать: https://habr.com/ru/companies/southbridge/articles/756652/
Powerful Generative AI Innovation Accelerates Discovery of New Molecules
Read: https://www.mongodb.com/blog/post/mongodb-investing-in-the-future-of-generative-ai-google-cloud
Read: https://www.mongodb.com/blog/post/mongodb-investing-in-the-future-of-generative-ai-google-cloud