DATABASE DESIGN – Telegram
DATABASE DESIGN
1.41K subscribers
2.08K photos
3 videos
5.32K links
Лучшие материалы по работе с хранилищами данных на русском и английском языке

Разместить рекламу: @tproger_sales_bot

Правила общения: https://tprg.ru/rules

Другие каналы: @tproger_channels

Другие наши проекты: https://tprg.ru/media
Download Telegram
Холиварный четверг: подключайтесь к BI-баттлу OpenSource vs проприетарное ПО

О чем стоит подумать в понедельник? Например, можно о том, чтобы поучаствовать в холиваре через три дня в четверг! Мы как раз готовимся провести онлайн-вебинар, посвященный решению задач Business Intelligence на базе OpenSource-технологий и проприетарного ПО. Но не просто так ради холивара, а на примере решения нескольких реальных кейсов. В мероприятии будут участвовать два эксперта, каждый из которых — убежденный сторонник своего подхода. Если тема BI вам близка, если любите похоливарить или просто хочется занять вечер четверга чем-то интересным, подключайтесь! Все подробности ивента — под катом.
Пожалуй, похоливарим...

Читать: https://habr.com/ru/companies/visiology/articles/741236/
BI система на прокачку: как мы используем плагины Fine BI

Вот уже больше года, мы в BI Consult работаем с китайской платформой self service BI-анализа – Fine BI. Работаем, изучаем, интегрируем и рассказываем. На этот раз хотим сделать акцент на интересном и актуальном вопросе - Плагины.

Расскажем про магазин плагинов, составим для вас список полезных плагинов, покажем как устанавливаются плагины без смс, регистрации и одноразовых SIM карт.

В конце статьи вы найдете список всех плагинов, поддерживающих английский язык с описанием, которые подтверждены вендором и готовы к работе.


Читать: https://habr.com/ru/articles/741304/
Балансируем между консистентностью и доступностью в распределённой системе: опыт Tarantool

Поговорим сегодня про выбор, перед которым встают разработчики всех распределённых систем: обеспечивать ли консистентность данных или доступность системы при различных внешних условиях —  поломках, плановых отключениях узлов, — а также во время штатной эксплуатации. Теория нам даёт простые, но не всегда применимые на практике ответы: можно выбрать либо консистентность, либо доступность (теорема CAP), а когда проблем с сетью нет — то либо консистентность, либо низкие задержки (PACELC). За скобками остаётся вопрос о том, как делать этот выбор. Система как будто всегда должна быть CP или AP, а что происходит, если вдруг работающая CP-система должна начать вести себя как AP, или, наоборот, перейти обратно из AP в CP?


Читать: https://habr.com/ru/companies/vk/articles/738616/
New Online Archive with Performance Improvements and Enhanced Metrics

Read: https://www.mongodb.com/blog/post/new-online-archive-performance-improvements-enhanced-metrics
Infrastructure Automation and CloudOps with the MariaDB SkySQL Terraform Provider

Read: https://mariadb.com/?p=36561
Как эффективно настроить autovacuum в Postgres для 1С

Кто не любит убирать мусор? Думаю практически все, а вот в Postgres это обязательный ритуал для эффективной работы. Как эффективно настроить уборку за 1С в Postgres можно прочитать в этой статье и еще раз задуматься о бесплатности Postgres.
Навести порядок

Читать: https://habr.com/ru/articles/741566/
MongoDB University Expands Education Outreach With New Partnerships

Read: https://www.mongodb.com/blog/post/mongodb-university-expands-education-outreach-new-partnerships
Unleashing Innovation in the Start-Up Nation: Inside MongoDB Israel

Read: https://www.mongodb.com/blog/post/unleashing-innovation-start-up-nation-inside-mongodb-israel
Организация хранения исторических данных в Oracle

Привет! Сегодня поговорим о разных способах организации хранения исторических данных в Oracle. Если вам известно более двух способов, то вы молодец и уже почти всё знаете, в чём вам и остаётся убедиться, просмотрев разделы статьи.


Читать: https://habr.com/ru/companies/sportmaster_lab/articles/741828/
Альтернатива есть! Обзор 6 российских СУБД для миграции

Привет, Хабр! Сегодня хочу коснуться наболевшей для многих российских компаний темы — замена зарубежного софта на доступное альтернативное. Так как я специализируюсь на системном ПО, все чаще я сталкиваюсь с подобными запросами по части СУБД.

Эта статья — мой обзор 6 СУБД из реестра отечественного ПО, которые можно использовать вместо MS SQL, Oracle и других. Каждую из них мы с командой К2Тех устанавливали и настраивали ручками. И в итоге убедились, что все они представляют собой действительно качественные продукты, на которых можно работать с большими объемами данных. Итак, представляем вам альтернативную «шестерку» СУБД под катом!
Будь как дома, путник!

Читать: https://habr.com/ru/companies/k2tech/articles/741980/
👍2
Improved Developer Experience with the Atlas Admin API

Read: https://www.mongodb.com/blog/post/improved-developer-experience-with-atlas-admin-api
Как извлечь больше данных о посетителях сайта через «Яндекс.Метрику» при помощи Python и с минимумом библиотек

Меня зовут Андрей Устьянцев, я ведущий аналитик направления Big Data в Лиге Цифровой Экономики. Эту статью я задумал как вторую в цикле материалов (первую об улучшении лендинга на основе метрик вы можете прочитать здесь). Сам текст будет полезен аналитикам, которым необходим более глубокий анализ данных о посетителях сайта, чем предоставляет стандартный интерфейс «Яндекс.Метрики». Или тем, кто хочет объединить данные из «Метрики» с другими источниками (например, из CRM) для визуализации, поиска инсайтов, проверки продуктовых гипотез etc.


Читать: https://habr.com/ru/companies/digitalleague/articles/742156/
ViTalk GPT: генератор DAX-запросов для Visiology 3

Привет, Хабр! Сегодня я хочу рассказать о нашем новом чат-боте ViTalk GPT. Он использует ИИ для генерации запросов на языке DAX, которые можно использовать в Visiology 3, причем учитывает не только особенности нашей платформы, но и контекст ваших запросов. О том как это работает, почему ViTalk GPT помогает переносить экспертизу не только из Power BI, в чем секрет создания “готовых” скриптов, которые можно просто вставлять в нужное поле в Visiology 3, и зачем вообще это нужно — читайте под катом.


Читать: https://habr.com/ru/companies/visiology/articles/742152/
Как использовать клиентские данные для машинного обучения

Рассказываем, как правильно подобрать данные для машинного обучения, какие данные подойдут и как использовать данные клиентов для ML.

Читать: «Как использовать клиентские данные для машинного обучения»
Picodata: простое масштабирование Tarantool

Привет! Сегодня я хочу познакомить вас с ПО, которое мы разрабатываем в нашей компанией — кластерной СУБД и сервером приложений на языке Rust. Мы профессионально занимаемся созданием и эксплуатацией решений на основе Tarantool и с некоторых пор начали разработку своего ПО, о котором и пойдёт речь.

Picodata — это дальнейшее развитие истории Tarantool, в которой учтен опыт эксплуатации этой СУБД и предложены решения как архитектурных, так и функциональных недостатков открытой версии Tarantool. Также, наше ПО проще запускать, настраивать и поддерживать в рабочем состоянии благодаря единой точке входа и интеграции всего инструментария в одном исполняемом файле. Мы создавали Picodata как изначально кластерную СУБД, которой удобно пользоваться. Если не верите, что российская СУБД может быть удобной, попробуйте — в конце этой статьи есть раздел Практикум, где можно сразу же попробовать собрать кластер самому на паре-тройке виртуальных машин или на вашем локальном компьютере. Сейчас же будет немного теории о том, как вообще работает распределенный кластер, что именно не так в “ванильном” Tarantool и что нам пришлось сделать чтобы это исправить.
Погрузиться в детали

Читать: https://habr.com/ru/articles/742244/
🔥1
How MariaDB Helps Specialized Media Dashboard Save 7x its Database Cost

Read: https://mariadb.com/?p=36658
Dedup Windows vs Linux, MS снова “удивит”?

Меня давно заинтриговала тема дедупликации данных. Это произошло в далеком 2016 году, когда передо мной встала задача впихнуть не впихуемое, на продакшн-серверах. Но обнаружить доступное решение оказалось невероятно сложно (на тот момент не возможно). Со временем у меня возникли и личные задачи, когда я хотел уменьшить объем третьей или четвертой копии данных, чтобы сэкономить место на диске. Но, возможно, я просто одержим датахордингом, и это тоже не исключено.


Читать: https://habr.com/ru/articles/742286/
Fueling Pricing Strategies with MongoDB and Databricks

Read: https://www.mongodb.com/blog/post/fueling-pricing-strategies-mongodb-databricks
How to Build Advanced GraphQL-based APIs With MongoDB Atlas and AWS AppSync Merged APIs

Read: https://www.mongodb.com/blog/post/how-build-advanced-graphql-based-apis-mongodb-atlas-aws-appsync-merged-apis
Кто управляет информацией — тот владеет миром: как сделать так, чтобы данные генерировали прибыль, а не убытки?

У всех компаний есть разнообразные данные: о клиентах, транзакциях, закупках, оборудовании, доходах и расходах. Но для одних компаний данные – драйвер роста, а другие несут убытки, полагаясь на них. Разница в том, что первые управляют информацией: знают, как и в какой форме она поступает, как ее внести в корпоративные системы, обогатить, и главное - как использовать, а вторые пускают эту работу на самотек и живут в зоопарке информационных систем без единой версии правды.

Это обзорный материал, я расскажу в нем об объектах основных данных, о том, по каким причинам часто возникают ошибки, какими инструментами улучшить качество данных и рассмотрю шаги конкретного проекта по внедрению НСИ.


Читать: https://habr.com/ru/articles/742910/