DATABASE DESIGN – Telegram
DATABASE DESIGN
1.41K subscribers
2.08K photos
3 videos
5.3K links
Лучшие материалы по работе с хранилищами данных на русском и английском языке

Разместить рекламу: @tproger_sales_bot

Правила общения: https://tprg.ru/rules

Другие каналы: @tproger_channels

Другие наши проекты: https://tprg.ru/media
Download Telegram
Аналитика данных подключенных автомобилей – 23 года работы шведской компании WirelessCar

Шведская компания WirelessCar специализируется на подключенных транспортных средствах c 1999 года. Они работают с OEM-производителями (BMW, Volkswagen Group, Volvo Cars) и используют все возможности подключенных услуг для достижения более безопасного, разумного и экологичного движения.

«Уже 23 года мы поддерживаем энергию и дух стартапа, но сегодня мы находимся в гораздо более крупной экосистеме мобильности, где подключенные автомобили стали обязательными для продвижения вперед. На прошлой неделе мы достигли цифры в 10 миллионов автомобилей, подключенных к нашим системам, что позволяет нам создавать безопасную, интеллектуальную и устойчивую мобильность в гораздо большем масштабе, чем в начале нашей работы», — говорит Никлас Флорен, генеральный директор WirelessCar.

Цель компании — помочь OEM-производителям не только предоставлять услуги, которые действительно нужны конечным пользователям, но и добиться масштабируемости. Услуги WirelessCar доступны более чем на 100 рынках по всему миру.

«Для начала очень важно понять, что мы не владеем данными. Данные принадлежат OEM-производителям или самим водителям, и с самого начала это было принципиальной позицией WirelessCar», — объясняет Флорен. «Мы помогаем OEM-производителям более разумно использовать имеющиеся у них данные. Например, чтобы предсказывать, сколько времени потребуется, чтобы добраться до пункта назначения, или как долго будет работать ваш аккумулятор — используя как данные из автомобиля, так и другие внешние данные (погода, дорожные условия)».


Читать: https://habr.com/ru/post/712054/
Obsidian + Dataview: Задачи

В прошлой статье Obsidian + Dataview: Таблицы я рассказал про установку плагина Dataview, формирование таблиц с его помощью и разобрал 4 кейса его использования.

Dataview - это очень мощный и функциональный плагин, с помощью которого кроме таблиц можно так же формировать списки, календари и задачи.

Сегодня хотелось бы остановиться на задачах, тем более что Dataview позволяет сделать из Обсидиана полноценный task/todo-менеджер с календарём и прочими приятностями.


Читать: https://habr.com/ru/post/712038/
🔥2
Страдающее ML: как мы автоматизировали проверку данных, чтобы не было мучительно больно

Работать с данными — муторно, но есть кое-что похуже — проверять их качество. Больше данных — больше изматывающих ручных проверок и меньше уверенности, что с массивом всё в порядке.

Я разрабатываю ML-модели для розничного бизнеса, провожу A/B-тесты и оцениваю бизнес-эффекты в Газпромбанке. Год назад мы разработали систему, которая показывает, где и насколько данные плохи, а инженерам остаётся только разобраться почему. Раньше они сначала вручную выясняли, что в данных пошло не так, а теперь есть система, которая даёт подсказки. Расскажу об алгоритме, лежащем в основе системы, и о том, что она сейчас собой представляет и как используется в наших бизнес-процессах.


Читать: https://habr.com/ru/post/712214/
Ускоряем MySQL: 5+ фишек для оптимизации работы базы данных

СУБД чрезвычайно важна для любого проекта, и почти перед каждым админом в какой-то момент встаёт задача её оптимизации. Чтобы сделать запросы быстрее, важно понимать, как работает MySQL в целом.

Описанные в этом посте методы повышают производительность базы данных MySQL. Однако есть и сложности, с которыми можно столкнуться на пути к оптимизации и о которых стоит предупредить сразу.


Читать: https://habr.com/ru/post/712292/
MariaDB Java Connector 3.1.2 and 2.7.8 now available

Read: https://mariadb.com/?p=34538
Поднимаем стенд Spring микросервисов в Kubernetes

Гайд для начинающих по поднятию домашнего стенда для экспериментов c k8s c базовым CI/CD для микросервисов Spring.

Читать: «Поднимаем стенд Spring микросервисов в Kubernetes»
Интеграция 1С в Cloud: выгоды, проблемы и сроки

Рассказываем, как интегрировать 1C в Cloud — ex SberCloud — в 2023 году. Cloud заменяет серверы, которые почти не поставляются с 2022 года.

Читать: «Интеграция 1С в Cloud: выгоды, проблемы и сроки»
Представляем Deep Lake, озеро данных для глубокого обучения

В рамках нашего крупнейшего проекта мы представляем Deep Lake - озеро данных для глубокого обучения. Deep Lake более чем в 2 раза производительнее по сравнению с предыдущим поколением и превосходит все другие загрузчики данных. Давайте ознакомимся с более подробной информацией о возможностях Deep Lake.


Читать: https://habr.com/ru/post/712856/
Организация рабочего места в современных условиях

Добрый день, коллеги. Меня зовут Сарафанов Павел. С 2003 года я работаю в качестве BackEnd разработчика в крупнейших банках Росси таких как: Сбербанк, Дойче банк, ВТБ, Газпромбанк.


Читать: https://habr.com/ru/post/712898/
Зачем вообще защищать данные при передаче?

Привет, Хабр!

Меня зовут Федор и я занимаюсь киберкриминалистикой. Не только на работе (в RTM Group), но и на досуге. Мне нравится исследовать, почему и как кого-то взломали, а еще думать, как сделать так, чтобы этого не происходило. В связи с COVIDом и прочими событиями гораздо больше важных данных все стали пересылать посредством электронной почты и мессенджеров. Соответственно, выросло и количество случаев кражи таких данных. И сегодня мы разберемся, как защищать важную информацию при передаче.

Понятно, что в мессенджерах, соцсетях и электронной почте есть уже необходимые инструменты ИБ. Но как быть с конфиденциальной корпоративной информацией? Ведь всегда существует риск утери устройства, перехвата пароля и другие векторы атак. Ниже мы опишем способы защиты данных при передаче, которые собрали за многолетнюю практику проведения аудитов ИБ, и покажем, какие из них более надежные, а какие - более быстрые. Сразу скажем, что излишняя паранойя в этом деле наверняка будет тормозить бизнес-процессы, поэтому предаваться ей не стоит, а лучше выбрать сбалансированный вариант самостоятельно.


Читать: https://habr.com/ru/post/712952/
Разворачиваем MySQL: установка и настройка

MySQL на сегодняшний день является одной из наиболее распространенных в мире. Достаточно сказать, что по рейтингам 2021 года данная СУБД лишь немного уступала Oracle.


Читать: https://habr.com/ru/post/712768/
Modernizing Core Banking: A Shift Toward Composable Systems

Read: https://www.mongodb.com/blog/post/modernizing-core-banking-shift-toward-composable-systems
Как мы ищем документы в Naumen Disk или еще один вариант организации FTS

В процессе работы над проектом мы рассмотрели различные способы организации Full Text Search (FTS) по файлам. И… отказались от них в пользу своего решения, которое базируется на стандартных методах. В статье я опишу путь построения полнотекстового поиска по файлам для веб приложения с акцентом на задачи FTS.


Читать: https://habr.com/ru/post/713090/
New Aggregation Pipeline Text Editor Debuts in MongoDB Compass

Read: https://www.mongodb.com/blog/post/new-aggregation-pipeline-text-editor-debuts-mongodb-compass
Техподдержка – техноддержОЧКА. Делаю камингаут – да, я айти инженер

Приехал на объект, ничего не предвещало ничего и тут понеслась!

Сразу спойлерну история закончилась хорошо. В итоге было найдено решение возникшей проблемы, спасибо пользователю «Dustin», который дал развёрнутый ответ. Не знаю инженер ли ты или просто добрый админ, но решение сработало. АТ-ДУ-ШИ душевно в душу бро брат братан братишка)
Ну, поехали

Читать: https://habr.com/ru/post/712998/
Boson — разработка СУБД «с нуля» (часть II)

В первой части статьи мы обсуждали разработку самого нижнего слоя СУБД Boson - CachedFileIO. Как упоминалось, статистика такого явления как Locality of Reference говорит о том, что в реальных приложениях ~95% запросов к данным локализованы в 10-15% базы данных. При этом среднее соотношение чтения/записи - 70%/30%. Это делает эффективным использование кэша (cache) работающего на основе алгоритма Least Recently Used (LRU). Реализовав его, мы получили 260%-600% прироста скорости чтения при 87%-97% cache hits.

Следующим после кэша слоем СУБД Boson является хранилище записей RecordFileIO. Это уже первый прообраз базы данных, который начинает приносить прикладную пользу. Сформулируем верхнеуровневую спецификацию требований:


Читать: https://habr.com/ru/post/712896/
Using Change Point Detection to Find Performance Regressions

Read: https://www.mongodb.com/blog/post/using-change-point-detection-find-performance-regressions
Мой новый домашний сервер, часть 5: изменения за год

С год назад я писал небольшой цикл статей про свой домашний сервер — как я дошел до жизни такой, зачем оно мне надо и из чего оно сделано. Прошел год и решил кратко описать изменения, как аппаратные, так и программные.
Сервер, конечно, уже не новый, всё же год прошел. Но, чтобы не разрывать цикл, оформлю как пятую часть.

Прошлые части:
Мой новый домашний сервер, часть 1: выбор железа
Мой новый домашний сервер, часть 2: выбор софта
Мой новый домашний сервер, часть 3: немного о сборке
Мой новый домашний сервер, часть 4: использование unraid


Читать: https://habr.com/ru/post/713778/
Как я создавал свой первый дашборд на Visiology 3 и почему второй буду делать немного позже

Привет, Хабр! Меня зовут Салават Сафиуллин, и сегодня я хочу поделиться с вами своим первым опытом создания дашборда на Visiology 3. Это новая версия платформы, которой мы пользуемся уже несколько лет, но она кардинально отличается как архитектурой, так и принципами работы. Дашборды на версии нужно создавать заново и по-другому. Поэтому мне было особенно интересно сделать пробу и подготовить дашборд на базе демонстрационной версии. Под катом — немного информации о платформе для тех, кто не в теме, а также подробный рассказ о моем "пилоте" и некоторые мысли о том, стоило ли так кардинально менять архитектуру BI-платформы.


Читать: https://habr.com/ru/post/713922/