NEW BOT Телеграм, страница

DATABASE DESIGN

Simplifying IoT Connectivity with myDevices and MongoDB

Read: https://www.mongodb.com/blog/post/simplifying-iot-connectivity-mydevices-mongodb

248 views19:07

DATABASE DESIGN

NAS за шапку сухарей

Привет коллеги! На связи системный администратор Cloud4Y Денис Генералов (или тот самый чел, который искал уязвимости биоса в прошлых статьях на ноутбуках, статья тут).

Сегодня предлагаю рассмотреть вариант сборки домашнего NAS дендральным методом.

Всё описанное в статье является результатом деятельности моего воспаленного мозга поиска оптимальной конфигурации для своего домашнего файлохранилища и не является призывами к прямому действию. Представляет из себя изыскание того самого продукта, который может максимально покрыть мои потребности за сравнительно небольшую плату. Не поднимает вопрос о подлинности и законности использования указанного решения на территории предприятия, для всего остального – есть GPL v2.

Читать: https://habr.com/ru/post/703540/

263 views08:06

DATABASE DESIGN

Tackling the 5G Complexity Beast with MongoDB’s Developer Data Platform Simplicity

Read: https://www.mongodb.com/blog/post/tackling-5g-complexity-beast-mongodbs-developer-data-platform-simplicity

244 views17:14

DATABASE DESIGN

Как мы обновили старый кластер Elasticsearch на 3 ПБ без простоев. Часть 3 — поиск и подстановочные знаки

Прим. переводчика: автор статьи рассказывает, с какими трудностями его команда столкнулась при настройке нового кластера. Среди них — проблема с низкой производительностью поиска по подстановочным знакам.

Это третья часть серии статей об обновлении кластера Elasticsearch без простоев и с минимальным воздействием на пользователей. В рамках проекта по обновлению Elasticsearch было необходимо определить, насколько улучшилась производительность поиска в новой версии по сравнению со старой. Использование старой версии Elasticsearch было сопряжено со множеством проблем с производительностью, и была надежда, что переход на новую версию поможет с ними разобраться.

Читать: https://habr.com/ru/post/703980/

252 views07:08

DATABASE DESIGN

DBA: хранение списков — таблица, массив, строка?

Достаточно часто при проектировании схемы БД возникает задача сохранить по основной сущности некоторый набор простых второстепенных данных.

Например, это могут быть ФИО сотрудников, принимающих участие во встрече, список приложенных к сообщению файлов или перечень отгружаемых по документу позиций.

Во всех этих случаях мы заранее понимаем, что список этот меняется редко и ни индексировать эти данные, ни искать по ним, ни извлекать отдельно от основной сущности (встречи, сообщения или документа), мы не захотим.

Давайте посмотрим, какие варианты хранения таких данных мы можем использовать в PostgreSQL, и какой из них окажется в разы более эффективным.

Читать: https://habr.com/ru/post/704250/

251 views13:31

DATABASE DESIGN

Telco Scaling Strategies: Modernizing Business Support Systems for Flexible Revenue Growth

Read: https://www.mongodb.com/blog/post/modernizing-business-support-systems-flexible-revenue-growth

258 views16:02

DATABASE DESIGN

MongoDB Donates Laptops to Metropolitan School - Frankfurt

Read: https://www.mongodb.com/blog/post/mongodb-donates-laptops-metropolitan-school-frankfurt

271 views18:55

DATABASE DESIGN

Влияние сбора статистик на скорость выполнения запросов в СУБД TERADATA

Расскажу о такой важной особенности работы СУБД TERADATA, как сбор и использование статистик при выполнении запросов и как их наличие или отсутствие может повлиять на скорость выполнения таких запросов. Попытаюсь объяснить, что представляют собой статистики и для чего они нужны TERADATA.

Читать: https://habr.com/ru/post/704316/

284 views07:48

DATABASE DESIGN

Tarantool: Билли Миллиган в мире СУБД

Привет! Меня зовут Mons Anderson, я архитектор, разработчик, продакт-менеджер и евангелист Tarantool. В VK работаю уже больше 10 лет. Я постоянно нуждаюсь в базах данных, использую их и очень люблю. И в последнее время, когда я говорю про БД, я всё чаще говорю про Tarantool. Сегодня тоже хочу рассказать, что уникального в этой базе данных и что делает её практически универсальной.

Читать: https://habr.com/ru/post/704286/

437 views07:48

DATABASE DESIGN

TDE в Platform V DataGrid: учим систему шифрования менять ключи на лету

Привет, Хабр! Это Никита Амельчев и Павел Переслегин. Мы создаём Platform V DataGrid — распределённую базу данных, которая используется в сервисах Сбера и внешних клиентов. В статье расскажем, как мы усилили базовые функции шифрования TDE в нашем продукте и как решали вопрос совмещения полного шифрования и высокой производительности базы данных.

Читать: https://habr.com/ru/post/704476/

343 views09:17

DATABASE DESIGN

В чём разница форматов медицинских снимков DICOM и NIfTI?

Стандарты визуализации и форматы файлов играют существенную роль в аннотировании медицинских снимков. В этой статье рассказывается о различиях между двумя самыми популярными стандартами медицинской визуализации, DICOM и NIfTI.

Одно из самых существенных достижений в сфере аннотирования медицинских снимков — применение машинного обучения для оценки изображений с целью более точной и быстрой медицинской диагностики.

До того, как будут применены машинное обучение (ML), искусственный интеллект (AI) или любые другие алгоритмы диагностики, нам нужно разобраться, какое ПО аннотирования способно обрабатывать два самых популярных формата файлов снимков, а именно DICOM и NIfTI.

Читать: https://habr.com/ru/post/703750/

282 views09:05

DATABASE DESIGN

Greenplum Backup в Ceph: история миграции

Привет, Хабр! У этой статьи два автора – Василий Меньшаков и Алексей Кузнецов. Мы системные архитекторы развития платформы больших данных в X5 Tech. Решили поделиться своим опытом построения нового хранилища резервных копий для Greenplum. Какие были проблемы у предыдущего решения? Почему мы выбрали Ceph? Какой способ интеграции лучше? С какими проблемами мы сталкивались при внедрении этого инструмента? Что мы настраивали? Читайте подробности в нашей статье.

Читать: https://habr.com/ru/post/705048/

267 views06:32

DATABASE DESIGN

Как мы обновили старый кластер Elasticsearch на 3 ПБ без простоев. Часть 4 — токенизация и нормализация

Прим. переводчика: автор статьи рассказывает, как его команде удалось оптимизировать временные и ресурсные затраты при токенизации текстов в Elasticsearch путем внедрения нормализации похожих символов.

Это четвертая часть серии статей об обновлении кластера Elasticsearch без простоев и с минимальным воздействием на пользователей.

Во второй части было рассказано о решении провести полную переиндексацию всего датасета в процессе обновления Elasticsearch. В этой части пойдет речь о некоторых изменениях, которые были внесены в документы во время переиндексации.

Читать: https://habr.com/ru/post/703982/

279 views07:09

DATABASE DESIGN

Forrester Study: How IT Decision Makers Are Using Next-Generation Data Platforms

Read: https://www.mongodb.com/blog/post/forrester-study-decision-makers-using-next-generation-data-platforms

256 views15:02

DATABASE DESIGN

MongoDB highlights from AWS re:Invent 2022

Read: https://www.mongodb.com/blog/post/mongodb-highlights-aws-reinvent-2022

261 views16:01

DATABASE DESIGN

Essential reading: Explaining modern data management (Part 2)

Data management, data analytics, machine learning and artificial intelligence are all hot topics. Oracle is a leading company in data management with over 4 decades of experience. Let's step back together and learn about the latest concepts, architectures and innovations provided by Oracle to turn your data into actions.

Read: https://blogs.oracle.com/database/post/explaining-modern-data-mgmt-pt-2

Oracle

Essential reading: Explaining Modern Data Management (Part 2/3)

Data management, data analytics, machine learning and artificial intelligence are all hot topics. Oracle is a leading company in data management with over 4 decades of experience. Let's step back together and learn about the latest concepts, architectures…

254 views04:43

DATABASE DESIGN

Поиск данных в инструментах Data Governance: вызовы и решения

Добрый день!

Меня зовут Никита, я работаю ведущим системным аналитиком в Департаменте управления данными компании Ростелеком.

В данной статье я опишу наш опыт использования Реестра отчетов и Бизнес-глоссария, подводные камни, с которыми мы столкнулись, а также планы по оптимизации рабочих процессов в инструментах Data Governance (далее – DG).

Три года назад ИТ-команда Ростелекома разработала Реестр отчетов и Бизнес-глоссарий на базе Open-Source технологий, и данные модули впоследствии получили широкое распространение в периметре компании. Также была создана Единая точка входа, позволяющая сотрудникам получать быстрый доступ ко всем отчетам и бизнес-терминам, существующим в компании. За два года количество постоянных пользователей Единой точки входа увеличилось с 200 до 2300 человек, при этом количество уникальных посетителей Единой точки входа составляет порядка 400 пользователей еженедельно, и данная цифра постоянно растет.

Инструментарий для работы с данными покрывает значительный объем запросов Ростелекома в разрезе таких сегментов как B2B, B2C, БТИ и т.д. Подробнее можно прочитать здесь и здесь.

Департамент по управлению данными заинтересован не только в оптимизации процессов работы с данными во всей компании, но и в улучшении показателей пользовательского опыта в разрезе DG продуктов. Для этого необходимо модернизировать функционал существующих систем путем поиска точек роста и выпуска обновлений по их устранению. Искать точки роста мы решили при помощи интервьюирования пользователей и сбора обратной связи от них. По результатам были отрисованы карты пользовательских путей (cjm – "customer journey map") в разрезе DG инструментов, а также сформирован бэклог, описывающий основные зоны роста в части систем по управлению данными. В связи с этим, в скором времени планируется ряд обновлений с целью внедрения доработок и увеличения эффективности продуктов.

Читать: https://habr.com/ru/post/704870/

252 views08:33

DATABASE DESIGN

Куда попадёт стрела времени?

Всегда лучше рассчитывать хранилище данных на устойчивость к extinction-level событиям.
Мы же не динозавры какие-то.

Читать: https://habr.com/ru/post/705472/

249 views12:01

DATABASE DESIGN

Что ждёт дата-инжиниринг в 2023 году? Семь прогнозов

Количество поисковых запросов по профессиям

Что таит в себе будущее дата-инжиниринга? В этой статье я поделюсь своими прогнозами на 2023 и последующие годы.

Статьи с прогнозами на следующий год — это банально, но у них есть своя цель. Они помогают нам подняться над повседневной рутиной и подумать над тем, что принесёт выгоду в долгосрочной перспективе.

Кроме того, они обычно бывают упражнениями в смирении: мы пытаемся нарисовать целостную «общую картину» отрасли, стремительно эволюционирующей во множестве направлений. Попробуйте-ка найти отрасль, в которой людям сильнее нужно поддерживать актуальность своих знаний!

Эти возможные направления развития становятся ещё более важными, когда занимающиеся данными организации начинают оценивать и переоценивать свои приоритеты в свете экономической рецессии и когда от инвестиций в дата-инжиниринг зависит способность компании оставаться гибкой, инновационной и конкурентоспособной.

Читать: https://habr.com/ru/post/705000/

287 views13:11

DATABASE DESIGN

Multiple VM Autonomous Database on Dedicated Exadata Infrastructure

Launch announcement for Multiple VM Autonomous Database on Dedicated Exadata Infrastructure

Read: https://blogs.oracle.com/database/post/multiple-vm-autonomous-database-on-dedicated-exadata-infrastructure

Oracle

Multiple VM Autonomous Database on Dedicated Exadata Infrastructure

Launch announcement for Multiple VM Autonomous Database on Dedicated Exadata Infrastructure

282 views23:04

DATABASE DESIGN

Чем занимается ClickHouse пока мы спим или неожиданный OOM

В силу тех или иных обстоятельств, развиваясь по карьерной лестнице мне все чаще стало необходимо соприкасаться с таким известным инструментом в IT мире, как ClickHouse. Хоть мои должности за последние N-лет и связаны уже больше с управлением коллективами - для меня очень важно понимать суть технологических решений и проблемы, с которыми мои команды сталкиваются. Не смотря на все свое дружелюбие и конструкторную гибкость - ClickHouse временами выглядит, как весьма капризная технология. Одной из таких особенностей, с которой мне довелось столкнуться - стала борьба с внезапным OOM. В данной статье мы вместе с вами попробуем рассмотреть причины, откуда этот внезапный OOM, собственно, может браться.

Конечно, довольно часто причина кроется в неоптимальной схеме этой таблицы, неэффективном запросе или настройках самого ClickHouse. В этой статье мы шагнем чуть дальше и поговорим о бэкграундных процессах в ClickHouse, необходимых для его работы и при этом потребляющих драгоценную оперативную память.
Об этом далее и пойдет текст

Читать: https://habr.com/ru/post/705590/

363 views23:38

About

Blog

Apps

Platform