Arenadata Catalog News – Telegram
Arenadata Catalog News
272 subscribers
32 photos
40 links
Новостной канал компании DataCatalog. Рассказываем о передовых инструментах по управлению данными и контролю их качества
Сайт: https://arenadc.io
Download Telegram
Качество данных играет решающую роль в достоверной аналитике и принятии обоснованных решений на основе данных. Разработка этого функционала становится ключевым направлением развития Arenadata Catalog в 2024 году.
👉 Узнайте больше посмотрев запись доклада Ивана Новоселова и Артёма Нестерчука.
Please open Telegram to view this post
VIEW IN TELEGRAM
👏31👍1
Каталог данных машинное обучение

Присоединяйтесь к вебинару, посвященному применению каталога данных для увеличения эффективности MLOps.

19 марта эксперты Arenadata Catalog и Иннодата поделятся опытом, как интеграция каталога данных и фабрики MLOps увеличенивает эффективность машинного обучения и снижает нагрузку на команду разработчиков. Вас ждет обзор решения и демонстрация систем на примере практического кейса.

👉 Зарегистрируйтсь по ссылке

Ждем вас!
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3
Эволюция Arenadata Catalog: главные новинки версии 0.6.2

Наиболее эффективным способом наполнения каталога данных является прямое подключение к источнику и считывание метаданных через коннектор.
Если такое подключение невозможно или структура источника находится на стадии проектирования, предлагаем использовать функционал импорта-экспорта метаданных через формат XLSX.
Также этот функционал будет полезен для расширения описаний уже каталогизированных источников и массового обновления объектов, таких как:
1. Базы данных
2. Схемы баз данных
3. Таблицы
4. Столбцы таблиц


Поиск. В новом релизе мы проделали значительную работу над поисковым движком ADC. Теперь он справляется со сложной морфологией русского и английского языков, успешно учитывает разделители и корректно обрабатывает букву «ё».

👉 Остальные улучшения смотрите по ссылке
Please open Telegram to view this post
VIEW IN TELEGRAM
👍62
04 апреля Иван Новосёлов, генеральный директор «ДатаКаталог», участвует в вебинаре «Прогнозная аналитика и AI/ML для крупных корпоративных клиентов»

Эксперты из крупнейших компаний обсудят перспективы прогнозной аналитики, искусственного интеллекта и машинного обучения.
Ждем вас на вебинаре в четверг, 🕔 4 апреля в 17:00  

Для участия необходимо зарегистрироваться
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4🔥1
Как Data Governance помог студентам педагогического вуза опередить конкурентов?

В воскресенье завершился Московский студенческий DATA-хакатон. 15 команд из различных вузов соревновались в решении бизнес-кейсов. Количество инструментов, доступных студентам, не ограничивалось. Применяй все, что хочешь! Были замечены Postgres, ML, MADlib, R, Bert, привычные Excel и Datalens, букет BI и другое.

Команда Analytics Aficionados из МГПУ исходно находилась в невыигрышном положении. Жребий вынес им задачу по оптимизации работы службы технической поддержки (СТП). Ребята признались, что до хакатона они даже не слышали о работе таких служб и не представляли, какие факторы могут влиять на эффективность работы СТП.

Каждый студент в их команде взял на себя определенную роль:
Дата-инженер
Дата-стюард
Дата-сайентсист
BI-аналитик

Используя предоставленные сырые данные, хранимые в разных форматах, дата-инженер переложил их в Postgres. Дата-стюард, используя Arenadata Catalog, отпрофилировал и описал таблицы. Данные получают контекст и становятся информацией, понятной BI аналитику и сайентсисту. Они визуализируют информацию и ищут связи. 💡

Стюард продолжил описывать оставшиеся таблицы. Ландшафт данных становится более обширным, что дает еще больше идей аналитикам.

Команда разработала 5 (пять!) гипотез, обработав все доступные источники информации за предоставленное время. На презентации кейса студенты защитили подход, показав, что их методика прозрачна, достоверна и воспроизводима. 👩‍💻

Соперники увлеклись оверинжинирингом используя Python и даже AI. В итоге они отработали пару красивых гипотез, но не успели представить визуализацию. В отсутствии описания структуры данных экспертам было сложно убедиться в достоверности исследования. Еще две команды застряли на отладке питоновского кода и сошли с дистанции.

Analytics Aficionados заслуженно заняли первое место. Они использовали методологию управления данными и командную работу чтобы превзойти сильных конкурентов. 🚀

Поздравляем всех участников и ждем следующий DATA-хакатон!
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥61👍1🤔1
Красный Синий Зеленый 🟥 🟦 🟩

Новая продвинутая диаграмма Data Lineage появилась в версии ADC 0.6.3. Цветовая маркировка линии преобразования данных наглядно показывает, каким образом данные преобразуются, каким образом меняется их структура и параметры, а также как информационные потоки разделяются и сходятся. Индивидуальный цвет получает каждый из трех способов построения связи:
автоматический
ручной
импортированный


Цветовая палитра удобно настраивается, на справочной вкладке отображается дата создания связи и ссылка на её создателя, а с создателями Arenadata Catalog можно встретиться на конференции ArenaDay которая пройдет 23 апреля.

👩‍🏫 Мы высаживаемся на конференцию большим составом. Будем рады встретиться, обсудить ваши задачи и поделиться новостями о планах развития ADC.
Регистрируйтесь на очное участие или подключайтесь онлайн.
🔜 Анкета для регистрации по ссылке
Please open Telegram to view this post
VIEW IN TELEGRAM
5👌1💯1
Внимание вебинар!

Присоединяйтесь к вебинару, посвященному обзору новых функциональных возможностей Arenadata Catalog

На вебинаре проведем обзор системы и уделим внимание новым функциональным возможностям появившимся в свежих версиях ADC: генерация ER диаграмм, расширение визуализации data lineage, связь объектов глоссария с физической структурой данных.

Вебинар состоится 22 мая при поддержке компании DBI
🔜Регистрируйтесь по ссылке и готовьте вопросы: https://pruffme.com/landing/u2789671/tmp1713257409
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6🔥3
Расширяем экосистему коннекторов к источникам метаданных

📊 Эффективное управление метаданными означает возможность построения графа происхождения данных от момента их появления до момента финального использования. Часто такой конечной точкой является дашборд BI-системы.

🔗 Компания DataCatalog разработала коннектор для сканирования метаданных BI платформы Visiology. Настроив оптимальное расписание, можно проводить автоматизированное сканирование системы и получать полную информацию о перечне объектов Visiology, включая дашборды, чарты, типы чартов и их описания. Дата-инженеры наглядно увидят пути трансформации данных, могут выявлять аномалии и отслеживать происходящие изменения. Бизнес-пользователи получают возможность связывать объекты бизнес-глоссария ADC с соответствующими чартами Visiology.

👉 Коннектор включен в дистрибутив ADC начиная с версии v0.6.2.2
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8
Делимся записями выступлений спикеров прошедшего в конце июня митапа Вино и Данные.👇

🔴Алиса Школьникова (ДАР, КОРУС Консалтинг) рассказала, что общего у качественного вина и качественных данных, и как это влияет на результат

🔴Артем Нестерчук (Arenadata Catalog) рассказал, на какой же полке (винного шкафа) хранить тесты качества и какой экономический эффект дает внедрение каталога данных

🔴 Ярослав Золотухин (Luxms) показал, как Luxms BI может помочь выбрать вино. Отличный лайфхак для тех, кто выбирает вино по этикетке - теперь будет шанс найти не только красивое, но и вкусное:)

🔴Владимир Митюшкин (Simple) поделился секретами виноделия, интересными фактами о винной культуре и географии виноградников

Обязательно посмотрите, лучше под бокал вина минералки🍷☺️
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥4👏2
🔐 Аутентификация в Arenadata Catalog

🔴 Обеспечение безопасного доступа к метаданным становится актуальной задачей для российских организаций внедряющих процессы Data Governance.
Интеграция Arenadata Catalog с сервером аутентификации Blitz Identity Provider позволяет использовать надежную идентификацию и аутентификацию.
Совместная работа продуктов была проверена в рамках испытаний, проведенных на специально развернутом стенде. Интеграция обеспечит пользователей передовыми функциями безопасности для защиты данных и управления доступом, что особенно важно в условиях повышенных требований к информационной безопасности.

👉 Более подробно здесь
🔥5
🍁Осень — начало бизнес-сезона и традиционное время для проведения конференций и выставок. Не стал исключением и 2024 год.
Делимся планам на ближайший месяц.


📅 17 сентября DataCatalog участвует в первой партнерской конференции Luxms. В докладе расскажем о ценности настроенных процессов Data Governance для эффективного управления бизнес-аналитикой. Конференция пройдет в двух форматах: очное участие и дистанционный формат. Будем рады увидеться лично, регистрация по ссылке

🗓 26 сентября выступаем на большой конференции по управлению данными, проводимой издательским домом "Открытые Системы". За последние годы конференция стала экспертной площадкой для обмена мнениями и отчетами о достигнутых результатах участников российской индустрии Data Governance. На выступлении дадим отчет о двухлетнем опыте работы нашей компании и поделимся результатами выполненных внедрений Arenadata Catalog. Ссылка на регистрацию

🗓 03 октября планируем участвовать в конференции IT Space. Это одно из крупнейших мероприятий, затрагивающее всё многообразие российских IT-продуктов и технологий. Естественно, такое мероприятие не могло обойти вниманием тему управления данными. Вместе с коллегами из Arenadata и Visiology будем работать на стенде и демонстрировать интеграцию продуктов управления данными и аналитики. Программа и регистрация на конференцию по ссылке

Увидимся
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6👏2
🔴 Дайджест новостей ДатаКаталог

Крупнейшие предприятия управляют данными с помощью Arenadata Catalog:

ПАО Банк ВТБ
объявил о переходе на решение
Arenadata Catalog


Сеть гипермаркетов Hoff
управляет данными
с помощью Arenadata Catalog


IT-холдинг Fplus
трансформирует культуру работы с данными
с помощью Arenadata Catalog


👉 Обновления ADC, вышедшие в последние месяцы, облегчают переход к композитному ИТ-ландшафту, ставшему актуальным для многих российских организаций.
Благодаря возможностям по сканированию метаданных новых источников, таких как Picodata, SAP BW и Форсайт у пользователей формируется репозиторий метаданных, объектов, процессов управления качеством связывающий все информационные системы и облегчающий миграцию на российское программное обеспечение.

В версии 0.7.3 представлены расширенные возможности загрузки семплов данных и улучшенный функционал профилировщика.
Пользовательские описания теперь можно добавить ко всем объектам физической модели данных, включая граф трансформации. Описания можно прикрепить непосредственно к графу Data Lineage, что упросит работу разработчиков и архитекторов при работе с потоками, в задачах миграции или проведении импакт анализа.
👉 Описание нового функционала по ссылке
🔥6👏4
⭐️ Все под контролем: качество данных, активность пользователей и каталогизация метаданных

Даже в небольшой организации, внедряющей процессы Data Governance, каталог данных может содержать информацию о десятках тысяч объектов метаданных, сотнях наборов тестов качества данных и тысячах объектов глоссария.

👉 В статье разобрали насущный вопрос, каким образом можно взглянуть на выполнение KPI процессов Data Governance и как настроить регулярный мониторинг этих показателей при помощи кастомизированной отчетности.
👍5
🚀 Управление данными в мире HighLoad

Все больше организаций встречаются с необходимостью применения высоконагруженных систем для анализа данных в режиме реального времени. Для решения этих задач существует отдельный класс резидентных СУБД, которые хранят данные в оперативной памяти, обеспечивая непревзойденную производительность и одновременно высокую персистентность. Представителем подобных систем является СУБД Picodata.

Лишь некоторые каталоги данных могут похвастаться возможностью сканирования метаданных систем Highload. Команда ДатаКаталог завершила разработку коннектора, позволяющего включить СУБД Picodata в полноценный процесс управления данными: сканирование структуры, извлечение метаданых, назначение владельцев, управление описаниями и привязку таблиц к объектам глоссария. Новый коннектор открывает двери Data Governance в мир HighLoad.

Коннектор доступен в релизе Arenadata Catalog 0.7.3.
👉 Более подробно в статье
🔥6👍4
Представляем анонс нового релиза Arenadata Catalog

Выпуск 0.8.0 является самым значимым по объему и важности релизом за вторую половину 2024 года. Он включает в себя улучшения функционала всех модулей продукта и заметные архитектурные изменения, которые позволят в дальнейшем быстрее развивать продукт

Вместе с публикацией релиза мы начинаем информировать пользователей не только о функциональных новинках, но и указывать на внесённые исправления. Публикация списка обновлений и исправлений будет предшествовать официальной готовности релиза к передаче. Это поможет клиентам заблаговременно выделять ресурсы и планировать время для перехода на новую версию, принимая во внимание весь объём нововведений и их актуальность.

Это один маленький шаг для
человека
ДатаКаталог, но гигантский скачок для всего
человечества
сообщества пользователей Arenadata Catalog
🔥753
Arenadata Catalog 💟 хранимые процедуры

Многие организации применяют хранимые процедуры (предварительно скомпилированные наборы SQL инструкций) для улучшения производительности, повышения безопасности СУБД, облегчения кода и оптимизации бизнес-логики приложений работающих с данными.
Отвечая на запрос клиентов, начиная с январского релиза, Arenadata Catalog предоставляет возможности по каталогизации хранимых процедур. В каталоге появился новый класс объектов - хранимая процедура СУБД

Новый функционал позволит:
* Упростить сопровождение хранилищ данных
* Вести историю изменений процедур, что важно для аудита
* Идентифицировать все связанные с таблицами процедуры, что поможет при проведение миграций и root cause анализа
* Выявлять редко используемые или устаревшие процедуры, которые можно оптимизировать или удалить

Сканирование и импорт процедур происходит автоматически при подключении источника данных либо при очередном сканировании его метаданных, что минимизирует человеческие ошибки.
Остальные улучшения релиза по ссылке
🔥12💯3
⚡️ Встречаемся на ArenaDAY!

22 апреля наша команда выступит на конференции ArenaDAY с докладом “Новая версия Arenadata Catalog, качество данных и применение AI”.

Про ArenaDAY 2025
▫️ 40+ докладов и стендов: «Северстали», «МегаФона», ФНС России, ВТБ, «Росатома», «Газпромнефти», Московского кредитного банка, HeadHunter, Московской биржи, Arenadata, Picodata, Garda, Корус Консалтинг
▫️ Презентации и демо новых продуктов и решений для работы с данными: cloud-native платформа, AI-ready Data Platform и вертикальные индустриальные решения

💥 Программа и форма регистрации по ссылке
🔥103
⚡️ Представляем проекты Arenadata - номинанты премии Data Award 2025

Бренд всероссийских государственных лотерей «Национальная лотерея» создает современное хранилище данных и внедряет практики Data Governance используя Arenadata DB и Arenadata Catalog. Основной целью проекта стало объединение разрозненных данных в единую платформу и обеспечение высокой производительности аналитических процессов.

💡Ознакомиться с ходом проекта и достигнутыми результатами можно в публикации Евгения Жилова, руководителя департамента аналитики и управления данными «Национальной лотереи»
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4
👉 Представляем анонс очередного релиза Arenadata Catalog

Выпуск 0.8.2 содержит улучшения функционала глоссария и актуальные изменения в области безопасного поиска, поддержку разворачивания в среде k8s и еще 120 долгожданных улучшений и исправлений!

Подробное описание релиза читайте на нашем сайте
🔥13👌52
🛡 Вопрос доверия к данным начинается с уверенности в надежности инструментов, которые этими данными управляют

Первый отечественный продукт в категории каталогов данных, систем управления качеством данных и корпоративных глоссариев успешно завершил сертификацию ФСТЭК.
Arenadata Catalog (ADC) был включен в Государственный реестр сертифицированных средств защиты информации и получил сертификат соответствия требованиям безопасности информации по 4 уровню доверия ФСТЭК России (сертификат № 4939) 28 мая 2025 года.
⚡️⚡️⚡️⚡️
Информация по ссылке
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥86
🔥 Готовимся к версии 0.8.4: вышел релиз 0.8.2.2_! 🔥

Команда разработчиков ДатаКаталог продолжает активно работать над версией 0.8.4, и сегодня мы рады представить промежуточное обновление 0.8.2.2. Этот релиз включает важные исправления и оптимизации, которые приближают нас к стабильному запуску основной версии.

Что нового в 0.8.2.2?
- Доработаны системы, которые будут ключевыми в будущих версиях
- Исправлены ошибки, обнаруженные в предыдущих сборках
- Добавлена поддержка сканирования метаданных FineBI 6.1

Этот апдейт — часть подготовки к масштабному релизу 1.0, где нас ждут:
- новые функции
- управление внутренними справочниками
- расширения модуля DQ
- ведение дата-контрактов

Как говорят по телевизору: Не переключайтесь!
🔥9👍1