Инструменты для ML мониторинга
В тему ландшафта инструментов мониторинга, регулярно попадаются статьи типа этой:
📃 Best Tools to do ML Model Monitoring (5-7 минут)
Интересно, что такие статьи обычно рассказывают про 3-5 инструментов, но не дают полное покрытие.
В четверг за круглым столом обсудим философско-холиварный вопрос: чем BI или Grafana + Prometheus не подходят для задач ML мониторинга, а пока пусть будет тут просто список специализированных инструментов.
Позиционируются плюс-минус как чисто ML мониторинг:
🔸 EvidentlyAI
🔸 ArizeAI
🔸 fiddler
🔸 Hydrosphere
🔸 snitch
🔸 Mona Labs
🔸 Aporia
🔸 WhyLabs
🔸 Arthur
🔸 Superwise
🔸 Waterdip
🔸 Censius
🔸 whitebox
Мониторинг качества данных в привязке к ML остался пока за кадром, единственное, наткнулся вчера на такой вот инструмент, который и про мониторинг моделей и про мониторинг данных:
🔸 Qualdo
Есть еще категория не совсем мониторинга, а, скорее, тестирования ML моделей:
🔸 Deepchecks
🔸 Truera
🔸 Robust Intelligence
Мониторинг безусловно стоит рядом с сервингом и MLOps. Вот инструменты, в которых мониторингу уделяется особое внимание:
🔸 Seldon (Alibi)
🔸 modzy
🔸 VertaAI
Мы в своей практике достаточно часто сталкиваемся со смешением понятий мониторинга и трекинга модельных экспериментов.
🔹 Вот ClearML, в котором есть функционал для трекинга экспериментов, он партнерится с тулом для монитороинга из спика выше - Aporia
🔸 Comet - тул, который может и в эксперименты и в мониторинг
Ну и практически во всех крупных DS/ML платформах есть свой ответ на мониторинг. Помимо тех, кто совсем на слуху (SAS, IBM, MS Azure, DataRobot, …), хочется отметить:
🔹 iguazio - MLOps, Feature Store, сервинг и мониторинг
🔹 Datatron - MLOps/ModelOps, Governance и мониторинг
🔹 Polymatica ML - NoCode разработка моделей, MLOps и мониторинг
В своей же классификации не смог решить, где сказать про наш инструмент))
◾️ Kolmogorov AI Predicate - мониторинг моделей и расчета кастомных метрик на Python;-) Скоро у нас будет полноценный красивый сайт, а пока слушайте наши доклады на митапах))
Про Monitoring vs Observability мы также еще поговорим подробно на круглом столе в четверг и, вообще, попробуем разобраться в других терминах: ml performance, ml explainability, ml visibility…
В приведенном списке инструментов еще не хватило классификации на open source / вендор, но об этом немного позже (наш Predicate, кстати, пока еще не опенсорсный, но уже бесплатный;-))
Список совсем не претендует на полноценный обзор того что есть. Какие инструменты (и термины) я забыл? Делитесь мыслями в чате, в треде “тема недели”→
Источник: https://news.1rj.ru/str/noml_digest/400
В тему ландшафта инструментов мониторинга, регулярно попадаются статьи типа этой:
📃 Best Tools to do ML Model Monitoring (5-7 минут)
Интересно, что такие статьи обычно рассказывают про 3-5 инструментов, но не дают полное покрытие.
В четверг за круглым столом обсудим философско-холиварный вопрос: чем BI или Grafana + Prometheus не подходят для задач ML мониторинга, а пока пусть будет тут просто список специализированных инструментов.
Позиционируются плюс-минус как чисто ML мониторинг:
🔸 EvidentlyAI
🔸 ArizeAI
🔸 fiddler
🔸 Hydrosphere
🔸 snitch
🔸 Mona Labs
🔸 Aporia
🔸 WhyLabs
🔸 Arthur
🔸 Superwise
🔸 Waterdip
🔸 Censius
🔸 whitebox
Мониторинг качества данных в привязке к ML остался пока за кадром, единственное, наткнулся вчера на такой вот инструмент, который и про мониторинг моделей и про мониторинг данных:
🔸 Qualdo
Есть еще категория не совсем мониторинга, а, скорее, тестирования ML моделей:
🔸 Deepchecks
🔸 Truera
🔸 Robust Intelligence
Мониторинг безусловно стоит рядом с сервингом и MLOps. Вот инструменты, в которых мониторингу уделяется особое внимание:
🔸 Seldon (Alibi)
🔸 modzy
🔸 VertaAI
Мы в своей практике достаточно часто сталкиваемся со смешением понятий мониторинга и трекинга модельных экспериментов.
🔹 Вот ClearML, в котором есть функционал для трекинга экспериментов, он партнерится с тулом для монитороинга из спика выше - Aporia
🔸 Comet - тул, который может и в эксперименты и в мониторинг
Ну и практически во всех крупных DS/ML платформах есть свой ответ на мониторинг. Помимо тех, кто совсем на слуху (SAS, IBM, MS Azure, DataRobot, …), хочется отметить:
🔹 iguazio - MLOps, Feature Store, сервинг и мониторинг
🔹 Datatron - MLOps/ModelOps, Governance и мониторинг
🔹 Polymatica ML - NoCode разработка моделей, MLOps и мониторинг
В своей же классификации не смог решить, где сказать про наш инструмент))
◾️ Kolmogorov AI Predicate - мониторинг моделей и расчета кастомных метрик на Python;-) Скоро у нас будет полноценный красивый сайт, а пока слушайте наши доклады на митапах))
Про Monitoring vs Observability мы также еще поговорим подробно на круглом столе в четверг и, вообще, попробуем разобраться в других терминах: ml performance, ml explainability, ml visibility…
В приведенном списке инструментов еще не хватило классификации на open source / вендор, но об этом немного позже (наш Predicate, кстати, пока еще не опенсорсный, но уже бесплатный;-))
Список совсем не претендует на полноценный обзор того что есть. Какие инструменты (и термины) я забыл? Делитесь мыслями в чате, в треде “тема недели”→
Источник: https://news.1rj.ru/str/noml_digest/400
neptune.ai
Best Tools to Do ML Model Monitoring
Learn how to compare machine learning model monitoring tools and discover the best options available on the market.
Немного про MPP
😎 Евгений Степанов из Банка Открытие на митапе в четверг сделает доклад про опыт построения предиктивного мониторинга и подходы MPP. На эту тему вспомним пару статей, которые у нас уже всплывали в канале:
📃 Модель следит за моделью: как MPP-подход помогает прогнозировать риски и принимать решения, 2020 (5 минут).
📃 Валидация моделей машинного обучения, 2021 (10 минут).
Про опыт коллег из Открытия есть также вот такая заметка по мотивам доклада на конференции Data Day:
📃 Прогрессивные методы мониторинга качества данных для моделей машинного обучения, 2022 (7 минут).
Про MPP сегодня в чате уже вспомнил 😎Артём Глазков (@allront):
📄 Статья: Ghanta et al. - MPP: Model Performance Predictor, 2019 (5 минут).
🔸 Библиотека: nannyML.
P.S.: А наш докладчик Евгений еще засветился с темой трендов:
📃 ML-/DS-тренды в задачах управления кредитным риском в розничном кредитовании, 2021
Статья правда не в публичном доступе, но мы в начале года обязательно соберемся на традиционный голосовой чат про тренды, и спросим Евгения, сбылись ли прогнозы😉
Источник: https://news.1rj.ru/str/noml_community/5019/5085
😎 Евгений Степанов из Банка Открытие на митапе в четверг сделает доклад про опыт построения предиктивного мониторинга и подходы MPP. На эту тему вспомним пару статей, которые у нас уже всплывали в канале:
📃 Модель следит за моделью: как MPP-подход помогает прогнозировать риски и принимать решения, 2020 (5 минут).
📃 Валидация моделей машинного обучения, 2021 (10 минут).
Про опыт коллег из Открытия есть также вот такая заметка по мотивам доклада на конференции Data Day:
📃 Прогрессивные методы мониторинга качества данных для моделей машинного обучения, 2022 (7 минут).
Про MPP сегодня в чате уже вспомнил 😎Артём Глазков (@allront):
📄 Статья: Ghanta et al. - MPP: Model Performance Predictor, 2019 (5 минут).
🔸 Библиотека: nannyML.
P.S.: А наш докладчик Евгений еще засветился с темой трендов:
📃 ML-/DS-тренды в задачах управления кредитным риском в розничном кредитовании, 2021
Статья правда не в публичном доступе, но мы в начале года обязательно соберемся на традиционный голосовой чат про тренды, и спросим Евгения, сбылись ли прогнозы😉
Источник: https://news.1rj.ru/str/noml_community/5019/5085
Хабр
Модель следит за моделью: как MPP-подход помогает прогнозировать риски и принимать решения
Алгоритмы машинного обучение сегодня нужны во всех ключевых бизнес-процессах любого финансового института. Все больше решений принимается с применением моделей,...
ML мониторинг и Feature Store
😎Марина Смирнова (Альфа-Банк) и 😎Александр Косов (GlowByte) в своем докладе завтра на митапе затронут важную тему мониторинга стабильности фич и то, как она связана с Feature Store. В связи с этим небольшая подборка статей с Хабра:
📃 Как поссорились Инженер и Ученый - Статья про данные для ML и FeatureStore, 2021 (8 минут).
📃 Каким должен быть Feature Store, чтобы оптимизировать работу с ML-моделями, 2022 (7 минут).
📃 Как не перестать быть data driven из-за data driften, или Пару слов о дрейфе данных, 2022 (13 минут).
Вторая статья в списке по мотивам выступления:
📺 Артём Глазков - Анализ потребности бизнеса в использовании Feature Store, 2022 (38 минут).
Ну и можно пересмотреть наш самый первый очный митап, который был год назад и как раз по теме Feature Store:
📺 Технологии Feature Store (~2 часа).
#FeatureStore
Источник:
https://news.1rj.ru/str/noml_community/5019/5087
😎Марина Смирнова (Альфа-Банк) и 😎Александр Косов (GlowByte) в своем докладе завтра на митапе затронут важную тему мониторинга стабильности фич и то, как она связана с Feature Store. В связи с этим небольшая подборка статей с Хабра:
📃 Как поссорились Инженер и Ученый - Статья про данные для ML и FeatureStore, 2021 (8 минут).
📃 Каким должен быть Feature Store, чтобы оптимизировать работу с ML-моделями, 2022 (7 минут).
📃 Как не перестать быть data driven из-за data driften, или Пару слов о дрейфе данных, 2022 (13 минут).
Вторая статья в списке по мотивам выступления:
📺 Артём Глазков - Анализ потребности бизнеса в использовании Feature Store, 2022 (38 минут).
Ну и можно пересмотреть наш самый первый очный митап, который был год назад и как раз по теме Feature Store:
📺 Технологии Feature Store (~2 часа).
#FeatureStore
Источник:
https://news.1rj.ru/str/noml_community/5019/5087
Хабр
Как поссорились Инженер и Ученый
Статья про данные для ML и FeatureStore Это материал из цикла статей о ModelOps от команды Advanced Analytics GlowByte. В предыдущих статьях мы уже рассказывали про: 5 столпов MLOps Как...
Инструменты ЖЦМ
А теперь попробуем собрать список специализированных инструментов для управления жизненным циклом моделей - Model Lifecycle Management (MLCM), а также Model Governance (MG) и Model Risk Management (MRM).
Я бы охарактеризовал такие инструменты, во-первых, наличием некоторого workflow-движка, а во-вторых, возможностью собирать в себе модельные артефакты разнообразной природы (данные, код, документы, принятые решения и т.д.).
Если так, то у меня получился такой список:
🔸 SAS Model Risk Management
🔸 FICO Decision Central (по крайней мере как я понял этот инструмент)
🔸 ModelOp (на скриншотах вроде есть workflow)
🔸 Kolmogorov AI Continuity (без комментариев;))
Но вообще у терминов ЖЦМ/MLCM, MG, MRM нет строгого определения, такой функционал позиционируется очень у многих инструментов. Вот пара неожиданных на мой взгляд примеров:
🔹 DataRobot Model Risk Management
🔹 MathWorks Model Risk Management
А про какие инструменты MLCM, MG, MRM знаете вы? Делитесь мыслями в чате, в топике “тема недели”→
P.S.: Кстати, докладчики вчера на митапе так зажгли, что до круглого стола мы не дошли) Так что предлагаю обсудить заявленные темы observability и модельного риска в голосовом чате уже в январе😉
Источник: https://news.1rj.ru/str/noml_digest/406
А теперь попробуем собрать список специализированных инструментов для управления жизненным циклом моделей - Model Lifecycle Management (MLCM), а также Model Governance (MG) и Model Risk Management (MRM).
Я бы охарактеризовал такие инструменты, во-первых, наличием некоторого workflow-движка, а во-вторых, возможностью собирать в себе модельные артефакты разнообразной природы (данные, код, документы, принятые решения и т.д.).
Если так, то у меня получился такой список:
🔸 SAS Model Risk Management
🔸 FICO Decision Central (по крайней мере как я понял этот инструмент)
🔸 ModelOp (на скриншотах вроде есть workflow)
🔸 Kolmogorov AI Continuity (без комментариев;))
Но вообще у терминов ЖЦМ/MLCM, MG, MRM нет строгого определения, такой функционал позиционируется очень у многих инструментов. Вот пара неожиданных на мой взгляд примеров:
🔹 DataRobot Model Risk Management
🔹 MathWorks Model Risk Management
А про какие инструменты MLCM, MG, MRM знаете вы? Делитесь мыслями в чате, в топике “тема недели”→
P.S.: Кстати, докладчики вчера на митапе так зажгли, что до круглого стола мы не дошли) Так что предлагаю обсудить заявленные темы observability и модельного риска в голосовом чате уже в январе😉
Источник: https://news.1rj.ru/str/noml_digest/406
Sas
Model Risk Management (MRM) Software | SAS
Model Risk Management (MRM) from SAS governs your entire model development and risk management life cycle. Find out how SAS MRM can improve model governance.
Forwarded from Мария
Открыт дополнительный поток курса "Введение в технологии NGS. Работа с данными секвенирования" от PCR.NEWS
Подробности👇🏻
📌КОГДА: 18 февраля - 23 февраля 2023 г.
📌КАК: очно (Москва) / онлайн
📌ГДЕ: @medtechmoscow – место совместной работы научных стартапов для ускорения внедрения инновационных решений.
Программа курса позволит в сжатые сроки получить максимум практических навыков по работе с геномными данными, а знания, приобретенные на нашем курсе, откроют новые карьерные возможности!
Вы изучите работу с базами данных, проведёте анализ результатов секвенирования и самостоятельно соберете геном, аннотируете мутации и освоите множество других навыков!
В программе:
• Обзор технологий секвенирования
• Введение в Linux и анализ данных NGS
• Анализ NGS данных, поиск и аннотация точечных мутаций
• Метагеномика и полногеномное секвенирование, особенности пробоподготовки и анализ данных
• Применение результатов NGS секвенирования в онкологии. Анализ альтернативного сплайсинга
• Анализ экспрессии генов
Курс специально разработан для тех, кто только погружается в сферу NGS. По окончании выдается документ о переквалификации
Успейте забронировать по специальной цене! Скидка 20% действует до 30 декабря 2022 г.
Количество мест ограничено => biomedschool.ru
Подробности👇🏻
📌КОГДА: 18 февраля - 23 февраля 2023 г.
📌КАК: очно (Москва) / онлайн
📌ГДЕ: @medtechmoscow – место совместной работы научных стартапов для ускорения внедрения инновационных решений.
Программа курса позволит в сжатые сроки получить максимум практических навыков по работе с геномными данными, а знания, приобретенные на нашем курсе, откроют новые карьерные возможности!
Вы изучите работу с базами данных, проведёте анализ результатов секвенирования и самостоятельно соберете геном, аннотируете мутации и освоите множество других навыков!
В программе:
• Обзор технологий секвенирования
• Введение в Linux и анализ данных NGS
• Анализ NGS данных, поиск и аннотация точечных мутаций
• Метагеномика и полногеномное секвенирование, особенности пробоподготовки и анализ данных
• Применение результатов NGS секвенирования в онкологии. Анализ альтернативного сплайсинга
• Анализ экспрессии генов
Курс специально разработан для тех, кто только погружается в сферу NGS. По окончании выдается документ о переквалификации
Успейте забронировать по специальной цене! Скидка 20% действует до 30 декабря 2022 г.
Количество мест ограничено => biomedschool.ru
👍1
Как специалисты по анализу данных мы используем Jupyter Notebook практически каждый день – от загрузки данных до создания и развертывания моделей с его помощью.
Мне нравится Jupyter Notebook за её простой и удобный дизайн и при этом Jupyter незаменим для решения любых python-ориентированных задач. В частности, Jupyter поддерживает возможность запуска и тестирование скриптов с множеством датасетов.
Однако, при всей простоте этого инструмента, мы часто склонны совершать ошибки, которые приводят к потере времени и увеличению затрат мощности.
В этой статье мы расскажем о некоторых советах и хитростях, которые должен знать каждый специалист по работе с данными. Эти трюки помогут сэкономить время и увеличить продуктивность работы.
@data_analysis_ml
Please open Telegram to view this post
VIEW IN TELEGRAM
Математика — это краеугольный камень Data Science. Хотя некоторые теоремы, аксиомы и формулы кажутся слишком абстрактными и далекими от практики, на самом деле без них невозможно по-настоящему глубоко анализировать и систематизировать огромные массивы данных.
Для специалиста Data Science важны следующие направления математики:
- статистика;
- теория вероятностей;
- математический анализ;
- линейная алгебра.
@data_analysis_ml
Please open Telegram to view this post
VIEW IN TELEGRAM
🚀 Один из важнейших инструментов MLOps — это MLFlow.
▶️ 12 января в 20:00 мск в рамках онлайн-курса MLOps от OTUS пройдёт открытый урок «MLFlow и переобучение ML-моделей».
✅ На открытом уроке вы узнаете:
🔹 Как экспериментировать сразу с несколькими ML-моделями, с разными гиперпараметрами и при этом не захлебнуться в разнообразии экспериментов.
🔹 Как, проводя регулярное переобучение, получить возможность сравнивать качество работы моделей и выбирать лучший результат.
🔹 Как не потерять накопленный опыт и воспроизводить более ранние эксперименты.
🔹 Как выбирать лучшие варианты для отправки в Prod / Staging среду, при этом делиться информацией и принимать совместное решение в команде.
💻 Спикером выступит преподаватель OTUS Данила Слепов. Он проектирует AI-системы, разрабатывает архитектуру MLOps платформ.
➡️ Для регистрации на вебинар пройдите вступительный тест: https://otus.pw/jCQ9/
Реклама. Информация о рекламодателе на сайте www.otus.ru.
▶️ 12 января в 20:00 мск в рамках онлайн-курса MLOps от OTUS пройдёт открытый урок «MLFlow и переобучение ML-моделей».
✅ На открытом уроке вы узнаете:
🔹 Как экспериментировать сразу с несколькими ML-моделями, с разными гиперпараметрами и при этом не захлебнуться в разнообразии экспериментов.
🔹 Как, проводя регулярное переобучение, получить возможность сравнивать качество работы моделей и выбирать лучший результат.
🔹 Как не потерять накопленный опыт и воспроизводить более ранние эксперименты.
🔹 Как выбирать лучшие варианты для отправки в Prod / Staging среду, при этом делиться информацией и принимать совместное решение в команде.
💻 Спикером выступит преподаватель OTUS Данила Слепов. Он проектирует AI-системы, разрабатывает архитектуру MLOps платформ.
➡️ Для регистрации на вебинар пройдите вступительный тест: https://otus.pw/jCQ9/
Реклама. Информация о рекламодателе на сайте www.otus.ru.
Новогодние праздники – идеальное время для новых знаний 👀
Делимся плейлистами со всеми лекциями образовательных программ AIRI в 2022 году:
▪️Летняя школа RDLS
▪️Летняя школа РАИИ
▪️Конференция
В этом году нас ждет еще больше образовательных программ и мероприятий, обязательно вернемся с новостями!😁
https://news.1rj.ru/str/airi_research_institute/178
Делимся плейлистами со всеми лекциями образовательных программ AIRI в 2022 году:
▪️Летняя школа RDLS
▪️Летняя школа РАИИ
▪️Конференция
В этом году нас ждет еще больше образовательных программ и мероприятий, обязательно вернемся с новостями!
https://news.1rj.ru/str/airi_research_institute/178
Please open Telegram to view this post
VIEW IN TELEGRAM
