Разметка данных: что нужно знать перед стартом работ
Data labeling или разметка данных — один из ключевых этапов работы над любым LegalTech-проектом, где есть необходимость обучать ML-модель понимать контекст и ориентироваться в примерах.
При разработке LegalTech-решений сбор данных и разметка обычно лежат на клиенте, так как именно он обладает уникальным опытом, который помогает ML-модели правильно находить юридические риски в документации и договорах. Вендору сделать это сложнее, т.к. они кроются в специфических формулировках, которые может найти только эксперт. При этом от разметки данных зависит качество всего продукта — чем точнее она выполнена, тем эффективнее алгоритм будет выполнять заданные сценарии.
О том, что нужно знать перед стартом работ с разметкой, рассказали в карточках 👉
Data labeling или разметка данных — один из ключевых этапов работы над любым LegalTech-проектом, где есть необходимость обучать ML-модель понимать контекст и ориентироваться в примерах.
При разработке LegalTech-решений сбор данных и разметка обычно лежат на клиенте, так как именно он обладает уникальным опытом, который помогает ML-модели правильно находить юридические риски в документации и договорах. Вендору сделать это сложнее, т.к. они кроются в специфических формулировках, которые может найти только эксперт. При этом от разметки данных зависит качество всего продукта — чем точнее она выполнена, тем эффективнее алгоритм будет выполнять заданные сценарии.
О том, что нужно знать перед стартом работ с разметкой, рассказали в карточках 👉
🔥5💯4❤2👏1
Подборка полезных и интересных материалов про ИИ-технологии
Делимся познавательным контентом о ИИ-моделях и работе с ними
Статьи:
➖ Интервью с начальником управления экспериментальных систем машинного обучения департамента SberDevices Сергеем Марковым — о стоимости обучения LLM, атомной программе Google и беспилотниках
➖ Колонка научного руководителя центра непрерывного образования ФКН НИУ ВШЭ Евгения Соколова об обучении нейросетей
➖ Материал от экспертов в области ИИ о том, как в 2025 году решить проблему нехватки данных для обучения ML-моделей
Заметки в блогах:
✍️ Обзор научных исследований об особенностях применения LLM в ЦОД, телекоме и других сферах
✍️ X5 Group о проблемах при передаче в промышленную эксплуатацию ИИ-продуктов и способах их решения
✍️ Материал руководителя службы аналитики и исследований в «Яндексе», Ирины Барской, о создании метрик для оценки генеративных моделей
Книги:
📚 Reinforcement Learning, Richard S. Sutton and Andrew G. Barto (2018)
📚 The Little Book of Deep Learning, François Fleuret (2023)
Подкасты:
🎤 Machine Learning Podcast: Антонина Горячева. Как отвечать за весь ML в компании, чтобы все работало
🎤 make sense podcast: О практике внедрения больших языковых моделей, вызовах и тестировании гипотез
Делимся познавательным контентом о ИИ-моделях и работе с ними
Статьи:
➖ Интервью с начальником управления экспериментальных систем машинного обучения департамента SberDevices Сергеем Марковым — о стоимости обучения LLM, атомной программе Google и беспилотниках
➖ Колонка научного руководителя центра непрерывного образования ФКН НИУ ВШЭ Евгения Соколова об обучении нейросетей
➖ Материал от экспертов в области ИИ о том, как в 2025 году решить проблему нехватки данных для обучения ML-моделей
Заметки в блогах:
✍️ Обзор научных исследований об особенностях применения LLM в ЦОД, телекоме и других сферах
✍️ X5 Group о проблемах при передаче в промышленную эксплуатацию ИИ-продуктов и способах их решения
✍️ Материал руководителя службы аналитики и исследований в «Яндексе», Ирины Барской, о создании метрик для оценки генеративных моделей
Книги:
📚 Reinforcement Learning, Richard S. Sutton and Andrew G. Barto (2018)
📚 The Little Book of Deep Learning, François Fleuret (2023)
Подкасты:
🎤 Machine Learning Podcast: Антонина Горячева. Как отвечать за весь ML в компании, чтобы все работало
🎤 make sense podcast: О практике внедрения больших языковых моделей, вызовах и тестировании гипотез
👏6🔥5👍2😱1
Data Science как способ повысить эффективность управленческих решений
ИИ-решения помогают не только оптимизировать работу и избавиться от рутины, но и сделать процесс стратегического планирования и принятия решений проще и эффективнее.
ML-модели обрабатывают большие объемы данных, издержки сокращаются, а эффективность повышается. В результате рентабельность компании увеличивается более чем на 5%.
В карточках рассказали, как ML-модели помогают достигать такого результата 👉
ИИ-решения помогают не только оптимизировать работу и избавиться от рутины, но и сделать процесс стратегического планирования и принятия решений проще и эффективнее.
ML-модели обрабатывают большие объемы данных, издержки сокращаются, а эффективность повышается. В результате рентабельность компании увеличивается более чем на 5%.
В карточках рассказали, как ML-модели помогают достигать такого результата 👉
🔥5👍4💯3👏1
За 2025 год доля компаний, использующих или активно интегрирующих ИИ-решения в свои бизнес-процессы, может приблизиться к 50%. На это повлияет снижение порога входа и большая доступность ML-моделей, а также появление новых специалистов по работе с искусственным интеллектом.
#цифрадня
#цифрадня
👍6🔥4👏2❤1
🇰🇷 Южная Корея одобрила Закон об ИИ
🇪🇺 В ЕС опубликован второй проект Кодекса практики для ИИ общего назначения
🇺🇸 Патентное бюро США опубликовало новую ИИ-стратегию
🇬🇧 Пол Маккартни призывает правительство Великобритании защищать авторские права в эпоху искусственного интеллекта
🇨🇳 DeepSeek вызывает вопросы конфиденциальности, этики и интеллектуальной собственности
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥7👍5❤4
Собрали бенчмарки отечественных разработчиков, которые помогут оценить эффективность моделей искусственного интеллекта, сравнить показатели производительности и определить области для улучшения.
👩💻 MERA объективно оценивает современные русскоязычные модели искусственного интеллекта и стремится решить проблемы предвзятости предыдущих бенчмарков, разработанных компаниями.
⚖️ LLM Arena позволяет сравнить ответы двух моделей ИИ и сформировать рейтинг. В будущем на платформе появятся функции для оценки качества ответов по разным запросам, включая решение сложных вопросов и поддержку длинного контекста беседы.
🔎 RULM-SBS2 оценивает русскоязычные LLM, аналогичные ChatGPT. Инструмент ставит оценки по 10-балльной шкале ответам двух моделей на задания, каждое сравнение проводится дважды с перестановкой ответов для исключения предвзятости.
✍️ LIBRA проверяет способность модели резюмировать, выделять основные идеи и оперировать таблицами. Тесты проводятся в формате Zero-shot, где модели предлагаются задачи, не использовавшиеся при обучении.
📄 ruIFEval помогает определить, насколько хорошо большие языковые модели понимают и выполняют инструкции на естественном языке, чтобы сделать процесс оценки более быстрым, понятным и объективным.
👩💻 MERA объективно оценивает современные русскоязычные модели искусственного интеллекта и стремится решить проблемы предвзятости предыдущих бенчмарков, разработанных компаниями.
⚖️ LLM Arena позволяет сравнить ответы двух моделей ИИ и сформировать рейтинг. В будущем на платформе появятся функции для оценки качества ответов по разным запросам, включая решение сложных вопросов и поддержку длинного контекста беседы.
🔎 RULM-SBS2 оценивает русскоязычные LLM, аналогичные ChatGPT. Инструмент ставит оценки по 10-балльной шкале ответам двух моделей на задания, каждое сравнение проводится дважды с перестановкой ответов для исключения предвзятости.
✍️ LIBRA проверяет способность модели резюмировать, выделять основные идеи и оперировать таблицами. Тесты проводятся в формате Zero-shot, где модели предлагаются задачи, не использовавшиеся при обучении.
📄 ruIFEval помогает определить, насколько хорошо большие языковые модели понимают и выполняют инструкции на естественном языке, чтобы сделать процесс оценки более быстрым, понятным и объективным.
👍6👏2💯2
Ключевые направления использования ИИ в промышленности
Эксперты АНО «Цифровая экономика» проанализировали более 230 кейсов использования искусственного интеллекта в промышленности. В результате специалисты выявили основные тенденции, выделили практики, которые помогают повышать экономическую эффективность, и сделали прогнозы о будущем развитии технологии.
Мы изучили отчет и собрали самые интересные данные в карточках
Эксперты АНО «Цифровая экономика» проанализировали более 230 кейсов использования искусственного интеллекта в промышленности. В результате специалисты выявили основные тенденции, выделили практики, которые помогают повышать экономическую эффективность, и сделали прогнозы о будущем развитии технологии.
Мы изучили отчет и собрали самые интересные данные в карточках
🔥6👍4❤1
Также в отчете говорится, что 85% опрошенных сталкивались с требованиями определить четкие экономические результаты от внедрения искусственного интеллекта, чтобы руководству были понятны выгоды технологии. Для этого исследователи предлагают включать в ROI конкретные финансовые и операционные результаты, в том числе экономию затрат, повышение производительности и ускорение вывода продукции на рынок.
#цифрадня
#цифрадня
🔥4👍3❤1