Embedika | ИТ-решения для бизнеса – Telegram
Embedika | ИТ-решения для бизнеса
418 subscribers
764 photos
4 files
386 links
Научно-ориентированная ИТ-компания, разработчик корпоративных систем на основе технологий обработки естественного языка и машинного обучения. Data science, LegalTech, AI https://embedika.ru
Download Telegram
Разметка данных: что нужно знать перед стартом работ

Data labeling или разметка данных — один из ключевых этапов работы над любым LegalTech-проектом, где есть необходимость обучать ML-модель понимать контекст и ориентироваться в примерах.

При разработке LegalTech-решений сбор данных и разметка обычно лежат на клиенте, так как именно он обладает уникальным опытом, который помогает ML-модели правильно находить юридические риски в документации и договорах. Вендору сделать это сложнее, т.к. они кроются в специфических формулировках, которые может найти только эксперт. При этом от разметки данных зависит качество всего продукта — чем точнее она выполнена, тем эффективнее алгоритм будет выполнять заданные сценарии.

О том, что нужно знать перед стартом работ с разметкой, рассказали в карточках 👉
🔥5💯42👏1
Подборка полезных и интересных материалов про ИИ-технологии

Делимся познавательным контентом о ИИ-моделях и работе с ними

Статьи:
Интервью с начальником управления экспериментальных систем машинного обучения департамента SberDevices Сергеем Марковым — о стоимости обучения LLM, атомной программе Google и беспилотниках
Колонка научного руководителя центра непрерывного образования ФКН НИУ ВШЭ Евгения Соколова об обучении нейросетей
Материал от экспертов в области ИИ о том, как в 2025 году решить проблему нехватки данных для обучения ML-моделей

Заметки в блогах:
✍️ Обзор научных исследований об особенностях применения LLM в ЦОД, телекоме и других сферах
✍️ X5 Group о проблемах при передаче в промышленную эксплуатацию ИИ-продуктов и способах их решения
✍️ Материал руководителя службы аналитики и исследований в «Яндексе», Ирины Барской, о создании метрик для оценки генеративных моделей

Книги:
📚 Reinforcement Learning, Richard S. Sutton and Andrew G. Barto (2018)
📚 The Little Book of Deep Learning, François Fleuret (2023)

Подкасты:
🎤 Machine Learning Podcast: Антонина Горячева. Как отвечать за весь ML в компании, чтобы все работало
🎤 make sense podcast: О практике внедрения больших языковых моделей, вызовах и тестировании гипотез
👏6🔥5👍2😱1
Data Science как способ повысить эффективность управленческих решений

ИИ-решения помогают не только оптимизировать работу и избавиться от рутины, но и сделать процесс стратегического планирования и принятия решений проще и эффективнее.

ML-модели обрабатывают большие объемы данных, издержки сокращаются, а эффективность повышается. В результате рентабельность компании увеличивается более чем на 5%.

В карточках рассказали, как ML-модели помогают достигать такого результата 👉
🔥5👍4💯3👏1
За 2025 год доля компаний, использующих или активно интегрирующих ИИ-решения в свои бизнес-процессы, может приблизиться к 50%. На это повлияет снижение порога входа и большая доступность ML-моделей, а также появление новых специалистов по работе с искусственным интеллектом.

#цифрадня
👍6🔥4👏21
Собрали бенчмарки отечественных разработчиков, которые помогут оценить эффективность моделей искусственного интеллекта, сравнить показатели производительности и определить области для улучшения.

👩‍💻 MERA объективно оценивает современные русскоязычные модели искусственного интеллекта и стремится решить проблемы предвзятости предыдущих бенчмарков, разработанных компаниями.

⚖️ LLM Arena позволяет сравнить ответы двух моделей ИИ и сформировать рейтинг. В будущем на платформе появятся функции для оценки качества ответов по разным запросам, включая решение сложных вопросов и поддержку длинного контекста беседы.

🔎 RULM-SBS2 оценивает русскоязычные LLM, аналогичные ChatGPT. Инструмент ставит оценки по 10-балльной шкале ответам двух моделей на задания, каждое сравнение проводится дважды с перестановкой ответов для исключения предвзятости.

✍️ LIBRA проверяет способность модели резюмировать, выделять основные идеи и оперировать таблицами. Тесты проводятся в формате Zero-shot, где модели предлагаются задачи, не использовавшиеся при обучении.

📄 ruIFEval помогает определить, насколько хорошо большие языковые модели понимают и выполняют инструкции на естественном языке, чтобы сделать процесс оценки более быстрым, понятным и объективным.
👍6👏2💯2
Ключевые направления использования ИИ в промышленности

Эксперты АНО «Цифровая экономика» проанализировали более 230 кейсов использования искусственного интеллекта в промышленности. В результате специалисты выявили основные тенденции, выделили практики, которые помогают повышать экономическую эффективность, и сделали прогнозы о будущем развитии технологии.

Мы изучили отчет и собрали самые интересные данные в карточках
🔥6👍41
Также в отчете говорится, что 85% опрошенных сталкивались с требованиями определить четкие экономические результаты от внедрения искусственного интеллекта, чтобы руководству были понятны выгоды технологии. Для этого исследователи предлагают включать в ROI конкретные финансовые и операционные результаты, в том числе экономию затрат, повышение производительности и ускорение вывода продукции на рынок.

#цифрадня
🔥4👍31