Институт AIRI – Telegram
Институт AIRI
11.7K subscribers
911 photos
9 videos
2 files
670 links
Канал Института AIRI ⚡️

Рассказываем про технологии ИИ и о том, как исследователи развивают их в России и мире: https://airi.net/ru/

ВКонтакте: https://vk.com/airi_institute

Регистрация в РКН: https://gosuslugi.ru/snet/686cce31f794ae555409516c
Download Telegram
Институт AIRI
Прямо сейчас в Канаде проходит ICML 2025⤵️ 13 июля в Ванкувере стартовала международная конференция по машинному обучению ICML 2025, в этом году на ней выступает инженер-исследователь группы «Адаптивные агенты» AIRI Никита Любайкин. Исследователи AIRI приняли…
Из Канады в Италию — на конференцию SIGIR 2025 🇮🇹

Параллельно с ICML в итальянской Падуе прошла 48-ая международная конференция SIGIR. От AIRI в конференции приняла участие доктор компьютерных наук, руководитель группы «Прикладное NLP» AIRI и старший научный сотрудник ИСП РАН Елена Тутубалина. В программе конференции — две статьи с участием исследователей AIRI:

⚫️BALI: Enhancing Biomedical Language Representations through Knowledge Graph and Language Model Alignment
Авторы представили новый метод, который дополняет языковые модели внешними знаниями из биомедицинского графа путем одновременного обучения и выравнивания представлений.

⚫️IDAT: A Multi-Modal Dataset and Toolkit for Building and Evaluating Interactive Task-Solving Agents
В статье описан новый масштабируемый инструмент сбора данных для обучения ИИ-агентов, действующий в средах типа Minecraft, с которыми можно взаимодействовать на естественном языке.

Делимся фото с конференции📌
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
62
Команда магистрантов кафедры банковских информационных технологий в МФТИ (СберТех) под руководством кандидата технических наук, научного сотрудника группы «Прикладное NLP» AIRI Олега Сомова заняла призовые места на соревновании Text-To-SPARQL Challenge🔥

Соревнование, организованное исследовательской группой Agile Knowledge Engineering and Semantic Web, стало частью конференции ESWC 2025, проходившей в начале июня в Словении. Задача участников заключалась в разработке модели, способной преобразовывать текстовые запросы на естественном языке в SPARQL‑запросы — формальный язык для работы с графами знаний, например Wikidata и DBpedia.

Среди 9 команд из ведущих европейских исследовательских центров, которые приняли участие в соревновании, команда под руководством Олега заняла третье место в треке DBPedia и пятое место в треке с корпоративным графом знаний. Подробнее о соревновании и о своём решении участники рассказали в статье на Хабре.

Поздравляем призёров!🎁
Please open Telegram to view this post
VIEW IN TELEGRAM
75
ACL 2025 стартовала в Вене⤵️

В этом году на конференции широкая тематическая программа — от вычислительных социальных наук до распознавания речи. Заявлена и специальная тема: генерализация NLP-моделей.

Исследователи AIRI представляют 11 статей на основных треках конференции:

⚫️AmbiK: Dataset of Ambiguous Tasks in Kitchen Environment

⚫️CLEAR: Character Unlearning in Textual and Visual Modalities

⚫️CrafText Benchmark: Advancing Language Grounding in Complex Multimodal Open-Ended World

⚫️Adaptive Retrieval Without Self-Knowledge? Bringing Uncertainty Back Home

⚫️BRIGHTER: BRIdging the Gap in Human-Annotated Textual Emotion Recognition Datasets for 28 Languages

⚫️Cramming 1568 Tokens into a Single Vector and Back Again: Exploring the Limits of Embedding Space Capacity

⚫️Feature-Level Insights into Artificial Text Detection with Sparse Autoencoders

⚫️Run LoRA Run: Faster and Lighter LoRA Implementations

⚫️HatePRISM: Policies, Platforms, and Research Integration. Advancing NLP for Hate Speech Proactive Mitigation

⚫️How to Compare Things Properly? A Study on Answering Comparative Questions using Argument Summarization

⚫️ATGen: A Framework for Active Text Generation


Вчера прошёл туториал по оценке неопределенностей для LLM в задачах генерации текста Uncertainty Quantification for Large Language Models, организованный исследователями AIRI. Учёные также планируют показать свои исследования на нескольких воркшопах.

Делимся фото с конференции!
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
53
Рассказываем про открытые вакансии в команду AIRI 💡

⚫️AI Research Scientist для проекта реверс-инжиниринга 3D-объектов в группу «Пространственный интеллект»

⚫️RL Researcher в лабораторию когнитивных систем искусственного интеллекта AIRI

⚫️Researcher и Middle/Senior Data Scientist в группу «Дизайн новых материалов»

Узнать подробнее про вакансии и откликнуться можно на сайте. Подавайтесь и делитесь с теми, кому может быть актуально📌

#дайджест_вакансий
Please open Telegram to view this post
VIEW IN TELEGRAM
44
AIRI на WAIC 2025 в Шанхае ⤵️

Иван Оселедец, Андрей Кузнецов, Пэни Ли, Константин Яковлев, Евгений Бурнаев и Семен Буденный выступили на сессии международной конференции AI Journey и приняли участие в форсайт-сессии AI Horizons на крупнейшей AI-конференции Восточной Азии — WAIC 2025. На ней российские и китайские эксперты обсудили, куда движутся генеративные модели, как искусственный интеллект меняет бизнес и какие вызовы ждут индустрию.

На конференции исследователи AIRI представили сразу несколько разработок: медицинского AI-помощника, модели Vintix для анализа данных, CADrille для 3D-восстановления промышленных деталей, LLM microscope, генерацию изображений для e-commerce, видеоаналитику для ритейла и MAPF GPT для моделирования движения агентов.

На фотографиях — атмосфера мероприятия в Китае 💡
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
66
Новый инструмент для проверки способностей роботов работать по неоднозначным инструкциям ⤵️

Исследователи AIRI и МФТИ при поддержке Центра робототехники Сбера представили набор данных AmbiK, созданный для оценки действий систем в неоднозначных условиях. Для этого авторы собрали текстовый датасет, включающий две тысячи задач с разметкой по типу неоднозначности для действий на кухне. Сейчас это самый большой набор данных в своей предметной области — существующие аналоги насчитывают лишь порядка 600 примеров.

Эксперименты с датасетом показали, что существующие алгоритмы пока недостаточно эффективно справляются с распознаванием ситуаций, требующих уточнения: даже лучшие модели демонстрируют успешный результат лишь в 20% случаев. Кроме того, AmbiK позволяет выяснить, на каком этапе плана возникает неопределённость.

Исследование было представлено на конференции ACL 2025 в Вене. Подробнее — в материале ТАСС.

Научная статья | GitHub
Please open Telegram to view this post
VIEW IN TELEGRAM
42
Сегодня рассказываем про новое технологическое партнерство ⤵️

IVA Technologies и лаборатория безопасного искусственного интеллекта SAIL AIRI-МТУСИ запускают тестирование метода Clarispeech для повышения точности распознавания речи в сервисах для коммуникаций.

Этот подход позволит значительно улучшить расшифровку звонков, учитывая эмоциональный окрас и профессиональную лексику, повысить качество аналитики разговоров и автоматизировать процессы на основе речевых команд в CRM. Компании также договорились о проведении совместной научно-исследовательской работы, что позволит углубить знания в области ИИ и его применения в корпоративных коммуникациях.

Рады начать совместную работу!
Please open Telegram to view this post
VIEW IN TELEGRAM
27
Исследователи из AIRI и МФТИ создали новый метод, который расширяет возможности больших языковых моделей при работе с трехмерным пространством ⤵️

Существующие подходы представления 3D-сцены в LLM не позволяют учитывать семантические связи между объектами, что снижает их способность корректно решать задачи на понимание и описание, а также отвечать на вопросы про сцену. Новая архитектура, названная 3DGraphLLM, позволяет улавливать смысловые связи между объектами. Это положительно сказывается на качестве восприятия языковыми моделями трёхмерных сцен.

Предложенный метод демонстрирует значительное превосходство по качеству поиска 3D-объектов над экспертными моделями, не использующими LLM. В экспериментах с 12 подходами на основе больших языковых моделей 3DGraphLLM также занял лидирующую позицию. Научная работа принята к публикации на конференции ICCV, а сама нейросетевая модель уже прошла апробацию на данных, собранных в Центре робототехники Сбера.

Arxiv | GitHub | HuggingFace | Хабр
Please open Telegram to view this post
VIEW IN TELEGRAM
46
Новый фреймворк сократит расходы на сбор и разметку данных для больших языковых моделей в 3 раза⤵️

Российская команда разработчиков из R&D-центра Т-Технологий, AIRI, Высшей школы экономики, университета «Иннополис» и Центра практического искусственного интеллекта Сбера создала ATGen — первый комплексный фреймворк, который существенно упрощает и удешевляет обучение больших языковых моделей для задач генерации текста. Он подходит в том числе для небольших команд и делает возможным разметку и сбор данных без больших бюджетов.

Фреймворк использует парадигму активного обучения, при которой сама модель на каждом этапе выбирает, какие новые примеры ей нужны для максимального роста точности. ATGen также предоставляет удобный веб-интерфейс для ручной разметки данных, инструменты для оценки моделей с помощью популярных метрик для генеративных задач, интеграции с большими языковыми моделями-«учителями», включая OpenAI и Anthropic, а также современные методы эффективного обучения и инференса моделей (PEFT, vLLM, Unsloth и других).

Исследование было представлено на конференции ACL 2025, которая прошла в Австрии. Подробнее — в материале ТАСС.

Научная статья | GitHub
Please open Telegram to view this post
VIEW IN TELEGRAM
47
Рассказываем про конференцию, которая пройдет в Казани 17 сентября ⤵️

Конференция «ИИ–ЗАМАН» станет отдельным научным треком на международном форуме Kazan Digital Week 2025.

Исследователи AIRI выступают кураторами трех направлений:
⚫️Андрей Кузнецов — Компьютерное зрение
⚫️Елена Тутубалина — Обработка естественного языка
⚫️Алексей Ковалёв — Воплощённый ИИ и робототехника


Подать статью можно до 20 августа  — публикации планируются в Springer LNCS и в журнале «Электронные библиотеки». Отобранные статьи будут также рекомендованы в журнал Optical Memory and Neural Networks. Подать можно как новые статьи, так и ранее опубликованные работы.

Подробнее про подачу статей — по ссылке.
Please open Telegram to view this post
VIEW IN TELEGRAM
25
Сегодня в офисе AIRI прошел интенсив «Кибербезопасность и устойчивость в эпоху ИИ»⤵️

Программа мероприятия была посвящена вопросам защиты ИИ-систем и обеспечения их устойчивости к современным киберугрозам. В рамках интенсива были представлены лекции с разбором практических кейсов, а также рассмотрены актуальные методы и результаты исследований на стыке кибербезопасности и искусственного интеллекта.

Спикерами были:
⚫️ML-инженер в VK, сооснователь платформы блокчейн-аналитики CherryPick Елизавета Лазарева

⚫️инженер-исследователь группы «Доверенные и безопасные интеллектуальные системы» AIRI Эльвир Каримов

⚫️аспират Сколтеха, дата-сайентист в компании «Наносемантика» Мария Вареца

⚫️патентный поверенный РФ, член Общественного совета Роспатента, руководитель направления по интеллектуальной собственности AIRI Вита Власова

⚫️младший научный сотрудник группы «Доверенные и безопасные интеллектуальные системы» AIRI Дмитрий Корж

⚫️кандидат физико-математических наук, ведущий научный сотрудник, руководитель группы «Доверенные и безопасные интеллектуальные системы» AIRI и лаборатории Safe AI Lab AIRI-МТУСИ Олег Рогов


Спасибо всем спикерам и слушателям за активное участие и живое обсуждение!
Please open Telegram to view this post
VIEW IN TELEGRAM
67
Новый пост на Хабре — про летнюю школу «Лето с AIRI» 2025 в Томске ⤵️

Анастасия Янке, студентка 2 курса направления «Информатика и вычислительная техника» в НИУ ВШЭ, делится впечатлениями об участии в летней школе по искусственному интеллекту, которая прошла на базе ТГУ.

В статье — взгляд участника на атмосферу, образовательную программу, лекции и проекты школы. А в конце — полезные советы тем, кто хочет попасть на «Лето с AIRI» в следующем году.

📎Читайте по ссылке.
Please open Telegram to view this post
VIEW IN TELEGRAM
44