AIRI на WAIC 2025 в Шанхае ⤵️
Иван Оселедец, Андрей Кузнецов, Пэни Ли, Константин Яковлев, Евгений Бурнаев и Семен Буденный выступили на сессии международной конференции AI Journey и приняли участие в форсайт-сессии AI Horizons на крупнейшей AI-конференции Восточной Азии — WAIC 2025. На ней российские и китайские эксперты обсудили, куда движутся генеративные модели, как искусственный интеллект меняет бизнес и какие вызовы ждут индустрию.
На конференции исследователи AIRI представили сразу несколько разработок: медицинского AI-помощника, модели Vintix для анализа данных, CADrille для 3D-восстановления промышленных деталей, LLM microscope, генерацию изображений для e-commerce, видеоаналитику для ритейла и MAPF GPT для моделирования движения агентов.
На фотографиях — атмосфера мероприятия в Китае💡
Иван Оселедец, Андрей Кузнецов, Пэни Ли, Константин Яковлев, Евгений Бурнаев и Семен Буденный выступили на сессии международной конференции AI Journey и приняли участие в форсайт-сессии AI Horizons на крупнейшей AI-конференции Восточной Азии — WAIC 2025. На ней российские и китайские эксперты обсудили, куда движутся генеративные модели, как искусственный интеллект меняет бизнес и какие вызовы ждут индустрию.
На конференции исследователи AIRI представили сразу несколько разработок: медицинского AI-помощника, модели Vintix для анализа данных, CADrille для 3D-восстановления промышленных деталей, LLM microscope, генерацию изображений для e-commerce, видеоаналитику для ритейла и MAPF GPT для моделирования движения агентов.
На фотографиях — атмосфера мероприятия в Китае
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤66
Новый инструмент для проверки способностей роботов работать по неоднозначным инструкциям ⤵️
Исследователи AIRI и МФТИ при поддержке Центра робототехники Сбера представили набор данных AmbiK, созданный для оценки действий систем в неоднозначных условиях. Для этого авторы собрали текстовый датасет, включающий две тысячи задач с разметкой по типу неоднозначности для действий на кухне. Сейчас это самый большой набор данных в своей предметной области — существующие аналоги насчитывают лишь порядка 600 примеров.
Эксперименты с датасетом показали, что существующие алгоритмы пока недостаточно эффективно справляются с распознаванием ситуаций, требующих уточнения: даже лучшие модели демонстрируют успешный результат лишь в 20% случаев. Кроме того, AmbiK позволяет выяснить, на каком этапе плана возникает неопределённость.
Исследование было представлено на конференции ACL 2025 в Вене. Подробнее — в материале ТАСС.
Научная статья | GitHub
Исследователи AIRI и МФТИ при поддержке Центра робототехники Сбера представили набор данных AmbiK, созданный для оценки действий систем в неоднозначных условиях. Для этого авторы собрали текстовый датасет, включающий две тысячи задач с разметкой по типу неоднозначности для действий на кухне. Сейчас это самый большой набор данных в своей предметной области — существующие аналоги насчитывают лишь порядка 600 примеров.
Эксперименты с датасетом показали, что существующие алгоритмы пока недостаточно эффективно справляются с распознаванием ситуаций, требующих уточнения: даже лучшие модели демонстрируют успешный результат лишь в 20% случаев. Кроме того, AmbiK позволяет выяснить, на каком этапе плана возникает неопределённость.
Исследование было представлено на конференции ACL 2025 в Вене. Подробнее — в материале ТАСС.
Научная статья | GitHub
Please open Telegram to view this post
VIEW IN TELEGRAM
❤42
Сегодня рассказываем про новое технологическое партнерство ⤵️
IVA Technologies и лаборатория безопасного искусственного интеллекта SAIL AIRI-МТУСИ запускают тестирование метода Clarispeech для повышения точности распознавания речи в сервисах для коммуникаций.
Этот подход позволит значительно улучшить расшифровку звонков, учитывая эмоциональный окрас и профессиональную лексику, повысить качество аналитики разговоров и автоматизировать процессы на основе речевых команд в CRM. Компании также договорились о проведении совместной научно-исследовательской работы, что позволит углубить знания в области ИИ и его применения в корпоративных коммуникациях.
Рады начать совместную работу!
IVA Technologies и лаборатория безопасного искусственного интеллекта SAIL AIRI-МТУСИ запускают тестирование метода Clarispeech для повышения точности распознавания речи в сервисах для коммуникаций.
Этот подход позволит значительно улучшить расшифровку звонков, учитывая эмоциональный окрас и профессиональную лексику, повысить качество аналитики разговоров и автоматизировать процессы на основе речевых команд в CRM. Компании также договорились о проведении совместной научно-исследовательской работы, что позволит углубить знания в области ИИ и его применения в корпоративных коммуникациях.
Рады начать совместную работу!
Please open Telegram to view this post
VIEW IN TELEGRAM
❤27
Исследователи из AIRI и МФТИ создали новый метод, который расширяет возможности больших языковых моделей при работе с трехмерным пространством ⤵️
Существующие подходы представления 3D-сцены в LLM не позволяют учитывать семантические связи между объектами, что снижает их способность корректно решать задачи на понимание и описание, а также отвечать на вопросы про сцену. Новая архитектура, названная 3DGraphLLM, позволяет улавливать смысловые связи между объектами. Это положительно сказывается на качестве восприятия языковыми моделями трёхмерных сцен.
Предложенный метод демонстрирует значительное превосходство по качеству поиска 3D-объектов над экспертными моделями, не использующими LLM. В экспериментах с 12 подходами на основе больших языковых моделей 3DGraphLLM также занял лидирующую позицию. Научная работа принята к публикации на конференции ICCV, а сама нейросетевая модель уже прошла апробацию на данных, собранных в Центре робототехники Сбера.
Arxiv | GitHub | HuggingFace | Хабр
Существующие подходы представления 3D-сцены в LLM не позволяют учитывать семантические связи между объектами, что снижает их способность корректно решать задачи на понимание и описание, а также отвечать на вопросы про сцену. Новая архитектура, названная 3DGraphLLM, позволяет улавливать смысловые связи между объектами. Это положительно сказывается на качестве восприятия языковыми моделями трёхмерных сцен.
Предложенный метод демонстрирует значительное превосходство по качеству поиска 3D-объектов над экспертными моделями, не использующими LLM. В экспериментах с 12 подходами на основе больших языковых моделей 3DGraphLLM также занял лидирующую позицию. Научная работа принята к публикации на конференции ICCV, а сама нейросетевая модель уже прошла апробацию на данных, собранных в Центре робототехники Сбера.
Arxiv | GitHub | HuggingFace | Хабр
Please open Telegram to view this post
VIEW IN TELEGRAM
❤46
Новый фреймворк сократит расходы на сбор и разметку данных для больших языковых моделей в 3 раза⤵️
Российская команда разработчиков из R&D-центра Т-Технологий, AIRI, Высшей школы экономики, университета «Иннополис» и Центра практического искусственного интеллекта Сбера создала ATGen — первый комплексный фреймворк, который существенно упрощает и удешевляет обучение больших языковых моделей для задач генерации текста. Он подходит в том числе для небольших команд и делает возможным разметку и сбор данных без больших бюджетов.
Фреймворк использует парадигму активного обучения, при которой сама модель на каждом этапе выбирает, какие новые примеры ей нужны для максимального роста точности. ATGen также предоставляет удобный веб-интерфейс для ручной разметки данных, инструменты для оценки моделей с помощью популярных метрик для генеративных задач, интеграции с большими языковыми моделями-«учителями», включая OpenAI и Anthropic, а также современные методы эффективного обучения и инференса моделей (PEFT, vLLM, Unsloth и других).
Исследование было представлено на конференции ACL 2025, которая прошла в Австрии. Подробнее — в материале ТАСС.
Научная статья | GitHub
Российская команда разработчиков из R&D-центра Т-Технологий, AIRI, Высшей школы экономики, университета «Иннополис» и Центра практического искусственного интеллекта Сбера создала ATGen — первый комплексный фреймворк, который существенно упрощает и удешевляет обучение больших языковых моделей для задач генерации текста. Он подходит в том числе для небольших команд и делает возможным разметку и сбор данных без больших бюджетов.
Фреймворк использует парадигму активного обучения, при которой сама модель на каждом этапе выбирает, какие новые примеры ей нужны для максимального роста точности. ATGen также предоставляет удобный веб-интерфейс для ручной разметки данных, инструменты для оценки моделей с помощью популярных метрик для генеративных задач, интеграции с большими языковыми моделями-«учителями», включая OpenAI и Anthropic, а также современные методы эффективного обучения и инференса моделей (PEFT, vLLM, Unsloth и других).
Исследование было представлено на конференции ACL 2025, которая прошла в Австрии. Подробнее — в материале ТАСС.
Научная статья | GitHub
Please open Telegram to view this post
VIEW IN TELEGRAM
❤47
Рассказываем про конференцию, которая пройдет в Казани 17 сентября ⤵️
Конференция «ИИ–ЗАМАН» станет отдельным научным треком на международном форуме Kazan Digital Week 2025.
Исследователи AIRI выступают кураторами трех направлений:
Подать статью можно до 20 августа — публикации планируются в Springer LNCS и в журнале «Электронные библиотеки». Отобранные статьи будут также рекомендованы в журнал Optical Memory and Neural Networks. Подать можно как новые статьи, так и ранее опубликованные работы.
Подробнее про подачу статей — по ссылке.
Конференция «ИИ–ЗАМАН» станет отдельным научным треком на международном форуме Kazan Digital Week 2025.
Исследователи AIRI выступают кураторами трех направлений:
⚫️ Андрей Кузнецов — Компьютерное зрение⚫️ Елена Тутубалина — Обработка естественного языка⚫️ Алексей Ковалёв — Воплощённый ИИ и робототехника
Подать статью можно до 20 августа — публикации планируются в Springer LNCS и в журнале «Электронные библиотеки». Отобранные статьи будут также рекомендованы в журнал Optical Memory and Neural Networks. Подать можно как новые статьи, так и ранее опубликованные работы.
Подробнее про подачу статей — по ссылке.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤25
Сегодня в офисе AIRI прошел интенсив «Кибербезопасность и устойчивость в эпоху ИИ»⤵️
Программа мероприятия была посвящена вопросам защиты ИИ-систем и обеспечения их устойчивости к современным киберугрозам. В рамках интенсива были представлены лекции с разбором практических кейсов, а также рассмотрены актуальные методы и результаты исследований на стыке кибербезопасности и искусственного интеллекта.
Спикерами были:
Спасибо всем спикерам и слушателям за активное участие и живое обсуждение!
Программа мероприятия была посвящена вопросам защиты ИИ-систем и обеспечения их устойчивости к современным киберугрозам. В рамках интенсива были представлены лекции с разбором практических кейсов, а также рассмотрены актуальные методы и результаты исследований на стыке кибербезопасности и искусственного интеллекта.
Спикерами были:
⚫️ ML-инженер в VK, сооснователь платформы блокчейн-аналитики CherryPick Елизавета Лазарева⚫️ инженер-исследователь группы «Доверенные и безопасные интеллектуальные системы» AIRI Эльвир Каримов⚫️ аспират Сколтеха, дата-сайентист в компании «Наносемантика» Мария Вареца⚫️ патентный поверенный РФ, член Общественного совета Роспатента, руководитель направления по интеллектуальной собственности AIRI Вита Власова⚫️ младший научный сотрудник группы «Доверенные и безопасные интеллектуальные системы» AIRI Дмитрий Корж⚫️ кандидат физико-математических наук, ведущий научный сотрудник, руководитель группы «Доверенные и безопасные интеллектуальные системы» AIRI и лаборатории Safe AI Lab AIRI-МТУСИ Олег Рогов
Спасибо всем спикерам и слушателям за активное участие и живое обсуждение!
Please open Telegram to view this post
VIEW IN TELEGRAM
❤67
Новый пост на Хабре — про летнюю школу «Лето с AIRI» 2025 в Томске ⤵️
Анастасия Янке, студентка 2 курса направления «Информатика и вычислительная техника» в НИУ ВШЭ, делится впечатлениями об участии в летней школе по искусственному интеллекту, которая прошла на базе ТГУ.
В статье — взгляд участника на атмосферу, образовательную программу, лекции и проекты школы. А в конце — полезные советы тем, кто хочет попасть на «Лето с AIRI» в следующем году.
📎 Читайте по ссылке.
Анастасия Янке, студентка 2 курса направления «Информатика и вычислительная техника» в НИУ ВШЭ, делится впечатлениями об участии в летней школе по искусственному интеллекту, которая прошла на базе ТГУ.
В статье — взгляд участника на атмосферу, образовательную программу, лекции и проекты школы. А в конце — полезные советы тем, кто хочет попасть на «Лето с AIRI» в следующем году.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤44
Российские школьники завоевали 6 золотых, одну серебряную и одну бронзовую медали на Международной олимпиаде по искусственному интеллекту (IOAI) в Пекине⤵️
В мае на площадке СберУниверситета прошёл недельный интенсив для кандидатов в сборную России, на который съехалось более 150 школьников со всей страны. Его организовали Центральный университет, Альянс в сфере искусственного интеллекта и МФТИ. В числе спикеров были ведущие эксперты в области ИИ, в том числе генеральный директор AIRI Иван Оселедец и руководитель лаборатории искусственного интеллекта, анализа данных и моделирования Центрального университета и AIRI Александр Горбань.
Сегодня все лайки — поздравления медалистам!
В мае на площадке СберУниверситета прошёл недельный интенсив для кандидатов в сборную России, на который съехалось более 150 школьников со всей страны. Его организовали Центральный университет, Альянс в сфере искусственного интеллекта и МФТИ. В числе спикеров были ведущие эксперты в области ИИ, в том числе генеральный директор AIRI Иван Оселедец и руководитель лаборатории искусственного интеллекта, анализа данных и моделирования Центрального университета и AIRI Александр Горбань.
Сегодня все лайки — поздравления медалистам!
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤122
Делимся подборкой выступлений исследователей AIRI в ближайшие дни ⤵️
⚫️ 16 августа в 14:00 доктор физико-математических наук, профессор РАН, генеральный директор AIRI Иван Оселедец выступит на IT-Пикнике с лекцией «Эволюция мультимодальных и мультиагентных систем».
⚫️ 21 августа в 18:00 кандидат компьютерных наук, руководитель группы «Контролируемый генеративный ИИ» лаборатории FusionBrain AIRI, заведующий Центра глубинного обучения и байесовских методов ВШЭ Айбек Аланов представит доклад «Как эффективно контролировать генерацию диффузионных моделей?» на серии митапов от MWS AI (Центра искусственного интеллекта МТС) для CV-инженеров и исследователей D >< Vision.
До встречи!📌
В докладе будет рассказано о текущем состоянии исследований в области мультимодальных и мультиагентных систем, их эволюции и задачах, которые ещё предстоит решить научному сообществу.
На лекции будут рассматриваться ключевые подходы к повышению контролируемости, а также будут показаны результаты исследований команды, которая улучшила текущий подход и проанализировала его эффективность в различных аспектах, включая вычислительные затраты и качество результатов.
До встречи!
Please open Telegram to view this post
VIEW IN TELEGRAM
❤44
В новом Хабре рассказываем, какую роль играют «ага-моменты» в способности больших языковых моделей рассуждать ⤵️
Рассуждающие модели вроде DeepSeek‑R1, которая вышла в начале этого года, показывают впечатляющие результаты при анализе информации, формулировке выводов и принятии решений. Способность к рассуждению выражается в использовании ими человекоподобных фраз, например, "Wait", "Alternatively" и других — так называемых «ага-моментов».
Исследователи AIRI решили выяснить, какую роль такие слова играют в рефлексии, самопроверке и сомнениях LLM. Они спустились на уровень скрытых представлений модели и нашли механизмы, отвечающие за способность к рассуждению. Оказалось, что, усиливая нужные компоненты, можно заставить модель рассуждать глубже и точнее.
Младший научный сотрудник группы «Доверенные и безопасные интеллектуальные системы» AIRI и исследователь лаборатории Safe AI Lab AIRI-МТУСИ Андрей Галичин раскрыл подробности исследования в новой статье на Хабре.
📎 Читайте по ссылке.
Arxiv | GitHub
Рассуждающие модели вроде DeepSeek‑R1, которая вышла в начале этого года, показывают впечатляющие результаты при анализе информации, формулировке выводов и принятии решений. Способность к рассуждению выражается в использовании ими человекоподобных фраз, например, "Wait", "Alternatively" и других — так называемых «ага-моментов».
Исследователи AIRI решили выяснить, какую роль такие слова играют в рефлексии, самопроверке и сомнениях LLM. Они спустились на уровень скрытых представлений модели и нашли механизмы, отвечающие за способность к рассуждению. Оказалось, что, усиливая нужные компоненты, можно заставить модель рассуждать глубже и точнее.
Младший научный сотрудник группы «Доверенные и безопасные интеллектуальные системы» AIRI и исследователь лаборатории Safe AI Lab AIRI-МТУСИ Андрей Галичин раскрыл подробности исследования в новой статье на Хабре.
Arxiv | GitHub
Please open Telegram to view this post
VIEW IN TELEGRAM
❤70
В мае на Startup Village мы подписали соглашение о сотрудничестве с Фондом Сколково по инициативам платформы ProGenAI ⤵️
В рамках этого проекта Фондом было проведено исследование внедрения генеративного ИИ в различных отраслях промышленности. Было изучено свыше 150 кейсов применения GenAI зарубежными и российскими компаниями в различных сферах, а также проанализированы практики внедрения российских LLM.
Согласно исследованию, несмотря на стремительный рост GenAI в других секторах, промышленность демонстрирует сдержанный подход. Технология активно апробируется передовыми компаниями, и в ближайшие 1-2 года ожидается переход первых успешных внедрений в практику промышленной эксплуатации.
Подробный отчет — по ссылке📎
В рамках этого проекта Фондом было проведено исследование внедрения генеративного ИИ в различных отраслях промышленности. Было изучено свыше 150 кейсов применения GenAI зарубежными и российскими компаниями в различных сферах, а также проанализированы практики внедрения российских LLM.
Согласно исследованию, несмотря на стремительный рост GenAI в других секторах, промышленность демонстрирует сдержанный подход. Технология активно апробируется передовыми компаниями, и в ближайшие 1-2 года ожидается переход первых успешных внедрений в практику промышленной эксплуатации.
Подробный отчет — по ссылке
Please open Telegram to view this post
VIEW IN TELEGRAM
❤24
Привет из Нидерландов! В Роттердаме стартовала Interspeech 2025 ⤵️
Конференции серии Interspeech посвящены речевым технологиям, обработке естественного языка и смежным с ними дисциплинам.
Институт представляют сотрудники группы «Доверенные и безопасные интеллектуальные системы»: стажёр-исследователь Эльвир Каримов, младший научный сотрудник Дмитрий Корж и руководитель группы, ведущий научный сотрудник, руководитель лаборатории Safe AI Lab AIRI-МТУСИ Олег Рогов. Также исследование представляет один из авторов, ведущий исследователь данных в команде Kandinsky в Sber AI Александр Варламов.
Исследователи представили статью Novel Loss-Enhanced Universal Adversarial Patches for Sustainable Speaker Privacy. В ней описана новая функция потерь, а также приведены экспериментальные подтверждения теоретических гарантий создания универсальных и переносимых атак с контролируемым уровнем искажения сигнала.
Делимся фотографиями с конференции📌
*организация Meta признана экстремистской, и ее деятельность запрещена на территории РФ
Конференции серии Interspeech посвящены речевым технологиям, обработке естественного языка и смежным с ними дисциплинам.
Институт представляют сотрудники группы «Доверенные и безопасные интеллектуальные системы»: стажёр-исследователь Эльвир Каримов, младший научный сотрудник Дмитрий Корж и руководитель группы, ведущий научный сотрудник, руководитель лаборатории Safe AI Lab AIRI-МТУСИ Олег Рогов. Также исследование представляет один из авторов, ведущий исследователь данных в команде Kandinsky в Sber AI Александр Варламов.
Исследователи представили статью Novel Loss-Enhanced Universal Adversarial Patches for Sustainable Speaker Privacy. В ней описана новая функция потерь, а также приведены экспериментальные подтверждения теоретических гарантий создания универсальных и переносимых атак с контролируемым уровнем искажения сигнала.
Делимся фотографиями с конференции
*организация Meta признана экстремистской, и ее деятельность запрещена на территории РФ
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤99
С началом осени возвращаемся к регулярным научным семинарам #AIRI_Seminars — раз в две недели по средам ⤵️
10 сентября в 17:00 кандидат философских наук, доцент философского факультета МГУ, научный сотрудник Московского центра исследования сознания Антон Кузнецов прочитает лекцию о сознании искусственного интеллекта — теме вдвойне сложной, поскольку до сих пор не существует ни полноценной теории сознания, ни ясного понимания принципов работы ИИ-систем. Несмотря на это, размышления о возможности искусственного сознания продолжаются: в лекции будут рассмотрены как основания для его принципиальной реализуемости, так и препятствия, мешающие сегодня определённо высказываться на этот счёт.
Оппонентом выступит Пётр Анохин, кандидат биологических наук, руководитель группы «Нейрокогнитивные архитектуры» AIRI.
📌 Регистрация на семинар на сайте.
VK Видео | YouTube
10 сентября в 17:00 кандидат философских наук, доцент философского факультета МГУ, научный сотрудник Московского центра исследования сознания Антон Кузнецов прочитает лекцию о сознании искусственного интеллекта — теме вдвойне сложной, поскольку до сих пор не существует ни полноценной теории сознания, ни ясного понимания принципов работы ИИ-систем. Несмотря на это, размышления о возможности искусственного сознания продолжаются: в лекции будут рассмотрены как основания для его принципиальной реализуемости, так и препятствия, мешающие сегодня определённо высказываться на этот счёт.
Оппонентом выступит Пётр Анохин, кандидат биологических наук, руководитель группы «Нейрокогнитивные архитектуры» AIRI.
VK Видео | YouTube
Please open Telegram to view this post
VIEW IN TELEGRAM
❤53