ACL 2025 стартовала в Вене⤵️
В этом году на конференции широкая тематическая программа — от вычислительных социальных наук до распознавания речи. Заявлена и специальная тема: генерализация NLP-моделей.
Исследователи AIRI представляют 11 статей на основных треках конференции:
Вчера прошёл туториал по оценке неопределенностей для LLM в задачах генерации текста Uncertainty Quantification for Large Language Models, организованный исследователями AIRI. Учёные также планируют показать свои исследования на нескольких воркшопах.
Делимся фото с конференции!
В этом году на конференции широкая тематическая программа — от вычислительных социальных наук до распознавания речи. Заявлена и специальная тема: генерализация NLP-моделей.
Исследователи AIRI представляют 11 статей на основных треках конференции:
⚫️ AmbiK: Dataset of Ambiguous Tasks in Kitchen Environment⚫️ CLEAR: Character Unlearning in Textual and Visual Modalities⚫️ CrafText Benchmark: Advancing Language Grounding in Complex Multimodal Open-Ended World⚫️ Adaptive Retrieval Without Self-Knowledge? Bringing Uncertainty Back Home⚫️ BRIGHTER: BRIdging the Gap in Human-Annotated Textual Emotion Recognition Datasets for 28 Languages⚫️ Cramming 1568 Tokens into a Single Vector and Back Again: Exploring the Limits of Embedding Space Capacity⚫️ Feature-Level Insights into Artificial Text Detection with Sparse Autoencoders⚫️ Run LoRA Run: Faster and Lighter LoRA Implementations⚫️ HatePRISM: Policies, Platforms, and Research Integration. Advancing NLP for Hate Speech Proactive Mitigation⚫️ How to Compare Things Properly? A Study on Answering Comparative Questions using Argument Summarization⚫️ ATGen: A Framework for Active Text Generation
Вчера прошёл туториал по оценке неопределенностей для LLM в задачах генерации текста Uncertainty Quantification for Large Language Models, организованный исследователями AIRI. Учёные также планируют показать свои исследования на нескольких воркшопах.
Делимся фото с конференции!
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤53
Рассказываем про открытые вакансии в команду AIRI 💡
⚫️ AI Research Scientist для проекта реверс-инжиниринга 3D-объектов в группу «Пространственный интеллект»
⚫️ RL Researcher в лабораторию когнитивных систем искусственного интеллекта AIRI
⚫️ Researcher и Middle/Senior Data Scientist в группу «Дизайн новых материалов»
Узнать подробнее про вакансии и откликнуться можно на сайте. Подавайтесь и делитесь с теми, кому может быть актуально📌
#дайджест_вакансий
Узнать подробнее про вакансии и откликнуться можно на сайте. Подавайтесь и делитесь с теми, кому может быть актуально
#дайджест_вакансий
Please open Telegram to view this post
VIEW IN TELEGRAM
❤44
AIRI на WAIC 2025 в Шанхае ⤵️
Иван Оселедец, Андрей Кузнецов, Пэни Ли, Константин Яковлев, Евгений Бурнаев и Семен Буденный выступили на сессии международной конференции AI Journey и приняли участие в форсайт-сессии AI Horizons на крупнейшей AI-конференции Восточной Азии — WAIC 2025. На ней российские и китайские эксперты обсудили, куда движутся генеративные модели, как искусственный интеллект меняет бизнес и какие вызовы ждут индустрию.
На конференции исследователи AIRI представили сразу несколько разработок: медицинского AI-помощника, модели Vintix для анализа данных, CADrille для 3D-восстановления промышленных деталей, LLM microscope, генерацию изображений для e-commerce, видеоаналитику для ритейла и MAPF GPT для моделирования движения агентов.
На фотографиях — атмосфера мероприятия в Китае💡
Иван Оселедец, Андрей Кузнецов, Пэни Ли, Константин Яковлев, Евгений Бурнаев и Семен Буденный выступили на сессии международной конференции AI Journey и приняли участие в форсайт-сессии AI Horizons на крупнейшей AI-конференции Восточной Азии — WAIC 2025. На ней российские и китайские эксперты обсудили, куда движутся генеративные модели, как искусственный интеллект меняет бизнес и какие вызовы ждут индустрию.
На конференции исследователи AIRI представили сразу несколько разработок: медицинского AI-помощника, модели Vintix для анализа данных, CADrille для 3D-восстановления промышленных деталей, LLM microscope, генерацию изображений для e-commerce, видеоаналитику для ритейла и MAPF GPT для моделирования движения агентов.
На фотографиях — атмосфера мероприятия в Китае
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤66
Новый инструмент для проверки способностей роботов работать по неоднозначным инструкциям ⤵️
Исследователи AIRI и МФТИ при поддержке Центра робототехники Сбера представили набор данных AmbiK, созданный для оценки действий систем в неоднозначных условиях. Для этого авторы собрали текстовый датасет, включающий две тысячи задач с разметкой по типу неоднозначности для действий на кухне. Сейчас это самый большой набор данных в своей предметной области — существующие аналоги насчитывают лишь порядка 600 примеров.
Эксперименты с датасетом показали, что существующие алгоритмы пока недостаточно эффективно справляются с распознаванием ситуаций, требующих уточнения: даже лучшие модели демонстрируют успешный результат лишь в 20% случаев. Кроме того, AmbiK позволяет выяснить, на каком этапе плана возникает неопределённость.
Исследование было представлено на конференции ACL 2025 в Вене. Подробнее — в материале ТАСС.
Научная статья | GitHub
Исследователи AIRI и МФТИ при поддержке Центра робототехники Сбера представили набор данных AmbiK, созданный для оценки действий систем в неоднозначных условиях. Для этого авторы собрали текстовый датасет, включающий две тысячи задач с разметкой по типу неоднозначности для действий на кухне. Сейчас это самый большой набор данных в своей предметной области — существующие аналоги насчитывают лишь порядка 600 примеров.
Эксперименты с датасетом показали, что существующие алгоритмы пока недостаточно эффективно справляются с распознаванием ситуаций, требующих уточнения: даже лучшие модели демонстрируют успешный результат лишь в 20% случаев. Кроме того, AmbiK позволяет выяснить, на каком этапе плана возникает неопределённость.
Исследование было представлено на конференции ACL 2025 в Вене. Подробнее — в материале ТАСС.
Научная статья | GitHub
Please open Telegram to view this post
VIEW IN TELEGRAM
❤42
Сегодня рассказываем про новое технологическое партнерство ⤵️
IVA Technologies и лаборатория безопасного искусственного интеллекта SAIL AIRI-МТУСИ запускают тестирование метода Clarispeech для повышения точности распознавания речи в сервисах для коммуникаций.
Этот подход позволит значительно улучшить расшифровку звонков, учитывая эмоциональный окрас и профессиональную лексику, повысить качество аналитики разговоров и автоматизировать процессы на основе речевых команд в CRM. Компании также договорились о проведении совместной научно-исследовательской работы, что позволит углубить знания в области ИИ и его применения в корпоративных коммуникациях.
Рады начать совместную работу!
IVA Technologies и лаборатория безопасного искусственного интеллекта SAIL AIRI-МТУСИ запускают тестирование метода Clarispeech для повышения точности распознавания речи в сервисах для коммуникаций.
Этот подход позволит значительно улучшить расшифровку звонков, учитывая эмоциональный окрас и профессиональную лексику, повысить качество аналитики разговоров и автоматизировать процессы на основе речевых команд в CRM. Компании также договорились о проведении совместной научно-исследовательской работы, что позволит углубить знания в области ИИ и его применения в корпоративных коммуникациях.
Рады начать совместную работу!
Please open Telegram to view this post
VIEW IN TELEGRAM
❤27
Исследователи из AIRI и МФТИ создали новый метод, который расширяет возможности больших языковых моделей при работе с трехмерным пространством ⤵️
Существующие подходы представления 3D-сцены в LLM не позволяют учитывать семантические связи между объектами, что снижает их способность корректно решать задачи на понимание и описание, а также отвечать на вопросы про сцену. Новая архитектура, названная 3DGraphLLM, позволяет улавливать смысловые связи между объектами. Это положительно сказывается на качестве восприятия языковыми моделями трёхмерных сцен.
Предложенный метод демонстрирует значительное превосходство по качеству поиска 3D-объектов над экспертными моделями, не использующими LLM. В экспериментах с 12 подходами на основе больших языковых моделей 3DGraphLLM также занял лидирующую позицию. Научная работа принята к публикации на конференции ICCV, а сама нейросетевая модель уже прошла апробацию на данных, собранных в Центре робототехники Сбера.
Arxiv | GitHub | HuggingFace | Хабр
Существующие подходы представления 3D-сцены в LLM не позволяют учитывать семантические связи между объектами, что снижает их способность корректно решать задачи на понимание и описание, а также отвечать на вопросы про сцену. Новая архитектура, названная 3DGraphLLM, позволяет улавливать смысловые связи между объектами. Это положительно сказывается на качестве восприятия языковыми моделями трёхмерных сцен.
Предложенный метод демонстрирует значительное превосходство по качеству поиска 3D-объектов над экспертными моделями, не использующими LLM. В экспериментах с 12 подходами на основе больших языковых моделей 3DGraphLLM также занял лидирующую позицию. Научная работа принята к публикации на конференции ICCV, а сама нейросетевая модель уже прошла апробацию на данных, собранных в Центре робототехники Сбера.
Arxiv | GitHub | HuggingFace | Хабр
Please open Telegram to view this post
VIEW IN TELEGRAM
❤46
Новый фреймворк сократит расходы на сбор и разметку данных для больших языковых моделей в 3 раза⤵️
Российская команда разработчиков из R&D-центра Т-Технологий, AIRI, Высшей школы экономики, университета «Иннополис» и Центра практического искусственного интеллекта Сбера создала ATGen — первый комплексный фреймворк, который существенно упрощает и удешевляет обучение больших языковых моделей для задач генерации текста. Он подходит в том числе для небольших команд и делает возможным разметку и сбор данных без больших бюджетов.
Фреймворк использует парадигму активного обучения, при которой сама модель на каждом этапе выбирает, какие новые примеры ей нужны для максимального роста точности. ATGen также предоставляет удобный веб-интерфейс для ручной разметки данных, инструменты для оценки моделей с помощью популярных метрик для генеративных задач, интеграции с большими языковыми моделями-«учителями», включая OpenAI и Anthropic, а также современные методы эффективного обучения и инференса моделей (PEFT, vLLM, Unsloth и других).
Исследование было представлено на конференции ACL 2025, которая прошла в Австрии. Подробнее — в материале ТАСС.
Научная статья | GitHub
Российская команда разработчиков из R&D-центра Т-Технологий, AIRI, Высшей школы экономики, университета «Иннополис» и Центра практического искусственного интеллекта Сбера создала ATGen — первый комплексный фреймворк, который существенно упрощает и удешевляет обучение больших языковых моделей для задач генерации текста. Он подходит в том числе для небольших команд и делает возможным разметку и сбор данных без больших бюджетов.
Фреймворк использует парадигму активного обучения, при которой сама модель на каждом этапе выбирает, какие новые примеры ей нужны для максимального роста точности. ATGen также предоставляет удобный веб-интерфейс для ручной разметки данных, инструменты для оценки моделей с помощью популярных метрик для генеративных задач, интеграции с большими языковыми моделями-«учителями», включая OpenAI и Anthropic, а также современные методы эффективного обучения и инференса моделей (PEFT, vLLM, Unsloth и других).
Исследование было представлено на конференции ACL 2025, которая прошла в Австрии. Подробнее — в материале ТАСС.
Научная статья | GitHub
Please open Telegram to view this post
VIEW IN TELEGRAM
❤47
Рассказываем про конференцию, которая пройдет в Казани 17 сентября ⤵️
Конференция «ИИ–ЗАМАН» станет отдельным научным треком на международном форуме Kazan Digital Week 2025.
Исследователи AIRI выступают кураторами трех направлений:
Подать статью можно до 20 августа — публикации планируются в Springer LNCS и в журнале «Электронные библиотеки». Отобранные статьи будут также рекомендованы в журнал Optical Memory and Neural Networks. Подать можно как новые статьи, так и ранее опубликованные работы.
Подробнее про подачу статей — по ссылке.
Конференция «ИИ–ЗАМАН» станет отдельным научным треком на международном форуме Kazan Digital Week 2025.
Исследователи AIRI выступают кураторами трех направлений:
⚫️ Андрей Кузнецов — Компьютерное зрение⚫️ Елена Тутубалина — Обработка естественного языка⚫️ Алексей Ковалёв — Воплощённый ИИ и робототехника
Подать статью можно до 20 августа — публикации планируются в Springer LNCS и в журнале «Электронные библиотеки». Отобранные статьи будут также рекомендованы в журнал Optical Memory and Neural Networks. Подать можно как новые статьи, так и ранее опубликованные работы.
Подробнее про подачу статей — по ссылке.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤25
Сегодня в офисе AIRI прошел интенсив «Кибербезопасность и устойчивость в эпоху ИИ»⤵️
Программа мероприятия была посвящена вопросам защиты ИИ-систем и обеспечения их устойчивости к современным киберугрозам. В рамках интенсива были представлены лекции с разбором практических кейсов, а также рассмотрены актуальные методы и результаты исследований на стыке кибербезопасности и искусственного интеллекта.
Спикерами были:
Спасибо всем спикерам и слушателям за активное участие и живое обсуждение!
Программа мероприятия была посвящена вопросам защиты ИИ-систем и обеспечения их устойчивости к современным киберугрозам. В рамках интенсива были представлены лекции с разбором практических кейсов, а также рассмотрены актуальные методы и результаты исследований на стыке кибербезопасности и искусственного интеллекта.
Спикерами были:
⚫️ ML-инженер в VK, сооснователь платформы блокчейн-аналитики CherryPick Елизавета Лазарева⚫️ инженер-исследователь группы «Доверенные и безопасные интеллектуальные системы» AIRI Эльвир Каримов⚫️ аспират Сколтеха, дата-сайентист в компании «Наносемантика» Мария Вареца⚫️ патентный поверенный РФ, член Общественного совета Роспатента, руководитель направления по интеллектуальной собственности AIRI Вита Власова⚫️ младший научный сотрудник группы «Доверенные и безопасные интеллектуальные системы» AIRI Дмитрий Корж⚫️ кандидат физико-математических наук, ведущий научный сотрудник, руководитель группы «Доверенные и безопасные интеллектуальные системы» AIRI и лаборатории Safe AI Lab AIRI-МТУСИ Олег Рогов
Спасибо всем спикерам и слушателям за активное участие и живое обсуждение!
Please open Telegram to view this post
VIEW IN TELEGRAM
❤67
Новый пост на Хабре — про летнюю школу «Лето с AIRI» 2025 в Томске ⤵️
Анастасия Янке, студентка 2 курса направления «Информатика и вычислительная техника» в НИУ ВШЭ, делится впечатлениями об участии в летней школе по искусственному интеллекту, которая прошла на базе ТГУ.
В статье — взгляд участника на атмосферу, образовательную программу, лекции и проекты школы. А в конце — полезные советы тем, кто хочет попасть на «Лето с AIRI» в следующем году.
📎 Читайте по ссылке.
Анастасия Янке, студентка 2 курса направления «Информатика и вычислительная техника» в НИУ ВШЭ, делится впечатлениями об участии в летней школе по искусственному интеллекту, которая прошла на базе ТГУ.
В статье — взгляд участника на атмосферу, образовательную программу, лекции и проекты школы. А в конце — полезные советы тем, кто хочет попасть на «Лето с AIRI» в следующем году.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤44
Российские школьники завоевали 6 золотых, одну серебряную и одну бронзовую медали на Международной олимпиаде по искусственному интеллекту (IOAI) в Пекине⤵️
В мае на площадке СберУниверситета прошёл недельный интенсив для кандидатов в сборную России, на который съехалось более 150 школьников со всей страны. Его организовали Центральный университет, Альянс в сфере искусственного интеллекта и МФТИ. В числе спикеров были ведущие эксперты в области ИИ, в том числе генеральный директор AIRI Иван Оселедец и руководитель лаборатории искусственного интеллекта, анализа данных и моделирования Центрального университета и AIRI Александр Горбань.
Сегодня все лайки — поздравления медалистам!
В мае на площадке СберУниверситета прошёл недельный интенсив для кандидатов в сборную России, на который съехалось более 150 школьников со всей страны. Его организовали Центральный университет, Альянс в сфере искусственного интеллекта и МФТИ. В числе спикеров были ведущие эксперты в области ИИ, в том числе генеральный директор AIRI Иван Оселедец и руководитель лаборатории искусственного интеллекта, анализа данных и моделирования Центрального университета и AIRI Александр Горбань.
Сегодня все лайки — поздравления медалистам!
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤122
Делимся подборкой выступлений исследователей AIRI в ближайшие дни ⤵️
⚫️ 16 августа в 14:00 доктор физико-математических наук, профессор РАН, генеральный директор AIRI Иван Оселедец выступит на IT-Пикнике с лекцией «Эволюция мультимодальных и мультиагентных систем».
⚫️ 21 августа в 18:00 кандидат компьютерных наук, руководитель группы «Контролируемый генеративный ИИ» лаборатории FusionBrain AIRI, заведующий Центра глубинного обучения и байесовских методов ВШЭ Айбек Аланов представит доклад «Как эффективно контролировать генерацию диффузионных моделей?» на серии митапов от MWS AI (Центра искусственного интеллекта МТС) для CV-инженеров и исследователей D >< Vision.
До встречи!📌
В докладе будет рассказано о текущем состоянии исследований в области мультимодальных и мультиагентных систем, их эволюции и задачах, которые ещё предстоит решить научному сообществу.
На лекции будут рассматриваться ключевые подходы к повышению контролируемости, а также будут показаны результаты исследований команды, которая улучшила текущий подход и проанализировала его эффективность в различных аспектах, включая вычислительные затраты и качество результатов.
До встречи!
Please open Telegram to view this post
VIEW IN TELEGRAM
❤44
В новом Хабре рассказываем, какую роль играют «ага-моменты» в способности больших языковых моделей рассуждать ⤵️
Рассуждающие модели вроде DeepSeek‑R1, которая вышла в начале этого года, показывают впечатляющие результаты при анализе информации, формулировке выводов и принятии решений. Способность к рассуждению выражается в использовании ими человекоподобных фраз, например, "Wait", "Alternatively" и других — так называемых «ага-моментов».
Исследователи AIRI решили выяснить, какую роль такие слова играют в рефлексии, самопроверке и сомнениях LLM. Они спустились на уровень скрытых представлений модели и нашли механизмы, отвечающие за способность к рассуждению. Оказалось, что, усиливая нужные компоненты, можно заставить модель рассуждать глубже и точнее.
Младший научный сотрудник группы «Доверенные и безопасные интеллектуальные системы» AIRI и исследователь лаборатории Safe AI Lab AIRI-МТУСИ Андрей Галичин раскрыл подробности исследования в новой статье на Хабре.
📎 Читайте по ссылке.
Arxiv | GitHub
Рассуждающие модели вроде DeepSeek‑R1, которая вышла в начале этого года, показывают впечатляющие результаты при анализе информации, формулировке выводов и принятии решений. Способность к рассуждению выражается в использовании ими человекоподобных фраз, например, "Wait", "Alternatively" и других — так называемых «ага-моментов».
Исследователи AIRI решили выяснить, какую роль такие слова играют в рефлексии, самопроверке и сомнениях LLM. Они спустились на уровень скрытых представлений модели и нашли механизмы, отвечающие за способность к рассуждению. Оказалось, что, усиливая нужные компоненты, можно заставить модель рассуждать глубже и точнее.
Младший научный сотрудник группы «Доверенные и безопасные интеллектуальные системы» AIRI и исследователь лаборатории Safe AI Lab AIRI-МТУСИ Андрей Галичин раскрыл подробности исследования в новой статье на Хабре.
Arxiv | GitHub
Please open Telegram to view this post
VIEW IN TELEGRAM
❤70