Издательство Elsevier опубликовало новую базу данных по публикационной активности самых успешных учёных мира 🔖
База содержит ключевые показатели: количество публикаций, число цитирований, индекс Хирша с учётом и без учёта самоцитирования, а также производные параметры. На основе этих данных каждому учёному присваивается ранг в общем рейтинге и в рейтинге по научным областям. База охватывает топ-2% исследователей по этим показателям в мире.
В этом году в этот список от AIRI были включены:
⚫️ доктор физико-математических наук, профессор РАН, генеральный директор AIRI Иван Оселедец — 35 977-е место в общем рейтинге и 790-е в области Artificial Intelligence & Image Processing
⚫️ доктор физико-математических наук, ведущий научный сотрудник AIRI, руководитель Центра искусственного интеллекта Сколтеха Евгений Бурнаев — 340 211-е место в общем рейтинге и 7 813-е в области Artificial Intelligence & Image Processing
Поздравляем коллег с этим достижением!🎁
База содержит ключевые показатели: количество публикаций, число цитирований, индекс Хирша с учётом и без учёта самоцитирования, а также производные параметры. На основе этих данных каждому учёному присваивается ранг в общем рейтинге и в рейтинге по научным областям. База охватывает топ-2% исследователей по этим показателям в мире.
В этом году в этот список от AIRI были включены:
Поздравляем коллег с этим достижением!
Please open Telegram to view this post
VIEW IN TELEGRAM
❤131
В эти выходные исследователи AIRI выступят на международном фестивале «Наука 0+» 💡
📆 11 октября, 16:00–17:00
Лекция «ИИ-агенты»
Ярослав Беспалов, руководитель группы «Мультимодальные архитектуры ИИ» лаборатории «Сильный ИИ в медицине» Института AIRI
ИИ-агенты — интеллектуальные системы, которые самостоятельно взаимодействуют с окружающей средой, принимают решения и обучаются. Как они устроены? Чем отличаются от традиционных алгоритмов? Какие перспективы открываются в разных сферах?
Где: Кампус Центрального университета, ул. Гашека, 7 стр.1
Регистрация
📆 12 октября, 12:15–13:15
Лекция «На пути к сильному ИИ»
Иван Оселедец, доктор физико-математических наук, профессор РАН, генеральный директор Института AIRI
Большие языковые модели уже решают сложные задачи и доказывают теоремы, но порой совершают ошибки. В лекции — обзор современных подходов к развитию сильного ИИ: рассуждения, мультиагентные системы, эволюция, а также главные вызовы, которые ещё предстоит преодолеть.
Где: Фундаментальная библиотека МГУ, Ломоносовский проспект, 27
Вход свободный или трансляция
📎 Подробная программа фестиваля — на сайте.
Лекция «ИИ-агенты»
Ярослав Беспалов, руководитель группы «Мультимодальные архитектуры ИИ» лаборатории «Сильный ИИ в медицине» Института AIRI
ИИ-агенты — интеллектуальные системы, которые самостоятельно взаимодействуют с окружающей средой, принимают решения и обучаются. Как они устроены? Чем отличаются от традиционных алгоритмов? Какие перспективы открываются в разных сферах?
Где: Кампус Центрального университета, ул. Гашека, 7 стр.1
Регистрация
Лекция «На пути к сильному ИИ»
Иван Оселедец, доктор физико-математических наук, профессор РАН, генеральный директор Института AIRI
Большие языковые модели уже решают сложные задачи и доказывают теоремы, но порой совершают ошибки. В лекции — обзор современных подходов к развитию сильного ИИ: рассуждения, мультиагентные системы, эволюция, а также главные вызовы, которые ещё предстоит преодолеть.
Где: Фундаментальная библиотека МГУ, Ломоносовский проспект, 27
Вход свободный или трансляция
Please open Telegram to view this post
VIEW IN TELEGRAM
❤30
Новый метод TLG позволяет выявлять нелепые изображения с точностью до 87,5% 🔖
Команда исследователей из группы «Вычислительная семантика» AIRI, Сколтеха, MWS AI и МФТИ представила инновационный подход к одной из сложных задач компьютерного зрения — определению того, нарушает ли изображение здравый смысл.
Люди мгновенно замечают нелепости на картинках, например, рыцаря с мобильным телефоном или пингвина на велосипеде. Искусственному интеллекту это даётся гораздо сложнее: существующие системы распознают объекты, но не всегда понимают их совместимость в рамках здравого смысла.
Новый метод TLG(Through the Looking Glass, «Сквозь зеркало» или «В Зазеркалье» — это отсылка к повести «Алиса в Зазеркалье» Льюиса Кэрролла) предлагает не анализировать само изображение, а исследовать, как большие мультимодальные языково-визуальные модели описывают картинку текстом. Противоречия и галлюцинации в таких описаниях указывают на «странность» изображения.
Для тестов учёные создали масштабный датасет WEIRD — 824 изображения с нелепыми ситуациями, значительно расширивший ранее использовавшийся в сообществе датасет WHOOPS!. Метод TLG превосходит более сложные и ресурсоёмкие системы, достигая до 87,5% точности.
Научная статья | Хабр | Известия
Команда исследователей из группы «Вычислительная семантика» AIRI, Сколтеха, MWS AI и МФТИ представила инновационный подход к одной из сложных задач компьютерного зрения — определению того, нарушает ли изображение здравый смысл.
Люди мгновенно замечают нелепости на картинках, например, рыцаря с мобильным телефоном или пингвина на велосипеде. Искусственному интеллекту это даётся гораздо сложнее: существующие системы распознают объекты, но не всегда понимают их совместимость в рамках здравого смысла.
Новый метод TLG
Для тестов учёные создали масштабный датасет WEIRD — 824 изображения с нелепыми ситуациями, значительно расширивший ранее использовавшийся в сообществе датасет WHOOPS!. Метод TLG превосходит более сложные и ресурсоёмкие системы, достигая до 87,5% точности.
Научная статья | Хабр | Известия
Please open Telegram to view this post
VIEW IN TELEGRAM
❤52
В Сеуле прошла конференция Conference on Robot Learning (CoRL) 2025
CoRL — одна из ведущих международных площадок для обмена знаниями и опытом по обучению роботов с помощью методов машинного обучения. В этом году Институт AIRI был представлен Владиславом Куренковым, руководителем группы «Адаптивные агенты», и тремя специалистами из группы «Воплощенные агенты» лаборатории когнитивных систем искусственного интеллекта: старшим научным сотрудником Алексеем Староверовым, младшим научным сотрудником Егором Черепановым и инженером-исследователем Никитой Качаевым.
Представленные статьи:
📎 ELMUR: External Layer Memory with Update/Rewrite for Long-Horizon RL
📎 Memory, Benchmark & Robots: A Benchmark for Solving Complex Tasks with Reinforcement Learning
📎 Unraveling the Complexity of Memory in RL Agents: an Approach for Classification and Evaluation
📎 Dynamic Neural Potential Field: Online Trajectory Optimization in the Presence of Moving Obstacles
📎 Transition From Offline to Online Reinforcement Learning for Robotic Manipulation with Transformer-Based Models (появится в открытом доступе позже)
📎 Vision-Language Models Unlock Task-Centric Latent Actions
Делимся фото из Сеула!
CoRL — одна из ведущих международных площадок для обмена знаниями и опытом по обучению роботов с помощью методов машинного обучения. В этом году Институт AIRI был представлен Владиславом Куренковым, руководителем группы «Адаптивные агенты», и тремя специалистами из группы «Воплощенные агенты» лаборатории когнитивных систем искусственного интеллекта: старшим научным сотрудником Алексеем Староверовым, младшим научным сотрудником Егором Черепановым и инженером-исследователем Никитой Качаевым.
Представленные статьи:
Делимся фото из Сеула!
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤62
Приглашаем на следующий #AIRI_Seminars, который пройдёт 22 октября в 17:00
Тема: «AlphaEvolve на практике: обзор и практические выводы».
Докладчик: Валентин Хрульков, PhD, руководитель группы «Генеративное проектирование», Лаборатория FusionBrain Института AIRI.
Оппонент: Даниил Гаврилов, руководитель T-Bank AI Research.
Подробное описание и регистрация на офлайн-формат на сайте.
YouTube | VK Видео
Тема: «AlphaEvolve на практике: обзор и практические выводы».
Докладчик: Валентин Хрульков, PhD, руководитель группы «Генеративное проектирование», Лаборатория FusionBrain Института AIRI.
Оппонент: Даниил Гаврилов, руководитель T-Bank AI Research.
Подробное описание и регистрация на офлайн-формат на сайте.
YouTube | VK Видео
❤64
Искусственный интеллект научился переводить древнеегипетские иероглифы 🔖
Группа учёных Института AIRI, ИСП РАН и ИТМО под руководством PhD, ведущего научного сотрудника Ильи Макарова создала систему, которая распознаёт и переводит древнеегипетские иероглифы с высокой точностью. Основой для обучения модели стал “Thesaurus Linguae Aegyptiae”— самое полное собрание древнеегипетских текстов с переводами. Сначала применялись автоматические метрики, затем тексты оценивали профессиональные египтологи из НИУ ВШЭ.
Распознавание иероглифов — сложная задача: вместо алфавита из 30-40 букв система должна «понимать» сотни похожих символов с уникальным значением. Для повышения точности ученые использовали контекстуальные OCR-модели и диффузионные модели, генерирующие реалистичные изображения для расширения обучающего набора.
В ходе проекта создаются новые технологии распознавания рукописных текстов, которые востребованы при создании и обогащении больших языковых моделей в условиях недостатка данных. В перспективе разработку можно будет использовать, например, в мобильных приложениях дополненной реальности.
Разработка уже представлена на международных конференциях SIGGRAPH 2025 и IEEE ISMAR, а несколько научных статей приняты к публикации на ведущих конференциях уровня A*. Система доступна по запросу для специалистов.
📎 Подробности – в материале РИА Новостей.
Группа учёных Института AIRI, ИСП РАН и ИТМО под руководством PhD, ведущего научного сотрудника Ильи Макарова создала систему, которая распознаёт и переводит древнеегипетские иероглифы с высокой точностью. Основой для обучения модели стал “Thesaurus Linguae Aegyptiae”— самое полное собрание древнеегипетских текстов с переводами. Сначала применялись автоматические метрики, затем тексты оценивали профессиональные египтологи из НИУ ВШЭ.
Распознавание иероглифов — сложная задача: вместо алфавита из 30-40 букв система должна «понимать» сотни похожих символов с уникальным значением. Для повышения точности ученые использовали контекстуальные OCR-модели и диффузионные модели, генерирующие реалистичные изображения для расширения обучающего набора.
В ходе проекта создаются новые технологии распознавания рукописных текстов, которые востребованы при создании и обогащении больших языковых моделей в условиях недостатка данных. В перспективе разработку можно будет использовать, например, в мобильных приложениях дополненной реальности.
Разработка уже представлена на международных конференциях SIGGRAPH 2025 и IEEE ISMAR, а несколько научных статей приняты к публикации на ведущих конференциях уровня A*. Система доступна по запросу для специалистов.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤78
Подробнее о новом бенчмарке для проверки долгосрочного планирования LLM в виртуальных RPG-мирaх — в блоге AIRI на Хабре ⤵️
HeroBench — это бенчмарк, выросший из студенческого проекта школы «Лето с AIRI». Основанный на MMORPG-песочнице Artifacts, он проверяет способность больших языковых моделей к сложному многошаговому планированию и выполнению комплексных задач в виртуальной среде.
Ведущий научный сотрудник, руководитель группы «Нейрокогнитивные архитектуры» Института AIRI Пётр Анохин и команда создали адаптированную версию среды, где агенты выполняют задачи по сбору ресурсов, крафту предметов и сражениям с монстрами. В тестировании приняли участие 25 открытых и проприетарных моделей, включая Gemini 2.5-Pro, Claude-4, Grok-4 и GPT-5. Это позволило определить, на какие современные LLM можно полагаться при планировании сложных процессов.
Команда, начавшая работу над бенчмарком ещё на школе: Роман Халиков, Сбер AGI NLP, МГУ, Виктор Волков, ТГУ и Стефан Ребриков, НИЦ Курчатовский институт, ВШЭ.
📎 Читайте по ссылке.
HeroBench — это бенчмарк, выросший из студенческого проекта школы «Лето с AIRI». Основанный на MMORPG-песочнице Artifacts, он проверяет способность больших языковых моделей к сложному многошаговому планированию и выполнению комплексных задач в виртуальной среде.
Ведущий научный сотрудник, руководитель группы «Нейрокогнитивные архитектуры» Института AIRI Пётр Анохин и команда создали адаптированную версию среды, где агенты выполняют задачи по сбору ресурсов, крафту предметов и сражениям с монстрами. В тестировании приняли участие 25 открытых и проприетарных моделей, включая Gemini 2.5-Pro, Claude-4, Grok-4 и GPT-5. Это позволило определить, на какие современные LLM можно полагаться при планировании сложных процессов.
Команда, начавшая работу над бенчмарком ещё на школе: Роман Халиков, Сбер AGI NLP, МГУ, Виктор Волков, ТГУ и Стефан Ребриков, НИЦ Курчатовский институт, ВШЭ.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤40
«Холодный старт» в рекомендательных системах требует нового подхода 🔖
Учёные Института AIRI сформулировали новый вызов в развитии рекомендательных систем — отсутствие единого подхода к выбору порога «холодного старта».
Анализ статей за последние 3 года на конференции RecSys показал: лишь 10% исследователей объясняют смысл фильтрации датасетов, и ни один не раскрывает обоснование выбранного порога.
Эффект «холодного старта» возникает, когда в системе появляется пользователь или товар с недостаточным числом взаимодействий. Правильный выбор порога фильтрации — ключ к качественным рекомендациям и корректным научным выводам. Сегодня чаще всего используют «5-core» фильтрацию (не менее 5 взаимодействий), но это решение часто принимается «на глаз».
Исследователи AIRI предложили методику автоматического определения оптимального порога, анализируя влияние числа взаимодействий на качество рекомендаций. Они протестировали популярные алгоритмы — SASRec, PureSVD, ItemKNN, EASER — на четырёх разнообразных датасетах (фильмы, косметика, искусство, пиво). Результаты показали, что оптимальный порог зависит от задачи и модели: например, SASRec требует в три раза больше взаимодействий, чем классические методы. Для честной оценки и воспроизводимости результатов важно обосновывать выбор порогов и использовать единые параметры фильтрации при сравнении моделей.
Работа была представлена на ведущей конференции ACM RecSys.
Научная статья | ТАСС
Учёные Института AIRI сформулировали новый вызов в развитии рекомендательных систем — отсутствие единого подхода к выбору порога «холодного старта».
Анализ статей за последние 3 года на конференции RecSys показал: лишь 10% исследователей объясняют смысл фильтрации датасетов, и ни один не раскрывает обоснование выбранного порога.
Эффект «холодного старта» возникает, когда в системе появляется пользователь или товар с недостаточным числом взаимодействий. Правильный выбор порога фильтрации — ключ к качественным рекомендациям и корректным научным выводам. Сегодня чаще всего используют «5-core» фильтрацию (не менее 5 взаимодействий), но это решение часто принимается «на глаз».
Исследователи AIRI предложили методику автоматического определения оптимального порога, анализируя влияние числа взаимодействий на качество рекомендаций. Они протестировали популярные алгоритмы — SASRec, PureSVD, ItemKNN, EASER — на четырёх разнообразных датасетах (фильмы, косметика, искусство, пиво). Результаты показали, что оптимальный порог зависит от задачи и модели: например, SASRec требует в три раза больше взаимодействий, чем классические методы. Для честной оценки и воспроизводимости результатов важно обосновывать выбор порогов и использовать единые параметры фильтрации при сравнении моделей.
Работа была представлена на ведущей конференции ACM RecSys.
Научная статья | ТАСС
Please open Telegram to view this post
VIEW IN TELEGRAM
❤27
В Тэджоне прошла конференция IEEE International Symposium on Mixed and Augmented Reality (ISMAR) 2025
ISMAR — одна из ведущих международных площадок для обмена знаниями и опытом в области смешанной и дополненной реальности. Конференция собирает исследователей и практиков, которые представляют новейшие разработки в технологиях визуализации, взаимодействия и применения AR/VR в разных сферах.
В этом году Институт AIRI представлял Иннокентий Хумонен, научный сотрудник группы «ИИ в промышленности». Он представил статью “Automatic Image Translation of Long Ancient Egyptian Texts for Augmented Reality Applications”. Про результаты этого проекта мы рассказывали ранее.
Делимся фото из Южной Кореи!
ISMAR — одна из ведущих международных площадок для обмена знаниями и опытом в области смешанной и дополненной реальности. Конференция собирает исследователей и практиков, которые представляют новейшие разработки в технологиях визуализации, взаимодействия и применения AR/VR в разных сферах.
В этом году Институт AIRI представлял Иннокентий Хумонен, научный сотрудник группы «ИИ в промышленности». Он представил статью “Automatic Image Translation of Long Ancient Egyptian Texts for Augmented Reality Applications”. Про результаты этого проекта мы рассказывали ранее.
Делимся фото из Южной Кореи!
❤47