Приглашаем на следующий #AIRI_Seminars, который пройдёт 5 ноября в 17:00
Тема: «Использование оценок внутренней размерности для понимания LLM и свойств текстов».
Докладчик: Владислав Педашенко, младший научный сотрудник, МГУ.
Оппонент: Айдар Булатов, научный сотрудник, Институт AIRI, исследователь МФТИ.
Подробное описание и регистрация на офлайн-формат на сайте.
YouTube | VK Видео
Тема: «Использование оценок внутренней размерности для понимания LLM и свойств текстов».
Докладчик: Владислав Педашенко, младший научный сотрудник, МГУ.
Оппонент: Айдар Булатов, научный сотрудник, Институт AIRI, исследователь МФТИ.
Подробное описание и регистрация на офлайн-формат на сайте.
YouTube | VK Видео
❤45
Создан бенчмарк для оценки качества химических языковых моделей 🔖
Учёные Института AIRI разработали инструмент для оценки эффективности нейросетевых языковых моделей в решении сложных химических задач. В отличие от простого извлечения фактов, современные химические LLM испытывают трудности с многоступенчатыми задачами, требующими последовательного логического рассуждения — например, определения продуктов реакции и оценки их свойств.
Новый бенчмарк, созданный на основе комбинации базовых химических задач, имитирует реальные рабочие процессы химиков при разработке лекарств и катализаторов. Исследование показало, что универсальные языковые модели дают содержательные ответы, но профильные химические LLM точнее в решении специализированных задач, хоть и уступают по формальным метрикам.
Исследование подготовили сотрудники группы органической химии центра ИИ-разработки лекарственных препаратов AIDD и группы «Прикладное NLP» под руководством Артура Кадурина и доктора компьютерных наук, старшего научного сотрудника ИСП РАН Елены Тутубалиной. Работа будет представлена на конференции EMNLP 2025.
📎 Подробности — в материале ТАСС.
Учёные Института AIRI разработали инструмент для оценки эффективности нейросетевых языковых моделей в решении сложных химических задач. В отличие от простого извлечения фактов, современные химические LLM испытывают трудности с многоступенчатыми задачами, требующими последовательного логического рассуждения — например, определения продуктов реакции и оценки их свойств.
Новый бенчмарк, созданный на основе комбинации базовых химических задач, имитирует реальные рабочие процессы химиков при разработке лекарств и катализаторов. Исследование показало, что универсальные языковые модели дают содержательные ответы, но профильные химические LLM точнее в решении специализированных задач, хоть и уступают по формальным метрикам.
Исследование подготовили сотрудники группы органической химии центра ИИ-разработки лекарственных препаратов AIDD и группы «Прикладное NLP» под руководством Артура Кадурина и доктора компьютерных наук, старшего научного сотрудника ИСП РАН Елены Тутубалиной. Работа будет представлена на конференции EMNLP 2025.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤59
О том, как устроены калькуляторы биологического возраста, и перспективах их применения — читайте в интервью для «Ъ-Науки» ⤵️
Дмитрий Крюков, PhD, руководитель группы исследования биомаркеров лаборатории «Сильный ИИ в медицине» Института AIRI, младший научный сотрудник Центра молекулярной и клеточной биологии Сколтеха, рассказывает:
⚫️ что такое биологический возраст и как точнее всего его измерить
⚫️ чем отличаются алгоритмы первого и второго поколения в определении биологического возраста
⚫️ как «часы старения» могут помочь в медицине: от раннего выявления заболеваний до оценки эффективности новых препаратов
⚫️ почему важно создавать международные стандарты и связывать биомаркеры с теорией старения
📎 Читайте материал по ссылке.
Дмитрий Крюков, PhD, руководитель группы исследования биомаркеров лаборатории «Сильный ИИ в медицине» Института AIRI, младший научный сотрудник Центра молекулярной и клеточной биологии Сколтеха, рассказывает:
Please open Telegram to view this post
VIEW IN TELEGRAM
❤34
Вчера в Китае завершилась конференция EMNLP 2025
Конференция по эмпирическим методам обработки естественного языка — одна из самых престижных в своей области. Здесь представляют доклады не только по диалоговым системам и распознаванию именованных сущностей, но и поднимают важные темы конфиденциальности ИИ, этики в компьютерной лингвистике и влияния больших языковых моделей на общество.
В этом году исследователи AIRI представили 12 научных статей на основном треке:
📎 Will It Still Be True Tomorrow? Multilingual Evergreen Question Classification to Improve Trustworthy QA
📎 LLM-Independent Adaptive RAG: Let the Question Speak for Itself
📎 Unconditional Truthfulness: Learning Unconditional Uncertainty of Large Language Models
📎 When Models Lie, We Learn: Multilingual Span-Level Hallucination Detection with PsiloQA
📎 When Punctuation Matters: A Large-Scale Comparison of Prompt Robustness Methods for LLMs
📎 RuCCoD: Towards Automated ICD Coding in Russian
📎 Two Steps from Hell: Compositionality on Chemical LMs
📎 A Head to Predict and a Head to Question: Pre-trained Uncertainty Quantification Heads for Hallucination Detection in LLM Outputs
📎 Exploring the Hidden Capacity of LLMs for One-Step Text Generation
📎 CLARITY: Clinical Assistant for Routing, Inference, and Triage
📎 Exploring Large Language Models for Detecting Mental Disorders
📎 Quantifying Logical Consistency in Transformers via Query-Key Alignment
И одну статью на воркшопе:
📎 Creation of the Russian PIQA Dataset: Technical Report
Делимся фото с конференции!
Конференция по эмпирическим методам обработки естественного языка — одна из самых престижных в своей области. Здесь представляют доклады не только по диалоговым системам и распознаванию именованных сущностей, но и поднимают важные темы конфиденциальности ИИ, этики в компьютерной лингвистике и влияния больших языковых моделей на общество.
В этом году исследователи AIRI представили 12 научных статей на основном треке:
И одну статью на воркшопе:
Делимся фото с конференции!
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤55
Новый датасет и алгоритмы помогут врачам кодировать диагнозы 🔖
Учёные Института AIRI совместно с Центром практического ИИ Сбера и Центром индустрии здоровья Сбербанка разработали систему автоматического кодирования диагнозов по Международной классификации болезней (МКБ). Новый тщательно размеченный датасет и алгоритмы позволяют точно сопоставлять диагнозы с корректными МКБ-кодами. После внедрения это позволит снизить административную нагрузку на врачей и улучшить качество медицинской статистики.
В группу исследователей от AIRI вошли доктор компьютерных наук, руководитель группы «Прикладное NLP», старший научный сотрудник ИСП РАН Елена Тутубалина, кандидат математических наук, старший научный сотрудник группы «Мультимодальные архитектуры ИИ» лаборатории «Сильный ИИ в медицине» Александр Нестеров, кандидат биологических наук, руководитель группы «Нейрокогнитивные архитектуры» Пётр Анохин и инженер-исследователь группы «Нейрокогнитивные архитектуры» Владимир Махарев.
Результаты исследования и инструменты опубликованы в открытом доступе и представлены на международной конференции EMNLP 2025.
Научная статья | GitHub | ТАСС
Учёные Института AIRI совместно с Центром практического ИИ Сбера и Центром индустрии здоровья Сбербанка разработали систему автоматического кодирования диагнозов по Международной классификации болезней (МКБ). Новый тщательно размеченный датасет и алгоритмы позволяют точно сопоставлять диагнозы с корректными МКБ-кодами. После внедрения это позволит снизить административную нагрузку на врачей и улучшить качество медицинской статистики.
В группу исследователей от AIRI вошли доктор компьютерных наук, руководитель группы «Прикладное NLP», старший научный сотрудник ИСП РАН Елена Тутубалина, кандидат математических наук, старший научный сотрудник группы «Мультимодальные архитектуры ИИ» лаборатории «Сильный ИИ в медицине» Александр Нестеров, кандидат биологических наук, руководитель группы «Нейрокогнитивные архитектуры» Пётр Анохин и инженер-исследователь группы «Нейрокогнитивные архитектуры» Владимир Махарев.
Результаты исследования и инструменты опубликованы в открытом доступе и представлены на международной конференции EMNLP 2025.
Научная статья | GitHub | ТАСС
Please open Telegram to view this post
VIEW IN TELEGRAM
❤37
Открыли приём заявок на участие в хакатоне AIRI, Академии наук Республики Татарстан и Kazan Digital Legends 🚀
«ИИ-ЗАМАН Хак» посвящён машинному обучению и обработке текстов. Участникам предстоит разработать алгоритмы детоксикации текстов на татарском языке — преобразовывать токсичные сообщения в нейтральные, сохраняя смысл. Подробнее про хакатон — в карточках.
Регистрируйтесь на сайте до 27 ноября, старт хакатона — 29 ноября, сдача решений — 30 ноября.
«ИИ-ЗАМАН Хак» посвящён машинному обучению и обработке текстов. Участникам предстоит разработать алгоритмы детоксикации текстов на татарском языке — преобразовывать токсичные сообщения в нейтральные, сохраняя смысл. Подробнее про хакатон — в карточках.
Регистрируйтесь на сайте до 27 ноября, старт хакатона — 29 ноября, сдача решений — 30 ноября.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤38
Международная конференция «Доверенный искусственный интеллект: Россия-Африка 2025» в Эфиопии
В Аддис-Абебе прошла первая международная конференция, посвящённая развитию доверенного и этичного ИИ в России и Африке. Организаторы — AIRI, МТУСИ, Аддис-Абебский университет и Эфиопский институт ИИ, при поддержке Россотрудничества и Русского дома.
Участники обсудили применение ИИ в здравоохранении, госуправлении, бизнесе и агропромышленности.
От AIRI с докладами выступили руководитель группы «Доверенные и безопасные интеллектуальные системы» и лаборатории безопасного искусственного интеллекта SAIL AIRI-МТУСИ Олег Рогов, руководитель группы «Цветовая вычислительная фотография» Егор Ершов и директор управления стратегического развития и партнёрств Максим Кузнецов.
В числе спикеров также были эксперты из МТУСИ, ИСП РАН и международных компаний, включая Amazon.
📎 Подробности — в материале.
В Аддис-Абебе прошла первая международная конференция, посвящённая развитию доверенного и этичного ИИ в России и Африке. Организаторы — AIRI, МТУСИ, Аддис-Абебский университет и Эфиопский институт ИИ, при поддержке Россотрудничества и Русского дома.
Участники обсудили применение ИИ в здравоохранении, госуправлении, бизнесе и агропромышленности.
От AIRI с докладами выступили руководитель группы «Доверенные и безопасные интеллектуальные системы» и лаборатории безопасного искусственного интеллекта SAIL AIRI-МТУСИ Олег Рогов, руководитель группы «Цветовая вычислительная фотография» Егор Ершов и директор управления стратегического развития и партнёрств Максим Кузнецов.
В числе спикеров также были эксперты из МТУСИ, ИСП РАН и международных компаний, включая Amazon.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤45