Исследователи AIRI на конференции NLDB 2025📷
С 4 по 6 июля в японском городе Канадзава прошла конференция NLDB 2025, посвящённая вопросам обработки естественного языка. Туда отправилось 6 исследователей из AIRI из команд «Вычислительная семантика» и «Прикладное NLP», включая руководителей групп: доктора компьютерных наук и старшего научного сотрудника ИСП РАН Елену Тутубалину и доктора компьютерных наук Александра Панченко. Они представили 3 устных доклада, а Елена выступила председателем одной из секций.
📎 Михаил Чайчук, Даниил Московский и Михаил Сальников поделились впечатлениями от поездки на Хабре, читайте по ссылке.
С 4 по 6 июля в японском городе Канадзава прошла конференция NLDB 2025, посвящённая вопросам обработки естественного языка. Туда отправилось 6 исследователей из AIRI из команд «Вычислительная семантика» и «Прикладное NLP», включая руководителей групп: доктора компьютерных наук и старшего научного сотрудника ИСП РАН Елену Тутубалину и доктора компьютерных наук Александра Панченко. Они представили 3 устных доклада, а Елена выступила председателем одной из секций.
Исследователи AIRI представили 3 статьи:
– Memory Efficient LM Compression Using Fisher Information from Low-Rank Representations
– ShortPathQA: A Dataset for Controllable Fusion of Large Language Models with Knowledge Graphs
– The Benefits of Query-Based KGQA Systems for Complex and Temporal Questions in LLM Era
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤39
12 сентября встречаемся на big tech night ⤵️
«Ночь музеев» в мире IT пройдёт в офисах Яндекса, Сбера, X5, Т-Банка и Lamoda. Вас ждут экскурсии в компании, знакомство с технологиями и экспозоны с премьерами новых решений. Кандидат технических наук, директор лаборатории FusionBrain AIRI Андрей Кузнецов выступит с докладом про автоматизацию процессов через LLM и мультиагентные сценарии.
📌 Регистрация и программа на сайте.
«Ночь музеев» в мире IT пройдёт в офисах Яндекса, Сбера, X5, Т-Банка и Lamoda. Вас ждут экскурсии в компании, знакомство с технологиями и экспозоны с премьерами новых решений. Кандидат технических наук, директор лаборатории FusionBrain AIRI Андрей Кузнецов выступит с докладом про автоматизацию процессов через LLM и мультиагентные сценарии.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤37
Запускаем рубрику #best_papers, в которой мы будем делиться статьями, отмеченными особым статусом на различных конференциях ⤵️
Сегодня рассказываем про статьи с ACL 2025, соавтором которых выступил руководитель группы «Вычислительная семантика» AIRI и руководитель группы NLP в Сколтехе Александр Панченко:
⚫️ Статус Best Resource Paper получила статья BRIGHTER: BRIdging the Gap in Human-Annotated Textual Emotion Recognition Datasets for 28 Languages. В ней представлен новый датасет с аннотациями эмоций на 28 различных языках.
⚫️ В рамках воркшопа SemEval-2025 конференции ACL статус Best Task Award выиграла статья SemEval-2025 Task 11: Bridging the Gap in Text-Based Emotion Detection. Её авторы представили задачу по распознаванию эмоций по тексту, охватывающую более 30 языков из семи различных языковых семей.
Сегодня все лайки — поздравления авторам!
Сегодня рассказываем про статьи с ACL 2025, соавтором которых выступил руководитель группы «Вычислительная семантика» AIRI и руководитель группы NLP в Сколтехе Александр Панченко:
Сегодня все лайки — поздравления авторам!
Please open Telegram to view this post
VIEW IN TELEGRAM
❤73
Открываем прием заявок на этическую экспертизу биомедицинских исследований с применением ИИ⤵️
В проектах на стыке медицины и искусственного интеллекта важно обеспечить безопасность участников и соответствие международным этическим нормам. Независимый этический комитет AIRI оценивает такие исследования, помогая авторам повысить качество работ и соответствовать требованиям научных журналов.
Подать заявку могут исследователи, медики, аспиранты, авторы публикаций, а также организации-спонсоры через ответственных исполнителей.
Рассматриваются:
⚫️ проекты с участием человека и технологий ИИ;
⚫️ работы с использованием данных о здоровье (публикации, диссертации);
⚫️ исследования анализа биоматериалов с помощью ИИ.
Инструкция по подаче заявки — на сайте.
В проектах на стыке медицины и искусственного интеллекта важно обеспечить безопасность участников и соответствие международным этическим нормам. Независимый этический комитет AIRI оценивает такие исследования, помогая авторам повысить качество работ и соответствовать требованиям научных журналов.
Подать заявку могут исследователи, медики, аспиранты, авторы публикаций, а также организации-спонсоры через ответственных исполнителей.
Рассматриваются:
Инструкция по подаче заявки — на сайте.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤36
Из Монреаля в Гуанчжоу ✈️
На выходных закончилась дополнительная часть 34-й Международной объединенной конференции по искусственному интеллекту IJCAI 2025, которая прошла в Китае. Как и первая часть, которая прошла в Канаде неделей ранее, это мероприятие было посвящено широкому спектру вопросов, связанных с ИИ.
Институт AIRI в Гуанчжоу представляли научный сотрудник группы «Обучаемый интеллект» Артём Сорокин, руководитель группы «Нейрокогнитивные архитектуры» Пётр Анохин, старший научный сотрудник группы «Мультимодальные архитектуры ИИ» Александр Нестеров, доктор физико-математических наук, ведущий научный сотрудник AIRI, руководитель Центра искусственного интеллекта Сколтеха Евгений Бурнаев, младший научный сотрудник группы «Мультимодальные архитектуры ИИ» Владимир Шапошников и инженер-исследователь группы «Автономное зрение» Булат Габдуллин.
Больше научной атмосферы — на фото📷
На выходных закончилась дополнительная часть 34-й Международной объединенной конференции по искусственному интеллекту IJCAI 2025, которая прошла в Китае. Как и первая часть, которая прошла в Канаде неделей ранее, это мероприятие было посвящено широкому спектру вопросов, связанных с ИИ.
Институт AIRI в Гуанчжоу представляли научный сотрудник группы «Обучаемый интеллект» Артём Сорокин, руководитель группы «Нейрокогнитивные архитектуры» Пётр Анохин, старший научный сотрудник группы «Мультимодальные архитектуры ИИ» Александр Нестеров, доктор физико-математических наук, ведущий научный сотрудник AIRI, руководитель Центра искусственного интеллекта Сколтеха Евгений Бурнаев, младший научный сотрудник группы «Мультимодальные архитектуры ИИ» Владимир Шапошников и инженер-исследователь группы «Автономное зрение» Булат Габдуллин.
Больше научной атмосферы — на фото
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤47
Все лекции и семинары «Лето с AIRI 2025» теперь в открытом доступе 🔥
Собрали для вас записи выступлений ведущих исследователей и экспертов — от фундаментальных вопросов искусственного интеллекта до практических примеров его применения в науке и индустрии.
📎 Сохраняйте ссылки на плейлисты: VK Видео, YouTube
Собрали для вас записи выступлений ведущих исследователей и экспертов — от фундаментальных вопросов искусственного интеллекта до практических примеров его применения в науке и индустрии.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤69
Новая модель для генерации белковых молекул в 100 раз компактнее аналогов, при этом превосходит их в эффективности 👍
Машинное обучение открыло дорогу к более эффективному предсказанию аминокислотных последовательностей, которые могли бы обеспечить необходимые свойства белков. Обычно для этого применяют авторегрессионные подходы или дискретную диффузию, но существующие решения требуют большого размера моделей и огромного количества данных для обучения.
Ученые из Института AIRI и немецкого Constructor University предложили новую модель под названием DiMA, которая опирается на непрерывные представления белков и латентную диффузию. Эксперименты, проведённые авторами, показали, что DiMA генерирует белки с качеством, не уступающим таковому у моделей с миллиардами параметров, являясь при этом гораздо более компактной.
Статья с подробным описанием новой модели была представлена на конференции ICML 2025. Подробнее читайте в материале ТАСС.
Научная статья | GitHub
Машинное обучение открыло дорогу к более эффективному предсказанию аминокислотных последовательностей, которые могли бы обеспечить необходимые свойства белков. Обычно для этого применяют авторегрессионные подходы или дискретную диффузию, но существующие решения требуют большого размера моделей и огромного количества данных для обучения.
Ученые из Института AIRI и немецкого Constructor University предложили новую модель под названием DiMA, которая опирается на непрерывные представления белков и латентную диффузию. Эксперименты, проведённые авторами, показали, что DiMA генерирует белки с качеством, не уступающим таковому у моделей с миллиардами параметров, являясь при этом гораздо более компактной.
Статья с подробным описанием новой модели была представлена на конференции ICML 2025. Подробнее читайте в материале ТАСС.
Научная статья | GitHub
Please open Telegram to view this post
VIEW IN TELEGRAM
❤53
В свежем посте на Хабре Никита Драгунов из группы «Интерпретируемый ИИ» лаборатории FusionBrain AIRI рассказывает про новый способ обучения авторегрессионных LCM — SONAR-LLM⤵️
Современные большие языковые модели умеют создавать связные тексты, но делают это в потокенном режиме. Следствием этого является квадратичный рост вычислительной сложности с длиной текста и проблемы с пониманием глобальной структуры документа.
Одной из попыток справиться с этим стал предложенный в прошлом году подход на основе LCM (Large Concept Models), в котором от генерации токенов модели переходят к генерации целых предложений. Несмотря на интересную идею, авторегрессионная реализация LCM показала слабые результаты.
Исследователи из группы «Интерпретируемый ИИ» придумали способ улучшить такие модели, и назвали свой подход SONAR-LLM. С помощью серии экспериментов они показали, что генерация на уровне предложений вполне способна стать альтернативой традиционным LLM.
Научная статья | GitHub | Хабр
Современные большие языковые модели умеют создавать связные тексты, но делают это в потокенном режиме. Следствием этого является квадратичный рост вычислительной сложности с длиной текста и проблемы с пониманием глобальной структуры документа.
Одной из попыток справиться с этим стал предложенный в прошлом году подход на основе LCM (Large Concept Models), в котором от генерации токенов модели переходят к генерации целых предложений. Несмотря на интересную идею, авторегрессионная реализация LCM показала слабые результаты.
Исследователи из группы «Интерпретируемый ИИ» придумали способ улучшить такие модели, и назвали свой подход SONAR-LLM. С помощью серии экспериментов они показали, что генерация на уровне предложений вполне способна стать альтернативой традиционным LLM.
Научная статья | GitHub | Хабр
Please open Telegram to view this post
VIEW IN TELEGRAM
❤40
Сегодня делимся подборкой выступлений исследователей AIRI на этой неделе ⤵️
⚫️ 10 сентября в 18:40 Илья Макаров, PhD, ведущий научный сотрудник, руководитель группы «ИИ в промышленности» AIRI, выступит с докладом «GNN для транзакционных моделей в банках» на Data.Meetup. Регистрация открыта по ссылке.
⚫️ Также завтра, 10 сентября, пройдет AIRI Seminars в нашем офисе в Сити. Кандидат философских наук, доцент философского факультета МГУ, научный сотрудник Московского центра исследования сознания Антон Кузнецов прочитает лекцию о сознании искусственного интеллекта. Оппонентом выступит Пётр Анохин, кандидат биологических наук, руководитель группы «Нейрокогнитивные архитектуры» AIRI. Не забудьте пройти регистрацию, если планируете быть на семинаре очно.
⚫️ 12 сентября кандидат технических наук, директор лаборатории FusionBrain AIRI Андрей Кузнецов выступит с докладом про автоматизацию процессов через LLM и мультиагентные сценарии на big tech night. Подробная программа мероприятия на сайте.
Увидимся!💡
Увидимся!
Please open Telegram to view this post
VIEW IN TELEGRAM
❤36
Исследователи AIRI и Сколтеха создали первую в мире открытую платформу для объективного сравнения алгоритмов определения биологического возраста человека — так называемых «часов старения» ⤵️
Работа объединила крупнейший в мире открытый набор данных по метилированию ДНК и стандартизированную методологию оценки, что впервые позволило системно сравнить разные модели, для которых раньше не было единого эталона.
В исследовании были протестированы 13 ведущих моделей «часов старения» на основе унифицированного набора из более чем 17 000 образцов. По итогам сравнения лучшей была признана модель PhenoAge второго поколения (созданная под руководством Морган Левин, Йельский университет*), второе место заняла разработка GrimAge (Стив Хорват, Калифорнийский университет).
Биологические часы имеют широкую практическую ценность. Они могут использоваться для оценки эффективности антивозрастных препаратов, кластеризации пациентов по рискам заболеваний, мониторинга здоровья в клинических исследованиях, а также встраиваются в носимые устройства для расчета «индекса здоровья». Платформа и собранный массив данных с открытой лицензией (Creative Commons). Это позволяет исследователям со всего мира свободно использовать, проверять и совершенствовать инструменты для подсчета биологического возраста.
Подробнее читайте в материале Компьютерры.
Научная статья | GitHub | Hugging Face
*Йельский университет (США) — организация, деятельность которой признана нежелательной на территории России.
Работа объединила крупнейший в мире открытый набор данных по метилированию ДНК и стандартизированную методологию оценки, что впервые позволило системно сравнить разные модели, для которых раньше не было единого эталона.
В исследовании были протестированы 13 ведущих моделей «часов старения» на основе унифицированного набора из более чем 17 000 образцов. По итогам сравнения лучшей была признана модель PhenoAge второго поколения (созданная под руководством Морган Левин, Йельский университет*), второе место заняла разработка GrimAge (Стив Хорват, Калифорнийский университет).
Биологические часы имеют широкую практическую ценность. Они могут использоваться для оценки эффективности антивозрастных препаратов, кластеризации пациентов по рискам заболеваний, мониторинга здоровья в клинических исследованиях, а также встраиваются в носимые устройства для расчета «индекса здоровья». Платформа и собранный массив данных с открытой лицензией (Creative Commons). Это позволяет исследователям со всего мира свободно использовать, проверять и совершенствовать инструменты для подсчета биологического возраста.
Подробнее читайте в материале Компьютерры.
Научная статья | GitHub | Hugging Face
*Йельский университет (США) — организация, деятельность которой признана нежелательной на территории России.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤43
На этой неделе проходит конференция CLEF-2025 в Мадриде ⤵️
16-я по счёту конференция серии, которая посвящена планомерной оценке и улучшению систем доступа к информации, длилась четыре дня: с 9 по 12 сентября. В её рамках прошло несколько прикладных треков — воркшопов и лабораторий — в которых приняли участие наши исследователи.
⚫️ Руководитель группы «Вычислительная семантика» в AIRI и группы NLP в Сколтехе, доктор компьютерных наук Александр Панченко и его коллеги из Германии, Испании, Индии, Франции, Италии, Израиля, Эфиопии, ОАЭ в рамках лаборатории PAN подготовили задачу и датасет по мультиязычной детоксификации текстов, который включает в себя тексты на русском и татарском языках.
⚫️ Руководитель группы «Прикладное NLP» в AIRI, доктор компьютерных наук и старший научный сотрудник ИСП РАН Елена Тутубалина вместе с коллегами организовали соревнование BioNNE-L по нормализации биомедицинских именованных сущностей, которое является частью воркшопа BioASQ. Воркшоп сделан совместно с коллегами из Греции, Испании, США и Италии.
Больше атмосферы CLEF 2025 — на фото💡
16-я по счёту конференция серии, которая посвящена планомерной оценке и улучшению систем доступа к информации, длилась четыре дня: с 9 по 12 сентября. В её рамках прошло несколько прикладных треков — воркшопов и лабораторий — в которых приняли участие наши исследователи.
Больше атмосферы CLEF 2025 — на фото
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤45
Forwarded from N + 1
За несколько десятилетий в машинном обучении появился целый пласт цифрового фольклора. Некоторые мемы мгновенно превратились в своеобразные тесты качества для нейросетей — например, брейнрот с Уиллом Смитом, уплетающим спагетти. Другие же просто стали частью культурного кода ML-инженеров — среди них фото модели из Playboy или заголовок «Attention Is All You Need».
Научный писатель AIRI и наш постоянный автор, физик-теоретик Марат Хамадеев, вспоминает историю легендарных мемов, о которых наверняка слышал любой исследователь ИИ. Из этого материала вы узнаете, кого называют первой леди интернета, а кого — человеком, который изобрел все
#IT | *2.9
Научный писатель AIRI и наш постоянный автор, физик-теоретик Марат Хамадеев, вспоминает историю легендарных мемов, о которых наверняка слышал любой исследователь ИИ. Из этого материала вы узнаете, кого называют первой леди интернета, а кого — человеком, который изобрел все
#IT | *2.9
❤38