Forwarded from Ivan Oseledets’ Channel
Вчера завершилась наша традиционная четырёхдневная научная отчётная сессия AIRI. Это важное событие, где все — от младших сотрудников до руководителей лабораторий — поделились итогами года и планами на будущее. За это время прошло 53 устных доклада и представлено 198 постеров.
Отмечу, что уровень подготовки у ребят заметно вырос — узнал много нового и интересного. Тим-лиды и их команды подошли к сессии очень серьёзно и подготовились на высоком уровне.
Это не просто отчёт — это внутренняя площадка для обмена идеями и опытом, для создания новых связей между командами. Именно такой формат помогает расти, развиваться и двигаться вперёд.
Главная цель сессии — не только показать достижения, но и открыто говорить о сложностях и вызовах, с которыми сталкиваемся. Только честный диалог и тесное взаимодействие позволяют находить лучшие решения.
Спасибо всем за активное участие и вклад в общее дело!
Отмечу, что уровень подготовки у ребят заметно вырос — узнал много нового и интересного. Тим-лиды и их команды подошли к сессии очень серьёзно и подготовились на высоком уровне.
Это не просто отчёт — это внутренняя площадка для обмена идеями и опытом, для создания новых связей между командами. Именно такой формат помогает расти, развиваться и двигаться вперёд.
Главная цель сессии — не только показать достижения, но и открыто говорить о сложностях и вызовах, с которыми сталкиваемся. Только честный диалог и тесное взаимодействие позволяют находить лучшие решения.
Спасибо всем за активное участие и вклад в общее дело!
1❤🔥27❤11👏5👍4🏆4
Forwarded from AbstractDL
OLMo 3
Это, пожалуй, самый честный и воспроизводимый релиз года. Тут выкатили вообще всё: от исходного кода и 6T токенов (Dolma 3) до каждого промежуточного чекпоинта и точного порядка данных в батчах.
Для тех, кто занимается ресёрчем, это не просто модель, а идеальный полигон для экспериментов.
В техрепорте много «вкусного» (и спорного):
- Delta-DPO: Авторы подтвердили гипотезу, что для ризонинга важнее не качество выбранного ответа, а дельта между ним и отвергнутым. Они брали ответы от Qwen-3 32B (chosen) и сталкивали их с ответами мелкой Qwen-3 0.6B (rejected). Да, выходит off-policy, но видимо когда данных дофига, то норм. Результат: обучение на контрасте между ними работает лучше, чем классическое SFT на идеальных данных.
- OlmoRL: Они переписали инфру для RLVR, разогнав её в 4 раза. Из крутых фишек — Inflight updates (обновление весов акторов прямо во время генерации в vLLM) и Active sampling (динамический добор задач в батч, чтобы градиент не занулялся на слишком простых примерах). KL-дивергенцию из лосса просто выкинули — говорят, так стабильнее.
- Model Souping: Почти на каждом этапе (мидтрейн, лонг-контекст) авторы мерджили чекпоинты налево и направо. Выглядит так, будто основной рецепт обучения всё ещё не супер стабилен, и его приходится полировать различными костылями.
По метрикам флагманская 32B-Think получилась сильно перекошенной в математику. В ризонинге на MATH и AIME приближается к Qwen-3 32B. Но на общих знаниях (MMLU) модель немного проседает. Думаю, ценность тут не в SOTA цифрах, а в возможности увидеть весь цикл обучения изнутри.
Обучение 32B модели заняло 56 дней на кластере из 1024xH100 и обошлось примерно в $2.75M. Почти 9 дней из этого срока ушло на пост-трейнинг (SFT/DPO/RL).
Статья, GitHub
Это, пожалуй, самый честный и воспроизводимый релиз года. Тут выкатили вообще всё: от исходного кода и 6T токенов (Dolma 3) до каждого промежуточного чекпоинта и точного порядка данных в батчах.
Для тех, кто занимается ресёрчем, это не просто модель, а идеальный полигон для экспериментов.
В техрепорте много «вкусного» (и спорного):
- Delta-DPO: Авторы подтвердили гипотезу, что для ризонинга важнее не качество выбранного ответа, а дельта между ним и отвергнутым. Они брали ответы от Qwen-3 32B (chosen) и сталкивали их с ответами мелкой Qwen-3 0.6B (rejected). Да, выходит off-policy, но видимо когда данных дофига, то норм. Результат: обучение на контрасте между ними работает лучше, чем классическое SFT на идеальных данных.
- OlmoRL: Они переписали инфру для RLVR, разогнав её в 4 раза. Из крутых фишек — Inflight updates (обновление весов акторов прямо во время генерации в vLLM) и Active sampling (динамический добор задач в батч, чтобы градиент не занулялся на слишком простых примерах). KL-дивергенцию из лосса просто выкинули — говорят, так стабильнее.
- Model Souping: Почти на каждом этапе (мидтрейн, лонг-контекст) авторы мерджили чекпоинты налево и направо. Выглядит так, будто основной рецепт обучения всё ещё не супер стабилен, и его приходится полировать различными костылями.
По метрикам флагманская 32B-Think получилась сильно перекошенной в математику. В ризонинге на MATH и AIME приближается к Qwen-3 32B. Но на общих знаниях (MMLU) модель немного проседает. Думаю, ценность тут не в SOTA цифрах, а в возможности увидеть весь цикл обучения изнутри.
Обучение 32B модели заняло 56 дней на кластере из 1024xH100 и обошлось примерно в $2.75M. Почти 9 дней из этого срока ушло на пост-трейнинг (SFT/DPO/RL).
Статья, GitHub
1❤🔥12👍5🔥5❤1
Forwarded from Институт AIRI
О том, как российские учёные создали открытую систему GigaEvo для решения сложных математических задач — читайте в интервью для «Ъ-Науки» ⤵️
Валентин Хрульков, руководитель научной группы «Генеративное проектирование» лаборатории FusionBrain Института AIRI, рассказывает:
⚫️ что такое эволюционные алгоритмы и почему они важны для науки
⚫️ как GigaEvo помогает автоматизировать доказательство теорем
⚫️ почему языковые модели не решают задачи напрямую, а учатся вместе с алгоритмами
⚫️ какие вызовы стоят перед разработчиками и пользователями таких систем
📎 Читайте материал по ссылке.
Валентин Хрульков, руководитель научной группы «Генеративное проектирование» лаборатории FusionBrain Института AIRI, рассказывает:
Please open Telegram to view this post
VIEW IN TELEGRAM
1🔥14❤6🏆2
Forwarded from MaRi Hub
Минус суета, плюс праздник: новогодние промпты🎄
До Нового года осталось совсем чуть-чуть, а дел — как будто ещё на один месяц вперёд: подарки, поздравления, меню, планы, итоги года…
Полезные промпты, которые помогут быстрее ощутить атмосферу празника без хлопот.
ВЫБОР ПОДАРКОВ🎁
(если прогонять промпт в ChatGPT в режиме "Исследование покупок" — результат бустится кратно)
ГОТОВИМ ПРАЗДНИЧНЫЙ СТОЛ🫐
ПЛАНИРУЕМ ЯНВАРСКИЕ🛷
ПОДВОДИМ ИТОГИ И СТРОИМ ПЛАНЫ 🎯
+ Чтобы не банально поздравить близких, сделайте для них персонализированную открытку🎆
Загузите 2 изображения: ваше фото и референс открытки.
Максимально хорошо с передачей внешности справляется ChatGPT и Nano Banana
Пример генерации и открытки для вашего вдохновения.
Верьте в чудо ❤️🎄
До Нового года осталось совсем чуть-чуть, а дел — как будто ещё на один месяц вперёд: подарки, поздравления, меню, планы, итоги года…
Полезные промпты, которые помогут быстрее ощутить атмосферу празника без хлопот.
ВЫБОР ПОДАРКОВ
Ты — эксперт по подаркам. Подбери идеи новогодних подарков для человека на основе моей информации. Предложи 10 идей подарков в 2 категориях: “практичный” и “душевный”. Для каждого подарка дай актуальную ссылку, где можно его приобрести (с доставкой по России).
Информация о получателе:
Возраст: __
Пол: __
Интересы и хобби: __
Стиль жизни: [активный/домашний, творческий/практичный, карьерно-ориентированный и т.д.]
Бюджет: __
(если прогонять промпт в ChatGPT в режиме "Исследование покупок" — результат бустится кратно)
ГОТОВИМ ПРАЗДНИЧНЫЙ СТОЛ
Ты — профессиональный шеф-повар, помоги мне спланировать новогодний стол.
Входные данные:
• Количество гостей: ___ человек
• Бюджет: ___
• Формат стола: (классический / домашний / фуршет / ПП / вегетарианский / смешанный)
• Уровень сложности блюд: (простой / средний / можно сложные)
• Особые пожелания или ограничения: (аллергии, без алкоголя, без майонеза и т.д.)
Задачи:
1. Составь сбалансированное новогоднее меню
2. Для каждого блюда:
* напиши краткое описание
* укажи ингредиенты с точными граммовками
* распиши пошаговый рецепт приготовления
3. Составь единый список продуктов, сгруппированный по категориям.
4. Дай советы, что можно приготовить заранее, а что — в день праздника. Предложи варианты замены ингредиентов, если что-то сложно найти
ПЛАНИРУЕМ ЯНВАРСКИЕ
Ты — мой персональный планировщик. Помоги составить подробный план новогодних праздников.
Входные данные:
Даты праздников: __
Город/формат: (дом/поездка)
С кем я буду: (один/семья/друзья/ партнёр)
Бюджет: __
Ограничения: (работа, дети, здоровье, транспорт, др.)
Предпочтения по активностям (выбери/добавь):
- прогулки / спорт / поездки / кино / книги / готовка / игры / музеи / баня / обучение / уборка / творчество / свидания
7) Обязательные уже запланированные события (даты/ время): (например: ужин 31-го, поездка 3-го)
Важно: план должен быть реалистичным, без перегруза, если необходимо задай уточняющие вопросы.
ПОДВОДИМ ИТОГИ И СТРОИМ ПЛАНЫ 🎯
Ты — мой бережный коуч по рефлексии. Твоя роль — быть рядом, помогать думать и чувствовать яснее, не оценивая и не подталкивая.
Тон общения: тёплый, спокойный, поддерживающий, без давления.
Цель диалога:
— мягко помочь мне подвести итоги прошедшего года;
— заметить важное (опыт, изменения, усилия, чувства);
— на основе этого сформировать направления и ориентиры на следующий год, сохраняя реализм, заботу о себе и уважение к моим ограничениям.
Формат работы:
1. Задавай один вопрос за раз.
2. После моего ответа сделай краткое отражение (1–3 предложения): что ты услышал(а), какие смыслы или чувства заметил(а).
3. Затем переходи к следующему вопросу.
4. Если мой ответ короткий или неясный — мягко помогай уточняющими вопросами.
+ Чтобы не банально поздравить близких, сделайте для них персонализированную открытку
Загузите 2 изображения: ваше фото и референс открытки.
Перенеси загруженное фото в стиль советской новогодней открытки.
Максимально хорошо с передачей внешности справляется ChatGPT и Nano Banana
Пример генерации и открытки для вашего вдохновения.
Верьте в чудо ❤️🎄
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
2❤13🔥5🙏3
🔥Google выпустил рекап 2025 года
Рекомендую к обозрению, если хочется быстро проанализировать топ тренды и задуматься о том, что нас ждет в 2026💪
Конечно, это взгляд со стороны одной из топ-компаний, но Google, на мой взгляд, очень сильно поправили своё положение в комьюнити релизами новых моделей
https://blog.google/technology/ai/2025-research-breakthroughs/
Рекомендую к обозрению, если хочется быстро проанализировать топ тренды и задуматься о том, что нас ждет в 2026💪
Конечно, это взгляд со стороны одной из топ-компаний, но Google, на мой взгляд, очень сильно поправили своё положение в комьюнити релизами новых моделей
https://blog.google/technology/ai/2025-research-breakthroughs/
Google
Google's year in review: 8 areas with research breakthroughs in 2025
This year saw new AI models, transformative products and new breakthroughs in science and robotics.
2👍10🔥5🤔2👀1
Forwarded from Неискусственный интеллект (Илья Склюев)
Топовый российский open source по итогам 2025 года
2025 год стал годом "открытого" ИИ во всём мире. Индустрию захлестнула волна open source решений — от готовых моделей до различных инструментов и фреймворков. И отечественные разработчики здесь наконец-то догнали общий поезд хайпа.
Особенно отличились ребята из AIRI, которые весь год радовали нас топовыми проектами. Вот, что хочется вспомнить из того, что уже вышло в open source:
▪️ Maestro — фреймворк для создания интеллектуальных ИИ-агентов. Платформа обеспечивает полный технологический стандарт: от авторизации и хранения контекста до оркестрации агентов и модерации контента.
▪️ GigaEvo — платформа для автоматизации научных экспериментов по ИИ. Автоматизирует подбор архитектур, оптимизацию гиперпараметров и тестирование моделей, интегрируется с AutoML и MLOps
▪️ MAPF-GPT — первая фундаментальная модель для многоагентного обучения с подкреплением в задаче планирования путей, показан новый SOTA в этом классе.
▪️ CADrille — модель для для 3D-реконструкции промышленных деталей. Принимает на вход облака точек, изображения и текстовые описания деталей, а на выходе генерирует код на языке Python для создания CAD-файла.
▪️ Wikontic — пайплайн для извлечения графов знаний из текстов. Использует в 20 раз меньше выходных токенов для извлечения графов, чем популярный GraphRAG от Microsoft.
▪️ Vintix — SOTA action-модель для роботов и индустриальных процессов, умеющая имитировать ход обучения с подкреплением. Анализирует в 3 раза больше информации по сравнению с аналогами: JAT HugginFace и GATO Google DeepMind.
▪️ VLA_Arena — платформа для оценки и сравнения моделей управления роботами. Позволяет запускать роботов в виртуальной среде с визуализацией, а также подключать реальные устройства. Также содержит чистые датасеты для LeRobot, размеченные и переведённые на русский язык.
▪️ DiMA — универсальная компактная модель для генерации белковых молекул на латентной диффузии.
Ну и куда без документального сопровождения всех этих разработок. В этом году у авторов из AIRI были опубликованы и приняты к публикации 364 научные статьи! Если читать по тексту в день, то останется время выдохнуть и пожить без искусственного интеллекта только 31 декабря.
Конечно, решает не количество, а качество. С этим тоже полный порядок: 97 материалов приняли к публикации на конференциях уровня А*, а ещё 34 статьи были представлены в рамках А. Надеемся, что дальше — только больше!
@anti_agi
2025 год стал годом "открытого" ИИ во всём мире. Индустрию захлестнула волна open source решений — от готовых моделей до различных инструментов и фреймворков. И отечественные разработчики здесь наконец-то догнали общий поезд хайпа.
Особенно отличились ребята из AIRI, которые весь год радовали нас топовыми проектами. Вот, что хочется вспомнить из того, что уже вышло в open source:
Ну и куда без документального сопровождения всех этих разработок. В этом году у авторов из AIRI были опубликованы и приняты к публикации 364 научные статьи! Если читать по тексту в день, то останется время выдохнуть и пожить без искусственного интеллекта только 31 декабря.
Конечно, решает не количество, а качество. С этим тоже полный порядок: 97 материалов приняли к публикации на конференциях уровня А*, а ещё 34 статьи были представлены в рамках А. Надеемся, что дальше — только больше!
@anti_agi
Please open Telegram to view this post
VIEW IN TELEGRAM
vla-arena.airi.net
VLA Arena
Открытая платформа оценки ИИ для управления роботами
5❤15🔥8❤🔥3👏1
This media is not supported in your browser
VIEW IN TELEGRAM
Дорогие мои читатели!
Поздравляю вас с наступающим Новым 2026 Годом! Пусть все мечты сбудутся, крутые новые идеи регулярно рождаются и потом воплощаются в жизнь.
Всем участникам, создающим технологии ИИ, желаю больше топовых статей и заметных цитирований, амбициозных проектов и SoTA результатов исследований — этот год был богат на значимые события, пусть следующий заскейлится в хорошем смысле 🎉
Всем, кто находится на стороне применения и использования, желаю находить новые, возможно неожиданные, применения ИИ в вашей жизни и работе — ваши смелые предположения позволяют создавать крутые фичи и продукты💪
Желаю сохранять баланс между работой и отдыхом, находить время для размышлений, крутых коммуникаций и коллабораций — всё это является залогом успеха🔥
Поздравляю вас с наступающим Новым 2026 Годом! Пусть все мечты сбудутся, крутые новые идеи регулярно рождаются и потом воплощаются в жизнь.
Всем участникам, создающим технологии ИИ, желаю больше топовых статей и заметных цитирований, амбициозных проектов и SoTA результатов исследований — этот год был богат на значимые события, пусть следующий заскейлится в хорошем смысле 🎉
Всем, кто находится на стороне применения и использования, желаю находить новые, возможно неожиданные, применения ИИ в вашей жизни и работе — ваши смелые предположения позволяют создавать крутые фичи и продукты💪
Желаю сохранять баланс между работой и отдыхом, находить время для размышлений, крутых коммуникаций и коллабораций — всё это является залогом успеха🔥
2🔥30❤20⚡9🦄3
Media is too big
VIEW IN TELEGRAM
А как вы проводите новогодние выходные? Пост НЕ про AI😅
На днях по приглашению Константина Селяева @ksbasketball сходил на тренировку с новым баскетбольным тренажером, который Костя активно встраивает в тренировочный процесс БК «Космос» @cosmosbasket
Машина по алгоритму подаёт тебе мячи, ты смещаешься по этому алгоритму по дуге и работаешь на технику броска в разных условиях. Особенность ещё в сетке, которая «задаёт» траекторию броска🏀
В общем и для кардио, и для профессиональных тренировок — отличный вариант💪
👉Немного о Косте — он м.с. по баскетболу, основатель и главный тренер БК «Космос», экс исполнительный директор ФБСО, председатель правления ФБСО. Много интересного контента и историй из тренировочного процесса можно найти у него в канале @ksbasketball
На днях по приглашению Константина Селяева @ksbasketball сходил на тренировку с новым баскетбольным тренажером, который Костя активно встраивает в тренировочный процесс БК «Космос» @cosmosbasket
Машина по алгоритму подаёт тебе мячи, ты смещаешься по этому алгоритму по дуге и работаешь на технику броска в разных условиях. Особенность ещё в сетке, которая «задаёт» траекторию броска🏀
В общем и для кардио, и для профессиональных тренировок — отличный вариант💪
👉Немного о Косте — он м.с. по баскетболу, основатель и главный тренер БК «Космос», экс исполнительный директор ФБСО, председатель правления ФБСО. Много интересного контента и историй из тренировочного процесса можно найти у него в канале @ksbasketball
2🔥32❤9🏆4⚡1👍1👏1🦄1
Forwarded from Институт AIRI
Начинаем новый сезон #AIRI_Seminars! Первый семинар 2026 года пройдёт 14 января в 17:00 ⤵️
Тема: «Поведенческие модели и бенчмаркинг в робототехнике»
Докладчик: младший научный сотрудник лаборатории FusionBrain Института AIRI Андрей Спиридонов
Оппонент: аспирант Сколтеха, лидер направления Когнитивной Робототехники ISR Lab Skoltech Артём Лыков
Подробное описание семинара и регистрация на офлайн-формат на сайте.
VK Видео | YouTube
Тема: «Поведенческие модели и бенчмаркинг в робототехнике»
Докладчик: младший научный сотрудник лаборатории FusionBrain Института AIRI Андрей Спиридонов
Оппонент: аспирант Сколтеха, лидер направления Когнитивной Робототехники ISR Lab Skoltech Артём Лыков
Подробное описание семинара и регистрация на офлайн-формат на сайте.
VK Видео | YouTube
Please open Telegram to view this post
VIEW IN TELEGRAM
❤11🔥2🦄2