⚡️⚡️⚡️На прошлой неделе мы в AIRI зарелизили очень крутую работу в рамках трека «Генеративное проектирование» — cadrille: Multi-modal CAD Reconstruction with Online Reinforcement Learning
Архитектура представляет собой мультимодальную LLM, которая на вход может принимать облака точек, изображения и текст, а на выходе генерировать код операций, восстанавливающих некоторый CAD объект (например, какую-то инженерную деталь). То есть мы одновременно решаем задачу понимания сложных модальностей и задачу синтеза последовательности операций, необходимых для её восстановления по фото и облаку точек.
В дополнение добавили несколько вариантов онлайн RL (DPO и Dr. CPPO), что позволило значительно улучшить метрики и выбить SoTA на самых известных бенчмарках по восстановлению CAD моделей: DeepCAD, Fusion360 и CC3D💪
📍Статья — https://arxiv.org/abs/2505.22914
📍GitHub
📍Hugging Face
📍На Papers With Code уверенная SoTA на DeepCAD бенчмарке
Буду очень рад обратной связи и предложениям по развитию, тестированию и будущему внедрению!
P.S. На прошедшем 30 мая DataFest’е в Сбере я рассказал подробно про наши исследования в области генеративного проектирования и кратко о модели, что вызвало большой интерес у представителей промышленности. Поэтому если вы ещё не слышали про cadrille, то обязательно расскажите своему другу - инженеру, ему особенно понравится😉
@complete_ai
Архитектура представляет собой мультимодальную LLM, которая на вход может принимать облака точек, изображения и текст, а на выходе генерировать код операций, восстанавливающих некоторый CAD объект (например, какую-то инженерную деталь). То есть мы одновременно решаем задачу понимания сложных модальностей и задачу синтеза последовательности операций, необходимых для её восстановления по фото и облаку точек.
В дополнение добавили несколько вариантов онлайн RL (DPO и Dr. CPPO), что позволило значительно улучшить метрики и выбить SoTA на самых известных бенчмарках по восстановлению CAD моделей: DeepCAD, Fusion360 и CC3D💪
📍Статья — https://arxiv.org/abs/2505.22914
📍GitHub
📍Hugging Face
📍На Papers With Code уверенная SoTA на DeepCAD бенчмарке
Буду очень рад обратной связи и предложениям по развитию, тестированию и будущему внедрению!
P.S. На прошедшем 30 мая DataFest’е в Сбере я рассказал подробно про наши исследования в области генеративного проектирования и кратко о модели, что вызвало большой интерес у представителей промышленности. Поэтому если вы ещё не слышали про cadrille, то обязательно расскажите своему другу - инженеру, ему особенно понравится😉
@complete_ai
4🔥54👍8🏆7❤5🤓1👀1
⚡️⚡️⚡️Вчера выложили нашу новую работу Confidence Is All You Need о способности языковых моделей выполнять роль функции наград (применяются в обучении с подкреплением — DeepSeek R1 яркий тому пример) для самостоятельного улучшения качества генерации текста на основе внутренней уверенности в своих ответах. Другими словами, языковая модель сама оценивает лучшие свои ответы, и эта оценка используется для её улучшения/дообучения. Мы назвали этот процесс Reinforcement Learning via Self-Confidence.
Такой подход позволяет избавиться от разработки отдельных функций наград, специальной разметки данных для обучения и дополнительных preference моделей.
В качестве базы для исследований взяли две модели Qwen2.5-Math: 1.5B и 7B, которые уже (как следует из названия) дообучались для решения математических задач. В итоге мы получили существенное улучшение на ряде математических бенчмарков за счёт такой простой процедуры: от +0.8% до +26.8%.
Поддержите апвоутами в голосовании за лучшую статью дня👇👇👇
https://huggingface.co/papers/2506.06395
Такой подход позволяет избавиться от разработки отдельных функций наград, специальной разметки данных для обучения и дополнительных preference моделей.
В качестве базы для исследований взяли две модели Qwen2.5-Math: 1.5B и 7B, которые уже (как следует из названия) дообучались для решения математических задач. В итоге мы получили существенное улучшение на ряде математических бенчмарков за счёт такой простой процедуры: от +0.8% до +26.8%.
Поддержите апвоутами в голосовании за лучшую статью дня👇👇👇
https://huggingface.co/papers/2506.06395
3🔥50❤10👍3🆒2
Делюсь забавным сервисом. Вам показывают фото и карту: надо угадать примерный год, когда оно было сделано, а также ткнуть на глобусе место фотографии
Довольно залипательная вещь👇
https://timeguessr.com/
Довольно залипательная вещь👇
https://timeguessr.com/
3💯14🔥11
Сегодня принял участие в сессии AI Journey на ПМЭФ-2025 в качестве модератора и спикера с темой «Новые тренды в мире AI» 🤖
Обсуждали с коллегами новейшие тренды AI и машинного обучения:
⚡️ применение reasoning LLM-моделей для решения математических задач
⚡️ значимость мультиагентных систем на пути к созданию AGI
⚡️ технологии автономного вождения
⚡️ разработки в области мультимодальных поведенческих моделей в робототехнике
На фото я с Александром Гасниковым, моим хорошим другом и блестящим учёным, членом-корреспондентом РАН, ректором Университета Иннополис, руководителем Лаборатории математических основ оптимизации МФТИ. Он выступал с темой «ИИ для решения математических задач» и рассказал, как современные модели могут справляться с решением задач различной сложности, используя обучение с подкреплением.
Обсуждали с коллегами новейшие тренды AI и машинного обучения:
На фото я с Александром Гасниковым, моим хорошим другом и блестящим учёным, членом-корреспондентом РАН, ректором Университета Иннополис, руководителем Лаборатории математических основ оптимизации МФТИ. Он выступал с темой «ИИ для решения математических задач» и рассказал, как современные модели могут справляться с решением задач различной сложности, используя обучение с подкреплением.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤🔥43❤21⚡11👍8👏3🏆2😁1🤓1🙊1
Forwarded from Машинное обучение RU
Такокого восстания мы не ожидали: Gemini угрожает САМОУНИЧТОЖИТЬСЯ, если в очередной раз не отладит ваш код.
😁30
Forwarded from Институт AIRI
Сегодня рассказываем подробнее про доклады, которые будут на ИИшнице 26 июня 🍳
Ведущий мероприятия — руководитель группы «Глубокое обучение в науках о жизни» AIRI Артур Кадурин.
◼️ В 15:30 директор по цифровой трансформации Промомед Иван Колесников выступит с докладом «ИИ — драйвер цифровой трансформации группы Промомед».
◼️ В 15:50 Константин Ушенин, кандидат физико-математических наук, старший научный сотрудник группы «Глубокое обучение в науках о жизни» AIRI расскажет про LAGNet — нейронную сеть для предсказания электронной плотности вокруг молекул.
◼️ В 16:10 Иван Поддъяков, специалист по исследованию данных в Sber AI Lab, расскажет про мультиагентный фреймворк для дизайна лекарственных молекул.
◼️ В 16:30 завершающий доклад «Поиск и моделирование флуоресцентных молекул для маркировки полимеров» прочитает Алексей Коровин, кандидат химических наук, старший научный сотрудник группы «Дизайн новых материалов» AIRI.
Подключайтесь к трансляции в VK Видео или на YouTube🍿
Ведущий мероприятия — руководитель группы «Глубокое обучение в науках о жизни» AIRI Артур Кадурин.
Подключайтесь к трансляции в VK Видео или на YouTube🍿
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
1❤9❤🔥3👏1🤔1
Forwarded from Лаборатория ИИ (Артур Ишмаев)
#ЛабораторияИИ #AILAB
Прошла встреча-знакомство с командой Института AIRI ⚡️⚡️⚡️ Обсудили подходы наших команд и как именно с пользой взаимодействовать и решать актуальные задачи проектирования. Наметили следующие шаги сотрудничества
Спасибо всем за встречу 🙃🙃🙃
Прошла встреча-знакомство с командой Института AIRI ⚡️⚡️⚡️ Обсудили подходы наших команд и как именно с пользой взаимодействовать и решать актуальные задачи проектирования. Наметили следующие шаги сотрудничества
Спасибо всем за встречу 🙃🙃🙃
🔥21👍6⚡3