Вчера прошел большой релиз фундаментальных моделей для компьютерного зрения от SuperIntelligence Labs:
Были выпущены:
1) SAM3 (код)(статья), который в отличие от SAM2 получил возможность сегментировать и отслеживать объекты по текстовым запросам
2) SAM 3D Body Model, 3DB (код)(статья) для реконструкции 3D модели тела человека по изображениям
3) SAM 3D Objects (код)(статья) для реконструкции 3D моделей произвольных объектов по изображениям и (опционально) облакам точек
#References
Были выпущены:
1) SAM3 (код)(статья), который в отличие от SAM2 получил возможность сегментировать и отслеживать объекты по текстовым запросам
2) SAM 3D Body Model, 3DB (код)(статья) для реконструкции 3D модели тела человека по изображениям
3) SAM 3D Objects (код)(статья) для реконструкции 3D моделей произвольных объектов по изображениям и (опционально) облакам точек
#References
🔥2
Forwarded from Center for Cognitive Modeling
11:15-11:30 AI Frontiers
Как большие языковые модели учатся планировать и рассуждать с помощью поисковых алгоритмов, Алексей Скрынник от AIRI
Современные большие языковые модели могут значительно расширять возможности автоматического рассуждения и планирования, если их дополнить стратегиями поиска. В докладе рассматриваются три основных подхода: неструктурированный поиск, эволюционный поиск и дерево поиска. Эти методы позволяют моделям исследовать несколько альтернативных траекторий рассуждений, корректировать ошибки на промежуточных шагах и выбирать наиболее перспективные решения.
11:55 - 12:15 Live studio
Рассуждающие модели воплощённого ИИ, Александр Панов
В докладе будет представлен обзор вариантов реализации рассуждений в нейросетевых моделях, используемых в задачах воплощенного ИИ - навигации и манипуляции. Обсудим, как связаны планирование действий и рассуждения, а также ограничения в современных поведенческих моделях (VLA). Разберем также последние работы нашей лаборатории в области интеграции обучаемых и классических подходов для повышения эффективности методов планирования и рассуждений в задачах воплощенного ИИ.
13:00-14:30 Главный зал
Форсайт: каким будет ИИ через 10 лет, Дмитрий Юдин среди участников
15:15-15:30 AI Frontiers
Применение больших языковых и визуально-языковых моделей в робототехнике, Алексей Ковалёв
Большие языковые и визуально-языковые модели (LLM и VLM) получили широкое распространение во множестве приложений и все активнее используются в робототехнике. На лекции мы обсудим, как такие модели помогают роботам распознавать неоднозначные инструкции, формировать планы действий и исправлять ошибки, возникающие при их выполнении.
15:30-15:45 AI Frontiers
Как большие языковые модели понимают 3D-пространство, Дмитрий Юдин
Развитие технологий пространственного ИИ — одно из важнейших современных направлений в робототехнике и беспилотном транспорте. В этом докладе мы рассмотрим концепции пространственного понимания, пространственных рассуждений и связанные с ними задачи. Обсудим потенциал современных MLLM для решения задач, связанных с визуальными ответами на вопросы, поиском трёхмерных объектов, генерацией графов трёхмерных сцен, созданием описаний 3D-сцен и др. Мы также обсудим ограничения популярных LLM в случае описания трёхмерной сцены только текстом. Рассмотрим современные решения для пространственного понимания, использующие модальности изображений, текста, облаков точек и графов. Кратко рассмотрим недавние разработки команд AIRI и МФТИ в этой области. Кроме того, мы обсудим перспективные нерешённые проблемы для дальнейшего развития.
Переходите по ссылкам и смотрите нас онлайн!
Please open Telegram to view this post
VIEW IN TELEGRAM
❤1
На AIJourney сегодня поучаствовал в Форсайт-сессии с заместителем Председателя Правительства РФ Д.Н.Чернышенко, где были презентованы результаты масштабного проекта «Горизонты искусственного интеллекта: Какими будут технологии ИИ через 10 лет». К открытому отчету к нему и я приложил руку, его можно скачать здесь.
Я рассказывал про особенности Направления 6. Узкий искусственный интеллект и сделал особенный упор на робототехнику, беспилотный транспорт и пространственный интеллект, которыми мы в команде занимаемся.
Видео можно посмотреть здесь.
#Activities
Я рассказывал про особенности Направления 6. Узкий искусственный интеллект и сделал особенный упор на робототехнику, беспилотный транспорт и пространственный интеллект, которыми мы в команде занимаемся.
Видео можно посмотреть здесь.
#Activities
🔥7
Также сегодня выступил в секции AI Frontiers конференции AIJourney с докладом «How Large Language Models Understand 3D Space?». Рассказал про важный тренд по разработке технологий пространственного искусственного интеллекта для современной робототехники.
Видео можно посмотреть здесь.
Спасибо модератору секции - Алексею Постникову из Центра робототехники Сбера за интересные вопросы!
#Activities
Видео можно посмотреть здесь.
Спасибо модератору секции - Алексею Постникову из Центра робототехники Сбера за интересные вопросы!
#Activities
⚡3❤2
Про нашу команду ITL-Mapper - в блоге организаторов хакатонов "Лидеры цифровой трансформации":
Forwarded from ЛЦТ 2025 | Хакатон
Так масштабно и необычно, что достойно отдельной благодарности
Именно так наша команда думает про каждый пост с победителями и призёрами хакатона, где мы делимся со всеми лучшими решениями!
🔴 В этом посте — топ-3 решений по задаче №5 направления «Город» от Департамента транспорта и развития дорожно-транспортной инфраструктуры города Москвы
Кстати, мы рассказываем про всё самое топовое в рамках рубрики #Марафон_проектов призёров хакатона «Лидеры цифровой трансформации»!
💥 @leaders_hack
Именно так наша команда думает про каждый пост с победителями и призёрами хакатона, где мы делимся со всеми лучшими решениями!
Кстати, мы рассказываем про всё самое топовое в рамках рубрики #Марафон_проектов призёров хакатона «Лидеры цифровой трансформации»!
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Показали министру промышленности и торговли А. А. Алиханову наши наработки в сфере интеллектуальной робототехники, которые мы делаем в Центре когнитивного моделирования Института ИИ МФТИ
#Activities
#Activities
❤5
Forwarded from Институт AIRI
В Сириусе проходит V Конгресс молодых учёных, рассказываем, в каких дискуссиях можно послушать исследователей AIRI💡
📆 26 ноября
Транспорт будущего: междисциплинарные вызовы высокой скорости
Дмитрий Юдин, ведущий научный сотрудник лаборатории когнитивных систем искусственного интеллекта AIRI
Запись
📆 27 ноября 12:00
AI Journey: путешествие в мир искусственного интеллекта
Дмитрий Юдин
Трансляция
📆 27 ноября 12:00
Аналитика будущего: искусственный интеллект в прогнозировании рисков и источников чрезвычайных ситуаций
Александр Панов, директор лаборатории когнитивных систем искусственного интеллекта AIRI
Трансляция
📆 27 ноября 14:00
Вложить нельзя отложить: наука как ключевой актив бизнеса
Егор Ершов, руководитель группы «Цветовая вычислительная фотография» AIRI
Трансляция
📆 28 ноября 16:00
Трансформационные достижения в области искусственного интеллекта: формирование будущего науки, исследований и образования
Александр Антропов, научный сотрудник AIRI и
Вениамин Фишман, ведущий научный сотрудник группы «Биоинформатика»
Трансляция
📎 Подробная программа и трансляция – на сайте.
Транспорт будущего: междисциплинарные вызовы высокой скорости
Дмитрий Юдин, ведущий научный сотрудник лаборатории когнитивных систем искусственного интеллекта AIRI
Запись
AI Journey: путешествие в мир искусственного интеллекта
Дмитрий Юдин
Трансляция
Аналитика будущего: искусственный интеллект в прогнозировании рисков и источников чрезвычайных ситуаций
Александр Панов, директор лаборатории когнитивных систем искусственного интеллекта AIRI
Трансляция
Вложить нельзя отложить: наука как ключевой актив бизнеса
Егор Ершов, руководитель группы «Цветовая вычислительная фотография» AIRI
Трансляция
Трансформационные достижения в области искусственного интеллекта: формирование будущего науки, исследований и образования
Александр Антропов, научный сотрудник AIRI и
Вениамин Фишман, ведущий научный сотрудник группы «Биоинформатика»
Трансляция
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥7👍2
Сегодня завершился Конгресс молодых ученых. В первый день на нем мне довелось выступить в секции «Транспорт будущего» (см. Видео), интересно было послушать, как в России делают беспилотные поезда и беспилотную строительную технику.
Во второй день на увлекательной сессии AIJourney рассказал про пространственный искусственный интеллект для роботов и автомобилей (см. Видео). Помимо растущей роли MLLM, коснулись традиционной роли лидаров для безопасного управления автомобилями. Также были интересные доклады от Сбера, Яндекса и ИТМО. Все делают реально полезные вещи. Отдельно запомнился термин Self-driving labs 😊
#Activities
Во второй день на увлекательной сессии AIJourney рассказал про пространственный искусственный интеллект для роботов и автомобилей (см. Видео). Помимо растущей роли MLLM, коснулись традиционной роли лидаров для безопасного управления автомобилями. Также были интересные доклады от Сбера, Яндекса и ИТМО. Все делают реально полезные вещи. Отдельно запомнился термин Self-driving labs 😊
#Activities
❤3🔥3👍1