Тренд 4. Моделирование (симуляция) 3D-мира с большим разнообразием объектов, воспроизведением их физических свойств и динамических взаимодействий. Это особенно полезно для эффективного обучения систем навигации и управления роботов и беспилотных автомобилей.
- Neural MP: A Neural Motion Planner (Award Finalist) (статья)(проект) Авторы: Murtaza Dalal,Jiahui Yang,Russell Mendonca, Youssef Khaky, Ruslan Salakhutdinov, Deepak Pathak (Carnegie Mellon University) . Эта работа демонстрирует, что предварительное обучение на корректно подготовленных 3D-симуляциях манипуляционных сред позволяет значительно повысить Success Rate для задачи планирования действий манипулятора.
- AgiBot World Colosseo: A Large-scale Manipulation Platform for Scalable and Intelligent Embodied Systems (Award Finalist) (статья)(проект)(код) от большой команды AgiBot-World Team. Здесь показано, что корректная генерация и аннотация данных о трехмерном мире из режима телеуправления разными роботами может лежать в основе платформ для обучения фундаментальных моделей для роботов.
- RoboVerse: Towards a Unified Platform, Dataset and Benchmark for Scalable and Generalizable Robot Learning (статья)(проект) Авторы: Haoran Geng et al. (Berkley, Stanford, etc). Эта масштабная работа показывает, что создание единых симуляционных платформ объединяющих большое количество сред дает путь к разработке более надежных фундаментальных моделей для управления роботами.
#IROS2025 #References
- Neural MP: A Neural Motion Planner (Award Finalist) (статья)(проект) Авторы: Murtaza Dalal,Jiahui Yang,Russell Mendonca, Youssef Khaky, Ruslan Salakhutdinov, Deepak Pathak (Carnegie Mellon University) . Эта работа демонстрирует, что предварительное обучение на корректно подготовленных 3D-симуляциях манипуляционных сред позволяет значительно повысить Success Rate для задачи планирования действий манипулятора.
- AgiBot World Colosseo: A Large-scale Manipulation Platform for Scalable and Intelligent Embodied Systems (Award Finalist) (статья)(проект)(код) от большой команды AgiBot-World Team. Здесь показано, что корректная генерация и аннотация данных о трехмерном мире из режима телеуправления разными роботами может лежать в основе платформ для обучения фундаментальных моделей для роботов.
- RoboVerse: Towards a Unified Platform, Dataset and Benchmark for Scalable and Generalizable Robot Learning (статья)(проект) Авторы: Haoran Geng et al. (Berkley, Stanford, etc). Эта масштабная работа показывает, что создание единых симуляционных платформ объединяющих большое количество сред дает путь к разработке более надежных фундаментальных моделей для управления роботами.
#IROS2025 #References
🔥2
Тренд 5. Анализ 4D (динамических, изменяющихся) сцен для методов локализации, реконструкции и построения карт местности, рендеринга и генерации пространственной информации.
- Embracing Dynamics: Dynamics-Aware 4D Gaussian Splatting SLAM (статья)(код). Авторы: Sun, Zhicong; Lo, Jacqueline Tsz Yin (The Hong Kong Polytechnic University); Hu, Jinxing (Shenzhen Institutes of Advanced Technology). В этой работе показано, что учет временной составляющей при трехмерной реконструкции сцены позволяет создавать более качественные методы SLAM в динамических средах.
- Flow4D: Leveraging 4D Voxel Network for LiDAR Scene Flow Estimation (статья)(код). Авторы: Kim, Jaeyeul; Woo, Jungwan (DGIST); Shin, Ukcheol; Oh, Jean (Carnegie Mellon University); Im, Sunghoon (DGIST). Здесь продемонстрировано, что использование 4D-воксельного представления позволило существенно повысить качество распознавания движущихся объектов в лидарных облаках точек.
#IROS2025 #References
- Embracing Dynamics: Dynamics-Aware 4D Gaussian Splatting SLAM (статья)(код). Авторы: Sun, Zhicong; Lo, Jacqueline Tsz Yin (The Hong Kong Polytechnic University); Hu, Jinxing (Shenzhen Institutes of Advanced Technology). В этой работе показано, что учет временной составляющей при трехмерной реконструкции сцены позволяет создавать более качественные методы SLAM в динамических средах.
- Flow4D: Leveraging 4D Voxel Network for LiDAR Scene Flow Estimation (статья)(код). Авторы: Kim, Jaeyeul; Woo, Jungwan (DGIST); Shin, Ukcheol; Oh, Jean (Carnegie Mellon University); Im, Sunghoon (DGIST). Здесь продемонстрировано, что использование 4D-воксельного представления позволило существенно повысить качество распознавания движущихся объектов в лидарных облаках точек.
#IROS2025 #References
👍4
Всем снова привет из Китая, где мы с Егором Ершовым участвуем в Пекинском Форуме в секции AI for a Harmonious Society: Building a Safe and Trustworthy Future. Завтра буду выступать здесь и рассказывать про Пространственный ИИ и его важность для робототехники и общества 😊
#Activities
#Activities
🔥8
Послушал выступление Нобелевского лауреата по химии 2013 года, биофизика из Стэнфорда Mikhael Levitt (H 102). Вот так выглядит его профиль в scholar, он продолжает публиковаться и использует методы ИИ в своей работе (AlphaFold, GPT-модели).
Слайды у него конечно были простоваты, но на них было кое-что интересное: рецепт как получить Нобелевскую премию (обратите внимание на размер научных групп и их финансирование), какие у него впечатления от использования ChatGPT, а также то, сколько ученые ошибаются (чем лучше ученый, тем больше он ошибается, потому что решает очень сложные задачи)
#Activities
Слайды у него конечно были простоваты, но на них было кое-что интересное: рецепт как получить Нобелевскую премию (обратите внимание на размер научных групп и их финансирование), какие у него впечатления от использования ChatGPT, а также то, сколько ученые ошибаются (чем лучше ученый, тем больше он ошибается, потому что решает очень сложные задачи)
#Activities
🔥8
Выступил на Пекинском Форуме с докладом «Spatial Intelligence and 3D Understanding: Advancing Robotics for the Prosperity of All». Рассказал, как технологии пространственного ИИ помогают в создании роботов и автомобилей, а также привнес технических деталей во, в целом, гуманитарный Форум 📈
#Activities
#Activities
🔥12
В той же секции со мной выступал про вызовы для Safe AI на китайском языке Hu Songlin (H 37) из University of Chinese Academy of Sciences. Причем потом оказалось, что он хорошо говорит по-английски и занимается релевантными для нас проектами в сфере LLM и MLLM.
Также на этом форуме выступил Zhu Song-Chun (H 106)из Peking University, рассказал про эволюцию цивилизации в эру ИИ - это его более гуманитарная версия доклада, который он делал на IROS-2025. С его роботехнической командой из Института искусственного интеллекта Пекинского университета у нас намечается сотрудничество.
#Activities
Также на этом форуме выступил Zhu Song-Chun (H 106)из Peking University, рассказал про эволюцию цивилизации в эру ИИ - это его более гуманитарная версия доклада, который он делал на IROS-2025. С его роботехнической командой из Института искусственного интеллекта Пекинского университета у нас намечается сотрудничество.
#Activities
🔥1
🔥7