Forwarded from Center for Cognitive Modeling
Конференция объединила исследователей ИИ со всей России. И наши ребята внесли свой вклад, представив работы Центра и партнёров:
Подход под названием BBQ (Beyond Bare Queries) помогает в решении проблемы автономных агентов по поиску объектов, неоднозначно описанных на естественном языке. Он создает представление 3D-сцены в виде графа с метрическими и семантическими пространственными связями и задействует крупную языковую модель в качестве интерфейса «человек-агент» через наш алгоритм дедуктивного анализа сцены.
Метод, который объединяет графовое планирование с динамическим обновлением сцены, позволяет роботу адаптироваться к изменяющейся среде и корректировать план действий в процессе выполнения задачи.
Новый метод M3PO, расширяющий классическую архитектуру Proximal Policy Optimization (PPO), в которой объединены мультизадачность и модель мира, которую робот выучивает в процессе взаимодействия при онлайн-обучении. В результате метод обеспечивает быстрое обучение компактных с точки зрения количества параметров стратегий, пригодных для быстрого развертывания на робототехнических манипуляторах.
CrafText — бенчмарк для оценки способности агентов следовать инструкциям в мультимодальной среде с разнообразными заданиями и динамическим взаимодействием. CrafText включает 3924 инструкции, содержащие 3423 уникальных слова, и охватывает задачи из разных областей.
Обработка неоднозначных инструкций в реальных условиях представляет сложность для LLM. Существуют различные методы выявления неоднозначности задач, однако их сравнение затруднено из-за использования разных наборов данных и отсутствия универсального эталона. Решить эту проблему поможет AmbiK (Ambiguous Tasks in Kitchen Environment) — полностью текстовый набор данных, содержащий неоднозначные инструкции, предназначенные для робота в кухонной среде.
#CV #VLM #AI
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥1
И наша пара статей вошла в сборник трудов конференции Нейроинформатика-2025 в Springer:
- GenLab: Automatic Multimodal Dataset Editor Using Diffusion Inpainting https://link.springer.com/chapter/10.1007/978-3-032-07690-8_18 и
- Efficient Compression of Vision–Language Patch Features for Zero-Shot Segmentation https://link.springer.com/chapter/10.1007/978-3-032-07690-8_20
#Papers
- GenLab: Automatic Multimodal Dataset Editor Using Diffusion Inpainting https://link.springer.com/chapter/10.1007/978-3-032-07690-8_18 и
- Efficient Compression of Vision–Language Patch Features for Zero-Shot Segmentation https://link.springer.com/chapter/10.1007/978-3-032-07690-8_20
#Papers
SpringerLink
GenLab: Automatic Multimodal Dataset Editor Using Diffusion Inpainting
With the development of diffusion models, there are unique opportunities for the application of innovative methods, in particular for the generation of synthetic training datasets. However, there are a range of difficulties associated with computational resources…
Forwarded from Нейроинформатика (Neuro AI)
Уважаемые коллеги!
Опубликована информация о доступе к электронной версии сборника 📘
Advances in Neural Computation, Machine Learning, and Cognitive Research IX
Информация о сборнике доступена по ссылке на платформе Springer:
👉 https://link.springer.com/book/10.1007/978-3-032-07690-8
#сборникspringer
#нейроинформатика2025
Опубликована информация о доступе к электронной версии сборника 📘
Advances in Neural Computation, Machine Learning, and Cognitive Research IX
Информация о сборнике доступена по ссылке на платформе Springer:
👉 https://link.springer.com/book/10.1007/978-3-032-07690-8
#сборникspringer
#нейроинформатика2025
SpringerLink
Advances in Neural Computation, Machine Learning, and Cognitive Research IX
The proceedings of Neuroinformatics 2025 cover advances in neural networks, with applications in neuroinformatics, computer vision and sensory systems
Forwarded from ЛЦТ 2025 | Хакатон
В посте — финалисты по направлению «Город»
Это те, кто знают, как менять мир своим подходом.
🔴 В карточках определены все команды, выбранные нашими экспертами
И также напомним, что всех победителей объявим 25 октября на Церемонии награждения, не забудь позвать с собой всех близких❗️
По всем интересующим вопросам можно обратиться к своим модераторам.
💥 @leaders_hack
Это те, кто знают, как менять мир своим подходом.
И также напомним, что всех победителей объявим 25 октября на Церемонии награждения, не забудь позвать с собой всех близких
По всем интересующим вопросам можно обратиться к своим модераторам.
Please open Telegram to view this post
VIEW IN TELEGRAM
Наши команды ITL-Mapper и ITL Spatial Warriors прошли в Финал хакатонов «Лидеры цифровой трансформации» https://i.moscow/lct по направлениям Редактор лидарных карт и Система определения координат объектов по фотографиям
Осталось еще чуть-чуть поднапрячься!
Осталось еще чуть-чуть поднапрячься!
i.moscow
Самый масштабный хакатон в мире для IT-специалистов со всей России и других стран. 40 000 000 призовой фонд. 20 актуальных задач.…
🎉1