iMapDAY – Telegram
iMapDAY
267 subscribers
292 photos
29 videos
1 file
95 links
Сделал канал для размещения новостей от меня @yuddim и моей команды, занимающейся трехмерным компьютерным зрением роботов и автомобилей. Также давно хотелось собирать в одном месте интересные для меня научные публикации и технологические заметки.
Download Telegram
И еще про тематику робототехники - на прошлых выходных проходила Битва роботов, на финал которой удалось попасть благодаря хакатону ЛЦТ. Масштаб и организация события были на высшем уровне! Все проходило на атмосферной площадке Кинопарка Москино, который открылся в 2024 году и где много локаций для съемок фильмов и прочих активностей.

Из приятно неожиданного - встретил там хорошего друга Евгения Добринского, который теперь поднимает нашу космическую отрасль!

#Activities
👍2
Сегодня провели семинар по свежим методам распознавания места
🔥1
🎓 — Семинар 16. Алгоритмы глобальной локализации роботов с учетом карт знанийи | Александр Мелехин, Егор Пинкин, Григорий Карташов

Современные задачи автономной навигации роботов требуют высокоточной глобальной локализации в сложных и динамически меняющихся средах. Традиционные подходы, основанные на одном типе сенсоров — будь то лидары или камеры, — часто оказываются недостаточно устойчивыми к изменениям освещения, погоды или структуры пространства.

На семинаре будет представлен обзор и анализ мультимодальных и мультисенсорных нейросетевых методов распознавания места, которые комбинируют данные от лидаров, RGB-камер и их последовательностей для повышения точности и надёжности локализации. Особое внимание будет уделено алгоритмам, таким как OPR-Loc-MM, который демонстрирует значительное улучшение метрик (медианная ошибка позиции всего 0.41 м и ориентации 4.37°) за счёт интеграции визуальных и лидарных данных.

Мы обсудим разные методы — от лидарных (MinkLoc3D) и визуальных (MegaLoc) до мультимодальных (MSSPlace) и последовательностных (OPR-Loc-Seq) — позволяет создавать эффективные пайплайны для реальных робототехнических систем. Также будут затронуты вопросы баланса между точностью и временем инференса, что особенно важно для систем, работающих в реальном времени.

📹 Трансляция Youtube и ВК

Приглашаем всех, кто интересуется навигацией роботов, компьютерным зрением и применением нейросетевых методов в робототехнике! Присоединяйтесь прямо сейчас!

#RL
🔥2
Сегодня в Самаре поучаствовал в качестве оппонента в защите кандидатской диссертации Никиты Фирсова про классификацию гиперспектральных изображений https://ssau.ru/resources/dis_protection/firsov.

Также удалось посмотреть лаборатории Самарского университета. Обратите внимание на проведение пар для студентов в огромном зале с самолетами.

Бонусом прикладываю видео с визуализацией спектра с гиперспектральной камеры Specim с портретом подзащитного и его оппонентов.
Такие гиперспектральные камеры позволяют различать типы почв и растительности на спутниковых снимках, а также распознавать материалы из которых сделаны объекты, что может быть очень полезно для робототехники.

#Activities
👍5🔥2
Коломенское сегодня порадовало! Отличный каток и Новогоднее настроение! Всем рекомендую!

#Travels #Moscow
6
Про нашу работу LAMDEN с IJCNN’25 о навигации робота с использованием лифта написали в Известиях: https://iz.ru/2017507/andrei-korshunov/poetazhnaia-strategiia-uchenye-nauchili-robotov-s-ii-ezdit-na-lifte

#News
🔥2
Приближается Новый 2026 год!

Поэтому пора написать что-то про итоги уходящего 2025 года:
это был насыщенный рабочий год - много получилось сделать, но были и трудности.

В этом году в нашей команде появились первые публикации на конференциях A*: BBQ (ICRA’25) и 3DGraphLLM (ICCV’2025). Мы усердно работаем, чтобы в следующем году их стало больше!

Также мы не забываем про публикации в журналах Q1, которые особенны важны для аспирантов российских вузов: в этом году вышли долгожданные SegmATRon (Neurocomputing), MSSPlace (IEEE Access), SegDT (IEEE Access), стремительный PRISM-TopoMap (RA-L).

Много наших интересных результатов все еще на рецензировании (например, LEG-SLAM, NeRFUS, DyGEnc, SG-RAPL, SGN-CIRL, PRISM-Loc), боремся за них!

Вообще, в 2025 году стал явно заметен тренд на интенсивное развитие пространственного искусственного интеллекта (Spatial AI) для роботов и беспилотных автомобилей. Каждый месяц появляются фундаментальные модели SAM3, DINOv3, RADIOv3, VGGT, Depth Anything v3, Cosmos, YOLOE, многочисленные VLM: Qwen 3 -VL, InternVL3.5 и др. Однако мы все еще видим очень много областей, где эти фундаментальные модели нужно существенно дорабатывать.

Мы следуем этому тренду и в этом году показали в наших работах, что построение графов 3D-сцены с применением фундаментальных моделей может существенно повысить качество решения задач поиска 3D-объектов и формирования текстовых ответов по языковым запросам, задач навигации и манипуляции мобильных роботов. Это особенно полезно для шагающих и колесных антропоморфных роботов, которые все шире появляются на складах, предприятиях и на многочисленных выставках. Предстоит много работы, расширение команды и несколько больших новых проектов!

Пожелаю всем сил, новых идей, удачи, усидчивости реализовать все задуманное в 2026 году! 🎄
Please open Telegram to view this post
VIEW IN TELEGRAM
8
В отличной компании встретили Старый Новый год! Поздравляю всех с праздником! 🎉
10
Сегодня наконец-то выбрались и собрали мультимодальный лидарно-камерный датасет с аномальными московскими сугробами в МФТИ и окрестностях. Эти данные очень пригодятся для наших продвинутых методов 3D-сегментации сцены, обновления HD-карт, всепогодного распознавания места.

#Activities #MIPT
👍114🔥4