NEW BOT Телеграм, страница

iMapDAY

Поучаствовал сегодня в Научном джеме в МФТИ - это свежий формат неформального общения широкой аудитории с исследователями. Рассказал как работается на Фитехе и в AIRI. Там со мной было много незнакомых и знакомых лиц, например, рад был увидеть Дениса Айвазова - директора Проектного офиса МФТИ по техпреду

#Activities

🔥6❤‍🔥2

322 views18:58

iMapDAY

Сегодня успешно завершился наш Хакатон Физтех.Картография про локализацию робота по последовательности изображений.

В этом году команд было немного, но участники были из самых разных вузов: НИУ ИТМО, НИЯУ МИФИ, СПбГМТУ, РТУ МИРЭА,
ИТМО, ПсковГУ, ВГУ.

В итоге уверенно победила команда AXIOM (МИФИ, МИРЭА, СПбГМТУ), ребята успели немного улучшить базовое решение и собрать корректный собственный датасет для валидации алгоритмов распознавания места. Поздравляем и будем надеяться на плодотворное сотрудничество в будущем!

Следует отметить, что для этого хакатона Александр Мелехин существенно доработал и упростил установку и взаимодействие с нашей библиотекой OpenPlaceRecognition как базового пайплайна решения задачи.

Больше фотографий с события можно посмотреть здесь.

#Activities

🔥5💋1

436 views19:54

iMapDAY

Пару дней назад исследователи из Китая (Peking University) выложили на Arxiv достаточно объемный и подробный обзор современных Vision-Language-Action моделей для управления роботами и беспилотными автомобилями:
A Survey on Vision-Language-Action Models: An Action Tokenization Perspective

Репозиторий с подборкой статей: https://github.com/Psi-Robot/Awesome-VLA-Papers

#References

🔥3👍2

730 viewsedited 20:38

iMapDAY

На этой неделе мой аспирант в МФТИ Чжан Хучженьюй (Zhang Huzhenyu) успешно выступил на конференции IJCNN (International Joint Conference on Neural Networks) в Риме. Эта конференция является флагманской для Международной нейростевой ассоциации (INNS).

На конференции он выступал с устным докладом по нашей статье, получившей достаточно высокие оценки рецензентов: LaMDEN: Addressing Elevator-based Navigation with Large Language Models and 3D Scene Graphs (Huzhenyu Zhang, Yudin Dmitry). В этой работе показана польза использования графа 3D-сцены для LLM-планирования действий мобильного манипулятора в многоэтажных помещениях с лифтом.

Презентацию можно посмотреть тут

Репозиторий к статье выложен в открытый доступ: https://github.com/zhanghuzhenyu/mul-floor-navigation

#Papers #IJCNN

🔥12

290 views11:27

iMapDAY

Настало время рубрики «Отзыв научного руководителя»

Начну по списку с выпускников нашей магистратуры в МФТИ по профилю МТИИ.

Михаил Авшалумов - тема его диплома была «Разработка мультимодальных нейросетевых методов распознавания изображений на основе трансформерных архитектур».

По этой теме он успел поучаствовать в конференции HAIS-2024 в Испанской Саламанке и опубликовать статью Reframing в престижной серии Lecture Notes in Artificial Intelligence издательства Springer. Сейчас наша работа Say It Better, где он выступает первым автором, подана в топовый журнал Neurocomputing и имеет все шансы на принятие.

Также он достаточно успешно участвовал в нашем проекте для Центра робототехники Сбера. Рецензирования ждет статья на конференцию IITI-2025 по мультимодальной сегментации изображений по запросам-картинкам и тексту.

Будем надеяться, что в какой-то момент Михаил выберет академический трек и поступит к нам в аспирантуру.

#Person #Papers

❤8🔥5

306 views17:31

iMapDAY

Следующий мой выпускник 2025 года из нашей магистратуры в МФТИ по профилю МТИИ - Лука Ветошкин

Тема его диплома: «Сегментация объектов сложной формы по текстовому запросу».

По этой теме мы с ним сделали неплохую статью Talk2SAM и подали на конференцию ICONIP-2025.

Лука много участвовал в индустриальных проектах, связанных с сегментацией изображений для роботов и автомобилей от ООО ИнтеграНТ и ООО Вега-ГАЗ. По первому из них есть препринт, и сейчас мы доделываем это исследование, чтобы представить в журнале Q1. По второму проекту мы вместе с Ольгой Матыкиной сделали статью в Труды МФТИ, которая выйдет в 3 номере этого года. Должен отметить, что Лука даже съездил в Якутию на испытания разработанной нами систему помощи водителю грузового автомобиля! Ну и наконец он помог нам с проектом по Код-ИИ Фонда содействия инновациям.

#Person #Papers

🔥8

305 views17:56

iMapDAY

В беспилотном транспорте Лидары (LiDARs) позволяют создавать системы машинного зрения, которые одинаково хорошо работают днем и ночью и могут различать препятствия на расстоянии более 200м. Долгое время они были очень дорогими (особенно 360°-е, мы их применяли на конкурсе Пятый уровень), но в последнее время появились твердотельные лидары, которые видят сектор пространства ~120° по горизонтали и ~25° по вертикали, их цена уже может быть ниже 1000$ и они становятся по-настоящему массовыми. На фото над лобовым стеклом машины Aito M9 именно такой лидар.

Мы на Физтехе активно занимаемся исследованием алгоритмов обработки лидарных облаков точек для сегментации объектов, локализации и картирования. Прикрепил пример 📷, как мы распознаем дорогу и лужи на кампусе МФТИ.

На прошлой неделе к нам в Лабу и Институт ИИ приезжала делегация из Китая, с которой пересекаются наши научные интересы. Обсудили дальнейшее сотрудничество. Надеюсь, в обозримом будущем наши алгоритмы будут массово работать на борту электромобилей 🚗

🔥4❤1👍1

1.69K views14:52

About

Blog

Apps

Platform