iMapDAY – Telegram
iMapDAY
267 subscribers
292 photos
29 videos
1 file
95 links
Сделал канал для размещения новостей от меня @yuddim и моей команды, занимающейся трехмерным компьютерным зрением роботов и автомобилей. Также давно хотелось собирать в одном месте интересные для меня научные публикации и технологические заметки.
Download Telegram
Forwarded from OS DevConf
Доклад для тех, кто хочет разобраться в одном из важнейших направлений в роботехнике и беспилотном транспорте 🔥

➡️ Пространственный искусственный интеллект: как роботы и беспилотные автомобили понимают 3D-мир. Дмитрий Юдин (AIRI, МФТИ)

Дмитрий Юдин, ведущий научный сотрудник лаборатории когнитивных систем искусственного интеллекта Института AIRI и заведующий лабораторией интеллектуального транспорта ЦКМ МФТИ, расскажет о развитии технологий пространственного AI.

В докладе рассматриваются концепции пространственного понимания и пространственных рассуждений, возможности современных фундаментальных моделей компьютерного зрения, многомодальных больших языковых моделей (MLLM) для работы с трёхмерными сценами, ограничения текстовых LLM для описания 3D-сцен и современные решения, использующие изображения, текст, облака точек и графы.


Регистрируйтесь, если ещё не сделали это 💻
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2
На этой неделе было интересно и необычно выступить на конференции OS DevConf, которая посвящена разработке системного ПО, ядра Linux и open source! Роботам и беспилотным автомобилям нужны сильные системные программисты!

Конференция прошла в достаточно уютном месте Loft Hall

#Activities
👍2
В четверг с ребятами выступили на Intelligent Automotive
Sensing and Perception
Workshop
.

Я рассказал про способы использования VLM и MLLM для пространственного рассуждения в бортовых системах интеллектуальных транспортных средств. При решении ряда задач эти модели уже могут демонстрировать десятки FPS на бортовых GPU, многое упирается в видеопамять.

А Владислав Дюжев и Александр Лазарев представили некоторые наши результаты по нейросетевой 3D-сегментации облаков точек лидаров для оценки состояния дорожного покрытия

#Activities
🔥31
Традиционная отчетная сессия AIRI идет бодро! Сегодня и я на ней выступил, рассказал про результаты и планы по мультимодальным 3D-картам знаний

#Activities
7
Сегодня в МФТИ успешно прошла защита кандидатских диссертаций по техническим наукам моих двоих аспирантов:

- Александра Мелехина с темой "Разработка и исследование методов и алгоритмов распознавания места на основе последовательности мультимодальных данных". Ссылка на диссертацию: https://mipt.ru/institute/departments/dissertatio/soiskateli/tn/melekhin-aleksandr-alekseevich

- Сергея Линок с темой "Разработка и исследование алгоритмов построения мультимодальных карт по последовательности неразмеченных изображений RGB-D камер интеллектуальных агентов". Ссылка на диссертацию: https://mipt.ru/institute/departments/dissertatio/soiskateli/tn/linok-sergey-aleksandrovich

Обе диссертации защищались по специальности 1.2.1 «Искусственный интеллект и машинное обучение». Всё прошло уверенно и четко!

Все отметили, в числе прочего, практическую значимость работы Александра над OpenPlaceRecognition и Сергея над BBQ. Это библиотеки с кодом, которые мы сейчас активно внедряем в компаниях-партнёрах.

Поздравляю ребят, молодцы!
🔥222
Новый банкомат Сбера очень похож на мобильный робот 😊
😁2
И еще про тематику робототехники - на прошлых выходных проходила Битва роботов, на финал которой удалось попасть благодаря хакатону ЛЦТ. Масштаб и организация события были на высшем уровне! Все проходило на атмосферной площадке Кинопарка Москино, который открылся в 2024 году и где много локаций для съемок фильмов и прочих активностей.

Из приятно неожиданного - встретил там хорошего друга Евгения Добринского, который теперь поднимает нашу космическую отрасль!

#Activities
👍2