Сделал канал для размещения новостей от меня @yuddim и моей команды, занимающейся трехмерным компьютерным зрением роботов и автомобилей в Лаборатории интеллектуального транспорта ЦКМ МФТИ и в AIRI. В том числе, мы разрабатываем методы, алгоритмы и код для построения трехмерных карт с помощью методов искусственного интеллекта (отсюда и название канала).
Также давно хотелось собирать в одном месте интересные для меня научные публикации и технологические заметки.
В постах будут соответствующие теги, по которым можно будет группировать новости и публикации.
Думаю, это будет полезно еще кому-то
Также давно хотелось собирать в одном месте интересные для меня научные публикации и технологические заметки.
В постах будут соответствующие теги, по которым можно будет группировать новости и публикации.
Думаю, это будет полезно еще кому-то
cogmodel.mipt.ru
Профиль | Юдин
Заведующий лабораторией Интеллектуального Транспорта
👍5
Поучаствовал в форуме DataFest 2025, рассказал как мы применяем фундаментальные нейросетевые модели для построения карт знаний роботами.
Прикрепляю немного фото. Мероприятие прошло бодро!
Презентацию можно посмотреть тут.
Видео с выступлением здесь.
Кроме того, мои аспиранты Александр Мелехин и Сергей Линок также выступили с интересными докладами на DataFest.
#Activities #Datafest
Прикрепляю немного фото. Мероприятие прошло бодро!
Презентацию можно посмотреть тут.
Видео с выступлением здесь.
Кроме того, мои аспиранты Александр Мелехин и Сергей Линок также выступили с интересными докладами на DataFest.
#Activities #Datafest
👏3
На этой неделе в Атланте в США прошла самая авторитетная конференция по робототехнике ICRA 2025 https://2025.ieee-icra.org/program/. На ней наша команда представила онлайн-доклад по работе, которую мы сделали в МФТИ совместно с AIRI и Центром робототехники Сбера: Beyond Bare Queries: Open-Vocabulary Object Grounding with 3D Scene Graph (авторы Сергей Линок, Татьяна Земскова, Светлана Ладанова, Роман Титков, Дмитрий Юдин, Максим Монастырный, Алексей Валенков). В ней мы показали, как можно строить мультимодальные карты помещений в виде графов и использовать их для поиска трехмерных объектов по запросам на естественном языке. Почитать статью можно тут: https://arxiv.org/abs/2406.07113. На фото пример, как этот подход работает на борту робота AGIBot
Проект с кратким описанием и ссылкой на код: https://linukc.github.io/BeyondBareQueries/
#Papers #ICRA #A_star
Проект с кратким описанием и ссылкой на код: https://linukc.github.io/BeyondBareQueries/
#Papers #ICRA #A_star
🔥5
