Провели сегодня презентацию хакатонов образовательного форума по ИИ и физике в МФТИ для финалистов Олимпиады "Я-Профессионал". В этом году у нас 4 интересных кейса от Сбера, РЖД, МТС и от нашей Лаборатории интеллектуального транспорта (Центр когнитивного моделирования МФТИ).
У команд впереди два насыщенных дня написания кода, общения, защит проектов и многого другого!
Победителей ждут приглашения на собеседования на стажировки и приятные призы!
Пожелаем участникам хакатонов удачи!
Некоторые фотографии с этого события буду складывать тут.
#Activities
У команд впереди два насыщенных дня написания кода, общения, защит проектов и многого другого!
Победителей ждут приглашения на собеседования на стажировки и приятные призы!
Пожелаем участникам хакатонов удачи!
Некоторые фотографии с этого события буду складывать тут.
#Activities
❤5👍1
Поучаствовал сегодня в Научном джеме в МФТИ - это свежий формат неформального общения широкой аудитории с исследователями. Рассказал как работается на Фитехе и в AIRI. Там со мной было много незнакомых и знакомых лиц, например, рад был увидеть Дениса Айвазова - директора Проектного офиса МФТИ по техпреду
#Activities
#Activities
🔥6❤🔥2
Сегодня успешно завершился наш Хакатон Физтех.Картография про локализацию робота по последовательности изображений.
В этом году команд было немного, но участники были из самых разных вузов: НИУ ИТМО, НИЯУ МИФИ, СПбГМТУ, РТУ МИРЭА,
ИТМО, ПсковГУ, ВГУ.
В итоге уверенно победила команда AXIOM (МИФИ, МИРЭА, СПбГМТУ), ребята успели немного улучшить базовое решение и собрать корректный собственный датасет для валидации алгоритмов распознавания места. Поздравляем и будем надеяться на плодотворное сотрудничество в будущем!
Следует отметить, что для этого хакатона Александр Мелехин существенно доработал и упростил установку и взаимодействие с нашей библиотекой OpenPlaceRecognition как базового пайплайна решения задачи.
Больше фотографий с события можно посмотреть здесь.
#Activities
В этом году команд было немного, но участники были из самых разных вузов: НИУ ИТМО, НИЯУ МИФИ, СПбГМТУ, РТУ МИРЭА,
ИТМО, ПсковГУ, ВГУ.
В итоге уверенно победила команда AXIOM (МИФИ, МИРЭА, СПбГМТУ), ребята успели немного улучшить базовое решение и собрать корректный собственный датасет для валидации алгоритмов распознавания места. Поздравляем и будем надеяться на плодотворное сотрудничество в будущем!
Следует отметить, что для этого хакатона Александр Мелехин существенно доработал и упростил установку и взаимодействие с нашей библиотекой OpenPlaceRecognition как базового пайплайна решения задачи.
Больше фотографий с события можно посмотреть здесь.
#Activities
🔥5💋1
Пару дней назад исследователи из Китая (Peking University) выложили на Arxiv достаточно объемный и подробный обзор современных Vision-Language-Action моделей для управления роботами и беспилотными автомобилями:
A Survey on Vision-Language-Action Models: An Action Tokenization Perspective
Репозиторий с подборкой статей: https://github.com/Psi-Robot/Awesome-VLA-Papers
#References
A Survey on Vision-Language-Action Models: An Action Tokenization Perspective
Репозиторий с подборкой статей: https://github.com/Psi-Robot/Awesome-VLA-Papers
#References
🔥3👍2
На этой неделе мой аспирант в МФТИ Чжан Хучженьюй (Zhang Huzhenyu) успешно выступил на конференции IJCNN (International Joint Conference on Neural Networks) в Риме. Эта конференция является флагманской для Международной нейростевой ассоциации (INNS).
На конференции он выступал с устным докладом по нашей статье, получившей достаточно высокие оценки рецензентов: LaMDEN: Addressing Elevator-based Navigation with Large Language Models and 3D Scene Graphs (Huzhenyu Zhang, Yudin Dmitry). В этой работе показана польза использования графа 3D-сцены для LLM-планирования действий мобильного манипулятора в многоэтажных помещениях с лифтом.
Презентацию можно посмотреть тут
Репозиторий к статье выложен в открытый доступ: https://github.com/zhanghuzhenyu/mul-floor-navigation
#Papers #IJCNN
На конференции он выступал с устным докладом по нашей статье, получившей достаточно высокие оценки рецензентов: LaMDEN: Addressing Elevator-based Navigation with Large Language Models and 3D Scene Graphs (Huzhenyu Zhang, Yudin Dmitry). В этой работе показана польза использования графа 3D-сцены для LLM-планирования действий мобильного манипулятора в многоэтажных помещениях с лифтом.
Презентацию можно посмотреть тут
Репозиторий к статье выложен в открытый доступ: https://github.com/zhanghuzhenyu/mul-floor-navigation
#Papers #IJCNN
🔥12
Настало время рубрики «Отзыв научного руководителя»
Начну по списку с выпускников нашей магистратуры в МФТИ по профилю МТИИ.
Михаил Авшалумов - тема его диплома была «Разработка мультимодальных нейросетевых методов распознавания изображений на основе трансформерных архитектур».
По этой теме он успел поучаствовать в конференции HAIS-2024 в Испанской Саламанке и опубликовать статью Reframing в престижной серии Lecture Notes in Artificial Intelligence издательства Springer. Сейчас наша работа Say It Better, где он выступает первым автором, подана в топовый журнал Neurocomputing и имеет все шансы на принятие.
Также он достаточно успешно участвовал в нашем проекте для Центра робототехники Сбера. Рецензирования ждет статья на конференцию IITI-2025 по мультимодальной сегментации изображений по запросам-картинкам и тексту.
Будем надеяться, что в какой-то момент Михаил выберет академический трек и поступит к нам в аспирантуру.
#Person #Papers
Начну по списку с выпускников нашей магистратуры в МФТИ по профилю МТИИ.
Михаил Авшалумов - тема его диплома была «Разработка мультимодальных нейросетевых методов распознавания изображений на основе трансформерных архитектур».
По этой теме он успел поучаствовать в конференции HAIS-2024 в Испанской Саламанке и опубликовать статью Reframing в престижной серии Lecture Notes in Artificial Intelligence издательства Springer. Сейчас наша работа Say It Better, где он выступает первым автором, подана в топовый журнал Neurocomputing и имеет все шансы на принятие.
Также он достаточно успешно участвовал в нашем проекте для Центра робототехники Сбера. Рецензирования ждет статья на конференцию IITI-2025 по мультимодальной сегментации изображений по запросам-картинкам и тексту.
Будем надеяться, что в какой-то момент Михаил выберет академический трек и поступит к нам в аспирантуру.
#Person #Papers
❤8🔥5