iMapDAY – Telegram
iMapDAY
267 subscribers
292 photos
29 videos
1 file
95 links
Сделал канал для размещения новостей от меня @yuddim и моей команды, занимающейся трехмерным компьютерным зрением роботов и автомобилей. Также давно хотелось собирать в одном месте интересные для меня научные публикации и технологические заметки.
Download Telegram
В той же секции со мной выступал про вызовы для Safe AI на китайском языке Hu Songlin (H 37) из University of Chinese Academy of Sciences. Причем потом оказалось, что он хорошо говорит по-английски и занимается релевантными для нас проектами в сфере LLM и MLLM.

Также на этом форуме выступил Zhu Song-Chun (H 106)из Peking University, рассказал про эволюцию цивилизации в эру ИИ - это его более гуманитарная версия доклада, который он делал на IROS-2025. С его роботехнической командой из Института искусственного интеллекта Пекинского университета у нас намечается сотрудничество.

#Activities
🔥1
И еще немного фоток из кампуса Пекинского университета, тут еще золотая осень

#Activities
🔥7
🪼 — Сотрудник Центра на HAIS 2025 в Испании!

HAIS — международная конференция, посвящённая гибридным системам ИИ. В этом году она проводилась в Саламанке — городе с молодым населением и старейшим университетом в Европе.

Василий Юрьев, наш сотрудник, студент бакалавриата МФТИ выступал с докладом "MapFM: Foundation Model-Driven HD Mapping with Multi-Task Contextual Learning".

В работе представлена модель MapFM для онлайн-генерации векторных HD-карт в беспилотном вождении. Метод использует мощные фундаментальные модели для кодирования изображений с камер, что повышает качество признаков. Для улучшения понимания сцены применяется многозадачное обучение с дополнительными сегментационными головами. Этот подход обогащает контекстную информацию, что приводит к более точным и качественным векторным HD-картам.

🪼Исходный код доступен публично.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
2
Поучаствовал вместе с Егором Ершовым в круглом столе “Peking University International Roundtable Dialogue on AI Governance на Пекинском Форуме.

В нем также участвовали компания Baidu AI Cloud, которая поддерживает фреймворк для беспилотного вождения Apollo и разрабатывает собственные GPU, Bytedance, которые продвигают различные образовательные инициативы, а не только Tik-Tok, Concordia AI, которая разрабатывает платформу AI Governance и активно внедряет ее в Китае.

Были нешуточные баталии про конкуренцию в сфере ИИ между США и Китаем, что Китаю запрещают Nvidia GPU и отказывают в визах. И нескольким гостям форума из США, в целом нечего было сказать, кроме «давайте жить дружно» 😊

#Activities
🔥2
Приглашаю присоединиться к нашей команде!
🪼Объявляем набор на стажировку в области искусственного интеллекта и робототехники в Центр когнитивного моделирования (Robotics, LLM, RL, CV, Planning)!

Ни для кого не секрет — будущее за искусственным интеллектом. Не просто следить за прогрессом, а создавать его вместе с ведущими учёными страны, участвовать в международных конференциях, получать опыт в прикладных и исследовательских проектах можно у нас на оплачиваемой стажировке.

На выбор предоставляется 20 проектов, которые включают:
🔹обучение с подкреплением
🔹компьютерное зрение
🔹планирование поведения и управление
🔹большие языковые модели
🔹и другое

Два шага для подачи заявки:
1️⃣ выбрать подходящие проекты на сайте
2️⃣ заполнить форму

Стажировку можно совмещать с написанием диплома, но не с другой работой. После успешного окончания возможно трудоустройство в лаборатории Центра, продолжение работы в компаниях-партнерах.

🔥Если у вас больше опыта и вы готовы выйти на полную ставку, то следите за новостями, совсем скоро мы выложим вакансии в Центр.

Прием заявок до 24 ноября 2025 включительно!

Вопросы можно задать в сообщениях @fissun.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥3
Подсвечу характерный тренд в 3D-компьютерном зрении - активно появляются трансформерные методы реконструкции трехмерной карты с одновременной оценкой позы камеры и, в последнее время, с генерацией параметров гауссиан. Из наиболее характерных работ: в начале года появилась и впечатлила всех модель VGGT (University of Oxford, Meta AI), затем разработали более быструю модель Pi3 (Shanghai AI Lab), в прошлом месяце вышла модель HunyuanWorld-Mirror (Tencent).

На днях ByteDance представила модель Depth Anything 3 (статья)(проект)(код). Depth Anything 3 может предсказывать пространственно-согласованную геометрию по одному или нескольким изображениям, даже без известных параметров камеры. Эта модель обучена на 27 датасетах и демонстрирует state-of-the-art показатели качества, можете сами попробовать - ссылка на демо

Модель имеет трансформерную архитектуру с набором специализированных голов для генерации карт глубин, ray map, поз камеры. Одна модель решает целый спектр задач: от монокулярной оценки глубины и определения поз камеры до прямой генерации 3D гауссианов для синтеза новых ракурсов.

Отмечу разнообразие предобученных версий моделей, например, DA3-Small имеет 30 миллионов параметров и работает почти в пять раз быстрее чем популярная модель VGGT.

#References
🔥51