iMapDAY – Telegram
iMapDAY
267 subscribers
292 photos
29 videos
1 file
95 links
Сделал канал для размещения новостей от меня @yuddim и моей команды, занимающейся трехмерным компьютерным зрением роботов и автомобилей. Также давно хотелось собирать в одном месте интересные для меня научные публикации и технологические заметки.
Download Telegram
И еще немного фоток из кампуса Пекинского университета, тут еще золотая осень

#Activities
🔥7
🪼 — Сотрудник Центра на HAIS 2025 в Испании!

HAIS — международная конференция, посвящённая гибридным системам ИИ. В этом году она проводилась в Саламанке — городе с молодым населением и старейшим университетом в Европе.

Василий Юрьев, наш сотрудник, студент бакалавриата МФТИ выступал с докладом "MapFM: Foundation Model-Driven HD Mapping with Multi-Task Contextual Learning".

В работе представлена модель MapFM для онлайн-генерации векторных HD-карт в беспилотном вождении. Метод использует мощные фундаментальные модели для кодирования изображений с камер, что повышает качество признаков. Для улучшения понимания сцены применяется многозадачное обучение с дополнительными сегментационными головами. Этот подход обогащает контекстную информацию, что приводит к более точным и качественным векторным HD-картам.

🪼Исходный код доступен публично.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
2
Поучаствовал вместе с Егором Ершовым в круглом столе “Peking University International Roundtable Dialogue on AI Governance на Пекинском Форуме.

В нем также участвовали компания Baidu AI Cloud, которая поддерживает фреймворк для беспилотного вождения Apollo и разрабатывает собственные GPU, Bytedance, которые продвигают различные образовательные инициативы, а не только Tik-Tok, Concordia AI, которая разрабатывает платформу AI Governance и активно внедряет ее в Китае.

Были нешуточные баталии про конкуренцию в сфере ИИ между США и Китаем, что Китаю запрещают Nvidia GPU и отказывают в визах. И нескольким гостям форума из США, в целом нечего было сказать, кроме «давайте жить дружно» 😊

#Activities
🔥2
Приглашаю присоединиться к нашей команде!
🪼Объявляем набор на стажировку в области искусственного интеллекта и робототехники в Центр когнитивного моделирования (Robotics, LLM, RL, CV, Planning)!

Ни для кого не секрет — будущее за искусственным интеллектом. Не просто следить за прогрессом, а создавать его вместе с ведущими учёными страны, участвовать в международных конференциях, получать опыт в прикладных и исследовательских проектах можно у нас на оплачиваемой стажировке.

На выбор предоставляется 20 проектов, которые включают:
🔹обучение с подкреплением
🔹компьютерное зрение
🔹планирование поведения и управление
🔹большие языковые модели
🔹и другое

Два шага для подачи заявки:
1️⃣ выбрать подходящие проекты на сайте
2️⃣ заполнить форму

Стажировку можно совмещать с написанием диплома, но не с другой работой. После успешного окончания возможно трудоустройство в лаборатории Центра, продолжение работы в компаниях-партнерах.

🔥Если у вас больше опыта и вы готовы выйти на полную ставку, то следите за новостями, совсем скоро мы выложим вакансии в Центр.

Прием заявок до 24 ноября 2025 включительно!

Вопросы можно задать в сообщениях @fissun.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥3
Подсвечу характерный тренд в 3D-компьютерном зрении - активно появляются трансформерные методы реконструкции трехмерной карты с одновременной оценкой позы камеры и, в последнее время, с генерацией параметров гауссиан. Из наиболее характерных работ: в начале года появилась и впечатлила всех модель VGGT (University of Oxford, Meta AI), затем разработали более быструю модель Pi3 (Shanghai AI Lab), в прошлом месяце вышла модель HunyuanWorld-Mirror (Tencent).

На днях ByteDance представила модель Depth Anything 3 (статья)(проект)(код). Depth Anything 3 может предсказывать пространственно-согласованную геометрию по одному или нескольким изображениям, даже без известных параметров камеры. Эта модель обучена на 27 датасетах и демонстрирует state-of-the-art показатели качества, можете сами попробовать - ссылка на демо

Модель имеет трансформерную архитектуру с набором специализированных голов для генерации карт глубин, ray map, поз камеры. Одна модель решает целый спектр задач: от монокулярной оценки глубины и определения поз камеры до прямой генерации 3D гауссианов для синтеза новых ракурсов.

Отмечу разнообразие предобученных версий моделей, например, DA3-Small имеет 30 миллионов параметров и работает почти в пять раз быстрее чем популярная модель VGGT.

#References
🔥51
Forwarded from Институт AIRI
Завтра стартует международная конференция по искусственному интеллекту AI Journey 2025 🚀

Событие пройдёт с 19 по 21 ноября и будет включать три тематических блока: общество, бизнес и наука. В этом году Институт AIRI представит 25 докладов, 15 постеров и 6 стендов.

Подробная программа и трансляция на сайте. До встречи в онлайне!
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM