Center for Cognitive Modeling – Telegram
Center for Cognitive Modeling
1.56K subscribers
596 photos
43 videos
3 files
575 links
Telegram-канал Центра Когнитивного Моделирования МФТИ: новости о нас, поступлении, стажировках и искусственном интеллекте🦾

Магистратура и аспирантура МТИИ МФТИ: https://cogmodel.mipt.ru/applicants

По вопросам: @rvainberg, @fissun
Download Telegram
— Начинаем семинар, присоединяйтесь к трансляции в ВК или на YouTube.
👍3
Forwarded from Grounding Knowledge 🦾
Наши ребята на ведущей конференции по обучению роботов в Корее - CoRL 2025🦾
🔥12
🦾Продолжается набор в бакалавриат для студентов 3 курса ФПМИ МФТИ по искусственному интеллекту и робототехнике!

В Центре под руководством ведущих специалистов вы сможете заниматься написанием статей на передовые международные конференции, а также работать над прикладными проектами по тематикам:

🌱Обучение с подкреплением для задач робототехники (манипуляция, навигация)
🌱Мультимодальные карты знаний в компьютерном зрении и робототехнике
🌱Компьютерное зрение для задач робототехники и беспилотного транспорта
🌱Большие языковые и мультимодальные модели для генерации действий в робототехнике
🌱Мультимодальные среды и модели в обучении с подкреплением

А что дальше?
🌱 Не прекращать учиться: у нас есть магистратура и аспирантура
🌱 Строить карьеру: наши выпускники идут на топовые позиции как в науке, так и в коммерции

🙂 Подавайте заявку через форму до 1 ноября включительно. Собеседования будут проходить с 2 ноября по 20.

Презентацию программы, учебный план и другие подробности можно посмотреть на сайте.
Please open Telegram to view this post
VIEW IN TELEGRAM
7🔥3🎉2
🎓 — Семинар 5. Safe RL and Multi-modal Safe RL | Григорий Горбов

Одной из основных проблем применения методов RL на реальных роботах является учёт безопасности. Доклад посвящен методам безопасного RL (Safe RL), а также набирающей популярность области Multi-modal Safe RL.

Аспирантом нашего Центра будет представлен обзор последних работ по Safe RL, Multi-modal Safe RL, а также последние наработки нашей команды в этих областях.

4️⃣ Гитхаб

👉🏻 Дата: 02.10.25, четверг в 17:00
📹 Трансляция: Youtube или ВК

Подключайтесь к живому обсуждению и задавайте вопросы в прямом эфире! Ждем всех!

#RL
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥71❤‍🔥1👍1
— Начинаем семинар, присоединяйтесь к трансляции в ВК или на YouTube.
🔥6
🚀 — В этом году МФТИ снова стал площадкой для проведения Олимпиады Я-Профессионал по направлению "Искусственный интеллект", за которую отвечает наш Центр!

📍От вас: регистрация по направлению "Искусственный интеллект" до 11 ноября и любовь к ИИ
📍От нас: интересные задачи, призы и дополнительные баллы при поступлении в МФТИ и другие вузы победителям и призёрам!

Отборочный этап стартует 14 ноября, так что начинайте готовиться уже сейчас — смотрите задания прошлых лет по ссылке.
Please open Telegram to view this post
VIEW IN TELEGRAM
9🔥2
Forwarded from iMapDAY
Media is too big
VIEW IN TELEGRAM
Напишу что-нибудь новенькое про методы 3D компьютерного зрения:

Позавчера авторы из Microsoft Research, Harvard и Tsinghua University выложили код SOTA-модели MoGe-2 для реконструкции метрической карты глубин и карты нормалей из монокулярных изображений, статья про которую была принята на Neurips 2025. Демо выглядит впечатляющим. Эта модель - развитие метода MoGe, представленного на СVPR2025.

Статья: MoGe-2: Accurate Monocular Geometry with Metric Scale and Sharp Details, Neurips 2025, https://arxiv.org/abs/2507.02546
Проект: https://wangrc.site/MoGe2Page/
Код: https://github.com/microsoft/moge

В качестве бонуса, приведу также ссылку на другую свежую модель UniK3D, позволяющую делать консистентную реконструкцию карт глубин по монокулярной видеопоследовательности, статья про которую также была принята на CVPR2025

#References
👍54
🎓Семинар 6. Реконструкция семантических 3D-сцен: Оптимизация и анализ признаков, методы гауссовского сплаттинга | Виталий Илюхин

В рамках семинара магистром нашего Центра будет представлен краткий анализ современных подходов к представлению и реконструкции 3D-сцен, включая трёхмерный, двумерный гауссовский сплаттинг и гибридные подходы.

Подробно будет рассмотрена обновлённая версия системы для решения задачи семантической (open-vocabulary) 3D-реконструкции сцены в реальном времени. Система построена на объединении гауссовского сплаттинга (Gaussian Splatting), методах сжатия визуально-языковых признаков (например, DINOv2, CLIP) и технологии одновременной локализации и построения карты (SLAM). Для достижения высокой скорости работы используется обучаемый компрессор на основе нейросетевого автоэнкодера, который эффективно сжимает семантические признаки, минимизируя вычислительные затраты.

👉🏻 Дата: 09.10.25, четверг в 17:00
📹 Трансляция: Youtube или ВК

Подключайтесь к живому обсуждению и задавайте вопросы в прямом эфире! Ждем всех!

#CV #SLAM
7🔥1
⚡️ — Начинаем семинар, присоединяйтесь к трансляции в ВК или на YouTube!
4🔥2
Forwarded from Будни Дикого
Ещё не выходные, а уже приключения)

Сейчас идёт конкурс НТИ по археологии. Задача - роботом находить предметы и объекты раскопок. Это в целом сложная наука, и в нее пытаются внедрять современные подходы.

Наша лаба решила участвовать, я руководитель команды TerraCognitaBot. Команда из 8 человек, где есть как магистры, так и пенсионеры))

Мы прошли в финал и начали сегодня был наш первый тестовый заезд на полигоне в Нахабино)

Все, поставленные на сегодня задачи были выполнены, но конечно есть ещё что улучшать).

На следующей неделе у нас ещё один заезд и соревы. Держим кулачки!

Как бонус - фото, способ защиты робота от дождя (реально рабочий и даже буераки нормально проезжает)
🔥12👍52👏1
🤖 — Недавно в Казани прошла научная конференция ИИ-ЗАМАН: делимся фотографиями и статьями!

Конференция объединила исследователей ИИ со всей России. И наши ребята внесли свой вклад, представив работы Центра и партнёров:

🪼Татьяна Земскова с работой "Beyond Bare Queries: Open-Vocabulary Object Grounding with 3D Scene Graph"
Подход под названием BBQ (Beyond Bare Queries) помогает в решении проблемы автономных агентов по поиску объектов, неоднозначно описанных на естественном языке. Он создает представление 3D-сцены в виде графа с метрическими и семантическими пространственными связями и задействует крупную языковую модель в качестве интерфейса «человек-агент» через наш алгоритм дедуктивного анализа сцены.

🪼Анатолий Онищенко с работой "LookPlanGraph: Embodied Instruction Following Method with VLM Graph Augmentation"
Метод, который объединяет графовое планирование с динамическим обновлением сцены, позволяет роботу адаптироваться к изменяющейся среде и корректировать план действий в процессе выполнения задачи.

🪼Адитья Нарендра с работой "M3PO: Massively Multi-Task Model-Based Policy Optimzation"
Новый метод M3PO, расширяющий классическую архитектуру Proximal Policy Optimization (PPO), в которой объединены мультизадачность и модель мира, которую робот выучивает в процессе взаимодействия при онлайн-обучении. В результате метод обеспечивает быстрое обучение компактных с точки зрения количества параметров стратегий, пригодных для быстрого развертывания на робототехнических манипуляторах.

🪼Григорий Горбов с работой "CrafText Benchmark: Advancing Instruction Following in Complex Multimodal Open-Ended World"
CrafText — бенчмарк для оценки способности агентов следовать инструкциям в мультимодальной среде с разнообразными заданиями и динамическим взаимодействием. CrafText включает 3924 инструкции, содержащие 3423 уникальных слова, и охватывает задачи из разных областей.

🪼Ева Бакаева с работой "AmbiK: Dataset of Ambiguous Tasks in Kitchen Environment"
Обработка неоднозначных инструкций в реальных условиях представляет сложность для LLM. Существуют различные методы выявления неоднозначности задач, однако их сравнение затруднено из-за использования разных наборов данных и отсутствия универсального эталона. Решить эту проблему поможет AmbiK (Ambiguous Tasks in Kitchen Environment) — полностью текстовый набор данных, содержащий неоднозначные инструкции, предназначенные для робота в кухонной среде.

#CV #VLM #AI
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5🔥52