Video Depth Anything: Consistent Depth Estimation for Super-Long Videos
Генератор консистентной глубины для длинных видео. На черрипиках бьет конкурентов, в том числе DepthCrafter.
Код
Демо
#video2depth
Генератор консистентной глубины для длинных видео. На черрипиках бьет конкурентов, в том числе DepthCrafter.
Код
Демо
#video2depth
🔥8🤯1
Hunyuan3D-2GP: 3D Generation for the GPU Poor
Это Hunyuan3D-2 для бедных. Генерация за одну минуту на 6ГБ VRAM
#textto3d #imageto3d
Это Hunyuan3D-2 для бедных. Генерация за одну минуту на 6ГБ VRAM
#textto3d #imageto3d
GitHub
GitHub - deepbeepmeep/Hunyuan3D-2GP: GPU Poor Version of Hunyuan3D-2
GPU Poor Version of Hunyuan3D-2. Contribute to deepbeepmeep/Hunyuan3D-2GP development by creating an account on GitHub.
❤3🔥1
UI-TARS
Агент взаимодействия с графическими интерфейсами (GUI) от ByteDance
В отличие от других подобных моделей, UI-TARS не нуждается в сложных дополнительных программах или подсказках, визуально-языковая модель и взаимодействие с интерфейсом объединены в одну модель.
умеет находить информацию, выполнять действия в приложениях и веб-сайтах
UI-TARS Desktop
#agent #gui #vlm
Агент взаимодействия с графическими интерфейсами (GUI) от ByteDance
В отличие от других подобных моделей, UI-TARS не нуждается в сложных дополнительных программах или подсказках, визуально-языковая модель и взаимодействие с интерфейсом объединены в одну модель.
умеет находить информацию, выполнять действия в приложениях и веб-сайтах
UI-TARS Desktop
#agent #gui #vlm
👍9🔥3
Media is too big
VIEW IN TELEGRAM
CameraHMR: Aligning People with Perspective
Реконструкция 3D позы и формы человека по одному изображению или видео с учетом перспективы камеры
Код
#poseestimation #video2pose #image2pose #videoto3d #video2mesh #humanreconstruction
Реконструкция 3D позы и формы человека по одному изображению или видео с учетом перспективы камеры
Есть 4 ключевых фактора, которые делают его точным и надежным:
1. Чтобы получить точную 3D-форму и позу, а также хорошее соответствие особенностям изображения, вам необходимо знать фокусное расстояние камеры. Чтобы решить эту проблему, мы обучаем HumanFOV вычислять поле зрения.
2. Мы вводим CameraHMR, который интегрирует HumanFOV в HMR2.0 для использования расчетного фокусного расстояния.
3. Чтобы получить точные обучающие данные pseudo ground truth (pGT), мы вычисляем фокусное расстояние для изображений в наборе данных 4DHumans и модифицируем SMPLify, чтобы учесть это.
4. Но SMPLify использует только разреженные 2D-ключевые точки, которые не отражают форму тела. Итак, мы тренируем детектор ключевых точек плотной поверхности, DenseKP, на BEDLAM и запускаем его на 4DHumans, что приводит к улучшению формы тела. Результирующий метод - CamSMPLify.
Мы повторяем обучение CameraHMR и запускаем CamSMPLify на обучающем наборе, инициализированном CameraHMR . Это приводит к значительному улучшению pGT для 4DHumans и методу HMR с одним изображением SOTA.
Код
#poseestimation #video2pose #image2pose #videoto3d #video2mesh #humanreconstruction
👍8🔥1💩1
Go with the Flow
Контроль движения на генерации видео за счет геометрического искажения шума
Код
Веса
Видео (4 минуты)
Видео туториал
#motioncontrol #motiontransfer #cameracontrol
Контроль движения на генерации видео за счет геометрического искажения шума
Код
Веса
Видео (4 минуты)
Видео туториал
#motioncontrol #motiontransfer #cameracontrol
👍12🔥4🍾2
Gemini 2.0 Flash Thinking
Гугл обновил свою рассуждалку. Контекст 1 миллион токенов - впятеро больше, чем o1 Pro
В топе на арене
Уже в AnyChat
Попробовать (не для российских IP)
#reasining #assistant
Гугл обновил свою рассуждалку. Контекст 1 миллион токенов - впятеро больше, чем o1 Pro
В топе на арене
Уже в AnyChat
Попробовать (не для российских IP)
#reasining #assistant
👍8❤2
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
DiffuEraser: A Diffusion Model for Video Inpainting
Слишком долго у Propainter не было конкурентов в опенсорсе.
Это инпейнтинг видео по маске. И на черрипиках он заметно лучше пропейнтера
Потребление видеопамяти - на скрине
Код
Демо
#videoinpainting #inpainting
Слишком долго у Propainter не было конкурентов в опенсорсе.
Это инпейнтинг видео по маске. И на черрипиках он заметно лучше пропейнтера
Потребление видеопамяти - на скрине
Код
Демо
#videoinpainting #inpainting
🔥7👍1🤔1