Hunyuan3D-2GP: 3D Generation for the GPU Poor
Это Hunyuan3D-2 для бедных. Генерация за одну минуту на 6ГБ VRAM
#textto3d #imageto3d
Это Hunyuan3D-2 для бедных. Генерация за одну минуту на 6ГБ VRAM
#textto3d #imageto3d
GitHub
GitHub - deepbeepmeep/Hunyuan3D-2GP: GPU Poor Version of Hunyuan3D-2
GPU Poor Version of Hunyuan3D-2. Contribute to deepbeepmeep/Hunyuan3D-2GP development by creating an account on GitHub.
❤3🔥1
UI-TARS
Агент взаимодействия с графическими интерфейсами (GUI) от ByteDance
В отличие от других подобных моделей, UI-TARS не нуждается в сложных дополнительных программах или подсказках, визуально-языковая модель и взаимодействие с интерфейсом объединены в одну модель.
умеет находить информацию, выполнять действия в приложениях и веб-сайтах
UI-TARS Desktop
#agent #gui #vlm
Агент взаимодействия с графическими интерфейсами (GUI) от ByteDance
В отличие от других подобных моделей, UI-TARS не нуждается в сложных дополнительных программах или подсказках, визуально-языковая модель и взаимодействие с интерфейсом объединены в одну модель.
умеет находить информацию, выполнять действия в приложениях и веб-сайтах
UI-TARS Desktop
#agent #gui #vlm
👍9🔥3
Media is too big
VIEW IN TELEGRAM
CameraHMR: Aligning People with Perspective
Реконструкция 3D позы и формы человека по одному изображению или видео с учетом перспективы камеры
Код
#poseestimation #video2pose #image2pose #videoto3d #video2mesh #humanreconstruction
Реконструкция 3D позы и формы человека по одному изображению или видео с учетом перспективы камеры
Есть 4 ключевых фактора, которые делают его точным и надежным:
1. Чтобы получить точную 3D-форму и позу, а также хорошее соответствие особенностям изображения, вам необходимо знать фокусное расстояние камеры. Чтобы решить эту проблему, мы обучаем HumanFOV вычислять поле зрения.
2. Мы вводим CameraHMR, который интегрирует HumanFOV в HMR2.0 для использования расчетного фокусного расстояния.
3. Чтобы получить точные обучающие данные pseudo ground truth (pGT), мы вычисляем фокусное расстояние для изображений в наборе данных 4DHumans и модифицируем SMPLify, чтобы учесть это.
4. Но SMPLify использует только разреженные 2D-ключевые точки, которые не отражают форму тела. Итак, мы тренируем детектор ключевых точек плотной поверхности, DenseKP, на BEDLAM и запускаем его на 4DHumans, что приводит к улучшению формы тела. Результирующий метод - CamSMPLify.
Мы повторяем обучение CameraHMR и запускаем CamSMPLify на обучающем наборе, инициализированном CameraHMR . Это приводит к значительному улучшению pGT для 4DHumans и методу HMR с одним изображением SOTA.
Код
#poseestimation #video2pose #image2pose #videoto3d #video2mesh #humanreconstruction
👍8🔥1💩1
Go with the Flow
Контроль движения на генерации видео за счет геометрического искажения шума
Код
Веса
Видео (4 минуты)
Видео туториал
#motioncontrol #motiontransfer #cameracontrol
Контроль движения на генерации видео за счет геометрического искажения шума
Код
Веса
Видео (4 минуты)
Видео туториал
#motioncontrol #motiontransfer #cameracontrol
👍12🔥4🍾2
Gemini 2.0 Flash Thinking
Гугл обновил свою рассуждалку. Контекст 1 миллион токенов - впятеро больше, чем o1 Pro
В топе на арене
Уже в AnyChat
Попробовать (не для российских IP)
#reasining #assistant
Гугл обновил свою рассуждалку. Контекст 1 миллион токенов - впятеро больше, чем o1 Pro
В топе на арене
Уже в AnyChat
Попробовать (не для российских IP)
#reasining #assistant
👍8❤2
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
DiffuEraser: A Diffusion Model for Video Inpainting
Слишком долго у Propainter не было конкурентов в опенсорсе.
Это инпейнтинг видео по маске. И на черрипиках он заметно лучше пропейнтера
Потребление видеопамяти - на скрине
Код
Демо
#videoinpainting #inpainting
Слишком долго у Propainter не было конкурентов в опенсорсе.
Это инпейнтинг видео по маске. И на черрипиках он заметно лучше пропейнтера
Потребление видеопамяти - на скрине
Код
Демо
#videoinpainting #inpainting
🔥7👍1🤔1
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
EMO2: End-Effector Guided Audio-Driven Avatar Video Generation
Оживлятор портретов звуком от Alibaba. Пение, речь, танцы рук
Напоминаю, что кода EMO за прошедший год мы так и не дождались
Код ждем
#audio2video #speech2video #talkinghead #portrainanimation
Оживлятор портретов звуком от Alibaba. Пение, речь, танцы рук
Напоминаю, что кода EMO за прошедший год мы так и не дождались
Код ждем
#audio2video #speech2video #talkinghead #portrainanimation
😁7👍6❤2