🔥14😁3👍1
MIMO: Controllable Character Video Synthesis withSpatial Decomposed Modeling
Манипуляции с персонажем в полный рост на видео. Модель декомпозит исходное видео с применением карты глубины - на главного перса, задник и скрытую передним планом часть. Дальше можно заменить персонажа, задавать анимацию с другого видео или склетом, ... , профит
Код ждем
#video2video #humananimation #personalization
Манипуляции с персонажем в полный рост на видео. Модель декомпозит исходное видео с применением карты глубины - на главного перса, задник и скрытую передним планом часть. Дальше можно заменить персонажа, задавать анимацию с другого видео или склетом, ... , профит
Код ждем
#video2video #humananimation #personalization
🔥15❤2👍1
DreamWaltz-G: Expressive 3D Gaussian Avatars from Skeleton-Guided 2D Diffusion
Еще одна модель создания 3D аватара по тексту на гауссианах. Управляется скелетом. Композится со сценами на гауссианах.
Код ждем
#text2avatar #text2gaussian #humanavatar
Еще одна модель создания 3D аватара по тексту на гауссианах. Управляется скелетом. Композится со сценами на гауссианах.
Код ждем
#text2avatar #text2gaussian #humanavatar
👍3
This media is not supported in your browser
VIEW IN TELEGRAM
TalkinNeRF: Animatable Neural Fields forFull-Body Talking Humans
Продолжаем тему. Говорящие человеки на нерфах в полный рост. Кода нет. Ну и правильно, кому сейчас нужны эти нерфы
#talkinghuman #speech2nerf #nerf #humananimation
Продолжаем тему. Говорящие человеки на нерфах в полный рост. Кода нет. Ну и правильно, кому сейчас нужны эти нерфы
#talkinghuman #speech2nerf #nerf #humananimation
❤1
😁6❤3
Oryx MLLM: On-Demand Spatial-Temporal Understanding at Arbitrary Resolution
Единая мультимодальная LLM для пространственно-временного понимания изображений, видео и трехмерных сцен с несколькими видами
По бенчмарку MLVU превосходит GPT-4o
Код
Демо
#mllm #vlm #video2text #image2text #3d2text
Единая мультимодальная LLM для пространственно-временного понимания изображений, видео и трехмерных сцен с несколькими видами
По бенчмарку MLVU превосходит GPT-4o
Код
Демо
#mllm #vlm #video2text #image2text #3d2text
👍11
Llama-3.2
Новость погромче. На прошлой неделе вышла Llama-3.2, ее старшие версии 11B и 90B тоже мультимодальные.
Она уже есть на vision арене
Уже есть колаб ноутбук для дообучения и Instruct версия
Веса на HF
Демо (чат)
Демо Llama-3.2-11B-Vision-Instruct
Новость погромче. На прошлой неделе вышла Llama-3.2, ее старшие версии 11B и 90B тоже мультимодальные.
Она уже есть на vision арене
Уже есть колаб ноутбук для дообучения и Instruct версия
Веса на HF
Демо (чат)
Демо Llama-3.2-11B-Vision-Instruct
👍4
This media is not supported in your browser
VIEW IN TELEGRAM
Synchronize Dual Hands for Physics-Based Dexterous Guitar Playing
Очень нишевая штука
Стэнфордский университет представил новый подход к управлению двумя руками при физическом моделировании игры на гитаре.
Виртуальный гитарист играет по табам. Судя по видео, играет неправильно - оставляет пальцы левой руки только на тех струнах которые сейчас играет.
Код
#music2animation
Очень нишевая штука
Стэнфордский университет представил новый подход к управлению двумя руками при физическом моделировании игры на гитаре.
Виртуальный гитарист играет по табам. Судя по видео, играет неправильно - оставляет пальцы левой руки только на тех струнах которые сейчас играет.
Код
#music2animation
🤯4👍2🔥2
LLaMa 3.2 Multimodal Web UI using Ollama
Ах да, забыл вам дать ссылку на локальную морду для новой лламы
Про требования к железу не спрашивайте, заготавливайте гигабайты
[UPDATE] в комментариях ссылка на получение ключа api на сумму 5$
Код
#mllm #vlm #assistant
Ах да, забыл вам дать ссылку на локальную морду для новой лламы
Про требования к железу не спрашивайте, заготавливайте гигабайты
[UPDATE] в комментариях ссылка на получение ключа api на сумму 5$
Код
#mllm #vlm #assistant
👍2
Держите три новые #Controlnet модели для #Flux, в том числе апскейлер
Flux.1-dev: Upscaler ControlNet
Flux.1-dev: Depth ControlNet
Flux.1-dev: Surface Normals ControlNet
#upscale #depth2image #normals2image
Flux.1-dev: Upscaler ControlNet
Flux.1-dev: Depth ControlNet
Flux.1-dev: Surface Normals ControlNet
#upscale #depth2image #normals2image
🔥13