This media is not supported in your browser
VIEW IN TELEGRAM
MaterialFusion: Enhancing Inverse Rendering with Material Diffusion Priors
Реконструкция материала по многоракурсному набору изображений объекта
Код
#image2passes #image2pbr
Реконструкция материала по многоракурсному набору изображений объекта
Код
#image2passes #image2pbr
❤8👍1
Media is too big
VIEW IN TELEGRAM
MaskedMimic: Unified Physics-Based Character Control Through Masked Motion Inpainting
Аниматор бипедов от Nvidia. Генерирует широкий спектр движений на различных поверхностях на основе интуитивно понятных пользовательских намерений.
Генерация движений всего тела на основе частичных целевых положений суставов, реагирование на управление джойстиком, взаимодействие с объектами, следование по траекториям, интерпретация текстовых команд и даже комбинирование этих возможностей, например, выполнение текстовых команд для следования по траекториям
Код
#text2animation #humananimation
Аниматор бипедов от Nvidia. Генерирует широкий спектр движений на различных поверхностях на основе интуитивно понятных пользовательских намерений.
Генерация движений всего тела на основе частичных целевых положений суставов, реагирование на управление джойстиком, взаимодействие с объектами, следование по траекториям, интерпретация текстовых команд и даже комбинирование этих возможностей, например, выполнение текстовых команд для следования по траекториям
Код
#text2animation #humananimation
👍6🔥3
This media is not supported in your browser
VIEW IN TELEGRAM
Mini-Omni: Language Models Can Hear, Talk While Thinking in Streaming
Языковая модель для голосового общения. По русски не умеет.Может слышать и говорить, одновременно думая.
Код
Демо
#assistant #voiceassistant #speech
Языковая модель для голосового общения. По русски не умеет.Может слышать и говорить, одновременно думая.
Код
Демо
#assistant #voiceassistant #speech
👍9
🔥14😁3👍1
MIMO: Controllable Character Video Synthesis withSpatial Decomposed Modeling
Манипуляции с персонажем в полный рост на видео. Модель декомпозит исходное видео с применением карты глубины - на главного перса, задник и скрытую передним планом часть. Дальше можно заменить персонажа, задавать анимацию с другого видео или склетом, ... , профит
Код ждем
#video2video #humananimation #personalization
Манипуляции с персонажем в полный рост на видео. Модель декомпозит исходное видео с применением карты глубины - на главного перса, задник и скрытую передним планом часть. Дальше можно заменить персонажа, задавать анимацию с другого видео или склетом, ... , профит
Код ждем
#video2video #humananimation #personalization
🔥15❤2👍1
DreamWaltz-G: Expressive 3D Gaussian Avatars from Skeleton-Guided 2D Diffusion
Еще одна модель создания 3D аватара по тексту на гауссианах. Управляется скелетом. Композится со сценами на гауссианах.
Код ждем
#text2avatar #text2gaussian #humanavatar
Еще одна модель создания 3D аватара по тексту на гауссианах. Управляется скелетом. Композится со сценами на гауссианах.
Код ждем
#text2avatar #text2gaussian #humanavatar
👍3
This media is not supported in your browser
VIEW IN TELEGRAM
TalkinNeRF: Animatable Neural Fields forFull-Body Talking Humans
Продолжаем тему. Говорящие человеки на нерфах в полный рост. Кода нет. Ну и правильно, кому сейчас нужны эти нерфы
#talkinghuman #speech2nerf #nerf #humananimation
Продолжаем тему. Говорящие человеки на нерфах в полный рост. Кода нет. Ну и правильно, кому сейчас нужны эти нерфы
#talkinghuman #speech2nerf #nerf #humananimation
❤1
😁6❤3
Oryx MLLM: On-Demand Spatial-Temporal Understanding at Arbitrary Resolution
Единая мультимодальная LLM для пространственно-временного понимания изображений, видео и трехмерных сцен с несколькими видами
По бенчмарку MLVU превосходит GPT-4o
Код
Демо
#mllm #vlm #video2text #image2text #3d2text
Единая мультимодальная LLM для пространственно-временного понимания изображений, видео и трехмерных сцен с несколькими видами
По бенчмарку MLVU превосходит GPT-4o
Код
Демо
#mllm #vlm #video2text #image2text #3d2text
👍11
Llama-3.2
Новость погромче. На прошлой неделе вышла Llama-3.2, ее старшие версии 11B и 90B тоже мультимодальные.
Она уже есть на vision арене
Уже есть колаб ноутбук для дообучения и Instruct версия
Веса на HF
Демо (чат)
Демо Llama-3.2-11B-Vision-Instruct
Новость погромче. На прошлой неделе вышла Llama-3.2, ее старшие версии 11B и 90B тоже мультимодальные.
Она уже есть на vision арене
Уже есть колаб ноутбук для дообучения и Instruct версия
Веса на HF
Демо (чат)
Демо Llama-3.2-11B-Vision-Instruct
👍4
This media is not supported in your browser
VIEW IN TELEGRAM
Synchronize Dual Hands for Physics-Based Dexterous Guitar Playing
Очень нишевая штука
Стэнфордский университет представил новый подход к управлению двумя руками при физическом моделировании игры на гитаре.
Виртуальный гитарист играет по табам. Судя по видео, играет неправильно - оставляет пальцы левой руки только на тех струнах которые сейчас играет.
Код
#music2animation
Очень нишевая штука
Стэнфордский университет представил новый подход к управлению двумя руками при физическом моделировании игры на гитаре.
Виртуальный гитарист играет по табам. Судя по видео, играет неправильно - оставляет пальцы левой руки только на тех струнах которые сейчас играет.
Код
#music2animation
🤯4👍2🔥2