4D Gaussian Splatting SLAM
4DGS-SLAM - реконструкция сцен в движении по входному видео RGBD.
Делит сцену на статические и динамические Gaussian-примитивы. Отслеживает движение объектов, генерирует маски движения. Вуаля
Код
#gaussian #video2scene #rendering #rgbd2scene #rgbd2gaussian
4DGS-SLAM - реконструкция сцен в движении по входному видео RGBD.
Делит сцену на статические и динамические Gaussian-примитивы. Отслеживает движение объектов, генерирует маски движения. Вуаля
Код
#gaussian #video2scene #rendering #rgbd2scene #rgbd2gaussian
👍8
SkyReels-A3
Анонсировали (или релизнули - непонятно) новый "непревзойденный" оживлятор персонажей по речи / пению.
И зачем-то дали ссылку на пустой репозиторий.
И ссылку на свой сервис где непонятно где искать новую модель.
Умеет создавать длинные ("неограниченно длинные") видео, несколько минут, сохраняя идентичность персонажа.
Умеет создавать профессиональное движение камеры
Гитхаб (пусто)
Попробовать видимо здесь
[UPDATE] Мне показали где он прячется, картинка в коментах. Он только для платных пользователей
#lipsync #portraitanimation #characteranimation #speech2video
Анонсировали (или релизнули - непонятно) новый "непревзойденный" оживлятор персонажей по речи / пению.
И зачем-то дали ссылку на пустой репозиторий.
И ссылку на свой сервис где непонятно где искать новую модель.
Умеет создавать длинные ("неограниченно длинные") видео, несколько минут, сохраняя идентичность персонажа.
Умеет создавать профессиональное движение камеры
Гитхаб (пусто)
Попробовать видимо здесь
[UPDATE] Мне показали где он прячется, картинка в коментах. Он только для платных пользователей
#lipsync #portraitanimation #characteranimation #speech2video
👍6👎2❤1👀1
This media is not supported in your browser
VIEW IN TELEGRAM
Suno Studio
Объявлена запись в вейтлист.
Мультитрековая генерация, экспорт в #midi и прочие радости.
Записаться в вейтлист
#music #musicediting
Объявлена запись в вейтлист.
Мультитрековая генерация, экспорт в #midi и прочие радости.
Записаться в вейтлист
#music #musicediting
👍9🔥4👎1
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
EchoMimicV3
Оживлятор персонажей по голосу на 1.3B параметров на основе Wan 2.1 1.3B.
Что-то там про мультимодальность и мультизадачность в архитектуре говорят.
Умеет делать взаимодействие с объектами, пение.
Выглядит несколько деревянно, но весит всего 3Гб с хвостиком
Код
Веса
#lipsync #portraitanimation #characteranimation #speech2video
Оживлятор персонажей по голосу на 1.3B параметров на основе Wan 2.1 1.3B.
Что-то там про мультимодальность и мультизадачность в архитектуре говорят.
Умеет делать взаимодействие с объектами, пение.
Выглядит несколько деревянно, но весит всего 3Гб с хвостиком
Код
Веса
#lipsync #portraitanimation #characteranimation #speech2video
👎6🔥3🤔2👍1
Автор Flux Omini Kontext выпустил две лоры - для персонажа и для объекта.
На гитхабе у него большой To-do список, будем следить
Гитхаб - ссылки на лоры там
#referencing #inpainting #imageediting #kontext
На гитхабе у него большой To-do список, будем следить
Гитхаб - ссылки на лоры там
#referencing #inpainting #imageediting #kontext
🔥8👍4
💡LightSwitch💡: Multi-view Relighting with Material-guided Diffusion
Изменение освещения на изображениях (релайтинг) с учётом свойств материалов объектов.
Пишут что побили #SOTA
Обрабатывает любое количество входных изображений, собирая информацию о материалах.
Пока дело доходит до релайтинка данные уже превращаются в сцену на гауссианах. И на выходе тоже гауссианы.
А там видимо рендерите чем хотите.
Авторы тестировали на A100
Код
#relighting
Изменение освещения на изображениях (релайтинг) с учётом свойств материалов объектов.
Пишут что побили #SOTA
Обрабатывает любое количество входных изображений, собирая информацию о материалах.
Пока дело доходит до релайтинка данные уже превращаются в сцену на гауссианах. И на выходе тоже гауссианы.
А там видимо рендерите чем хотите.
Авторы тестировали на A100
Код
#relighting
👍6❤1
Matrix-3D: Omnidirectional Explorable 3D World Generation
Генератор 3D миров по изображению с бесконечным перемещением в них.
Траектория камеры задается перед началом генерации.
Сначала создает панорамное видео, потом из этого видео собственно доступную для исследования 3D модель.
Код
HF
#text2world #research #text2game
Генератор 3D миров по изображению с бесконечным перемещением в них.
Траектория камеры задается перед началом генерации.
Сначала создает панорамное видео, потом из этого видео собственно доступную для исследования 3D модель.
Код
HF
#text2world #research #text2game
👍11
Крутанские лоры Qwen-Image от нашего подписчика @Danrisi
Воркфлоу там же
Lenovo_Qwen - бустер реализма, ждем версию под Chrome
adorablegirls_qwen - с фокусом на женскую красоту
Реддит - не скупитесь на лайки
#text2image #lora #workflow
Воркфлоу там же
Lenovo_Qwen - бустер реализма, ждем версию под Chrome
adorablegirls_qwen - с фокусом на женскую красоту
Реддит - не скупитесь на лайки
#text2image #lora #workflow
🔥22👍5❤4👎1