This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
EchoMimicV3
Оживлятор персонажей по голосу на 1.3B параметров на основе Wan 2.1 1.3B.
Что-то там про мультимодальность и мультизадачность в архитектуре говорят.
Умеет делать взаимодействие с объектами, пение.
Выглядит несколько деревянно, но весит всего 3Гб с хвостиком
Код
Веса
#lipsync #portraitanimation #characteranimation #speech2video
Оживлятор персонажей по голосу на 1.3B параметров на основе Wan 2.1 1.3B.
Что-то там про мультимодальность и мультизадачность в архитектуре говорят.
Умеет делать взаимодействие с объектами, пение.
Выглядит несколько деревянно, но весит всего 3Гб с хвостиком
Код
Веса
#lipsync #portraitanimation #characteranimation #speech2video
👎6🔥3🤔2👍1
Автор Flux Omini Kontext выпустил две лоры - для персонажа и для объекта.
На гитхабе у него большой To-do список, будем следить
Гитхаб - ссылки на лоры там
#referencing #inpainting #imageediting #kontext
На гитхабе у него большой To-do список, будем следить
Гитхаб - ссылки на лоры там
#referencing #inpainting #imageediting #kontext
🔥8👍4
💡LightSwitch💡: Multi-view Relighting with Material-guided Diffusion
Изменение освещения на изображениях (релайтинг) с учётом свойств материалов объектов.
Пишут что побили #SOTA
Обрабатывает любое количество входных изображений, собирая информацию о материалах.
Пока дело доходит до релайтинка данные уже превращаются в сцену на гауссианах. И на выходе тоже гауссианы.
А там видимо рендерите чем хотите.
Авторы тестировали на A100
Код
#relighting
Изменение освещения на изображениях (релайтинг) с учётом свойств материалов объектов.
Пишут что побили #SOTA
Обрабатывает любое количество входных изображений, собирая информацию о материалах.
Пока дело доходит до релайтинка данные уже превращаются в сцену на гауссианах. И на выходе тоже гауссианы.
А там видимо рендерите чем хотите.
Авторы тестировали на A100
Код
#relighting
👍6❤1
Matrix-3D: Omnidirectional Explorable 3D World Generation
Генератор 3D миров по изображению с бесконечным перемещением в них.
Траектория камеры задается перед началом генерации.
Сначала создает панорамное видео, потом из этого видео собственно доступную для исследования 3D модель.
Код
HF
#text2world #research #text2game
Генератор 3D миров по изображению с бесконечным перемещением в них.
Траектория камеры задается перед началом генерации.
Сначала создает панорамное видео, потом из этого видео собственно доступную для исследования 3D модель.
Код
HF
#text2world #research #text2game
👍11
Крутанские лоры Qwen-Image от нашего подписчика @Danrisi
Воркфлоу там же
Lenovo_Qwen - бустер реализма, ждем версию под Chrome
adorablegirls_qwen - с фокусом на женскую красоту
Реддит - не скупитесь на лайки
#text2image #lora #workflow
Воркфлоу там же
Lenovo_Qwen - бустер реализма, ждем версию под Chrome
adorablegirls_qwen - с фокусом на женскую красоту
Реддит - не скупитесь на лайки
#text2image #lora #workflow
🔥22👍5❤4👎1
This media is not supported in your browser
VIEW IN TELEGRAM
Pika audio-driven performance model
Оживлятор картинок по звуку от Pika.
В 20 раз быстрее и дешеле предыдущей модели.
Создает видео за 6 секунд.
Похоже что доступно (или будет доступно) только в мобильном приложении
AppStore
#lipsync #portraitanimation #characteranimation #speech2video #mobile #ios
Оживлятор картинок по звуку от Pika.
В 20 раз быстрее и дешеле предыдущей модели.
Создает видео за 6 секунд.
Похоже что доступно (или будет доступно) только в мобильном приложении
AppStore
#lipsync #portraitanimation #characteranimation #speech2video #mobile #ios
👍2