GSTAR: Gaussian Surface Tracking and Reconstruction
Реконструкция динамичных 3D сцен на гауссианах по видео, с фотореалистичным рендером и 3D-трекином
GSTAR адаптируется к изменениям топологии с помощью двух механизмов: последовательного отслеживания стабильных поверхностей (красные кружочки) и динамической генерации поверхности для вновь появляющейся геометрии (оранжевые кружочки).
Код ждем
#video2scene #video2gaussian #videoto3d #videoto4D #video2mesh #gaussian
Реконструкция динамичных 3D сцен на гауссианах по видео, с фотореалистичным рендером и 3D-трекином
GSTAR адаптируется к изменениям топологии с помощью двух механизмов: последовательного отслеживания стабильных поверхностей (красные кружочки) и динамической генерации поверхности для вновь появляющейся геометрии (оранжевые кружочки).
Код ждем
#video2scene #video2gaussian #videoto3d #videoto4D #video2mesh #gaussian
👍5🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Goku: Flow Based Video Generative Foundation Models
Новый генератор видео и картинок от ByteDance
И на основе Goku они еще сделали Goku+ - семейство моделей для оптимизации рекламных сценариев с участием людей и продуктов
гитхаб (кода нет)
#text2video #image2video #text2image
Новый генератор видео и картинок от ByteDance
И на основе Goku они еще сделали Goku+ - семейство моделей для оптимизации рекламных сценариев с участием людей и продуктов
гитхаб (кода нет)
#text2video #image2video #text2image
🔥7👍6
😁6👎3💩2👍1🤡1
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Lumina-Video-f24R960
Новая модель убийцы всего
Генератор видео со звуком (без звука тоже может) по тексту
#text2video #text2audio #multimodal
Новая модель убийцы всего
Генератор видео со звуком (без звука тоже может) по тексту
#text2video #text2audio #multimodal
😁13😭8🔥4
This media is not supported in your browser
VIEW IN TELEGRAM
Zonos
Голосовая модель от Zyphra
Хвастаются превосходством над всеми конкурентами
- Контроль эмоций
- Клонирование голоса по 10-30 секундному образцу
- Звуковые префиксы: Добавьте текст плюс аудиофайл чтобы задать динамику, например шепот
- Поддерживает английский, японский, китайский, французский и немецкий языки, русского нет
- Контроль скорости речи, высоты тона, максимальной частоты, качества звука
- Работает вдвое быстрее рилтайма на RTX 4090
- Есть Playground и API
Код
Демо - вход через гугл/регу
Блог - там есть тесты сравнения с конкурентами
#voicecloning #tts #text2speech
Голосовая модель от Zyphra
Хвастаются превосходством над всеми конкурентами
- Контроль эмоций
- Клонирование голоса по 10-30 секундному образцу
- Звуковые префиксы: Добавьте текст плюс аудиофайл чтобы задать динамику, например шепот
- Поддерживает английский, японский, китайский, французский и немецкий языки, русского нет
- Контроль скорости речи, высоты тона, максимальной частоты, качества звука
- Работает вдвое быстрее рилтайма на RTX 4090
- Есть Playground и API
Код
Демо - вход через гугл/регу
Блог - там есть тесты сравнения с конкурентами
#voicecloning #tts #text2speech
🔥12👍5❤4👎2😐2