у меня короче не получается драматургию чисто на действии держать.
я думаю надо сделать что-то гибридное и оставить закадровый голос в стиле рилсов "Этот парень показал..."
я думаю надо сделать что-то гибридное и оставить закадровый голос в стиле рилсов "Этот парень показал..."
Пацаны, такую имбищу нашел
qwen tts voice design
Можно взять и нагенерить кучу крутых уникальных голосов за 5 мин чтобы потом использовать в
VibeVoice
qwen tts voice design
Можно взять и нагенерить кучу крутых уникальных голосов за 5 мин чтобы потом использовать в
VibeVoice
🔥6👍2
This media is not supported in your browser
VIEW IN TELEGRAM
И еще из полезного.
Я много времени убил на то, чтобы заставить ltxv-2 работать на 3090
Перепробовал кучу готовых workflow - у меня ничего нормально не завелось.
Потом нашел WanGP, заработало все с первого раза.
Я много времени убил на то, чтобы заставить ltxv-2 работать на 3090
Перепробовал кучу готовых workflow - у меня ничего нормально не завелось.
Потом нашел WanGP, заработало все с первого раза.
🤣7❤2👏1👌1
Media is too big
VIEW IN TELEGRAM
Ребят, зацените, теперь новый формат.
Мне кажется, если на фоне сделать плакаты СССР и одеть ее в пионерскую форму мои подписчики пенсионеры очень кайфанут.
6.5 минут на генерацию и все полностью локально.
Голос tts чутка рваный, мне было лень переделывать.
Из минусов - есть ощущение зловещей долины.
Мне кажется, если на фоне сделать плакаты СССР и одеть ее в пионерскую форму мои подписчики пенсионеры очень кайфанут.
6.5 минут на генерацию и все полностью локально.
Голос tts чутка рваный, мне было лень переделывать.
Из минусов - есть ощущение зловещей долины.
🔥12
This media is not supported in your browser
VIEW IN TELEGRAM
Новый гиперфокус
надо пайплайн с альтухами довести до идеала
надо пайплайн с альтухами довести до идеала
🔥12👀2❤1👍1😁1
This media is not supported in your browser
VIEW IN TELEGRAM
https://research.nvidia.com/labs/toronto-ai/chronoedit/
Я не знаю на сколько это свежая штука, но меня безумно впечатлила.
Это i2i модель вроде бананы, которая для правок под капотам делает мини видео с трансформацией из оригинального изображения в целевое.
За счет этого, она в теории должна делать максимально логичные и физически корректные правки.
Это некоторая альтернатива ризонингу у текстовых LLM.
Там на сайте есть демки с визуализацией того, как она размышляет по hover на картинке.
Я смотрю на них и вижу в них отличный слоп потенциал.
Я не знаю на сколько это свежая штука, но меня безумно впечатлила.
Это i2i модель вроде бананы, которая для правок под капотам делает мини видео с трансформацией из оригинального изображения в целевое.
За счет этого, она в теории должна делать максимально логичные и физически корректные правки.
Это некоторая альтернатива ризонингу у текстовых LLM.
Там на сайте есть демки с визуализацией того, как она размышляет по hover на картинке.
Я смотрю на них и вижу в них отличный слоп потенциал.
🔥4
Она сырая и больше похожа на прототип.
Но смотрите в чем замут.
промпт: they jump
Первая картинка это банана, она действует как фотошоп.
А вторая - chrono. Она поняла что это за действие и челы прыгнули. Правда вся остальная картинка попорчена из-за wan vae.
banana pro это лечит текстовым ризонингом, но это костыль.
Но смотрите в чем замут.
промпт: they jump
Первая картинка это банана, она действует как фотошоп.
А вторая - chrono. Она поняла что это за действие и челы прыгнули. Правда вся остальная картинка попорчена из-за wan vae.
banana pro это лечит текстовым ризонингом, но это костыль.
🔥2