This media is not supported in your browser
VIEW IN TELEGRAM
Stable Part Diffusion 4D: Multi-View RGB and Kinematic Parts Video Generation (SP4D)
Сегментатор кинематических частей на картинках и видео. Stability AI выступают одним из двух соавторов
В отличие от методов, которые генерируют только внешний вид, SP4D фиксирует как визуальную структуру, так и сочлененную геометрию, создавая 3D-объекты, готовые к ригу с учетом частей и анимации
Код ждем
#segmentation #segmentation3D #3d #imageto3d #videoto3d
Сегментатор кинематических частей на картинках и видео. Stability AI выступают одним из двух соавторов
В отличие от методов, которые генерируют только внешний вид, SP4D фиксирует как визуальную структуру, так и сочлененную геометрию, создавая 3D-объекты, готовые к ригу с учетом частей и анимации
Код ждем
#segmentation #segmentation3D #3d #imageto3d #videoto3d
👍6
ComfyUI-VoxCPM
Кастом нода контекстной бестокеновой думающей говорилки VoxCPM
#comfyui #tts #text2speech #realtime #voicecloning
Кастом нода контекстной бестокеновой думающей говорилки VoxCPM
#comfyui #tts #text2speech #realtime #voicecloning
🔥9
воркфлоу WanAnimate
Scaled веса
GGUF - даже есть Q8 на ~20Гб
Спасибо @J_Jordan
#image2video #video2video #characteranimation #chracterswap #faceswap #workflow #gguf
Scaled веса
GGUF - даже есть Q8 на ~20Гб
Спасибо @J_Jordan
#image2video #video2video #characteranimation #chracterswap #faceswap #workflow #gguf
GitHub
ComfyUI-WanVideoWrapper/example_workflows/wanvideo_WanAnimate_example_01.json at main · kijai/ComfyUI-WanVideoWrapper
Contribute to kijai/ComfyUI-WanVideoWrapper development by creating an account on GitHub.
🔥13
SongBloom-Safetensors
Веса незаслуженно забытого открытого генератора музыки в формате .safetensors
Оригинальные веса были в формате .pt
#text2music #music #musicediting
Веса незаслуженно забытого открытого генератора музыки в формате .safetensors
Оригинальные веса были в формате .pt
#text2music #music #musicediting
huggingface.co
fredconex/SongBloom-Safetensors at main
We’re on a journey to advance and democratize artificial intelligence through open source and open science.
👍11🤯1
Moondream 3 Preview
Превью 3 версии VLM для описания (и не только) изображений
— может отвечать на открытые вопросы об изображениях
— создаёт описания изображений разной длины: короткие, стандартные и длинные
— определяет координаты конкретных объектов на изображении
— предоставляет bounding boxes (ограничивающие рамки) для объектов на изображении
— поддерживает предварительное кодирование изображений для ускорения многократных запросов
— работает как с изображениями, так и как универсальная текстовая модель
Плейграунд попробовать
Демо HF
API
#vlm #captioning #detection #moe #cv #image2text
Превью 3 версии VLM для описания (и не только) изображений
— может отвечать на открытые вопросы об изображениях
— создаёт описания изображений разной длины: короткие, стандартные и длинные
— определяет координаты конкретных объектов на изображении
— предоставляет bounding boxes (ограничивающие рамки) для объектов на изображении
— поддерживает предварительное кодирование изображений для ускорения многократных запросов
— работает как с изображениями, так и как универсальная текстовая модель
Плейграунд попробовать
Демо HF
API
#vlm #captioning #detection #moe #cv #image2text
👍7❤3🔥1
Wan 2.2 Animate in ComfyUI
Вчерашний стрим #ComfyUI по Wan 2.2 Animate
Воркфлоу тот который вчера выкладывал
#image2video #video2video #characteranimation #chracterswap #faceswap
Вчерашний стрим #ComfyUI по Wan 2.2 Animate
Воркфлоу тот который вчера выкладывал
#image2video #video2video #characteranimation #chracterswap #faceswap
YouTube
Wan 2.2 Animate in ComfyUI with Flipping Sigmas
Special Guest: @FlippingSigmas
Join us live as we explore Wan2.2-Animate inside ComfyUI—a unified model designed for character animation and replacement, complete with naturalistic movement and expression replication.
We’ll dive into how Animate lets you…
Join us live as we explore Wan2.2-Animate inside ComfyUI—a unified model designed for character animation and replacement, complete with naturalistic movement and expression replication.
We’ll dive into how Animate lets you…
👍17
ARC-Qwen-Video
Версия ARC-Hunyuan-Video-7B с Qwen2.5-VL-7B-Instruct в качестве базовой модели.
Мультимодальная модель для понимания коротких видеороликов из реального мира. Обрабатывает визуальные, аудио- и текстовые сигналы
Синхронизирует визуальные и аудиосигналы, что позволяет отвечать на сложные вопросы, которые невозможно решить, используя только один тип данных
Определяет не только, что происходит в видео, но и когда это происходит, поддерживает детализированную временную разметку и обобщение событий
Знает китайский и английский
На скриншоте транскрибация демонстрационного видео (перевод с китайского)
ARC-Qwen-Video-7B
ARC-Qwen-Video-7B-Narrator - выдает описания видео с таймкодами, определяет личности говорящих в видео, распознаёт и транскрибирует речь
Гитхаб
Демо - вход по китайскому телефону
#vlm #assistant #video2text #asr #speech2text #stt
Версия ARC-Hunyuan-Video-7B с Qwen2.5-VL-7B-Instruct в качестве базовой модели.
Мультимодальная модель для понимания коротких видеороликов из реального мира. Обрабатывает визуальные, аудио- и текстовые сигналы
Синхронизирует визуальные и аудиосигналы, что позволяет отвечать на сложные вопросы, которые невозможно решить, используя только один тип данных
Определяет не только, что происходит в видео, но и когда это происходит, поддерживает детализированную временную разметку и обобщение событий
Знает китайский и английский
На скриншоте транскрибация демонстрационного видео (перевод с китайского)
ARC-Qwen-Video-7B
ARC-Qwen-Video-7B-Narrator - выдает описания видео с таймкодами, определяет личности говорящих в видео, распознаёт и транскрибирует речь
Гитхаб
Демо - вход по китайскому телефону
#vlm #assistant #video2text #asr #speech2text #stt
👍10
Media is too big
VIEW IN TELEGRAM
Vidu Q1 Reference to Image
Давно не заглядывали в Vidu?
Они прокачали генерацию видео по референсам. Чего-то там больше, что-то там лучше
Функция доступна на сайте и в мобильном приложении
#referencing #image2video #text2video
Давно не заглядывали в Vidu?
Они прокачали генерацию видео по референсам. Чего-то там больше, что-то там лучше
Функция доступна на сайте и в мобильном приложении
#referencing #image2video #text2video
👍9🍾1
This media is not supported in your browser
VIEW IN TELEGRAM
Давно не заглядывали в Morphic?
А у них теперь есть генерация видео по аннотациям на картинке
#annotate2video #image2video #sketch2video
А у них теперь есть генерация видео по аннотациям на картинке
#annotate2video #image2video #sketch2video
👍14😁1
Вот куда вы точно давно не заглядывали так это на Artbreeder
Они там конечно наплодили инструментов похожих один на другой для смешивания персонажей
Даже какой-то оживлятор персонажей есть
#referencing #inage2image #characteranimation
Они там конечно наплодили инструментов похожих один на другой для смешивания персонажей
Даже какой-то оживлятор персонажей есть
#referencing #inage2image #characteranimation
👀6❤4
This media is not supported in your browser
VIEW IN TELEGRAM
Кожаные пытаются заставить робота перестать танцевать нижний брейк потому что он слишком невыносимо хорош
#humor #robot
#humor #robot
😁17😱2