SteadyDancer : Harmonized and Coherent Human Image Animation with First-Frame Preservation
Оживлятор-аниматор человеков по картинке с сохранением первого кадра и точным управлением движением. Превосходит конкурентов, требует меньше ресурсов для обучения.
Построен на базе Wan2.1-I2V-14B-480P
HF
#characteranimation #image2video
Оживлятор-аниматор человеков по картинке с сохранением первого кадра и точным управлением движением. Превосходит конкурентов, требует меньше ресурсов для обучения.
Построен на базе Wan2.1-I2V-14B-480P
HF
#characteranimation #image2video
🔥8👍2
Retake
В LTX Studio завезли инструмент для редактирования видео. С его помощью можно:
- перефразировать диалог, сохраняя оригинальный голос, исполнение и обстановку
- изменить начало или конец сцены, скорректировать темп, эмоции или кадрирование
- улучшить темп, подачу, исполнение и ритм в рамках одного кадра.
Оплату берут только за те секунды видео, которые были изменены.
#videoediting
В LTX Studio завезли инструмент для редактирования видео. С его помощью можно:
- перефразировать диалог, сохраняя оригинальный голос, исполнение и обстановку
- изменить начало или конец сцены, скорректировать темп, эмоции или кадрирование
- улучшить темп, подачу, исполнение и ритм в рамках одного кадра.
Оплату берут только за те секунды видео, которые были изменены.
#videoediting
👍9🔥6
Moondream Segmentation
У Moondream новая функция - SVG сегментация
Превращает текстовые промпты, точки или рамки в SVG-полигоны с пиксельной точностью.
Побивает Gemini Flash 2.5, SAM3 на бенчах
Работает и для видео — нужно просто применять её к каждому кадру
Попробовать
#segmentation #noscript #image2noscript #image2mask
У Moondream новая функция - SVG сегментация
Превращает текстовые промпты, точки или рамки в SVG-полигоны с пиксельной точностью.
Побивает Gemini Flash 2.5, SAM3 на бенчах
Работает и для видео — нужно просто применять её к каждому кадру
Попробовать
#segmentation #noscript #image2noscript #image2mask
👍8
This media is not supported in your browser
VIEW IN TELEGRAM
iMontage: Unified, Versatile, Highly Dynamic Many-to-many Image Generation
Универсальный динамичный мультигенератор картинок
Работает по принципу many-to-many, то есть может принимать несколько исходных изображений и генерировать на их основе несколько выходных изображений с учётом текстового запроса.
— умеет редактировать изображения: менять фон, цвет объектов, стиль, добавлять или удалять элементы
— создает картинки, сохраняя идентичность и стиль нескольких эталонных изображений
— комбинирует эталонные изображения с управляющими сигналами (карты глубины, OpenPose, Canny) для контролируемой генерации
— переносит художественные стили на контент, сохраняя его структуру
— меняет ракурс в сцене
— генерирует последовательные раскадровки из референсов персонажей с описаниями сюжета.
Гитхаб
HF
#referencing #text2image #image2image #imageediting
Универсальный динамичный мультигенератор картинок
Работает по принципу many-to-many, то есть может принимать несколько исходных изображений и генерировать на их основе несколько выходных изображений с учётом текстового запроса.
— умеет редактировать изображения: менять фон, цвет объектов, стиль, добавлять или удалять элементы
— создает картинки, сохраняя идентичность и стиль нескольких эталонных изображений
— комбинирует эталонные изображения с управляющими сигналами (карты глубины, OpenPose, Canny) для контролируемой генерации
— переносит художественные стили на контент, сохраняя его структуру
— меняет ракурс в сцене
— генерирует последовательные раскадровки из референсов персонажей с описаниями сюжета.
Гитхаб
HF
#referencing #text2image #image2image #imageediting
👍8
Z-Image
Авторы наконец допилили сайт проекта, теперь все по красоте
И главное - Z-Image можно запустить в бесплатном колабе (не проверял)
#text2image #imageediting #colab
Авторы наконец допилили сайт проекта, теперь все по красоте
И главное - Z-Image можно запустить в бесплатном колабе (не проверял)
#text2image #imageediting #colab
👍7
This media is not supported in your browser
VIEW IN TELEGRAM
Topaz's Flagship Upscale Models in ComfyUI
Топаз завезли в комфи.
Объясняю понятным языком: платно, в API ноды
для видео:
- Video Upscale (до 4K)
- Starlight Fast — повышение чёткости видео с помощью диффузионной технологии
- Starlight Creative (Astra) — творческое улучшение видео
- Apollo — интерполяция кадров
для изображений:
- Image Enhance (до 8K)
- Bloom (Reimagine) — креативное улучшение и переработка изображений
#upscale #comfyui #upscalevideo #imagerestoration #frameinterpolation
Топаз завезли в комфи.
Объясняю понятным языком: платно, в API ноды
для видео:
- Video Upscale (до 4K)
- Starlight Fast — повышение чёткости видео с помощью диффузионной технологии
- Starlight Creative (Astra) — творческое улучшение видео
- Apollo — интерполяция кадров
для изображений:
- Image Enhance (до 8K)
- Bloom (Reimagine) — креативное улучшение и переработка изображений
#upscale #comfyui #upscalevideo #imagerestoration #frameinterpolation
👍8😁2🤔1
❤8👍6
ComfyUI-PainterFLF2V
Улучшает динамику генерации WAN, делая движения более плавными и естественными. Динамически усиленная версия оригинальной ноды для генерации по первому-последнему кадру
#wan #comfyui #FLF2V
Улучшает динамику генерации WAN, делая движения более плавными и естественными. Динамически усиленная версия оригинальной ноды для генерации по первому-последнему кадру
#wan #comfyui #FLF2V
👍18
Нейронавт | Нейросети в творчестве
Sa2VA-Qwen3-VL-4B ByteDance выпустил Sa2VA на Qwen3-VL-4B Модель объединяет SAM2 и LLaVA для глубокого понимания изображений и видео Гитхаб #segmentation #vlm #assistant #video2text #vide2mask #captiopning
Sa2VA-Qwen3-VL-2B
ByteDance выпустил сегментатор Sa2VA на Qwen3-VL-2B
4B было тут
Модель объединяет SAM2 и LLaVA для глубокого понимания изображений и видео
Гитхаб
#segmentation #vlm #assistant #video2text #vide2mask #captiopning
ByteDance выпустил сегментатор Sa2VA на Qwen3-VL-2B
4B было тут
Модель объединяет SAM2 и LLaVA для глубокого понимания изображений и видео
Гитхаб
#segmentation #vlm #assistant #video2text #vide2mask #captiopning
huggingface.co
ByteDance/Sa2VA-Qwen3-VL-2B · Hugging Face
We’re on a journey to advance and democratize artificial intelligence through open source and open science.
👍6🔥2
BlockVid: Block Diffusion for High-Fidelity and Coherent Minute-Long Video Generation
Очередной 'enlarge yourvideo '
Видеогенератор высокой чёткости и с хорошей связностью длительностью до минуты от Alibaba.
Много архитектурных ухищрений придумали.
Кода, моделей нет
Зато есть основанный на той же папире
Inferix - движок нового поколения для синтеза иммерсивных миров на базе Wan-1.3B. А по сути - потоковый видеогенератор длинных интерактивных видео. То есть, сюжетом можно управлять на лету
Поддерживает Self Forcing, CausVid, MAGI-1
Гитхаб - тут хоть почти весь функционал еще в планах, но уже не просто красивая статья, а репозиторий в работе.
#text2video #streaming #interactive #longvideo
Очередной 'enlarge your
Видеогенератор высокой чёткости и с хорошей связностью длительностью до минуты от Alibaba.
Много архитектурных ухищрений придумали.
Кода, моделей нет
Зато есть основанный на той же папире
Inferix - движок нового поколения для синтеза иммерсивных миров на базе Wan-1.3B. А по сути - потоковый видеогенератор длинных интерактивных видео. То есть, сюжетом можно управлять на лету
Поддерживает Self Forcing, CausVid, MAGI-1
Гитхаб - тут хоть почти весь функционал еще в планах, но уже не просто красивая статья, а репозиторий в работе.
#text2video #streaming #interactive #longvideo
👍10❤2
Prompting Guide - FLUX.2
Официальный гайд по промптингу Flux.2
Основное:
- поддерживает структурированные промпты в формате JSON, что даёт точный контроль над элементами изображения
- позволяет использовать HEX-коды для точного подбора цветов
- не поддерживает негативные промпты — нужно описывать, что хочется увидеть, а не то, чего хочется избежать
- понимает промпты на разных языках, что помогает создавать культурно аутентичные результаты
- для фотореалистичных изображений можно указывать модели камер, объективы и настройки.
#guide #prompting
Официальный гайд по промптингу Flux.2
Основное:
- поддерживает структурированные промпты в формате JSON, что даёт точный контроль над элементами изображения
- позволяет использовать HEX-коды для точного подбора цветов
- не поддерживает негативные промпты — нужно описывать, что хочется увидеть, а не то, чего хочется избежать
- понимает промпты на разных языках, что помогает создавать культурно аутентичные результаты
- для фотореалистичных изображений можно указывать модели камер, объективы и настройки.
#guide #prompting
👍8❤7🥴1