UMO: Scaling Multi-Identity Consistency for Image Customization via Matching Reward
Еще один персонализатор-кастомизатор картинок от ByteDance из семейства UXO (UMO, USO и UNO)
Сохраняет идентичность при работе с несколькими референсными изображениями и снижает путаницу между ними за счет измерения оной путаницы с помощью новой метрики
Свободно комбинирует идентичности с разными объектами.
У них там внутри ByteDance должна быть нешуточная конкуренция ибо сравнивают свою модель с UNO, DreamO, OmniGen2
А прикручено собственно к UNO и OmniGen2
Гитхаб
HF
Демо UMO-UNO
Демо UMO-OmniGen2
#personalization #referencing #text2image #image2image
Еще один персонализатор-кастомизатор картинок от ByteDance из семейства UXO (UMO, USO и UNO)
Сохраняет идентичность при работе с несколькими референсными изображениями и снижает путаницу между ними за счет измерения оной путаницы с помощью новой метрики
Свободно комбинирует идентичности с разными объектами.
У них там внутри ByteDance должна быть нешуточная конкуренция ибо сравнивают свою модель с UNO, DreamO, OmniGen2
А прикручено собственно к UNO и OmniGen2
Гитхаб
HF
Демо UMO-UNO
Демо UMO-OmniGen2
#personalization #referencing #text2image #image2image
👍8
Нейронавт | Нейросети в творчестве
Wan2.2-Fun-Reward-LoRAs Подтверждено, это релиз. + опубликовали Reward-LoRAs Reward LoRA можно использовать с базовой моделью #Wan22 и доработанными моделями (Wan2.2-Fun), что значительно повышает качество генерации видео Гитхаб воркфлоу - там же на гитхабе…
В чате трое включая меня отписались что воркфлоу не работает
Короче есть воркфлоу который работает с GGUF и safetensots Wan2.2-VACE-Fun
Только пишут что VACE-Fun это не оригинальный VACE.
И результаты он выдает даже хуже чем обычный Fun-Control. Ну или руки у меня кривые.
воркфлоу
Видеоинструкция от автора воркфлоу
#workflow #controlnet #referencing #depth2video #pose2video #lora
Короче есть воркфлоу который работает с GGUF и safetensots Wan2.2-VACE-Fun
Только пишут что VACE-Fun это не оригинальный VACE.
И результаты он выдает даже хуже чем обычный Fun-Control. Ну или руки у меня кривые.
воркфлоу
Видеоинструкция от автора воркфлоу
#workflow #controlnet #referencing #depth2video #pose2video #lora
YouTube
Vace 2.2 Wan 2.2 Fun Vace Video to Video with photo reference. Video Outpainting GGUF. Best AI Guide
Wan 2.2 Fun Vace GGUF ComfyUI best workflow. Learning AI easy Tutorial. Image to video and video to video AI with image reference. avatar, AI animation. opensource video generator. Outpaint your image to video. Make your own pose to video with Vace. Installation…
👍7
CineScale;_4K_Text_to_Video_Generation_2160p_25fps_VP9_160kbit_Opus.webm
61 MB
CineScale: Free Lunch in High-Resolution Cinematic Visual Generation
Метод повышения разрешения генерации изображений и видео от Netflix.
Использует специальные подходы для устранения повторяющихся паттернов и повышения качества
— создаёт видео в разрешении 4K при минимальной настройке LoRA
— позволяет редактировать визуальные материалы с предварительным просмотром в низком разрешении
В качестве базовых моделей использовали Wan2.1 1.3B и 14B
Для инференса в 3К нужна A100, а в 4K - их нужно 8. Так что порешали проблемы с картинкой (см примеры на сайте) но не с вычислительными ресурсами
Модельки маленькие, видимо лоры. Если есть A100 можете попробовать
Код
Спасибо @atttashe
#optimization #text2video #image2video #video2video
Метод повышения разрешения генерации изображений и видео от Netflix.
Использует специальные подходы для устранения повторяющихся паттернов и повышения качества
— создаёт видео в разрешении 4K при минимальной настройке LoRA
— позволяет редактировать визуальные материалы с предварительным просмотром в низком разрешении
В качестве базовых моделей использовали Wan2.1 1.3B и 14B
Для инференса в 3К нужна A100, а в 4K - их нужно 8. Так что порешали проблемы с картинкой (см примеры на сайте) но не с вычислительными ресурсами
Модельки маленькие, видимо лоры. Если есть A100 можете попробовать
Код
Спасибо @atttashe
#optimization #text2video #image2video #video2video
🔥7❤2
Reve
Обновился сервис создания и редактирования изображений. Теперь это контекстный редактор, конкурент Банана, QIE и иже с ними. Умеет все то что умеют конкуренты, но у него еще есть GUI
— создаёт и ремиксит изображения
— редактирует изображения через простой текст
— объединяет элементы из разных изображений
— имеет редактор с перетаскиванием объектов -
— есть API
Есть бесплатный тариф, каждый день насыпают новый лимит. Но сколько - не признаются.
Вход через страны первого сорта
Подробнее у Сергея Цыпцына
Блог
#imageediting #referencing #GUI
Обновился сервис создания и редактирования изображений. Теперь это контекстный редактор, конкурент Банана, QIE и иже с ними. Умеет все то что умеют конкуренты, но у него еще есть GUI
— создаёт и ремиксит изображения
— редактирует изображения через простой текст
— объединяет элементы из разных изображений
— имеет редактор с перетаскиванием объектов -
— есть API
Есть бесплатный тариф, каждый день насыпают новый лимит. Но сколько - не признаются.
Вход через страны первого сорта
Подробнее у Сергея Цыпцына
Блог
#imageediting #referencing #GUI
👍6😁3❤1
Нейронавт | Нейросети в творчестве
Reve Обновился сервис создания и редактирования изображений. Теперь это контекстный редактор, конкурент Банана, QIE и иже с ними. Умеет все то что умеют конкуренты, но у него еще есть GUI — создаёт и ремиксит изображения — редактирует изображения через…
Reve милашка
Прошу его изобразить персонажей Футурамы, стиль Ложкина - сам ищет референсы, показывает.
В целом на уровне конкурентов. Если не считать режима редактирования, где он сам семантически выделяет слои/объекты для изменений. И все это бесплатново.
Очень понравилась картина с оглядывающейся девочкой. Но как и остальные генерилки, Reve ставит ее в центр проезжей части, никак не хочет перенести действие к одной или другой стороне улицы. А если переносит то меняет и персонажей или кринж какой-то добавляет вроде бомжовских штанов или иначе портит композицию. Тут понадобится сторонний инпейнт. Но в целом он хорош.
Короче, неидеально, но отличная бесплатная альтернатива.
Остальное закину туда которое нельзя рекламировать
Накидывайте свои эксперименты
#neuronaut_art
Прошу его изобразить персонажей Футурамы, стиль Ложкина - сам ищет референсы, показывает.
В целом на уровне конкурентов. Если не считать режима редактирования, где он сам семантически выделяет слои/объекты для изменений. И все это бесплатново.
Очень понравилась картина с оглядывающейся девочкой. Но как и остальные генерилки, Reve ставит ее в центр проезжей части, никак не хочет перенести действие к одной или другой стороне улицы. А если переносит то меняет и персонажей или кринж какой-то добавляет вроде бомжовских штанов или иначе портит композицию. Тут понадобится сторонний инпейнт. Но в целом он хорош.
Короче, неидеально, но отличная бесплатная альтернатива.
Остальное закину туда которое нельзя рекламировать
Накидывайте свои эксперименты
#neuronaut_art
👍7😁2
Media is too big
VIEW IN TELEGRAM
Hunyuan3D 3.0
Только что запустили новую версию 3D генератора
- точность повышена в три раза
- геометрическое разрешение составляет 1536 x 1536 x 1536
- используется 3,6 миллиарда вокселей для ультра-HD моделирования
- создание лиц с реалистичными контурами и естественными позами
- точная интерпретация входных изображений для реконструкции сложных структур
- генерация ультрачётких деталей профессионального уровня с улучшенной точностью текстур и их выравниванием
Доступен бесплатно через Hunyuan 3D AI Engine (20 генераций) и через Tencent Cloud API
Попробовать
#imageto3d #textto3d
Только что запустили новую версию 3D генератора
- точность повышена в три раза
- геометрическое разрешение составляет 1536 x 1536 x 1536
- используется 3,6 миллиарда вокселей для ультра-HD моделирования
- создание лиц с реалистичными контурами и естественными позами
- точная интерпретация входных изображений для реконструкции сложных структур
- генерация ультрачётких деталей профессионального уровня с улучшенной точностью текстур и их выравниванием
Доступен бесплатно через Hunyuan 3D AI Engine (20 генераций) и через Tencent Cloud API
Попробовать
#imageto3d #textto3d
🔥17👍4❤2😱1
This media is not supported in your browser
VIEW IN TELEGRAM
ComfyUI Cloud
#ComfyUI анонсировали облачный сервис
Обещают топовые GPU, обмазаться VRAM, топовые модели
Сейчас он в приватной бете, можно записаться в вейтлист
#ComfyUI анонсировали облачный сервис
Обещают топовые GPU, обмазаться VRAM, топовые модели
Сейчас он в приватной бете, можно записаться в вейтлист
👍7❤1👎1