Есть демоспейс SRPO (Файнтюн Flux-dev от Tencent-Hunyuan с улучшенным реализмом и эстетикой)
Нравится картинка
Промпт:
Демо
#text2image #fluxc
Нравится картинка
Промпт:
real life photo of a fantasy Fish straight-walking from left to right in a human megapolis along the walkway as undercover agent, wearing human suite, wearing a landsuite with a helmet filled with water to breathe, wearing a hat over the helmet, in human disguisewe can see the Fish's face thought the helmet's visor. People on the street are reacting to the unseen creature. masterpiece, wide view, distant view, sideview
Демо
#text2image #fluxc
👍9❤1
UMO: Scaling Multi-Identity Consistency for Image Customization via Matching Reward
Еще один персонализатор-кастомизатор картинок от ByteDance из семейства UXO (UMO, USO и UNO)
Сохраняет идентичность при работе с несколькими референсными изображениями и снижает путаницу между ними за счет измерения оной путаницы с помощью новой метрики
Свободно комбинирует идентичности с разными объектами.
У них там внутри ByteDance должна быть нешуточная конкуренция ибо сравнивают свою модель с UNO, DreamO, OmniGen2
А прикручено собственно к UNO и OmniGen2
Гитхаб
HF
Демо UMO-UNO
Демо UMO-OmniGen2
#personalization #referencing #text2image #image2image
Еще один персонализатор-кастомизатор картинок от ByteDance из семейства UXO (UMO, USO и UNO)
Сохраняет идентичность при работе с несколькими референсными изображениями и снижает путаницу между ними за счет измерения оной путаницы с помощью новой метрики
Свободно комбинирует идентичности с разными объектами.
У них там внутри ByteDance должна быть нешуточная конкуренция ибо сравнивают свою модель с UNO, DreamO, OmniGen2
А прикручено собственно к UNO и OmniGen2
Гитхаб
HF
Демо UMO-UNO
Демо UMO-OmniGen2
#personalization #referencing #text2image #image2image
👍8
Нейронавт | Нейросети в творчестве
Wan2.2-Fun-Reward-LoRAs Подтверждено, это релиз. + опубликовали Reward-LoRAs Reward LoRA можно использовать с базовой моделью #Wan22 и доработанными моделями (Wan2.2-Fun), что значительно повышает качество генерации видео Гитхаб воркфлоу - там же на гитхабе…
В чате трое включая меня отписались что воркфлоу не работает
Короче есть воркфлоу который работает с GGUF и safetensots Wan2.2-VACE-Fun
Только пишут что VACE-Fun это не оригинальный VACE.
И результаты он выдает даже хуже чем обычный Fun-Control. Ну или руки у меня кривые.
воркфлоу
Видеоинструкция от автора воркфлоу
#workflow #controlnet #referencing #depth2video #pose2video #lora
Короче есть воркфлоу который работает с GGUF и safetensots Wan2.2-VACE-Fun
Только пишут что VACE-Fun это не оригинальный VACE.
И результаты он выдает даже хуже чем обычный Fun-Control. Ну или руки у меня кривые.
воркфлоу
Видеоинструкция от автора воркфлоу
#workflow #controlnet #referencing #depth2video #pose2video #lora
YouTube
Vace 2.2 Wan 2.2 Fun Vace Video to Video with photo reference. Video Outpainting GGUF. Best AI Guide
Wan 2.2 Fun Vace GGUF ComfyUI best workflow. Learning AI easy Tutorial. Image to video and video to video AI with image reference. avatar, AI animation. opensource video generator. Outpaint your image to video. Make your own pose to video with Vace. Installation…
👍7
CineScale;_4K_Text_to_Video_Generation_2160p_25fps_VP9_160kbit_Opus.webm
61 MB
CineScale: Free Lunch in High-Resolution Cinematic Visual Generation
Метод повышения разрешения генерации изображений и видео от Netflix.
Использует специальные подходы для устранения повторяющихся паттернов и повышения качества
— создаёт видео в разрешении 4K при минимальной настройке LoRA
— позволяет редактировать визуальные материалы с предварительным просмотром в низком разрешении
В качестве базовых моделей использовали Wan2.1 1.3B и 14B
Для инференса в 3К нужна A100, а в 4K - их нужно 8. Так что порешали проблемы с картинкой (см примеры на сайте) но не с вычислительными ресурсами
Модельки маленькие, видимо лоры. Если есть A100 можете попробовать
Код
Спасибо @atttashe
#optimization #text2video #image2video #video2video
Метод повышения разрешения генерации изображений и видео от Netflix.
Использует специальные подходы для устранения повторяющихся паттернов и повышения качества
— создаёт видео в разрешении 4K при минимальной настройке LoRA
— позволяет редактировать визуальные материалы с предварительным просмотром в низком разрешении
В качестве базовых моделей использовали Wan2.1 1.3B и 14B
Для инференса в 3К нужна A100, а в 4K - их нужно 8. Так что порешали проблемы с картинкой (см примеры на сайте) но не с вычислительными ресурсами
Модельки маленькие, видимо лоры. Если есть A100 можете попробовать
Код
Спасибо @atttashe
#optimization #text2video #image2video #video2video
🔥7❤2
Reve
Обновился сервис создания и редактирования изображений. Теперь это контекстный редактор, конкурент Банана, QIE и иже с ними. Умеет все то что умеют конкуренты, но у него еще есть GUI
— создаёт и ремиксит изображения
— редактирует изображения через простой текст
— объединяет элементы из разных изображений
— имеет редактор с перетаскиванием объектов -
— есть API
Есть бесплатный тариф, каждый день насыпают новый лимит. Но сколько - не признаются.
Вход через страны первого сорта
Подробнее у Сергея Цыпцына
Блог
#imageediting #referencing #GUI
Обновился сервис создания и редактирования изображений. Теперь это контекстный редактор, конкурент Банана, QIE и иже с ними. Умеет все то что умеют конкуренты, но у него еще есть GUI
— создаёт и ремиксит изображения
— редактирует изображения через простой текст
— объединяет элементы из разных изображений
— имеет редактор с перетаскиванием объектов -
— есть API
Есть бесплатный тариф, каждый день насыпают новый лимит. Но сколько - не признаются.
Вход через страны первого сорта
Подробнее у Сергея Цыпцына
Блог
#imageediting #referencing #GUI
👍6😁3❤1
Нейронавт | Нейросети в творчестве
Reve Обновился сервис создания и редактирования изображений. Теперь это контекстный редактор, конкурент Банана, QIE и иже с ними. Умеет все то что умеют конкуренты, но у него еще есть GUI — создаёт и ремиксит изображения — редактирует изображения через…
Reve милашка
Прошу его изобразить персонажей Футурамы, стиль Ложкина - сам ищет референсы, показывает.
В целом на уровне конкурентов. Если не считать режима редактирования, где он сам семантически выделяет слои/объекты для изменений. И все это бесплатново.
Очень понравилась картина с оглядывающейся девочкой. Но как и остальные генерилки, Reve ставит ее в центр проезжей части, никак не хочет перенести действие к одной или другой стороне улицы. А если переносит то меняет и персонажей или кринж какой-то добавляет вроде бомжовских штанов или иначе портит композицию. Тут понадобится сторонний инпейнт. Но в целом он хорош.
Короче, неидеально, но отличная бесплатная альтернатива.
Остальное закину туда которое нельзя рекламировать
Накидывайте свои эксперименты
#neuronaut_art
Прошу его изобразить персонажей Футурамы, стиль Ложкина - сам ищет референсы, показывает.
В целом на уровне конкурентов. Если не считать режима редактирования, где он сам семантически выделяет слои/объекты для изменений. И все это бесплатново.
Очень понравилась картина с оглядывающейся девочкой. Но как и остальные генерилки, Reve ставит ее в центр проезжей части, никак не хочет перенести действие к одной или другой стороне улицы. А если переносит то меняет и персонажей или кринж какой-то добавляет вроде бомжовских штанов или иначе портит композицию. Тут понадобится сторонний инпейнт. Но в целом он хорош.
Короче, неидеально, но отличная бесплатная альтернатива.
Остальное закину туда которое нельзя рекламировать
Накидывайте свои эксперименты
#neuronaut_art
👍7😁2