Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.43K photos
3.7K videos
41 files
4.74K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
UMO: Scaling Multi-Identity Consistency for Image Customization via Matching Reward

Еще один персонализатор-кастомизатор картинок от ByteDance из семейства UXO (UMO, USO и UNO)

Сохраняет идентичность при работе с несколькими референсными изображениями и снижает путаницу между ними за счет измерения оной путаницы с помощью новой метрики

Свободно комбинирует идентичности с разными объектами.

У них там внутри ByteDance должна быть нешуточная конкуренция ибо сравнивают свою модель с UNO, DreamO, OmniGen2

А прикручено собственно к UNO и OmniGen2

Гитхаб
HF
Демо UMO-UNO
Демо UMO-OmniGen2

#personalization #referencing #text2image #image2image
👍8
Нейронавт | Нейросети в творчестве
Wan2.2-Fun-Reward-LoRAs Подтверждено, это релиз. + опубликовали Reward-LoRAs Reward LoRA можно использовать с базовой моделью #Wan22 и доработанными моделями (Wan2.2-Fun), что значительно повышает качество генерации видео Гитхаб воркфлоу - там же на гитхабе…
В чате трое включая меня отписались что воркфлоу не работает

Короче есть воркфлоу который работает с GGUF и safetensots Wan2.2-VACE-Fun
Только пишут что VACE-Fun это не оригинальный VACE.
И результаты он выдает даже хуже чем обычный Fun-Control. Ну или руки у меня кривые.

воркфлоу
Видеоинструкция от автора воркфлоу

#workflow #controlnet #referencing #depth2video #pose2video #lora
👍7
В Сан-Франциско уже даже ИИ-агенты расклеивают объявлен6ия в поиске работы

#humor
😁5🤯1🥴1
CineScale;_4K_Text_to_Video_Generation_2160p_25fps_VP9_160kbit_Opus.webm
61 MB
CineScale: Free Lunch in High-Resolution Cinematic Visual Generation

Метод повышения разрешения генерации изображений и видео от Netflix.
Использует специальные подходы для устранения повторяющихся паттернов и повышения качества

— создаёт видео в разрешении 4K при минимальной настройке LoRA

— позволяет редактировать визуальные материалы с предварительным просмотром в низком разрешении

В качестве базовых моделей использовали Wan2.1 1.3B и 14B
Для инференса в 3К нужна A100, а в 4K - их нужно 8. Так что порешали проблемы с картинкой (см примеры на сайте) но не с вычислительными ресурсами

Модельки маленькие, видимо лоры. Если есть A100 можете попробовать

Код

Спасибо @atttashe

#optimization #text2video #image2video #video2video
🔥72
Reve

Обновился сервис создания и редактирования изображений. Теперь это контекстный редактор, конкурент Банана, QIE и иже с ними. Умеет все то что умеют конкуренты, но у него еще есть GUI

— создаёт и ремиксит изображения

— редактирует изображения через простой текст

— объединяет элементы из разных изображений

— имеет редактор с перетаскиванием объектов -

— есть API

Есть бесплатный тариф, каждый день насыпают новый лимит. Но сколько - не признаются.

Вход через страны первого сорта

Подробнее у Сергея Цыпцына

Блог

#imageediting #referencing #GUI
👍6😁31
Нейронавт | Нейросети в творчестве
Reve Обновился сервис создания и редактирования изображений. Теперь это контекстный редактор, конкурент Банана, QIE и иже с ними. Умеет все то что умеют конкуренты, но у него еще есть GUI — создаёт и ремиксит изображения — редактирует изображения через…
Reve милашка
Прошу его изобразить персонажей Футурамы, стиль Ложкина - сам ищет референсы, показывает.
В целом на уровне конкурентов. Если не считать режима редактирования, где он сам семантически выделяет слои/объекты для изменений. И все это бесплатново.

Очень понравилась картина с оглядывающейся девочкой. Но как и остальные генерилки, Reve ставит ее в центр проезжей части, никак не хочет перенести действие к одной или другой стороне улицы. А если переносит то меняет и персонажей или кринж какой-то добавляет вроде бомжовских штанов или иначе портит композицию. Тут понадобится сторонний инпейнт. Но в целом он хорош.

Короче, неидеально, но отличная бесплатная альтернатива.
Остальное закину туда которое нельзя рекламировать

Накидывайте свои эксперименты

#neuronaut_art
👍7😁2
Media is too big
VIEW IN TELEGRAM
Hunyuan3D 3.0

Только что запустили новую версию 3D генератора

- точность повышена в три раза

- геометрическое разрешение составляет 1536 x 1536 x 1536

- используется 3,6 миллиарда вокселей для ультра-HD моделирования

- создание лиц с реалистичными контурами и естественными позами

- точная интерпретация входных изображений для реконструкции сложных структур

- генерация ультрачётких деталей профессионального уровня с улучшенной точностью текстур и их выравниванием

Доступен бесплатно через Hunyuan 3D AI Engine (20 генераций) и через Tencent Cloud API

Попробовать

#imageto3d #textto3d
🔥17👍42😱1
This media is not supported in your browser
VIEW IN TELEGRAM
ComfyUI Cloud

#ComfyUI анонсировали облачный сервис

Обещают топовые GPU, обмазаться VRAM, топовые модели

Сейчас он в приватной бете, можно записаться в вейтлист
👍71👎1