Blur Background / Unblur Background
Две лоры #kontext - для размытия фона и для восстановления четкости фона
Blur Background
Unblur Background
#lora
Две лоры #kontext - для размытия фона и для восстановления четкости фона
Blur Background
Unblur Background
#lora
❤6👍4
3D сцены HunyuanWorld 1.0 полностью редактируемые
(ну они так и написали - совместимые с 3D пайплайнами)
Можно попробовать запустить его в Google Colab Pro (нужно 22ГБ VRAM)
Jupiter / Colab
#text2world #image2world #text2panorama #image2panorama #360 #text2scene #image2scene #world
(ну они так и написали - совместимые с 3D пайплайнами)
Можно попробовать запустить его в Google Colab Pro (нужно 22ГБ VRAM)
Jupiter / Colab
#text2world #image2world #text2panorama #image2panorama #360 #text2scene #image2scene #world
👍7🔥2
Leosam из команды Wan показал WAN 2.2 I2V и дал немного инфы
Несколько моделей Wan2.2 опубликуют сегодня с 15 по 17ч по Москве
реддит
Hugging Face: https://huggingface.co/Wan-AI
GitHub: https://github.com/Wan-Video
Official Site: https://wan.video/
#news
Несколько моделей Wan2.2 опубликуют сегодня с 15 по 17ч по Москве
реддит
Hugging Face: https://huggingface.co/Wan-AI
GitHub: https://github.com/Wan-Video
Official Site: https://wan.video/
#news
🔥6👍3
WAN 2.2
Опубликовали 6 моделей
t2v и i2v
5B и 14B
Внедрили совет экспертов (#MoE). А я ванговал что ЛЛМные фишки будут везде.
Это увеличивает общую производительность модели при сохранении тех же вычислительных затрат.
Из пока понятного мне умеет
- генерировать видео в кинематографическом стиле — с учётом освещения, композиции и других деталей;
- создавать сложные движения в видео;
- работать на обычных RTX 4090;
- выдавать видео в разрешении 720p с частотой 24 кадра в секунду.
#text2video #image2video
Опубликовали 6 моделей
t2v и i2v
5B и 14B
Внедрили совет экспертов (#MoE). А я ванговал что ЛЛМные фишки будут везде.
Это увеличивает общую производительность модели при сохранении тех же вычислительных затрат.
Из пока понятного мне умеет
- генерировать видео в кинематографическом стиле — с учётом освещения, композиции и других деталей;
- создавать сложные движения в видео;
- работать на обычных RTX 4090;
- выдавать видео в разрешении 720p с частотой 24 кадра в секунду.
#text2video #image2video
❤3👍1🔥1
Wan2.2 Day-0 Support in ComfyUI
Ну и спасибо разрабам, нативная поддержка новых моделей в #ComfyUI
5B работает на 8ГБ VRAM!
Доступны
Wan2.2-TI2V-5B: Text/Image to video, FP16
Wan2.2-I2V-A14B: Images to video, FP16/FP8
Wan2.2-T2V-A14B: Text to video, FP16/FP8
воркфлоу уже есть в официальном наборе (Workflow → Browse Templates → Video)
#text2video #image2video
Ну и спасибо разрабам, нативная поддержка новых моделей в #ComfyUI
5B работает на 8ГБ VRAM!
Доступны
Wan2.2-TI2V-5B: Text/Image to video, FP16
Wan2.2-I2V-A14B: Images to video, FP16/FP8
Wan2.2-T2V-A14B: Text to video, FP16/FP8
воркфлоу уже есть в официальном наборе (Workflow → Browse Templates → Video)
#text2video #image2video
👍21🔥5❤2
👍8🔥5❤1
👍8
This media is not supported in your browser
VIEW IN TELEGRAM
Ускоряющая четырехшаговая лора WAN2.1-lightx2v работает с WAN2.2!
воркфлоу
лора
#text2video #lora #image2video #optimization #workflow
воркфлоу
лора
#text2video #lora #image2video #optimization #workflow
❤6👍2🔥2🤔1
This media is not supported in your browser
VIEW IN TELEGRAM
Пока одни изобретают браузеры нового поколения, другие прикручивают ИИ-свистоперделки к старым
В Edge появился режим Copilot.
нейросеть группирует вкладки, пересказывает статьи, выполняет голосовые команды и подсказывает в нужный момент. Бесплатново. Но придется притвориться что вы не в России
#news #browser #agent
В Edge появился режим Copilot.
нейросеть группирует вкладки, пересказывает статьи, выполняет голосовые команды и подсказывает в нужный момент. Бесплатново. Но придется притвориться что вы не в России
#news #browser #agent
👀2❤1👍1😁1
This media is not supported in your browser
VIEW IN TELEGRAM
JAM: A Tiny Flow-based Song Generator with Fine-grained Controllability and Aesthetic Alignment
Компактная модель для генерации песен из готовых текстов.
Основная фишка - позволяет точно контролировать, когда и как долго звучат слова и слоги в песне — можно подгонять вокал под нужный ритм. А также полный контроль над структурой песни - ну там когда куплеты когда припевы
На примерах да, контроль заметен, слова и акценты расставляет как человек
Код
Веса - 2 Гб
#music #text2music
Компактная модель для генерации песен из готовых текстов.
Основная фишка - позволяет точно контролировать, когда и как долго звучат слова и слоги в песне — можно подгонять вокал под нужный ритм. А также полный контроль над структурой песни - ну там когда куплеты когда припевы
На примерах да, контроль заметен, слова и акценты расставляет как человек
Код
Веса - 2 Гб
#music #text2music
👍5🔥1
Music Arena
Арена / лидерборд генераторов музыки.
Можно поиграть с генерацией коротких кусочков. Мне сгенерил 11с и 30с
Лидерборд пока пуст
#text2music #leaderboard
Арена / лидерборд генераторов музыки.
Можно поиграть с генерацией коротких кусочков. Мне сгенерил 11с и 30с
Лидерборд пока пуст
#text2music #leaderboard
👍7
Wan 2.2 14B T2V (GGUF Q8) против Flux.1 Dev (GGUF Q8) в генерации картинок
Слева WAN, справа Flux
Автор не черрипикал, брал первые результаты.
WAN 2.2 полностью обратно совместим с лорами WAN 2.1 (так пишут)
Напомню, что не так давно сообщество заинтересовалось способностью видеогенераторов к созданию изображений
Скрипач Flux не нужен?
воркфлоу
Реддит
#shootout #comparison #text2image
Слева WAN, справа Flux
Автор не черрипикал, брал первые результаты.
WAN 2.2 полностью обратно совместим с лорами WAN 2.1 (так пишут)
Напомню, что не так давно сообщество заинтересовалось способностью видеогенераторов к созданию изображений
воркфлоу
Реддит
#shootout #comparison #text2image
🔥21👍5❤2🥴1💯1