🚀HunyuanCustom ComfyUI
Ждать пришлось недолго. Киджай сделал тестовый воркфлоу
1️⃣ Скачать модель fp8_scaled
2️⃣ Обновить #ComfyUI, ComfyUI-HunyuanVideoWrapper и ComfyUI-KJNodes до последней версии
3️⃣ настройте параметры воркфлоу: включите
#text2video #image2video #audio2video #video2video #personalization #multisubject
Ждать пришлось недолго. Киджай сделал тестовый воркфлоу
1️⃣ Скачать модель fp8_scaled
2️⃣ Обновить #ComfyUI, ComfyUI-HunyuanVideoWrapper и ComfyUI-KJNodes до последней версии
3️⃣ настройте параметры воркфлоу: включите
cfg = 7.5, отключите use_cfg_zero_star и выставьте разрешение 720p#text2video #image2video #audio2video #video2video #personalization #multisubject
Telegram
Нейронавт | Нейросети в творчестве
HunyuanCustom: A Multimodal-Driven Architecture for Customized Video Generation
Мультимодальный генератор видео с кастомизацией-персонализацией по нескольким объектам.
На вход принимает текст, картинки, видео и даже звук.
Внутри LlaVa
Вопрос: сколько нужно…
Мультимодальный генератор видео с кастомизацией-персонализацией по нескольким объектам.
На вход принимает текст, картинки, видео и даже звук.
Внутри LlaVa
Вопрос: сколько нужно…
👍8
Step1X-3D: Towards High-Fidelity and Controllable Generation of Textured 3D Assets
Генератор текстурированных 3D моделей от Stepfun AI
Хвастаются точным маппингом текстур на сетку
Обещают сделать комфи и контроль генерации по нескольким ракурсам, баундиннг боксу, скелету
Код
Веса
Демо
#imageto3d #3d #texture
Генератор текстурированных 3D моделей от Stepfun AI
Хвастаются точным маппингом текстур на сетку
Обещают сделать комфи и контроль генерации по нескольким ракурсам, баундиннг боксу, скелету
Код
Веса
Демо
#imageto3d #3d #texture
🔥4👍2❤1👌1🍌1
Triton V3.3.0 Windows Native Build
Ошибкам из-за неработающего triton на Windows конец?
Предыдущее решение у меня сработало без каких-либо проблем, но мне повезло, не у всех так.
Это решение вез какой-либо виртуализации, родная Windows библиотека. Но только для Nvidia
Пользуйтесь на свой страх и риск
#tools #python #fix
Ошибкам из-за неработающего triton на Windows конец?
Предыдущее решение у меня сработало без каких-либо проблем, но мне повезло, не у всех так.
Это решение вез какой-либо виртуализации, родная Windows библиотека. Но только для Nvidia
Пользуйтесь на свой страх и риск
#tools #python #fix
GitHub
GitHub - leomaxwell973/Triton-3.3.0-UPDATE_FROM_3.2.0_and_FIXED-Windows-Nvidia-Prebuilt: This is a pre-built wheel of Triton 3.3.0…
This is a pre-built wheel of Triton 3.3.0 for Windows with Nvidia only + Proton - leomaxwell973/Triton-3.3.0-UPDATE_FROM_3.2.0_and_FIXED-Windows-Nvidia-Prebuilt
🔥6👍1
ComfyUI wrapper nodes for Latent Bridge Matching (LBM)
Подвезли #ComfyUI преобразователя изображений LBM
воркфлоу
туториал
Спасибо @kostyanchik_94
#workflow #image2image #imageediting #inpainting #objectremoval #relighting #image2depth #image2normal #enhance #tutorial #imagerestoration
Подвезли #ComfyUI преобразователя изображений LBM
воркфлоу
туториал
Спасибо @kostyanchik_94
#workflow #image2image #imageediting #inpainting #objectremoval #relighting #image2depth #image2normal #enhance #tutorial #imagerestoration
👍12🔥1👀1
Kandinsky 3D
Генерилка текстурированных 3D моделей по тексту от Сбера.
По текстовому описанию выдает 4 варианта модели с разным сидом на выбор
Обещают сделать генерацию по изображению, расширенные настройки генерации, инструменты упрощения и оптимизации 3D-модели.
#тестбендера по текстовому описанию картинки из JoyCaption Beta One провален с первой попытки - нарисовал что-то совсем непохожее. Со второй - на твердую троечку
Сетку оцените сами
Попробовать - нужен Sber ID, но это фигня, при каждом запросе придется писать капчу. Короче, Сбер опять отличился. Но похоже что других ограничений нет.
API
#textto3D
Генерилка текстурированных 3D моделей по тексту от Сбера.
По текстовому описанию выдает 4 варианта модели с разным сидом на выбор
Обещают сделать генерацию по изображению, расширенные настройки генерации, инструменты упрощения и оптимизации 3D-модели.
#тестбендера по текстовому описанию картинки из JoyCaption Beta One провален с первой попытки - нарисовал что-то совсем непохожее. Со второй - на твердую троечку
Сетку оцените сами
Попробовать - нужен Sber ID, но это фигня, при каждом запросе придется писать капчу. Короче, Сбер опять отличился. Но похоже что других ограничений нет.
API
#textto3D
🥴13👍4👎4🤔2😁1
Альтман опять что-то спойлерит, неизвестно что.
Делаем ставки
👍 - придумают нормальное название продукта
👎 - как всегда, будет бессмысленное цифро-буквенное обозначение
#news
Делаем ставки
👍 - придумают нормальное название продукта
👎 - как всегда, будет бессмысленное цифро-буквенное обозначение
#news
👎42🤔4👍3
Установил вчера VACE в Pinokio
Он там лежит в Community Scripts.
Ждал пару часов пока все скачается - засрал 75Гб сразу
Потом ждал пару часов пока обработается
Потом читал мануал, все стало еще непонятнее
Потом потыкал препроцессоры
Потом лег спать
И вот наконец, наутро мне нечего показать
Кто понял что там нажимать чтобы заменить лицо на видео?
Он там лежит в Community Scripts.
Ждал пару часов пока все скачается - засрал 75Гб сразу
Потом ждал пару часов пока обработается
Потом читал мануал, все стало еще непонятнее
Потом потыкал препроцессоры
Потом лег спать
И вот наконец, наутро мне нечего показать
Кто понял что там нажимать чтобы заменить лицо на видео?
😁8👍7🔥2
Stable Scripts UI (SSUI)
Автор испугался огромных комфи воркфлоу и сделал свой комфи с блэкджеком. Короче среда сборки и запуска воркфлоу с нейросетками, но чтоб не было десятков и сотен непонятных блоков.
Главная идея - простота и воспроизводимость. У всех все должно запускаться одинаково. Что-то вроде Pinokio если бы он был конструктором для непрограммистов. И что-то вроде комфи где не надо разбираться что куда втыкать
- Простота использования
- Воспроизводимость: Скрипты, необходимые для них модули и сам SSUI являются версионными. Скрипты могут запускаться точно в той же среде, что и автор сценария.
- Управляемость моделями и конфигурациями
- Строгая типизированность: Все ресурсы (включая модели) являются строго типизированными, и их невозможно использовать неправильно.
- Настраиваемость: Вы можете настроить скрипты, типы, модели, панели, загрузчики, фреймворк пользовательского интерфейса и многое другое.
Проект на стадии MVP (минимальный функционал), сейчас поддерживает только SD1, SDXL, Flux
#text2image #tools #GUI
Автор испугался огромных комфи воркфлоу и сделал свой комфи с блэкджеком. Короче среда сборки и запуска воркфлоу с нейросетками, но чтоб не было десятков и сотен непонятных блоков.
Главная идея - простота и воспроизводимость. У всех все должно запускаться одинаково. Что-то вроде Pinokio если бы он был конструктором для непрограммистов. И что-то вроде комфи где не надо разбираться что куда втыкать
- Простота использования
- Воспроизводимость: Скрипты, необходимые для них модули и сам SSUI являются версионными. Скрипты могут запускаться точно в той же среде, что и автор сценария.
- Управляемость моделями и конфигурациями
- Строгая типизированность: Все ресурсы (включая модели) являются строго типизированными, и их невозможно использовать неправильно.
- Настраиваемость: Вы можете настроить скрипты, типы, модели, панели, загрузчики, фреймворк пользовательского интерфейса и многое другое.
Проект на стадии MVP (минимальный функционал), сейчас поддерживает только SD1, SDXL, Flux
#text2image #tools #GUI
👍12🤷♂2
Stable Audio Open Small
Спустя пару месяцев Stability AI выпустили мобильный генератор звуков для девайсов ARM
До 11 секунд 44.1kHz стерео по тексту локально на мобилках
Веса
Гитхаб
#news #mobile #text2audio
Спустя пару месяцев Stability AI выпустили мобильный генератор звуков для девайсов ARM
До 11 секунд 44.1kHz стерео по тексту локально на мобилках
Веса
Гитхаб
#news #mobile #text2audio
🤔2👍1👏1
Media is too big
VIEW IN TELEGRAM
MoviiGen 1.1
Файнтюн Wan 2.1 с заявкой на кинокачество, видео по тексту.
720P и 1080P
Должно работать с любым родным Wan 2.1 t2v вокрфлоу
есть GGUF
#text2video
Файнтюн Wan 2.1 с заявкой на кинокачество, видео по тексту.
720P и 1080P
Должно работать с любым родным Wan 2.1 t2v вокрфлоу
есть GGUF
#text2video
👍18👏3🔥2❤1
Hunyuan Image 2.0
Tencent выкатил генератор картинок 2.0
Генерит мгновенно!
Высокая реалистичность.
Dual-Canvas Studio - редактор с холстом позволяет смешивать слои.
Как пользоваться - непонятно, все на китайском. Для начала надо войти по имейлу. Вот куда-то ткнул, сделал котика. Первая картинка с котиком - моя, просто по запросу Cat, непонятно новой моделью или старой.
Вообще выглядит впечатляюще
#text2image #realtime #imageediting
Tencent выкатил генератор картинок 2.0
Генерит мгновенно!
Высокая реалистичность.
Dual-Canvas Studio - редактор с холстом позволяет смешивать слои.
Как пользоваться - непонятно, все на китайском. Для начала надо войти по имейлу. Вот куда-то ткнул, сделал котика. Первая картинка с котиком - моя, просто по запросу Cat, непонятно новой моделью или старой.
Вообще выглядит впечатляюще
#text2image #realtime #imageediting
👍10❤7