😁13🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
Китайский бесплатный генератор музыки DiffRythm уже есть в Pinokio.
Устанавливаем, радуемся
Требования по VRAM: 8Гб
#music #text2music
Устанавливаем, радуемся
Требования по VRAM: 8Гб
#music #text2music
❤5👍1👎1🤔1
GEN3C: 3D-Informed World-Consistent Video Generation with Precise Camera Control
NVIDIA дообучили Cosmos - получили видеогенератор по картинке с точным управлением камерой и временнОй согласованностью в 3D за счет 3D-кэша
Траекторию камеры можно настраивать интерактивно
Код ждем
#image2video #cameracontrol
NVIDIA дообучили Cosmos - получили видеогенератор по картинке с точным управлением камерой и временнОй согласованностью в 3D за счет 3D-кэша
Траекторию камеры можно настраивать интерактивно
Код ждем
#image2video #cameracontrol
🔥9👍3
TrajectoryCrafter: Redirecting Camera Trajectory for Monocular Videos via Diffusion Models
Еще похожий прошлогодний проект, управление камерой упихано в набор пресетов.
Зато можно попробовать
Код
Демо
Спасибо @SakurakoujiLuna
#cameracontrol #video2video #novelview
Еще похожий прошлогодний проект, управление камерой упихано в набор пресетов.
Зато можно попробовать
Код
Демо
Спасибо @SakurakoujiLuna
#cameracontrol #video2video #novelview
👍6❤1
Diffusion Self-Distillation for Zero-Shot Customized Image Generation
Персонализация для генераторов картинок.
Применяют самодистилляцию - дообучение модели на ею же сгенерированном наборе пар картинок.
Считают что превзошли все методы персонализации без дообучения.
Метод применим для релайтинга
#тестбендера в комментах
Код
Демо
#text2image #personalization #relighting
Персонализация для генераторов картинок.
Применяют самодистилляцию - дообучение модели на ею же сгенерированном наборе пар картинок.
Считают что превзошли все методы персонализации без дообучения.
Метод применим для релайтинга
#тестбендера в комментах
Код
Демо
#text2image #personalization #relighting
👍7🔥5
QwQ-32B
Языковая модель от Qwen Alibaba на 32B параметров, побивающая по некоторым бенчмаркам DeepSeek-R1 671B
Попробовать - посмотрите в список моделей, там не только QwQ-32B
#reasoning #assistant
Языковая модель от Qwen Alibaba на 32B параметров, побивающая по некоторым бенчмаркам DeepSeek-R1 671B
Попробовать - посмотрите в список моделей, там не только QwQ-32B
#reasoning #assistant
👍5
Open R1
Полностью открытое воспроизведение DeepSeek-R1 от HuggingFace. В процессе разработки
Гитхаб
#assistant #reasoning #coding
Полностью открытое воспроизведение DeepSeek-R1 от HuggingFace. В процессе разработки
Гитхаб
#assistant #reasoning #coding
🔥6
Обновки ACE++
Кто не видел, в репозитории редактора изображений от Alibaba ACE++ добавлены воркфлоу #ComfyUI, конфига файнтюна и унифицированная fft модель (что это? сам не знаю, говорят что поддерживает больше задач #image2image)
#personalization #imageediting #inpainting
Кто не видел, в репозитории редактора изображений от Alibaba ACE++ добавлены воркфлоу #ComfyUI, конфига файнтюна и унифицированная fft модель (что это? сам не знаю, говорят что поддерживает больше задач #image2image)
#personalization #imageediting #inpainting
❤13
This media is not supported in your browser
VIEW IN TELEGRAM
Gradio Sketch 2.0
Вайб-кодинг
Визуальное создание полных приложений Gradio, включая добавление событий, без единой строки кода
Если у вас уже установлен Gradio, то обновляем
и запускаем в терминале:
#coding #vibecoding
Вайб-кодинг
Визуальное создание полных приложений Gradio, включая добавление событий, без единой строки кода
Если у вас уже установлен Gradio, то обновляем
𝚙𝚒𝚙 𝚒𝚗𝚜𝚝𝚊𝚕𝚕 --𝚞𝚙𝚐𝚛𝚊𝚍𝚎 𝚐𝚛𝚊𝚍𝚒𝚘
и запускаем в терминале:
𝚐𝚛𝚊𝚍𝚒𝚘 𝚜𝚔𝚎𝚝𝚌𝚑
#coding #vibecoding
🔥14❤1👍1
Опубликован код MatAnyone + есть #ComfyUI
Код
ComfyUI_MatAnyone_Kytra
#segmentation #matting #video2matte #video2mask
Код
ComfyUI_MatAnyone_Kytra
#segmentation #matting #video2matte #video2mask
Telegram
Нейронавт | Нейросети в творчестве
MatAnyone: Stable Video Matting with Consistent Memory Propagation
Создает маску на заданного человека на видео
На вход принимает маску в первом кадре. Но потеть не придется, целевая маска создается в несколько кликов.
Пока еще далеко от идеала, но надеюсь…
Создает маску на заданного человека на видео
На вход принимает маску в первом кадре. Но потеть не придется, целевая маска создается в несколько кликов.
Пока еще далеко от идеала, но надеюсь…
🔥12
Nunchaku v0.1.4
Инференсный движок для запуска 4-битных диффузных моделей по методу SVDQuant (там есть демо, среди авторов MIT, NVIDIA, Pika Labs)
Поддерживает лоры
Сокращает требование по VRAM для FLUX.1 до 4Гб, увеличивая скорость в 2-3 раза.
Протестирован с SDXL, PixArt-∑, FLUX.1б SANA 1.6B
Код
Демо
ComfyUI
https://huggingface.co/mit-han-lab/nunchaku/blob/main/nunchaku-0.1.4%2Btorch2.6-cp312-cp312-win_amd64.whl - может пригодиться для Windows
#text2image #optimization
Инференсный движок для запуска 4-битных диффузных моделей по методу SVDQuant (там есть демо, среди авторов MIT, NVIDIA, Pika Labs)
Поддерживает лоры
Сокращает требование по VRAM для FLUX.1 до 4Гб, увеличивая скорость в 2-3 раза.
Протестирован с SDXL, PixArt-∑, FLUX.1б SANA 1.6B
Код
Демо
ComfyUI
https://huggingface.co/mit-han-lab/nunchaku/blob/main/nunchaku-0.1.4%2Btorch2.6-cp312-cp312-win_amd64.whl - может пригодиться для Windows
#text2image #optimization
🔥15❤3