Тем временем вайбкодинг стал словом 2025 года по мнению британского словаря Collins
#news #vibecoding
#news #vibecoding
😈4😎3👍1😁1
pi-Flow: Policy-Based Flow Models
Новый метод от Adobe и Stanford University, позволяющий дистиллировать диффузные генераторы
Есть 4-шаговые и 8-шаговые адаптеры
Гитхаб
HF pi-Qwen-Image
HF pi-FLUX.1
pi-Qwen Demo
pi-FLUX Demo
ComfyUI pi-Flow Nodes
спасибо @m_franz
#optimization #text2image #comfyui
Новый метод от Adobe и Stanford University, позволяющий дистиллировать диффузные генераторы
Есть 4-шаговые и 8-шаговые адаптеры
Гитхаб
HF pi-Qwen-Image
HF pi-FLUX.1
pi-Qwen Demo
pi-FLUX Demo
ComfyUI pi-Flow Nodes
спасибо @m_franz
#optimization #text2image #comfyui
👍11😱2
Trajectory Control in ComfyUI - Wan ATI
Стримчик от Comfy Org про контроль траектории в WAN ATI
#comfyui #tutorial #cameracontrol #motioncontrol
Стримчик от Comfy Org про контроль траектории в WAN ATI
#comfyui #tutorial #cameracontrol #motioncontrol
YouTube
Trajectory Control in ComfyUI - Wan ATI
You’ve seen those wild viral videos where the background drifts and folds like an M.C. Escher fever dream — that’s Wan ATI Trajectory Control.
Today, Fill’s not just explaining it — he’s showing off his animated spline editor, a creative tool that lets you…
Today, Fill’s not just explaining it — he’s showing off his animated spline editor, a creative tool that lets you…
👍3
EVTAR: End2End Virtual Try-on with Visual Reference
Виртуальная примерочная на базе Flux-Kontext.dev с использованием дополнительных визуальных референсов. Надевает целевую одежду на изображение человека, учитывая референсные изображения для более точного отображения деталей одежды.
Гитхаб
HF
#tryon
Виртуальная примерочная на базе Flux-Kontext.dev с использованием дополнительных визуальных референсов. Надевает целевую одежду на изображение человека, учитывая референсные изображения для более точного отображения деталей одежды.
Гитхаб
HF
#tryon
👍10
Step-Audio-EditX
Опенсорсная аудиомодель от Степана (Stepfun) на базе LLM на 3B параметров.
Выразительное и итеративное редактирование звука.
Генератор речи по тексту без дообучения
Среди примеров есть очистка аудио от шума, ускорение речи, смена эмоции в речи, перевод обычной речи в шепот, контроль 10 типов паралингвистических особенностей (например, дыхание, смех, вздох, вопросы и т. д.)
Китайский и английский
работает на частоте 41.6Hz. Тут вероятно опечатка и речь о килогерцах
Оптимальный объем VRAM 32 GB, оптимальный хронометрах аудио - до 30 сек
Гитхаб
HF
Демо
#tts #text2speech #audioediting #speechcontrol #speechediting #speech2speech
Опенсорсная аудиомодель от Степана (Stepfun) на базе LLM на 3B параметров.
Выразительное и итеративное редактирование звука.
Генератор речи по тексту без дообучения
Среди примеров есть очистка аудио от шума, ускорение речи, смена эмоции в речи, перевод обычной речи в шепот, контроль 10 типов паралингвистических особенностей (например, дыхание, смех, вздох, вопросы и т. д.)
Китайский и английский
работает на частоте 41.6Hz. Тут вероятно опечатка и речь о килогерцах
Оптимальный объем VRAM 32 GB, оптимальный хронометрах аудио - до 30 сек
Гитхаб
HF
Демо
#tts #text2speech #audioediting #speechcontrol #speechediting #speech2speech
👍9❤1
Qwen-Image-Edit-2509-Light_restoration
Еще интересная лора #QIE от dx8152
Удаляет с изображения освещение. То есть, выполняет первый шаг релайтинга. Может пригодиться для создания датасетов релайтинга
Демо
#lora #relighting
Еще интересная лора #QIE от dx8152
Удаляет с изображения освещение. То есть, выполняет первый шаг релайтинга. Может пригодиться для создания датасетов релайтинга
Демо
#lora #relighting
🔥10👍3
Qwen-Image-Edit-2509-Photo-to-Anime
Наверняка кому-нибудь из вас это надо.
Лора #QIE для превращения фото в аниме
Демо
#lora #anime #stylization
Наверняка кому-нибудь из вас это надо.
Лора #QIE для превращения фото в аниме
Демо
#lora #anime #stylization
👍11🥴2😁1
Phased DMD: Few-step Distribution Matching Distillation via Score Matching within Subintervals
Опубликован препринт и сайт проекта метода на котором построен Wan2.2-Lightning.
Qwen-Image-20B тоже подвергли дистилляции этим методом
#optimization #text2image #text2video
Опубликован препринт и сайт проекта метода на котором построен Wan2.2-Lightning.
Qwen-Image-20B тоже подвергли дистилляции этим методом
#optimization #text2image #text2video
👍8
Qwen-Edit-2509-Upscale-LoRA
Лора #QIE для реставрации фото, в процессе разработки
устраняет низкое разрешение (до 16x), чрезмерную резкость, шум (до 50 %), блюр (радиус до 3 пикселей), артефакты JPEG (при качестве от 5 %), моушен блюр (до 64 пикселей), пикселизацию (до 16x), цветовой бандинг (до 3 бит), проблемы после использования других моделей увеличения масштаба (до 16x)
Воркфлоу в репозитории
#lora #upscale #imagerestoration #deblur #deartifact
Лора #QIE для реставрации фото, в процессе разработки
устраняет низкое разрешение (до 16x), чрезмерную резкость, шум (до 50 %), блюр (радиус до 3 пикселей), артефакты JPEG (при качестве от 5 %), моушен блюр (до 64 пикселей), пикселизацию (до 16x), цветовой бандинг (до 3 бит), проблемы после использования других моделей увеличения масштаба (до 16x)
Воркфлоу в репозитории
#lora #upscale #imagerestoration #deblur #deartifact
🔥14👍7
😱10🔥7👍5