qwen_image_edit_inpainting
И такая же лора от Ostris
Только заполняет не черные а зеленые области (идеально зеленый - 00FF00 / 0,255,0)
И не требует промпта активации как предыдущая лора
Так, кажется не надо было отключать ноду Scale Image to total pixels. Включил ее и проблема с кропом/экстендом почти исчезла. Но мне важно чтобы размер изображения оставался таким же как на входе!
Изображение все-таки немного меняется но некритично, дальше уже можно руками по маске собрать с инпейнтом
Видео
#inpainting #lora #imageediting
И такая же лора от Ostris
Только заполняет не черные а зеленые области (идеально зеленый - 00FF00 / 0,255,0)
И не требует промпта активации как предыдущая лора
Так, кажется не надо было отключать ноду Scale Image to total pixels. Включил ее и проблема с кропом/экстендом почти исчезла. Но мне важно чтобы размер изображения оставался таким же как на входе!
Изображение все-таки немного меняется но некритично, дальше уже можно руками по маске собрать с инпейнтом
Видео
#inpainting #lora #imageediting
👍6❤2
Drawing2CAD: Sequence-to-Sequence Learning for CAD Generation from Vector Drawings
Вообще не знаю имеет ли это какой-то смысл, но вот.
Генератор CAD по векторным рисункам
#imageto3d #vectorto3d #3d
Вообще не знаю имеет ли это какой-то смысл, но вот.
Генератор CAD по векторным рисункам
#imageto3d #vectorto3d #3d
❤4👍3🤔3🔥1
😁11😱2👍1
Media is too big
VIEW IN TELEGRAM
WaveBlender: Practical Sound-Source Animation in Blended Domains
Создает звуковые эффекты на основе входной анимации с "аккустическими шейдерами". И вроде бы даже без нейросетей. Но посмотрите-послушайте что вытворяет.
Использует метод конечных разностей во временной области (FDTD) и ускоряется с помощью GPU.
— синтезирует звуки для различных существующих физических источников звука: воды, модальных источников, тонких оболочек, кинематических деформаторов
— создаёт точечные источники для маленьких твёрдых тел
— работает надёжно при разных разрешениях
— оптимизирована для работы на GPU
— может быть в 1000 раз быстрее, чем предыдущие волновые решатели на CPU
Stanford University / Adobe Research / NVIDIA
Код
#3d2sfx #foley #sfx #animation2sfx
Создает звуковые эффекты на основе входной анимации с "аккустическими шейдерами". И вроде бы даже без нейросетей. Но посмотрите-послушайте что вытворяет.
Использует метод конечных разностей во временной области (FDTD) и ускоряется с помощью GPU.
— синтезирует звуки для различных существующих физических источников звука: воды, модальных источников, тонких оболочек, кинематических деформаторов
— создаёт точечные источники для маленьких твёрдых тел
— работает надёжно при разных разрешениях
— оптимизирована для работы на GPU
— может быть в 1000 раз быстрее, чем предыдущие волновые решатели на CPU
Stanford University / Adobe Research / NVIDIA
Код
#3d2sfx #foley #sfx #animation2sfx
🔥17👍3
VibeVoice вернулся после 404
Microsoft, как можно было предположить, забеспокоился что юзеры при помощи их инструмента сделают что-нибудь нехорошее и прикрыл репозиторий.
Сейчас репозиторий снова открыт, в нем нет кода и появилось такое сообщение:
А также появился SECURITY.md
Модели на HF снова доступны вроде.
Но изначально проект был выпущен под лицензией MIT, так что уже поздно запрещать. Пользуемся в ComfyUI
#news #podcast #voicecloning #tts #text2speech #text2podcast
Microsoft, как можно было предположить, забеспокоился что юзеры при помощи их инструмента сделают что-нибудь нехорошее и прикрыл репозиторий.
Сейчас репозиторий снова открыт, в нем нет кода и появилось такое сообщение:
2025-09-05: VibeVoice - это исследовательская платформа с открытым исходным кодом, предназначенная для развития сотрудничества в сообществе по синтезу речи. После выпуска мы обнаружили случаи, когда инструмент использовался способами, несовместимыми с заявленными целями. Поскольку ответственное использование искусственного интеллекта является одним из руководящих принципов Microsoft, мы отключили это хранилище до тех пор, пока не будем уверены, что использование за пределами области применения больше невозможно.
А также появился SECURITY.md
Безопасность
Корпорация Майкрософт серьезно относится к безопасности своих программных продуктов и сервисов, включая все хранилища исходного кода в наших организациях на GitHub.
Пожалуйста, не сообщайте об уязвимостях в системе безопасности через общедоступные публикации на GitHub.
Для получения информации о безопасности, местоположениях, контактных данных и политиках, пожалуйста, ознакомьтесь с последними рекомендациями для репозиториев Майкрософт по адресу https://aka.ms/SECURITY.md.
Модели на HF снова доступны вроде.
Но изначально проект был выпущен под лицензией MIT, так что уже поздно запрещать. Пользуемся в ComfyUI
#news #podcast #voicecloning #tts #text2speech #text2podcast
😁12👍3❤2
👍2