Tripо 3.0
Обновка 3D генератора.
Под капотом TripoSF - не знаю та ли версия что была выложена в марте.
Картинки генерятся силами Flux Kontext и GPT-4o
#SOTA PBR текстуры
Обещают сделать 3D видеогенератор
Попробовать
#3d #textto3d #imageto3d #pbr
Обновка 3D генератора.
Под капотом TripoSF - не знаю та ли версия что была выложена в марте.
Картинки генерятся силами Flux Kontext и GPT-4o
#SOTA PBR текстуры
Обещают сделать 3D видеогенератор
Попробовать
#3d #textto3d #imageto3d #pbr
❤3👍2🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
Made by Google ‘25
Идет презентация Google.
—————————
Google Photos внедряет новую функцию редактирования изображений с помощью ИИ. Пользователи смогут описывать желаемые изменения текстом или голосом, а Gemini будет вносить правки автоматически. Сначала функция появится на Pixel 10 в США. Также в Google Photos добавят поддержку C2PA Content Credentials — это позволит видеть, как изображение было отредактировано с помощью ИИ. Редизайн редактора уже упрощает редактирование, предлагая AI-подсказки и объединяя инструменты в одном месте. С новой функцией можно будет делать как корректирующие правки (например, убрать отвлекающие элементы или исправить освещение), так и более креативные изменения (поменять фон, добавить предметы и т. д.).
#news #imageediting
Идет презентация Google.
—————————
Google Photos внедряет новую функцию редактирования изображений с помощью ИИ. Пользователи смогут описывать желаемые изменения текстом или голосом, а Gemini будет вносить правки автоматически. Сначала функция появится на Pixel 10 в США. Также в Google Photos добавят поддержку C2PA Content Credentials — это позволит видеть, как изображение было отредактировано с помощью ИИ. Редизайн редактора уже упрощает редактирование, предлагая AI-подсказки и объединяя инструменты в одном месте. С новой функцией можно будет делать как корректирующие правки (например, убрать отвлекающие элементы или исправить освещение), так и более креативные изменения (поменять фон, добавить предметы и т. д.).
#news #imageediting
⚡3👀2
4DNeX: Feed-Forward 4D Generative Modeling Made Easy
Генератор 4D-сцен (динамические 3D-сцены) из одного изображения или видео. Позволяет смотреть на изображение или видео с новых ракурсов/
Под капотом затюненный диффузный видеогенератор
Работает с единым 6D-представлением видео - для каждой RGB точки известны ее XYZ координаты
Код ждем
#4d #imageto4d #videoto4d #image2depth #video2depth
Генератор 4D-сцен (динамические 3D-сцены) из одного изображения или видео. Позволяет смотреть на изображение или видео с новых ракурсов/
Под капотом затюненный диффузный видеогенератор
Работает с единым 6D-представлением видео - для каждой RGB точки известны ее XYZ координаты
Код ждем
#4d #imageto4d #videoto4d #image2depth #video2depth
👍6❤2👎2
DiT4SR: Taming Diffusion Transformer for Real-World Image Super-Resolution
Наш чатик принес прекрасное.
Повышение разрешения и четкости изображений реального мира.
Работает с текстовым промптом, для этого в демо есть LLAVA
Склонен в светлых областях съедать яркость. Это пока все к чему я могу придраться не считая лого Адидас
Код
Демо
Спасибо @iNevestenko
#superresolution #upscale #imagerestoration
Наш чатик принес прекрасное.
Повышение разрешения и четкости изображений реального мира.
Работает с текстовым промптом, для этого в демо есть LLAVA
Склонен в светлых областях съедать яркость. Это пока все к чему я могу придраться не считая лого Адидас
Код
Демо
Спасибо @iNevestenko
#superresolution #upscale #imagerestoration
🔥12👍5🤔1
This media is not supported in your browser
VIEW IN TELEGRAM
ComfyUI-Copilot: Your Intelligent Assistant for ComfyUI
В названии все сказано. Ассистент для #ComfyUI от Alibaba
Умеет дебажить-фиксить ошибки, переделывать воркфлоу. А и с нуля создавать воркфлоу тоже умеет. Опишет какая нода что делает, порекомендует ноду, модель.
Работает по API с LLM провайдерами.
Есть интеграция LMStudio для локальных LLM
Ура, товарищи!
Гитхаб
В названии все сказано. Ассистент для #ComfyUI от Alibaba
Умеет дебажить-фиксить ошибки, переделывать воркфлоу. А и с нуля создавать воркфлоу тоже умеет. Опишет какая нода что делает, порекомендует ноду, модель.
Работает по API с LLM провайдерами.
Есть интеграция LMStudio для локальных LLM
Ура, товарищи!
Гитхаб
👍13🤔5❤1
This media is not supported in your browser
VIEW IN TELEGRAM
InfiniteTalk: Audio-driven Video Generation for Sparse-Frame Video Dubbing
Бесконечная болталка на основе Wan2.1. Ну и там еще kokoro под капотом.
Модель для дублирования видео с редкими ключевыми кадрами. Создает новые видео на основе исходного видео и аудиодорожки, синхронизируя не только губы, но и движения головы, позу тела и выражение лица с аудио.
Умеет оживлять картинку по звуку и без входного звука - так написано в гитхабе.
Более точная синхронизация губ и меньше искажений рук и тела по сравнению с MultiTalk.
Ребята поленились сделать сайт проекта с примерами, но похоже проект стоящий. На видео пример с реддита
Гитхаб
HF
Kijai
ComfyUI wrapper nodes for InfiniteTalk
#imageanimation #speech2video #chracteranimation #video2video #lipsync #dubbing #image2video
Бесконечная болталка на основе Wan2.1. Ну и там еще kokoro под капотом.
Модель для дублирования видео с редкими ключевыми кадрами. Создает новые видео на основе исходного видео и аудиодорожки, синхронизируя не только губы, но и движения головы, позу тела и выражение лица с аудио.
Умеет оживлять картинку по звуку и без входного звука - так написано в гитхабе.
Более точная синхронизация губ и меньше искажений рук и тела по сравнению с MultiTalk.
Ребята поленились сделать сайт проекта с примерами, но похоже проект стоящий. На видео пример с реддита
Гитхаб
HF
Kijai
ComfyUI wrapper nodes for InfiniteTalk
#imageanimation #speech2video #chracteranimation #video2video #lipsync #dubbing #image2video
👍12❤2
flymyai-lora-trainer
Поддерживает обучение лор Qwen-Image-Edit
Сделали первую лору Qwen Image Edit Inscene LoRA
В этой лоре:
🎯 Улучшена согласованность сцен во время редактирования
🎬 Улучшена работа с перспективой камеры
🎭 Улучшена последовательность действий в сценах
🧠 Улучшено понимание пространства
На примерах слева голая модель, справа с лорой
#qwenimage #lora #finetuning #tools
Поддерживает обучение лор Qwen-Image-Edit
Сделали первую лору Qwen Image Edit Inscene LoRA
В этой лоре:
🎯 Улучшена согласованность сцен во время редактирования
🎬 Улучшена работа с перспективой камеры
🎭 Улучшена последовательность действий в сценах
🧠 Улучшено понимание пространства
На примерах слева голая модель, справа с лорой
#qwenimage #lora #finetuning #tools
👍14❤2😁1
Qwen-Image-DiffSynth-ControlNets
Контролнеты от DyffSynth под #qwenimage лежат в репозитории Comfy-Org
Поддержка контролнетов под Qwen в #ComfyUI же, да?
О нативной поддержке самого Qwen-Image написали вчера:
Qwen-Image-Edit ComfyUI Native Support
#news #controlnet
Контролнеты от DyffSynth под #qwenimage лежат в репозитории Comfy-Org
Поддержка контролнетов под Qwen в #ComfyUI же, да?
О нативной поддержке самого Qwen-Image написали вчера:
Qwen-Image-Edit ComfyUI Native Support
#news #controlnet
👍8🔥2
PERSONA: Personalized Whole-Body 3D Avatar with Pose-Driven Deformations from a Single Image
Полный 3D аватар человека по одной картинке, управляемый позой - переносом движения с образца.
Код
Спасибо @m_franz
#humanavatar #characteranimation #pose2video
Полный 3D аватар человека по одной картинке, управляемый позой - переносом движения с образца.
Код
Спасибо @m_franz
#humanavatar #characteranimation #pose2video
❤9👍2😁1
Mirage 2
Новая версия генератора игровых миров игрового движка от Dynamycs Lab
Можно загрузить свою картинку с описанием или без описания - создаст игру в вашей картинке.
Помимо направления движения можно крутить камеру курсорами, прыгать, атаковать. Ну и потом скачать видео игрового процесса.
Если персонаж затупил жмем Shift
Ну и можно делиться ссылкой на свой мир https://demo.dynamicslab.ai/chaos?init_id=aec81151-9a6b-48db-9c9a-2debd6ea7cbc
Подрезал у @cgevent
#game #realtime #world #text2world
Новая версия генератора игровых миров игрового движка от Dynamycs Lab
Можно загрузить свою картинку с описанием или без описания - создаст игру в вашей картинке.
Помимо направления движения можно крутить камеру курсорами, прыгать, атаковать. Ну и потом скачать видео игрового процесса.
Если персонаж затупил жмем Shift
Ну и можно делиться ссылкой на свой мир https://demo.dynamicslab.ai/chaos?init_id=aec81151-9a6b-48db-9c9a-2debd6ea7cbc
Подрезал у @cgevent
#game #realtime #world #text2world
👍8