NEW BOT Телеграм, страница

MagicTryOn: Harnessing Diffusion Transformer for Garment-Preserving Video Virtual Try-on

Видеопримерочная на VideoX-Fun / Wan2.1-I2V-14B
Для описания одежды используют Qwen2.5-VL-7B-Instruct.
Ну и еще там под капотом openpose, densepose и прочее.

Короче если ктото хотел затюнить WAN 2.1 под примерку то вот оно

Код

#tryon #image2video

👍7❤2

10.9K views12:16

Нейронавт | Нейросети в творчестве

1:24

Media is too big

VIEW IN TELEGRAM

OmniTry: Virtual Try-On Anything without Masks

Еще примерочная. Работает не только с одеждой, но и с аксессуарами

Под капотом FLUX.1-Fill-dev и лора. Вот так новый продукт делают, оказывается 👀

В BF16 требует 28Гб VRAM

Потыкал - смотрите сами что вышло

Код
Демо

#tryon

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

😁5👍4❤1

2.09K views13:16

Нейронавт | Нейросети в творчестве

1:32

Media is too big

VIEW IN TELEGRAM

Tripо 3.0

Обновка 3D генератора.
Под капотом TripoSF - не знаю та ли версия что была выложена в марте.

Картинки генерятся силами Flux Kontext и GPT-4o

#SOTA PBR текстуры

Обещают сделать 3D видеогенератор

Попробовать

#3d #textto3d #imageto3d #pbr

❤3👍2🔥2

2.07K views16:11

Нейронавт | Нейросети в творчестве

0:21

This media is not supported in your browser

VIEW IN TELEGRAM

Made by Google ‘25

Идет презентация Google.
—————————

Google Photos внедряет новую функцию редактирования изображений с помощью ИИ. Пользователи смогут описывать желаемые изменения текстом или голосом, а Gemini будет вносить правки автоматически. Сначала функция появится на Pixel 10 в США. Также в Google Photos добавят поддержку C2PA Content Credentials — это позволит видеть, как изображение было отредактировано с помощью ИИ. Редизайн редактора уже упрощает редактирование, предлагая AI-подсказки и объединяя инструменты в одном месте. С новой функцией можно будет делать как корректирующие правки (например, убрать отвлекающие элементы или исправить освещение), так и более креативные изменения (поменять фон, добавить предметы и т. д.).

#news #imageediting

⚡3👀2

2.06K views17:50

Нейронавт | Нейросети в творчестве

0:32

This media is not supported in your browser

VIEW IN TELEGRAM

0:36

This media is not supported in your browser

4DNeX: Feed-Forward 4D Generative Modeling Made Easy

Генератор 4D-сцен (динамические 3D-сцены) из одного изображения или видео. Позволяет смотреть на изображение или видео с новых ракурсов/

Под капотом затюненный диффузный видеогенератор

Работает с единым 6D-представлением видео - для каждой RGB точки известны ее XYZ координаты

Код ждем

#4d #imageto4d #videoto4d #image2depth #video2depth

👍6❤2👎2

1.74K views05:08

Нейронавт | Нейросети в творчестве

DiT4SR: Taming Diffusion Transformer for Real-World Image Super-Resolution

Наш чатик принес прекрасное.
Повышение разрешения и четкости изображений реального мира.

Работает с текстовым промптом, для этого в демо есть LLAVA

Склонен в светлых областях съедать яркость. Это пока все к чему я могу придраться не считая лого Адидас

Код
Демо

Спасибо @iNevestenko

#superresolution #upscale #imagerestoration

🔥12👍5🤔1

2.08K views06:18

Нейронавт | Нейросети в творчестве

1:36

This media is not supported in your browser

VIEW IN TELEGRAM

ComfyUI-Copilot: Your Intelligent Assistant for ComfyUI

В названии все сказано. Ассистент для #ComfyUI от Alibaba
Умеет дебажить-фиксить ошибки, переделывать воркфлоу. А и с нуля создавать воркфлоу тоже умеет. Опишет какая нода что делает, порекомендует ноду, модель.

Работает по API с LLM провайдерами.
Есть интеграция LMStudio для локальных LLM

Ура, товарищи!

Гитхаб

👍13🤔5❤1

2.31K views07:11

Нейронавт | Нейросети в творчестве

0:40

This media is not supported in your browser

VIEW IN TELEGRAM

InfiniteTalk: Audio-driven Video Generation for Sparse-Frame Video Dubbing

Бесконечная болталка на основе Wan2.1. Ну и там еще kokoro под капотом.

Модель для дублирования видео с редкими ключевыми кадрами. Создает новые видео на основе исходного видео и аудиодорожки, синхронизируя не только губы, но и движения головы, позу тела и выражение лица с аудио.
Умеет оживлять картинку по звуку и без входного звука - так написано в гитхабе.

Более точная синхронизация губ и меньше искажений рук и тела по сравнению с MultiTalk.

Ребята поленились сделать сайт проекта с примерами, но похоже проект стоящий. На видео пример с реддита

Гитхаб
HF
Kijai
ComfyUI wrapper nodes for InfiniteTalk

#imageanimation #speech2video #chracteranimation #video2video #lipsync #dubbing #image2video

👍12❤2

2.33K views08:11

Нейронавт | Нейросети в творчестве

flymyai-lora-trainer

Поддерживает обучение лор Qwen-Image-Edit

Сделали первую лору Qwen Image Edit Inscene LoRA
В этой лоре:

🎯 Улучшена согласованность сцен во время редактирования
🎬 Улучшена работа с перспективой камеры
🎭 Улучшена последовательность действий в сценах
🧠 Улучшено понимание пространства

На примерах слева голая модель, справа с лорой

#qwenimage #lora #finetuning #tools

👍14❤2😁1

2.4K views10:13

About

Blog

Apps

Platform