Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.46K photos
3.73K videos
41 files
4.76K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
wan2.2-controlnet

День свистоперделок какой-то

Контролнет для #wan22

Пользуйтесь ComfyUI-WanVideoWrapper

Гитхаб
воркфлоу

#controlnet #workflow
🔥15😁3👍2
Voost : A Unified and Scalable Diffusion Transformer for Bidirectional Virtual Try-On and Try-Off

Виртуальная примерочная-раздевалочная, #sota
Результатом раздевания будет не человек без одежды, как вы в силу своей испорченности подумали, а одежда без человека

Код ждем
Демо ждем

#tryon #tryoff
👍7😁51
ComfyUI LoRA Manager

Расширение для управления лорами в #ComfyUI

#extension
9👍7🍌1👨‍💻1
4D Gaussian Splatting SLAM

4DGS-SLAM - реконструкция сцен в движении по входному видео RGBD.

Делит сцену на статические и динамические Gaussian-примитивы. Отслеживает движение объектов, генерирует маски движения. Вуаля

Код

#gaussian #video2scene #rendering #rgbd2scene #rgbd2gaussian
👍8
SkyReels-A3

Анонсировали (или релизнули - непонятно) новый "непревзойденный" оживлятор персонажей по речи / пению.
И зачем-то дали ссылку на пустой репозиторий.
И ссылку на свой сервис где непонятно где искать новую модель.

Умеет создавать длинные ("неограниченно длинные") видео, несколько минут, сохраняя идентичность персонажа.

Умеет создавать профессиональное движение камеры

Гитхаб (пусто)
Попробовать видимо здесь

[UPDATE] Мне показали где он прячется, картинка в коментах. Он только для платных пользователей

#lipsync #portraitanimation #characteranimation #speech2video
👍6👎21👀1
This media is not supported in your browser
VIEW IN TELEGRAM
Suno Studio

Объявлена запись в вейтлист.
Мультитрековая генерация, экспорт в #midi и прочие радости.

Записаться в вейтлист

#music #musicediting
👍9🔥4👎1
EchoMimicV3

Оживлятор персонажей по голосу на 1.3B параметров на основе Wan 2.1 1.3B.

Что-то там про мультимодальность и мультизадачность в архитектуре говорят.

Умеет делать взаимодействие с объектами, пение.

Выглядит несколько деревянно, но весит всего 3Гб с хвостиком

Код
Веса

#lipsync #portraitanimation #characteranimation #speech2video
👎6🔥3🤔2👍1