NEW BOT Телеграм, страница

VoiceCraft: Zero-Shot Speech Editing and Text-to-Speech in the Wild

Новый клонировщик/генератор голоса, потомок VoiceCraft

Автор пишет что новая SOTA (чемпион), единственный аргумент - график на видео. Ни препринта, ни бенча

- клонирует по короткому образцу
- создает речь длиннее чем самый длинный обучающий образец
- контроль продолжительности

Код

#tts #text2speech #voicecloning

🔥4👍3

2.1K viewsedited 07:55

Нейронавт | Нейросети в творчестве

0:09

This media is not supported in your browser

VIEW IN TELEGRAM

Reconstructing Humans with a Biomechanically Accurate Skeleton

Метод реконструкции человека в 3D по одному изображению с использованием биомеханически точной модели скелета (а не этого вашего плоского OpenPose)

Код
Колаб
Демо

#HMR #HSMR #humanrecontrustion #image2pose #image2mesh #imageto3d

👍10🔥8👎3😁1

1.8K views08:18

Нейронавт | Нейросети в творчестве

Ray2 Bolt Cam У видеогенератора Dream machine RAY 2 обновка. Крутит исходную картинку в пространстве, выглядит очень впечатляюще. Только для платных подписанов #image2video #cameracontrlol

0:04

This media is not supported in your browser

VIEW IN TELEGRAM

Тем временем Higgsfield

#cameracontrlol

🔥18👍5🥴1

1.65K views08:37

Нейронавт | Нейросети в творчестве

0:06

This media is not supported in your browser

VIEW IN TELEGRAM

0:06

This media is not supported in your browser

VIEW IN TELEGRAM

0:06

This media is not supported in your browser

VIEW IN TELEGRAM

0:06

This media is not supported in your browser

VIEW IN TELEGRAM

SketchVideo: Sketch-based Video Generation and Editing

Видегенератор/редактор по эскизу.
Под капотом два файнтюна CogVideo-2b - для генерации и редактирования. И контролнет

На 720x480 потребляет 21-23 Гб VRAM

Код

#sketch2video #image2video

👍10🔥1😁1

1.75K views09:11

Нейронавт | Нейросети в творчестве

Опубликован код и модели аниматора взаимодействия TokenHSI

Код
Веса

#HSI #humananimation

0:17

Нейронавт | Нейросети в творчестве

TokenHSI: Unified Synthesis of Physical Human-Scene Interactions through Task Tokenization

унифицированная модель, которая позволяет персонажам, основанным на физике, выполнять разнообразные задачи взаимодействия человека со сценой. Для 3D персонажей и роботов…

👍4🔥1

2.22K viewsedited 09:36

Нейронавт | Нейросети в творчестве

EasyControl: Adding Efficient and Flexible Control for Diffusion Transformer

Убийца контролнета.
Стабильно работает в разных разрешениях.
Прикручено к Flux.
Интегрировано в CFG-Zero

Код
Демо
Демо гиблификация
ComfyUI

#conditioning #controlnet #flux #comfyui #image2image #referencing #personalization

👍12🔥4

2.28K views12:09

Нейронавт | Нейросети в творчестве

#оффтоп

Пока я болел, много всего произошло, буду потихоньку нагонять.

И спасибо добрым подписанам за звезды. Обнял-припонднял

108❤19

1.66K views14:27

Нейронавт | Нейросети в творчестве

ZenCtrl

Еще одна альтернатива #controlnet от Fotographer AI
Умеет генерить разные ракурсы сцены/объекта, фон под объект. Из привычного - Canny, Depth

Разрешение до 1024×1024, в будущем 2К и 4К

Есть пара моделек под #flux и одна под Ominicontrol (деблюр)

Код ждем
Демо
Веса
API
Статья

#conditioning #deblur #image2image #personalization #multiview #novelview

❤8👍1🔥1

1.94K views07:55

Нейронавт | Нейросети в творчестве