Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.44K photos
3.71K videos
41 files
4.75K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
VoiceCraft: Zero-Shot Speech Editing and Text-to-Speech in the Wild

Новый клонировщик/генератор голоса, потомок VoiceCraft

Автор пишет что новая SOTA (чемпион), единственный аргумент - график на видео. Ни препринта, ни бенча

- клонирует по короткому образцу
- создает речь длиннее чем самый длинный обучающий образец
- контроль продолжительности

Код

#tts #text2speech #voicecloning
🔥4👍3
Reconstructing Humans with a Biomechanically Accurate Skeleton

Метод реконструкции человека в 3D по одному изображению с использованием биомеханически точной модели скелета (а не этого вашего плоского OpenPose)

Код
Колаб
Демо

#HMR #HSMR #humanrecontrustion #image2pose #image2mesh #imageto3d
👍10🔥8👎3😁1
SketchVideo: Sketch-based Video Generation and Editing

Видегенератор/редактор по эскизу.
Под капотом два файнтюна CogVideo-2b - для генерации и редактирования. И контролнет

На 720x480 потребляет 21-23 Гб VRAM

Код

#sketch2video #image2video
👍10🔥1😁1
EasyControl: Adding Efficient and Flexible Control for Diffusion Transformer

Убийца контролнета.
Стабильно работает в разных разрешениях.
Прикручено к Flux.
Интегрировано в CFG-Zero

Код
Демо
Демо гиблификация
ComfyUI

#conditioning #controlnet #flux #comfyui #image2image #referencing #personalization
👍12🔥4
#оффтоп

Пока я болел, много всего произошло, буду потихоньку нагонять.

И спасибо добрым подписанам за звезды. Обнял-припонднял
10819
ZenCtrl

Еще одна альтернатива #controlnet от Fotographer AI
Умеет генерить разные ракурсы сцены/объекта, фон под объект. Из привычного - Canny, Depth

Разрешение до 1024×1024, в будущем 2К и 4К

Есть пара моделек под #flux и одна под Ominicontrol (деблюр)

Код ждем
Демо
Веса
API
Статья

#conditioning #deblur #image2image #personalization #multiview #novelview
8👍1🔥1
TriplaneTurbo: Progressive Rendering Distillation: Adapting Stable Diffusion for Instant Text-to-Mesh Generation without 3D Data

#SD адаптировали для генерации 3D моделей по тексту за 4 шага.

Должен же быть легковесный генератор 3D, да?

Код
Демо

#textto3d
🔥4👍2