Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.7K subscribers
4.5K photos
3.79K videos
41 files
4.81K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
LongCat-Video-Avatar

Генератор на базе LongCat-Video создаёт реалистичные длительные видеоролики с липсинком и сохранением идентичности персонажа

Генерирует видео на основе аудио и текста или аудио, текста и изображения

Умеет петь, продлять видео, делать мультидиалог, видеоподкасты, продающие видео

Гитхаб
HF
MS

#ati2v #at2v #avatar #longvideo #characteranimation #speech2animation #image2video
🔥10
This media is not supported in your browser
VIEW IN TELEGRAM
Seedance 1.5

Еще одна обновка видеогенератора от ByteDance

Заявлены естественные диалоги и качественный липсинк
Ежедневные бесплатные генерации в СapCut

https://www.capcut.com/tools/seedance-1-5-ai-video-generator
https://dreamina.capcut.com/ai-tool/generate - Model 3.5

#text2video #image2video
👍5😁2
DistillPatch LoRA

Восстанавливает истинную 8-шаговую скорость Turbo для любой LoRA, обученной на Z-Image Turbo

решает проблему ухудшения качества изображений (размытие) при использовании стандартной тренировки LoRA в Z-Image Turbo при параметрах steps=8 и cfg=1

HF
Демо
MS
MS Демо
Гитхаб

#lora #zimage #optimization
🔥5😁1
Media is too big
VIEW IN TELEGRAM
TRELLIS.2

А вот и треллис обновился.

Генератор текстурировапнных PBR 3D моделей по картинке, разрешение до 1536³

4B параметров.
Обрабатывает сложные структуры: открытые поверхности, nonmanifold-геометрию, внутренние структуры

SC-VAE: Sparse Compression VAE - придумали 3D-VAE для сжатия воксельных данных.

Гитхаб
Демо
HF

#imageto3d #pbr
5🔥4👍2
EgoX: Egocentric Video Generation from a Single Exocentric Video

Еще одна работа на субъективный вид от первого лица (POV), от KAIST

Превращает видео с видом со стороны в видео от лица одного из персонажей

Лора на базе Wan 2.1 14B i2v

Код ждем

#video2pov #pov #video2video #cameracontrol #lora
😱1
chatterbox-turbo

Новая версия голосовой модели от Resemble AI, всего 350М параметров

Для естественности можно добавлять паралингвистические теги, например [cough], [laugh], [chuckle]

В аудиофайлы, созданные с помощью Chatterbox, встраиваются незаметные нейронные водяные знаки Perth, которые сохраняются при сжатии MP3, редактировании аудио и других манипуляциях

Ну и главное - есть мультиязычная версия модели на 500М параметров, поддерживающая более 23 языков, в том числе русский

HF
Демо

#voicecloning #tts #russian
🔥3