Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.47K photos
3.74K videos
41 files
4.78K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
Rask.ai

выкатили липсинк-перевод для нескольких спикеров одновременно. Что приятно, для русского есть бета клонирование голоса.

Зацените El Risitas

Попробовать

#lipsync #dubbing #speech2speech #translation
😁11👍4
AntiFake

Защита голоса от клонирования.
Соседние каналы пишут что якобы человеческое ухо вообще не улавливает изменения. Легко убедиться что это не так. AntiFake добавляет к голосу шум, похожий на журчание воды. При этом голос звучит узнаваемо. Но нейросетку уже на этом голосе обучить не получится. Вернее, обучить можно, но на выходе голос будет другой.

Код

#voicecloning #tools #security
👍4
This media is not supported in your browser
VIEW IN TELEGRAM
SparseCtrl: Adding Sparse Controls to Text-to-Video Diffusion Models

Больше управляемости и контроля для генераторов видео. А-ля контролнет для видео.

- интерполяция кадров
- интерполяция видео
- анимация изображения
- предсказание/продление видео
- генерация видео по карте глубины
- генерация видео по эскизу
- генерация видео по раскадровке

Код обещают выложить

#video2video #text2video
👍61
LEDITS++: Limitless Image Editing using Text-to-Image Models

Новый уровень редактирования изображений текcтовыми указаниями. Очевидно, развитие проекта LEDITS

- быстрый
- универсальный
- точный, привязывает изменения к соответствующим областям
- не зависит от архитектуры

Код
Демо

#image2image #text2image #inpainting #imageediting
👍3
Что-то на сингулярном. GPT4 дает более развернутые ответы если если ему пообещать чаевые

твиттер

#яниначтоненамекаю
😁16🤔41
GraphDreamer: Compositional 3D Scene Synthesis from Scene Graphs

Генератор 3D с новой парадигмой. Генерирует композиционные 3D-сцены из графов сцен, где объекты представлены в виде узлов, а их взаимодействия - в виде ребер. Текстовый промт графа пишет ChatGPT. Не вручную же его создавать.

Ну а для семантической реконструкции графа из изображения - используют GPT4V

Код обещают выложить

#text2csene #textto3D
GeoDream: High-Fidelity and Consistent 3D Generation

Генератор 3D объектов по тексту. Модель помогает диффузионному генератору каким-то 3D пониматором. На выходе текстурированный меш

Код
Колаб

#texto3D
2🔥2
Scaffold-GS: Structured 3D Gaussians for View-Adaptive Rendering

Новый уровень точности реконструкции 3D сцен гауссианами. Превосходит 3D-GS по скорости, экономичности и качеству

Код обещают выложить на этой неделе

#imageto3D #image2scene #rendering #gaussian
🔥7👍3