Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.45K photos
3.72K videos
41 files
4.76K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
Zonos

Голосовая модель от Zyphra
Хвастаются превосходством над всеми конкурентами

- Контроль эмоций
- Клонирование голоса по 10-30 секундному образцу
- Звуковые префиксы: Добавьте текст плюс аудиофайл чтобы задать динамику, например шепот
- Поддерживает английский, японский, китайский, французский и немецкий языки, русского нет
- Контроль скорости речи, высоты тона, максимальной частоты, качества звука
- Работает вдвое быстрее рилтайма на RTX 4090
- Есть Playground и API


Код
Демо - вход через гугл/регу
Блог - там есть тесты сравнения с конкурентами

#voicecloning #tts #text2speech
🔥12👍54👎2😐2
This media is not supported in your browser
VIEW IN TELEGRAM
Bleep That Sh*t

Автоматически запикиваем любые заданные слова на видео

Под капотом Whisper, так что должно работать с русским языком

Код

#speech2speech #audio2audio
👍6
This media is not supported in your browser
VIEW IN TELEGRAM
InsMind

Онлайн редактор изображений
Сейчас форсят аутпейнтинг - расширение картинки с учетом контекста

Но там много чего бесплатно дают сделать
- генерация изображения
- удаление/замена фона
- удаление/замена объекта - инпейнтинг
- создание логотипа
- добавление тени
- улучшение качества (есть ли апскейл не проверял)
- стилизация
- замена лица

#design #imageediting #bgremoval #online #inpainting #enhance #outpainting #stylization #faceswap
👍9😐3
This media is not supported in your browser
VIEW IN TELEGRAM
loras.dev

Онлайн генератор картинок с предустановленными лорами.

Притворитесь что вы не в РФ

Опенсорс, под капотом #Flux и Together AI

Код

#text2image #online
👍3🥴2👏1🤡1
History-Guided Video Diffusion

Метод генерации видео
За счет трюков с контекстом и трансформера форсированной диффуззи (DFoT) позволяет создавать консистентные ультрадлинные видео, видео бесконечной навигации, генерировать композиционное видео (сам не уверен о чем тут речь)

На видео с роботом объяснение работы модели, это непохоже на генерацию

Модельки небольшие, и разрешение у них 128x128 да 256x256, так что это пока не про контентмейкинг, а про фичи которые можно ожидать в видеогенераторах

Код
Демо

#image2video
🔥7🤔1
CustomVideoX: 3D Reference Attention Driven Dynamic Adaptation for Zero-Shot Customized Video Diffusion Transformers

Видеогенератор с персонализацией, создает видео с объектом, заданным картинкой

За основу берут CogVideoX-5B и прикручивают лору

Код ждем

#personalization #text2video
👍4