Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.45K photos
3.71K videos
41 files
4.75K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
Vevo: Controllable Zero-Shot Voice Imitation with Self-Supervised Disentanglement

День звука продолжается

Клонировщик-генератор голоса с контролем эмоций и тембра

Есть 4 модели

- Vevo-Timbre: преобразование голоса с сохранением стиля.
- Vevo-Style: преобразование стиля, например преобразование акцента и эмоций.
- Vevo-Voice: преобразование голоса с учетом стиля.
- Vevo-TTS: генерация речи по тексту с регулируемым стилем и тембром.

Примеры по ссылке в заголовке

Обучен на шести языках - английский, китайский, немецкий, французский, японский и корейский
Так что на русский пока не стоит рассчитывать

Код

#voicecloning #speech2speech #tts #text2speech
🔥5😭3👍2
Отличный подарок к дню рождения, спасибо ❤️
518🍾9👍1
Коллекция фигурок пополнилась

#оффтоп
🔥19👍8
Мемов на сон грядущий

#humor
😁30👎6💩5🤡3😐2
не зашло) 🤷‍♂️
🤡5
This media is not supported in your browser
VIEW IN TELEGRAM
Inference Providers

HuggingFace запустил Inference Providers - бессерверный запуск моделей.

Теперь не надо никуда ходить чтобы потестить интересную модель, даже на Spaces.

Обеспечивают этот праздник партнеры - fal, Replicate, Sambanova, Together AI. Можете в аккаунте указать их API ключи если у вас есть. А можете и не указывать, тогда инференс будет на мощностях HF

Бесплатным пользователям отсыпают немножко токенов в день

#news
6👍2
This media is not supported in your browser
VIEW IN TELEGRAM
Появился демоспейс генератора музыки YuE, можно потыкать

Демо

#text2music #music
7
Stable Flow: Vital Layers for Training-Free Image Editing

Редактирование изображений без обучения

Нежесткое редактирование, добавление объектов, удаление объектов и глобальное редактирование сцены

Жрет 80ГБ

Код

#imageediting
🔥7😎1
OmniHuman-1: Rethinking the Scaling-Up of One-Stage Conditioned Human Animation Models

ByteDance снова что-то анимируют

Оживлятор человеческих (и не только) портретов любой крупности (лицо, поясной, полный рост) и соотношения сторон. Анимирует как фото, так и рисунки.

На вход помимо собственно портрета нужен сигнал для извлечения движения: звук, видео или их комбинация

Выглядит круто,
Кода нет

#portraitanimation #audio2video #audio2motion #motion2video #talkinghead #lipsync
🔥216👍4🥴1👀1
This media is not supported in your browser
VIEW IN TELEGRAM
Хорошие новости для недомузыкантов вроде меня

Генератор музыки YuE можно установить локально в пару кликов в Pinokio

Для работы достаточно 10Гб VRAM, только Nvidia

Умеет принимать ваше аудио на вход!

#text2music #music #audio2music #music2music
👍104
MatAnyone: Stable Video Matting with Consistent Memory Propagation

Создает маску на заданного человека на видео
На вход принимает маску в первом кадре. Но потеть не придется, целевая маска создается в несколько кликов.

Пока еще далеко от идеала, но надеюсь станет подспорьем в композе

Код и демо ждем на следующей неделе

#segmentation #matting #video2matte #video2mask
🔥111👎1