Vevo: Controllable Zero-Shot Voice Imitation with Self-Supervised Disentanglement
День звука продолжается
Клонировщик-генератор голоса с контролем эмоций и тембра
Есть 4 модели
- Vevo-Timbre: преобразование голоса с сохранением стиля.
- Vevo-Style: преобразование стиля, например преобразование акцента и эмоций.
- Vevo-Voice: преобразование голоса с учетом стиля.
- Vevo-TTS: генерация речи по тексту с регулируемым стилем и тембром.
Примеры по ссылке в заголовке
Обучен на шести языках - английский, китайский, немецкий, французский, японский и корейский
Так что на русский пока не стоит рассчитывать
Код
#voicecloning #speech2speech #tts #text2speech
День звука продолжается
Клонировщик-генератор голоса с контролем эмоций и тембра
Есть 4 модели
- Vevo-Timbre: преобразование голоса с сохранением стиля.
- Vevo-Style: преобразование стиля, например преобразование акцента и эмоций.
- Vevo-Voice: преобразование голоса с учетом стиля.
- Vevo-TTS: генерация речи по тексту с регулируемым стилем и тембром.
Примеры по ссылке в заголовке
Обучен на шести языках - английский, китайский, немецкий, французский, японский и корейский
Так что на русский пока не стоит рассчитывать
Код
#voicecloning #speech2speech #tts #text2speech
GitHub
Amphion/models/vc/vevo at main · open-mmlab/Amphion
Amphion (/æmˈfaɪən/) is a toolkit for Audio, Music, and Speech Generation. Its purpose is to support reproducible research and help junior researchers and engineers get started in the field of audi...
🔥5😭3👍2
This media is not supported in your browser
VIEW IN TELEGRAM
Inference Providers
HuggingFace запустил Inference Providers - бессерверный запуск моделей.
Теперь не надо никуда ходить чтобы потестить интересную модель, даже на Spaces.
Обеспечивают этот праздник партнеры - fal, Replicate, Sambanova, Together AI. Можете в аккаунте указать их API ключи если у вас есть. А можете и не указывать, тогда инференс будет на мощностях HF
Бесплатным пользователям отсыпают немножко токенов в день
#news
HuggingFace запустил Inference Providers - бессерверный запуск моделей.
Теперь не надо никуда ходить чтобы потестить интересную модель, даже на Spaces.
Обеспечивают этот праздник партнеры - fal, Replicate, Sambanova, Together AI. Можете в аккаунте указать их API ключи если у вас есть. А можете и не указывать, тогда инференс будет на мощностях HF
Бесплатным пользователям отсыпают немножко токенов в день
#news
❤6👍2
Stable Flow: Vital Layers for Training-Free Image Editing
Редактирование изображений без обучения
Нежесткое редактирование, добавление объектов, удаление объектов и глобальное редактирование сцены
Жрет 80ГБ
Код
#imageediting
Редактирование изображений без обучения
Нежесткое редактирование, добавление объектов, удаление объектов и глобальное редактирование сцены
Жрет 80ГБ
Код
#imageediting
🔥7😎1
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
OmniHuman-1: Rethinking the Scaling-Up of One-Stage Conditioned Human Animation Models
ByteDance снова что-то анимируют
Оживлятор человеческих (и не только) портретов любой крупности (лицо, поясной, полный рост) и соотношения сторон. Анимирует как фото, так и рисунки.
На вход помимо собственно портрета нужен сигнал для извлечения движения: звук, видео или их комбинация
Выглядит круто,
Кода нет
#portraitanimation #audio2video #audio2motion #motion2video #talkinghead #lipsync
ByteDance снова что-то анимируют
Оживлятор человеческих (и не только) портретов любой крупности (лицо, поясной, полный рост) и соотношения сторон. Анимирует как фото, так и рисунки.
На вход помимо собственно портрета нужен сигнал для извлечения движения: звук, видео или их комбинация
Выглядит круто,
Кода нет
#portraitanimation #audio2video #audio2motion #motion2video #talkinghead #lipsync
🔥21❤6👍4🥴1👀1
This media is not supported in your browser
VIEW IN TELEGRAM
Хорошие новости для недомузыкантов вроде меня
Генератор музыки YuE можно установить локально в пару кликов в Pinokio
Для работы достаточно 10Гб VRAM, только Nvidia
Умеет принимать ваше аудио на вход!
#text2music #music #audio2music #music2music
Генератор музыки YuE можно установить локально в пару кликов в Pinokio
Для работы достаточно 10Гб VRAM, только Nvidia
Умеет принимать ваше аудио на вход!
#text2music #music #audio2music #music2music
👍10❤4
MatAnyone: Stable Video Matting with Consistent Memory Propagation
Создает маску на заданного человека на видео
На вход принимает маску в первом кадре. Но потеть не придется, целевая маска создается в несколько кликов.
Пока еще далеко от идеала, но надеюсь станет подспорьем в композе
Код и демо ждем на следующей неделе
#segmentation #matting #video2matte #video2mask
Создает маску на заданного человека на видео
На вход принимает маску в первом кадре. Но потеть не придется, целевая маска создается в несколько кликов.
Пока еще далеко от идеала, но надеюсь станет подспорьем в композе
Код и демо ждем на следующей неделе
#segmentation #matting #video2matte #video2mask
🔥11❤1👎1