o3-mini для всех
Open AI таки выдали всем свою рассуждающую модель o3-mini
По лимитам для бесплатников непонятно
Пользуемся
#news
Open AI таки выдали всем свою рассуждающую модель o3-mini
По лимитам для бесплатников непонятно
Пользуемся
#news
Openai
OpenAI o3-mini
Pushing the frontier of cost-effective reasoning.
👍5
Vevo: Controllable Zero-Shot Voice Imitation with Self-Supervised Disentanglement
День звука продолжается
Клонировщик-генератор голоса с контролем эмоций и тембра
Есть 4 модели
- Vevo-Timbre: преобразование голоса с сохранением стиля.
- Vevo-Style: преобразование стиля, например преобразование акцента и эмоций.
- Vevo-Voice: преобразование голоса с учетом стиля.
- Vevo-TTS: генерация речи по тексту с регулируемым стилем и тембром.
Примеры по ссылке в заголовке
Обучен на шести языках - английский, китайский, немецкий, французский, японский и корейский
Так что на русский пока не стоит рассчитывать
Код
#voicecloning #speech2speech #tts #text2speech
День звука продолжается
Клонировщик-генератор голоса с контролем эмоций и тембра
Есть 4 модели
- Vevo-Timbre: преобразование голоса с сохранением стиля.
- Vevo-Style: преобразование стиля, например преобразование акцента и эмоций.
- Vevo-Voice: преобразование голоса с учетом стиля.
- Vevo-TTS: генерация речи по тексту с регулируемым стилем и тембром.
Примеры по ссылке в заголовке
Обучен на шести языках - английский, китайский, немецкий, французский, японский и корейский
Так что на русский пока не стоит рассчитывать
Код
#voicecloning #speech2speech #tts #text2speech
GitHub
Amphion/models/vc/vevo at main · open-mmlab/Amphion
Amphion (/æmˈfaɪən/) is a toolkit for Audio, Music, and Speech Generation. Its purpose is to support reproducible research and help junior researchers and engineers get started in the field of audi...
🔥5😭3👍2
This media is not supported in your browser
VIEW IN TELEGRAM
Inference Providers
HuggingFace запустил Inference Providers - бессерверный запуск моделей.
Теперь не надо никуда ходить чтобы потестить интересную модель, даже на Spaces.
Обеспечивают этот праздник партнеры - fal, Replicate, Sambanova, Together AI. Можете в аккаунте указать их API ключи если у вас есть. А можете и не указывать, тогда инференс будет на мощностях HF
Бесплатным пользователям отсыпают немножко токенов в день
#news
HuggingFace запустил Inference Providers - бессерверный запуск моделей.
Теперь не надо никуда ходить чтобы потестить интересную модель, даже на Spaces.
Обеспечивают этот праздник партнеры - fal, Replicate, Sambanova, Together AI. Можете в аккаунте указать их API ключи если у вас есть. А можете и не указывать, тогда инференс будет на мощностях HF
Бесплатным пользователям отсыпают немножко токенов в день
#news
❤6👍2
Stable Flow: Vital Layers for Training-Free Image Editing
Редактирование изображений без обучения
Нежесткое редактирование, добавление объектов, удаление объектов и глобальное редактирование сцены
Жрет 80ГБ
Код
#imageediting
Редактирование изображений без обучения
Нежесткое редактирование, добавление объектов, удаление объектов и глобальное редактирование сцены
Жрет 80ГБ
Код
#imageediting
🔥7😎1
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
OmniHuman-1: Rethinking the Scaling-Up of One-Stage Conditioned Human Animation Models
ByteDance снова что-то анимируют
Оживлятор человеческих (и не только) портретов любой крупности (лицо, поясной, полный рост) и соотношения сторон. Анимирует как фото, так и рисунки.
На вход помимо собственно портрета нужен сигнал для извлечения движения: звук, видео или их комбинация
Выглядит круто,
Кода нет
#portraitanimation #audio2video #audio2motion #motion2video #talkinghead #lipsync
ByteDance снова что-то анимируют
Оживлятор человеческих (и не только) портретов любой крупности (лицо, поясной, полный рост) и соотношения сторон. Анимирует как фото, так и рисунки.
На вход помимо собственно портрета нужен сигнал для извлечения движения: звук, видео или их комбинация
Выглядит круто,
Кода нет
#portraitanimation #audio2video #audio2motion #motion2video #talkinghead #lipsync
🔥21❤6👍4🥴1👀1
This media is not supported in your browser
VIEW IN TELEGRAM
Хорошие новости для недомузыкантов вроде меня
Генератор музыки YuE можно установить локально в пару кликов в Pinokio
Для работы достаточно 10Гб VRAM, только Nvidia
Умеет принимать ваше аудио на вход!
#text2music #music #audio2music #music2music
Генератор музыки YuE можно установить локально в пару кликов в Pinokio
Для работы достаточно 10Гб VRAM, только Nvidia
Умеет принимать ваше аудио на вход!
#text2music #music #audio2music #music2music
👍10❤4