URAvatar: Universal Relightable Gaussian Codec Avatars
Портретный аватар на гауссианах. На вход достаточно подать "телефонный скан" - что это? фотограмметрия? скан с лидара? видео с разных ракурсов?
Ну и дальше в реальном времени можно управлять анимацией и освещением
Кода нет
#humanavatar #gaussian #facialanimation #headanimation #talkinghead
Портретный аватар на гауссианах. На вход достаточно подать "телефонный скан" - что это? фотограмметрия? скан с лидара? видео с разных ракурсов?
Ну и дальше в реальном времени можно управлять анимацией и освещением
Кода нет
#humanavatar #gaussian #facialanimation #headanimation #talkinghead
🔥7
This media is not supported in your browser
VIEW IN TELEGRAM
Talk to Claude
Демоспейс для поболтать с Claude голосом
Вам понадобится Anthropic API Key, а также логин и API Key от PlayHT
#voicechat #voiceassistant
Демоспейс для поболтать с Claude голосом
Вам понадобится Anthropic API Key, а также логин и API Key от PlayHT
#voicechat #voiceassistant
👍3
fish.audio
Быстрый и качественный опенсорсный голосовой движок!
Состоит из модели голоса Fish Speech и агента Fish Agent
В команде - разработчики RVC, So-VITS-SVC
Клонирует голос по отрывку речи 10-30 секунд.
Есть готовые голоса на офсайте.
Помимо клонирования много другого умеет.
Увы, русского пока нет в числе поддерживаемых языков.
Демо на HF - текст в речь
Демо на офсайте с выбором голоса
Демо агента на HF - загружаете аудио и даете агенту задания
Голосовой чат
Гитхаб
#voicecloning #text2speech #tts #agent #voiceassistant
Быстрый и качественный опенсорсный голосовой движок!
Состоит из модели голоса Fish Speech и агента Fish Agent
В команде - разработчики RVC, So-VITS-SVC
Клонирует голос по отрывку речи 10-30 секунд.
Есть готовые голоса на офсайте.
Помимо клонирования много другого умеет.
Увы, русского пока нет в числе поддерживаемых языков.
Демо на HF - текст в речь
Демо на офсайте с выбором голоса
Демо агента на HF - загружаете аудио и даете агенту задания
Голосовой чат
Гитхаб
#voicecloning #text2speech #tts #agent #voiceassistant
🔥9
Давно не открывал ChatGPT, а там уже на бесплатном тарифе и картинки генерить можно, и файлы отправлять, и по ссылкам он читает - красота!
#assistant
#assistant
😁12👍10👎1🤯1
This media is not supported in your browser
VIEW IN TELEGRAM
How Far is Video Generation from World Model?
Исследование на тему Могут ли видеогенераторы (например, #SORA) считаться моделями физического мира.
Кратко по выводам:
1. Модель идеально обобщает данные, находящиеся в распределении (датасете?), но не может выполнять обобщение вне распределения. Для комбинаторных сценариев соблюдается закон масштабирования.
2. Модели не в состоянии абстрагировать общие правила и вместо этого пытаются имитировать ближайший пример из датасета.
3. При обращении к обучающим данным модель расставляет приоритеты атрибутов так: цвет> размер> скорость> форма.
#news
Исследование на тему Могут ли видеогенераторы (например, #SORA) считаться моделями физического мира.
Кратко по выводам:
1. Модель идеально обобщает данные, находящиеся в распределении (датасете?), но не может выполнять обобщение вне распределения. Для комбинаторных сценариев соблюдается закон масштабирования.
2. Модели не в состоянии абстрагировать общие правила и вместо этого пытаются имитировать ближайший пример из датасета.
3. При обращении к обучающим данным модель расставляет приоритеты атрибутов так: цвет> размер> скорость> форма.
#news
👍10🤓2❤1
FLUX1.1 [pro] Ultra / Raw
Обновка от BlackForest Labs
Разрешение новой модели Flux Ultra - до 4 мегапикселей
Короче, Ultra - высокое разрешение.
Raw - для получения естественных результатов, похожих на фотографии
Помним что [pro] - платная версия - 24 кредита за одну генерацию на fal.ai, это $0.06 за картинку
Доступно по API и на сайте
fal.ai
#text2image #flux
Обновка от BlackForest Labs
Разрешение новой модели Flux Ultra - до 4 мегапикселей
Короче, Ultra - высокое разрешение.
Raw - для получения естественных результатов, похожих на фотографии
Помним что [pro] - платная версия - 24 кредита за одну генерацию на fal.ai, это $0.06 за картинку
Доступно по API и на сайте
fal.ai
#text2image #flux
❤8👍1
This media is not supported in your browser
VIEW IN TELEGRAM
GenXD: Generating Any 3D and 4D Scenes
Генерация 3D и 4D (с движением) сцен по одному или нескольким ракурсам
Код ждем
#videoto3d #videoto4d
Генерация 3D и 4D (с движением) сцен по одному или нескольким ракурсам
Код ждем
#videoto3d #videoto4d
👍3❤1
Открылся демоспейс реставратора изображений InstantIR
Демо
#imagerestoration #BIR #imageediting #image2image #upscale
Демо
#imagerestoration #BIR #imageediting #image2image #upscale
👍5👎4🤔1
Разводим реставратор InstantIR в #ComfyUI
Бонусом еще один демоспейс. Собрал все ссылки в кучу
Демо2
Демо2
ComfyUI_InstantIR_Wrapper
Код
Веса
#imagerestoration #BIR #imageediting #image2image #upscale
Бонусом еще один демоспейс. Собрал все ссылки в кучу
Демо2
Демо2
ComfyUI_InstantIR_Wrapper
Код
Веса
#imagerestoration #BIR #imageediting #image2image #upscale
🔥8❤1👍1
Hertz-dev
Первая опенсорсная базовая модель для генерации разговорного звука.
Полный дуплеккс, то есть может генерить одновременно два голоса диалога, каждый в отдельном латентном канале генерации.
Основная способность модели - продолжение входного аудио.
Работает в 16 кГц
Поддержка русского силами подписчиков не обнаружена
Код
Демо
Веса
Hallucinator - Pinokio/Github
#audio2audio #speech #audioextension
Первая опенсорсная базовая модель для генерации разговорного звука.
Полный дуплеккс, то есть может генерить одновременно два голоса диалога, каждый в отдельном латентном канале генерации.
Основная способность модели - продолжение входного аудио.
Работает в 16 кГц
Поддержка русского силами подписчиков не обнаружена
Код
Демо
Веса
Hallucinator - Pinokio/Github
#audio2audio #speech #audioextension
🔥11🤯3❤1👍1😐1
X-Portrait: Expressive Portrait Animation with Hierarchical Motion Attention
Аниматор портретов по образцу движения от ByteDance, опубликован код.
Код
Демо (макс 2 секунды входного видео)
#facialanimation #portraitanimation #headanimation #motioncloning #personalization
Аниматор портретов по образцу движения от ByteDance, опубликован код.
Код
Демо (макс 2 секунды входного видео)
#facialanimation #portraitanimation #headanimation #motioncloning #personalization
👍8🔥2😁1
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
X-Portrait 2: Highly Expressive Portrait Animation
То же самое, но круче.
Есть сравнение с Runway Act
Код ждем
#facialanimation #portraitanimation #headanimation #motioncloning #personalization
То же самое, но круче.
Есть сравнение с Runway Act
Код ждем
#facialanimation #portraitanimation #headanimation #motioncloning #personalization
🔥14👍2❤1