Hummingbird-0
Ну логично, видеоаватары уже есть, должно быть нетрудно адаптировать для липсинка.
Hummingbird-0 от Tavus делает реалистичную, сохраняющую индивидуальность синхронизацию губ из любого MP3 + MP4. Дообучение не требуется
Говорят, что SOTA (самая лучшая модель)
Попробовать
#lipsync
Ну логично, видеоаватары уже есть, должно быть нетрудно адаптировать для липсинка.
Hummingbird-0 от Tavus делает реалистичную, сохраняющую индивидуальность синхронизацию губ из любого MP3 + MP4. Дообучение не требуется
Говорят, что SOTA (самая лучшая модель)
Попробовать
#lipsync
👍9😐2
Нейронавт | Нейросети в творчестве
Hunyuan3D 2.5 Новая версия 3D-генератора, 10B параметров. Авториг, многоракурсная генерация 3D, PBR текстуры Попробовать - можно войти по имейлу #imageto3d #textto3d
Ахаха! Белая плесень
Ладно, сделал мне копеечный пластиковый сувенир вместо технологичного робота
Ладно, сделал мне копеечный пластиковый сувенир вместо технологичного робота
😁7🥴1
Media is too big
VIEW IN TELEGRAM
Lyria 2
Генератор музыки от Deepmind
Все серьезно и очень продуктово.
Детализация жанровых нюансов, генерация инструментальных партий по текстовым описаниям, расширение композиций, редактирование стиля. Можно менять темп, тональность или полностью переосмыслить трек
Записаться в вейтлист
————————
Lyria RealTime
А это тот же генератор в реальном времени, есть кнопка попробовать (не для россиян)
Ну что, суно/удио бояться, батя вышел на поляну.
#music #text2music #music2music
Генератор музыки от Deepmind
Все серьезно и очень продуктово.
Детализация жанровых нюансов, генерация инструментальных партий по текстовым описаниям, расширение композиций, редактирование стиля. Можно менять темп, тональность или полностью переосмыслить трек
Записаться в вейтлист
————————
Lyria RealTime
А это тот же генератор в реальном времени, есть кнопка попробовать (не для россиян)
Ну что, суно/удио бояться, батя вышел на поляну.
#music #text2music #music2music
🔥6🤷♂1
MusicGPT
Еще один генератор-редактор музыки/песен/звука
Можно делать инструментал, можно с вокалом
Делает ремиксы, умеет преобразовывать звуки, в том числе изменять голос. Ах да, есть TTS, может создать речь из вашего текста
И какой позор что их презентационное видео в твиттере залито БЕЗ ЗВУКА!
Я вам сам потыкал в ТОП 50 с сайта, наслаждайтесь
На старте дают 500 кредитов - это примерно на 10 музыкальных треков. За приглашение друзей докидывают еще по 500 кредитов. Но коммерческое использование музыки все равно только на платном тарифе
#music #text2music #text2sound #music2music #tts #text2speech
Еще один генератор-редактор музыки/песен/звука
Можно делать инструментал, можно с вокалом
Делает ремиксы, умеет преобразовывать звуки, в том числе изменять голос. Ах да, есть TTS, может создать речь из вашего текста
И какой позор что их презентационное видео в твиттере залито БЕЗ ЗВУКА!
Я вам сам потыкал в ТОП 50 с сайта, наслаждайтесь
На старте дают 500 кредитов - это примерно на 10 музыкальных треков. За приглашение друзей докидывают еще по 500 кредитов. Но коммерческое использование музыки все равно только на платном тарифе
#music #text2music #text2sound #music2music #tts #text2speech
🔥10🤮1
Seurat: From Moving Points to Depth
Еще один трекер точек/генератор глубины для видео. Глубину предсказывает по траекториям точек, не по картинке как обычно делают остальные модели
Код ждем
Демо ждем
#trtacking #video2depth
Еще один трекер точек/генератор глубины для видео. Глубину предсказывает по траекториям точек, не по картинке как обычно делают остальные модели
Код ждем
Демо ждем
#trtacking #video2depth
❤3
CausVid: From Slow Bidirectional to Fast Autoregressive Video Diffusion Models
Это не просто быстрый видеогенератор, это видеогенератор в реальном времени от MIT и Adobe, основанный на WAN
9.4 кадра в секунду на одном GPU (вероятнее всего, речь о H100)
Обещают взять более качественный датасет и обучить модель с лучшим качеством
Код
#text2video #image2video #realtime
Это не просто быстрый видеогенератор, это видеогенератор в реальном времени от MIT и Adobe, основанный на WAN
9.4 кадра в секунду на одном GPU (вероятнее всего, речь о H100)
Обещают взять более качественный датасет и обучить модель с лучшим качеством
Код
#text2video #image2video #realtime
😱10👍5🔥5😐3💩2
MAGI-1 4.5B
На HF появились веса средней модели видеогенератора. Вероятно, запустится на RTX 4090
#text2video #image2video
На HF появились веса средней модели видеогенератора. Вероятно, запустится на RTX 4090
#text2video #image2video
huggingface.co
sand-ai/MAGI-1 at main
We’re on a journey to advance and democratize artificial intelligence through open source and open science.
👍4❤2🤔1
This media is not supported in your browser
VIEW IN TELEGRAM
3D inpainting
Для тех кто готов поколупаться с запуском ячеек в Google Colab
1. Запустите весь подготовительный код - каждая ячейка занимает около 10 минут и может завершиться сбоем во время выполнения, проследите чтобы каждая ячейка отработала.
2. Загрузите свой меш .ply и референсное изображение. Работает лучше всего, если изображение представляет собой измененный снимок экрана или визуализацию вашей модели. Тогда это с меньшей вероятностью приведет к появлению пробелов в модели.
3. Перемещайте и масштабируйте модель и область инпейнтинга.
реддит
#inpainting3d #colab #3dto3d
Для тех кто готов поколупаться с запуском ячеек в Google Colab
1. Запустите весь подготовительный код - каждая ячейка занимает около 10 минут и может завершиться сбоем во время выполнения, проследите чтобы каждая ячейка отработала.
2. Загрузите свой меш .ply и референсное изображение. Работает лучше всего, если изображение представляет собой измененный снимок экрана или визуализацию вашей модели. Тогда это с меньшей вероятностью приведет к появлению пробелов в модели.
3. Перемещайте и масштабируйте модель и область инпейнтинга.
реддит
#inpainting3d #colab #3dto3d
👍3❤2
Media is too big
VIEW IN TELEGRAM
3DGUT: Enabling Distorted Cameras and Secondary Rays in Gaussian Splatting
Рендер сцен на гауссианах от Nvidia
В отличие от оригинального 3DGS, поддерживает фишай (очень широугольные обеъективы), корректно реконструирует сцены по видео, снятому с роллинг шаттером, позволяет воспроизводить оптические преломления и отражения
Код
#gaussian #video2scene #rendering #novelview #fisheye
Рендер сцен на гауссианах от Nvidia
В отличие от оригинального 3DGS, поддерживает фишай (очень широугольные обеъективы), корректно реконструирует сцены по видео, снятому с роллинг шаттером, позволяет воспроизводить оптические преломления и отражения
Код
#gaussian #video2scene #rendering #novelview #fisheye
🔥6