Video World Models with Long-term Spatial Memory
Видеогенератор использует долгосрочную пространственную память для улучшения качества и согласованности генерируемых видео
Кода нет зато похоже на RDR2
#image2video
Видеогенератор использует долгосрочную пространственную память для улучшения качества и согласованности генерируемых видео
Кода нет зато похоже на RDR2
#image2video
👍5
This media is not supported in your browser
VIEW IN TELEGRAM
MARBLE: Material Recomposition and Blending in CLIP-Space
Новинка от Stability AI
Метод редактирования и смешивания материалов в изображениях с помощью предварительно обученных генеративных моделей, управляя ими через изменения в пространстве эмбеддингоав CLIP. Это позволяет настраивать такие свойства материалов, как шероховатость, металлический вид, прозрачность и свечение.
Код
Демо
#material #imageediting
Новинка от Stability AI
Метод редактирования и смешивания материалов в изображениях с помощью предварительно обученных генеративных моделей, управляя ими через изменения в пространстве эмбеддингоав CLIP. Это позволяет настраивать такие свойства материалов, как шероховатость, металлический вид, прозрачность и свечение.
Код
Демо
#material #imageediting
❤8🤔4
На fal.ai завезли Veo 3 от Гугла. Об этом в соответствующем анонсе объявила сама площадка в своем дискорде.
Никаких пробных попыток не дают, генерация 5-ти секундного видео стоит $3.75.
Спасибо @asleephidden
#text2video
https://fal.ai/models/fal-ai/veo3/playground
Никаких пробных попыток не дают, генерация 5-ти секундного видео стоит $3.75.
Спасибо @asleephidden
#text2video
https://fal.ai/models/fal-ai/veo3/playground
👎14😱7❤4🔥1
Media is too big
VIEW IN TELEGRAM
SeedVR2: One-Step Video Restoration via Diffusion Adversarial Post-Training
Метод одношаговой реставрации видео с помощью диффузии
Код ждем
#videorestoration
Метод одношаговой реставрации видео с помощью диффузии
Код ждем
#videorestoration
👍9🔥1🌚1
Media is too big
VIEW IN TELEGRAM
FlexPainter: Flexible and Multi-View Consistent Texture Generation
Гибкая генерация текстур, согласованных по ракурсам
На вход принимает референсные картинки и текстовые описания
Код ждем
#texture #image2texture
Гибкая генерация текстур, согласованных по ракурсам
На вход принимает референсные картинки и текстовые описания
Код ждем
#texture #image2texture
🔥3🌚1
Pixel3DMM: Versatile Screen-Space Priors for Single-Image 3D Face Reconstruction
Создание 3D-модели лица по одной фотографии. Модель анализирует изображение и предсказывает геометрические характеристики для каждой точки изображения, что позволяет точно реконструировать форму лица в трёх измерениях.
Но выходе можно получить:
- нормали
- uv-координаты
- 2D-вершины (точки на плоскости, которые помогают в реконструкции геометрии лица)
- параметры 3D морфабельной модели лица (3DMM), которые описывают форму и особенности лица в трёх измерениях
Код
#imageto3d #head #image2normal #image2uv #uv
Создание 3D-модели лица по одной фотографии. Модель анализирует изображение и предсказывает геометрические характеристики для каждой точки изображения, что позволяет точно реконструировать форму лица в трёх измерениях.
Но выходе можно получить:
- нормали
- uv-координаты
- 2D-вершины (точки на плоскости, которые помогают в реконструкции геометрии лица)
- параметры 3D морфабельной модели лица (3DMM), которые описывают форму и особенности лица в трёх измерениях
Код
#imageto3d #head #image2normal #image2uv #uv
👍5🔥1
SkyReels-Audio: Omni Audio-Conditioned Talking Portraits in Video Diffusion Transformers
Оживлятор портретов по аудиофайлу речи от SkyReels
Умеет делать липсинк видео
Похоже что код и веса публиковать не собираются
Платно на офсайте - Можно загрузить свое аудио или сгенерировать, на выбор есть библиотека голосов
#lipsync #portraitanimation #speech2video #image2video
Оживлятор портретов по аудиофайлу речи от SkyReels
Умеет делать липсинк видео
Похоже что код и веса публиковать не собираются
Платно на офсайте - Можно загрузить свое аудио или сгенерировать, на выбор есть библиотека голосов
#lipsync #portraitanimation #speech2video #image2video
👍4👎4
Media is too big
VIEW IN TELEGRAM
Difix3D+: Improving 3D Reconstructions with Single-Step Diffusion Models
Исправляет артефакты NeRF и 3DGS в областях с недостатком констрейнов (??), повышая общее качество 3D-представления. Проект NVIDIA
Код ждем
#gaussian #nerf
Исправляет артефакты NeRF и 3DGS в областях с недостатком констрейнов (??), повышая общее качество 3D-представления. Проект NVIDIA
Код ждем
#gaussian #nerf
🔥7❤2
Media is too big
VIEW IN TELEGRAM
CAST: Component-Aligned 3D Scene Reconstruction from an RGB Image
Cоздает 3D модели по одной картинке с учётом физических взаимодействий и пространственных отношений объектов
В деле замешаны Deemos
Код ждем
#imageto3d #image2scene
Cоздает 3D модели по одной картинке с учётом физических взаимодействий и пространственных отношений объектов
В деле замешаны Deemos
Код ждем
#imageto3d #image2scene
👍7🔥3👎1
Media is too big
VIEW IN TELEGRAM
TeGA: Texture Space Gaussian Avatars for High-Resolution DynamicHead Modeling
Аватары на гауссианах от Google
Впечатляющее качество, уделали всех конкурентов, но
Кода нет
#gaussian #humanavatar
Аватары на гауссианах от Google
Впечатляющее качество, уделали всех конкурентов, но
Кода нет
#gaussian #humanavatar
👍6🌚1
FreeTimeGS: Free Gaussian Primitives at Anytime Anywhere for Dynamic Scene Reconstruction
Реконструкция объемных динамических сцен по видео, на гауссианах
Еще один проект без кода, зато можно интерактивно покрутить сцены (поддерживает VR гарнитуры)
#novelveiw #rendering #gaussian #video2gaussian #videoto4D #4D
Реконструкция объемных динамических сцен по видео, на гауссианах
Еще один проект без кода, зато можно интерактивно покрутить сцены (поддерживает VR гарнитуры)
#novelveiw #rendering #gaussian #video2gaussian #videoto4D #4D
👍8❤4👎1
HeyGem
Опенсорсная альтернатива HeyGen. Ну можно было и по названию догадаться
- Аватар в 4K по отрывку видео 1 секунда (???)
- Клонирование лица и голоса
- Запускается на 1080Ti +
Код
#lipsync #humanavatar #vocecloning #avatar #
Опенсорсная альтернатива HeyGen. Ну можно было и по названию догадаться
- Аватар в 4K по отрывку видео 1 секунда (???)
- Клонирование лица и голоса
- Запускается на 1080Ti +
Код
#lipsync #humanavatar #vocecloning #avatar #
😐8🔥7👍3
Опубликован код и веса видеореставратора SeedVR2
Одна H100-80G может обрабатывать видео с разрешением 100x720x1280. 4 штуки H100-80G - дополнительно поддерживают видео 1080p и 2K.
Но обещают в будущем Tile-VAE и Progressive Aggregation Sampling
Код
Веса
#videorestoration
Одна H100-80G может обрабатывать видео с разрешением 100x720x1280. 4 штуки H100-80G - дополнительно поддерживают видео 1080p и 2K.
Но обещают в будущем Tile-VAE и Progressive Aggregation Sampling
Код
Веса
#videorestoration
Telegram
Нейронавт | Нейросети в творчестве
SeedVR2: One-Step Video Restoration via Diffusion Adversarial Post-Training
Метод одношаговой реставрации видео с помощью диффузии
Код ждем
#videorestoration
Метод одношаговой реставрации видео с помощью диффузии
Код ждем
#videorestoration
👍6😱2
Выпущена новая версия Pinokio 3.9.0
Исправили проблему с "Discover" страницей.
#news
Исправили проблему с "Discover" страницей.
Теперь мы используем URL GitHub Pages напрямую, чтобы не только исправить текущую проблему с доменом, но и убедиться, что такие проблемы не возникнут в будущем даже в самом худшем случае.
Размещая сайт полностью на GitHub Pages и используя URL GitHub Pages напрямую (вместо использования пользовательского домена, который требует обслуживания), мы можем быть уверены, что даже в худшем случае приложение продолжит работать (если только GitHub не отключится).
#news
GitHub
Releases · pinokiocomputer/pinokio
AI Browser. Contribute to pinokiocomputer/pinokio development by creating an account on GitHub.
👍3😁1
This media is not supported in your browser
VIEW IN TELEGRAM
PartCrafter: Structured 3D Mesh Generation via Compositional Latent Diffusion Transformers
3D-генератор от ByteDance, синтезирует набор семантически значимых 3D-сеток из одного изображения. Короче, создает не единую сетку, а модель состоящую из частей
Код и демо ждем
#imageto3d
3D-генератор от ByteDance, синтезирует набор семантически значимых 3D-сеток из одного изображения. Короче, создает не единую сетку, а модель состоящую из частей
Код и демо ждем
#imageto3d
👍8❤1