EchoMimic: Lifelike Audio-Driven Portrait Animations through Editable Landmark Conditioning
Вам мало оживляторов портретов? Вот еще один.
Анимирует портрет по звуку речи и/или входной мимике
Код
ComfyUI
Инструкция по установке (youtube)
#image2video #humananimation #speech2video #pose2video
Вам мало оживляторов портретов? Вот еще один.
Анимирует портрет по звуку речи и/или входной мимике
Код
ComfyUI
Инструкция по установке (youtube)
#image2video #humananimation #speech2video #pose2video
👍7😁1
Zero-Painter: Training-Free Layout Control for Text-to-Image Synthesis
Контроль генерации изображения управляющими масками без дообучения, этакий контролнет от Picsart
Код
#text2image #conditioning
Контроль генерации изображения управляющими масками без дообучения, этакий контролнет от Picsart
Код
#text2image #conditioning
👍7
This media is not supported in your browser
VIEW IN TELEGRAM
FasterLivePortrait
Прокачанный LivePortrait
30+ кадров в секунду на RTX 3090 GPU
Работает на TesorRT. При конверсии в onnx скорость 12 кадров в секунду.
Не зависит от Pytorch/
На gradio быстрая обработка нескольких лиц одновременно
#image2video #pose2video #realtime
Прокачанный LivePortrait
30+ кадров в секунду на RTX 3090 GPU
Работает на TesorRT. При конверсии в onnx скорость 12 кадров в секунду.
Не зависит от Pytorch/
На gradio быстрая обработка нескольких лиц одновременно
#image2video #pose2video #realtime
🔥10👍1
This media is not supported in your browser
VIEW IN TELEGRAM
VD3D: Taming Large Video Diffusion Transformers for 3D Camera Control
Университет Торонто совместно со Snap ищут способы управлять камерой при генерации видео/
Кода нет. Посмотрим куда внедрят
#text2video #trajectory2video #conditioning #cameracontrol
Университет Торонто совместно со Snap ищут способы управлять камерой при генерации видео/
Кода нет. Посмотрим куда внедрят
#text2video #trajectory2video #conditioning #cameracontrol
👍8🔥1
Media is too big
VIEW IN TELEGRAM
Goldfish: Vision-Language Understanding of Arbitrarily Long Videos
Модель понимания видео на MiniGPT4-video. По бенчмаркам авторы показывают превосходство над конкурентами на длинных и коротких видео.
Код
Демо (очередь медленно двигается)
#vlm #chatbot #video2text
Модель понимания видео на MiniGPT4-video. По бенчмаркам авторы показывают превосходство над конкурентами на длинных и коротких видео.
Код
Демо (очередь медленно двигается)
#vlm #chatbot #video2text
❤3👍1
Splatfacto-W: A Nerfstudio Implementation of Gaussian Splatting for Unconstrained Photo Collections
Улучшенная реконструкция сцен гауссианами по набору фото в nerfstudio
Код
#gaussian #image2scene #imageto3d
Улучшенная реконструкция сцен гауссианами по набору фото в nerfstudio
Код
#gaussian #image2scene #imageto3d
👍6🔥1
IMAGDressing-v1 : Customizable Virtual Dressing
Виртуальная примерочная с контролем позы, сцены, лица.
Можно дополнительно подключать ControlNet, IP-Adapter, T2I-Adapter, AnimateDiff
Код
Демо
#video2video #inpainting #tryon
Виртуальная примерочная с контролем позы, сцены, лица.
Можно дополнительно подключать ControlNet, IP-Adapter, T2I-Adapter, AnimateDiff
Код
Демо
#video2video #inpainting #tryon
👍13🔥2❤1
Следующий драйвер NVIDIA будет выпущен с открытым исходным кодом. Похоже, отныне драйвера NVIDIA будут в опенсорсе. Почему? И почему не сделали этого раньше?
#news
#news
NVIDIA Technical Blog
NVIDIA Transitions Fully Towards Open-Source GPU Kernel Modules
With the R515 driver, NVIDIA released a set of Linux GPU kernel modules in May 2022 as open source with dual GPL and MIT licensing. The initial release targeted datacenter compute GPUs…
🔥2
Kolors IP-Adapter-Plus
В репозитории Kwai-Kolors опубликован код обучения и веса IP-Adapter-Plus для базовой модели Kolors.
Теперь можно даже тренить свои айпиадаптеры
Гитхаб
ComfyUI
Вокрфлоу
#text2image #conditioning #personalization
В репозитории Kwai-Kolors опубликован код обучения и веса IP-Adapter-Plus для базовой модели Kolors.
Теперь можно даже тренить свои айпиадаптеры
Гитхаб
ComfyUI
Вокрфлоу
#text2image #conditioning #personalization
❤8👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Ultralytics upscaler
Tile-upscaler завезли на бесплатный сервис tost.ai
Здесь он называется Ultralytics upscaler
А чтобы им воспользоваться, надо выбрать в меню Upscaler 2.0
Да, вот так 🤷♂️
#upscale
Tile-upscaler завезли на бесплатный сервис tost.ai
Здесь он называется Ultralytics upscaler
А чтобы им воспользоваться, надо выбрать в меню Upscaler 2.0
Да, вот так 🤷♂️
#upscale
🔥10👍4
Media is too big
VIEW IN TELEGRAM
👍5🥴3⚡1👎1🔥1
Media is too big
VIEW IN TELEGRAM
Shape of Motion: 4D Reconstruction from a Single Video
Вам понравится.
Реконструкция динамической 3D сцены по видео с одного ракурса. Реконструкция построена на объединении точек в жесткие группы по векторам движения, трекинге, оценке глубины.
Код
#videoto3d #video2scene #video2video #novelview
Вам понравится.
Реконструкция динамической 3D сцены по видео с одного ракурса. Реконструкция построена на объединении точек в жесткие группы по векторам движения, трекинге, оценке глубины.
Код
#videoto3d #video2scene #video2video #novelview
❤7🔥6👍3
Media is too big
VIEW IN TELEGRAM
Streetscapes: Large-scale Consistent Street View Generation Using Autoregressive Video Diffusion
Шикарный проект студентов-исследователей Google Research.
Генератор видео проездов по улицам по входным картам.
Может интерполировать набор картинок Google Street (или просто набор фото локации) в длинное видео. Автор еще по видео собирает #nerf - на видео справа
Текстовым промптом можно задать нужные погодные условия, время суток, антураж города.
Представьте, у вас есть сцена проезда на автомобиле, снятая на хромаке, а подходящего задника не хватает. Расчехляете Streetscapes и вперед собирать идеальный задник (пустой улицы)
К сожалению без кода
#map2video #map2scene #image2video
Шикарный проект студентов-исследователей Google Research.
Генератор видео проездов по улицам по входным картам.
Может интерполировать набор картинок Google Street (или просто набор фото локации) в длинное видео. Автор еще по видео собирает #nerf - на видео справа
Текстовым промптом можно задать нужные погодные условия, время суток, антураж города.
Представьте, у вас есть сцена проезда на автомобиле, снятая на хромаке, а подходящего задника не хватает. Расчехляете Streetscapes и вперед собирать идеальный задник (пустой улицы)
К сожалению без кода
#map2video #map2scene #image2video
❤5👍2
😁18👍1