Sora: First Impressions
OpenAI опубликовали работы и первые впечатления избранных представителей творческих профессий от Sora
#news
OpenAI опубликовали работы и первые впечатления избранных представителей творческих профессий от Sora
#news
🔥17
ComfyUI IPAdapter plus
Обновление IPAdapter для ComfyUI. В IPAdapter V2 полностью переписан код, старые воркфлоу не будут работать после обновления.
- multiple new IPAdapter nodes: regular (named "IPAdapter"), advanced ("IPAdapter Advanced"), and faceID ("IPAdapter FaceID);
- there's no need for a separate CLIPVision Model Loader node anymore, CLIPVision can be applied in a "IPAdapter Unified Loader" node;
- CLIPVision can be applied separately if "IPAdapter Unified Loader" is not used;
- new Weight Types;
- new Combine Embed types for multiple images inside of one IPAdapter node.
#text2image #image2image
Обновление IPAdapter для ComfyUI. В IPAdapter V2 полностью переписан код, старые воркфлоу не будут работать после обновления.
- multiple new IPAdapter nodes: regular (named "IPAdapter"), advanced ("IPAdapter Advanced"), and faceID ("IPAdapter FaceID);
- there's no need for a separate CLIPVision Model Loader node anymore, CLIPVision can be applied in a "IPAdapter Unified Loader" node;
- CLIPVision can be applied separately if "IPAdapter Unified Loader" is not used;
- new Weight Types;
- new Combine Embed types for multiple images inside of one IPAdapter node.
#text2image #image2image
GitHub
GitHub - cubiq/ComfyUI_IPAdapter_plus
Contribute to cubiq/ComfyUI_IPAdapter_plus development by creating an account on GitHub.
👍5
FlashFace: Human Image Personalization with High-fidelity Identity Preservation
Персонализация лучше чем InstantID, FaceID
- изменение возраста, пола
- делает реалистичные версии фантастических персонажей
- интерполяция персонажей
- стилизация
- контроль текстосвыми указаниями
Код ждем
Демо ждем
#personalization #stylization #image2image
Персонализация лучше чем InstantID, FaceID
- изменение возраста, пола
- делает реалистичные версии фантастических персонажей
- интерполяция персонажей
- стилизация
- контроль текстосвыми указаниями
Код ждем
Демо ждем
#personalization #stylization #image2image
👍2
Forwarded from эйай ньюз
This media is not supported in your browser
VIEW IN TELEGRAM
🔥RadSplat - качество рендеринга как NeRF, но в 900FPS!
Переносить реальные пространства в VR в высоком разрешении - это то к чему многие ресерчеры стремятся. Но для реального применения, тут важно уметь быстро рендерить реалистичную картинку отсканированных объектов.
Концептуально в новом методе RadSplat всё очень просто: сначала тренируем нерф и запекаем его в гауссовый сплат. Потом, сравнивая с нерфом, определяем важность каждого элемента сплата и обрезаем ненужные. От такого прунинга качество, внезапно, даже растёт.
Для ускорения на больших сценах предлагают разбить сцену на несколько кластеров, определить что из каждого кластера видно и рендерить только это. В чём-то это похоже на VastGaussian, о котором я рассказывал пару недель назад.
В целом оно быстрее обычных нерфов вплоть до 3 тысяч раз(!), что по скорости примерно на уровне метода Re-ReND от нашей команды, где мы запекали нерф в light-field на меши, что позволяло рендерить со скоростью до 1000FPS на GPU и 74 FPS на шлеме Oculus Pro.
Сайт проекта
@ai_newz
Переносить реальные пространства в VR в высоком разрешении - это то к чему многие ресерчеры стремятся. Но для реального применения, тут важно уметь быстро рендерить реалистичную картинку отсканированных объектов.
Концептуально в новом методе RadSplat всё очень просто: сначала тренируем нерф и запекаем его в гауссовый сплат. Потом, сравнивая с нерфом, определяем важность каждого элемента сплата и обрезаем ненужные. От такого прунинга качество, внезапно, даже растёт.
Для ускорения на больших сценах предлагают разбить сцену на несколько кластеров, определить что из каждого кластера видно и рендерить только это. В чём-то это похоже на VastGaussian, о котором я рассказывал пару недель назад.
В целом оно быстрее обычных нерфов вплоть до 3 тысяч раз(!), что по скорости примерно на уровне метода Re-ReND от нашей команды, где мы запекали нерф в light-field на меши, что позволяло рендерить со скоростью до 1000FPS на GPU и 74 FPS на шлеме Oculus Pro.
Сайт проекта
@ai_newz
🔥8👎1
SDXS: Real-Time One-Step Latent Diffusion Models with Image Conditions
Одношаговая генерация изображений в реальном времени с визуальным промптингом (как в Controlnet, IPadapter)
Представлены две модели, SDXS-512 и SDXS-1024, обеспечивающие скорость вывода примерно 100 кадров в секунду (в 30 раз быстрее, чем SD v1.5) и 30 кадров в секунду (в 60 раз быстрее, чем SDXL) на одном графическом процессоре соответственно
Код, пре-релизные веса для diffusers
#realtime #text2image #conditioning #SDXS
Одношаговая генерация изображений в реальном времени с визуальным промптингом (как в Controlnet, IPadapter)
Представлены две модели, SDXS-512 и SDXS-1024, обеспечивающие скорость вывода примерно 100 кадров в секунду (в 30 раз быстрее, чем SD v1.5) и 30 кадров в секунду (в 60 раз быстрее, чем SDXL) на одном графическом процессоре соответственно
Код, пре-релизные веса для diffusers
#realtime #text2image #conditioning #SDXS
👍8
InTeX: Interactive Text-to-Texture Synthesis via Unified Depth-aware Inpainting
Интерактивное текстурирование 3D на базе SD
Код
#texture #text2texture #3Dtotexture #texturing
Интерактивное текстурирование 3D на базе SD
Код
#texture #text2texture #3Dtotexture #texturing
👍5
Media is too big
VIEW IN TELEGRAM
Gaussian-SLAM: Photo-realistic Dense SLAM with Gaussian Splatting
Реконструкция сцен реального мира по RGBD - видео на гауссианах. Канал глубины решает, ну и архитектура тоже
Код
#gaussian #video2scene #rendering #videoto3D
Реконструкция сцен реального мира по RGBD - видео на гауссианах. Канал глубины решает, ну и архитектура тоже
Код
#gaussian #video2scene #rendering #videoto3D
This media is not supported in your browser
VIEW IN TELEGRAM
Говорят, Google Photos обновился ИИ-фичами
- Magic Eraser - самое интересное, удаление объектов
- Photo Stacks - группирование похожих фото
- Highlight video - автомонтаж видеоклипов
- Best Take - выбор лучшего варианта фото
- Организация документов и чеков в отдельные альбомы
#inpainting
- Magic Eraser - самое интересное, удаление объектов
- Photo Stacks - группирование похожих фото
- Highlight video - автомонтаж видеоклипов
- Best Take - выбор лучшего варианта фото
- Организация документов и чеков в отдельные альбомы
#inpainting
🔥7
AniPortrait: Audio-Driven Synthesis of Photorealistic Portrait Animations
Анимация портрета по звуку речи. Для референса мимики можно еще и видео на вход подать
Код
#image2video #talkinghead #speech2video
Анимация портрета по звуку речи. Для референса мимики можно еще и видео на вход подать
Код
#image2video #talkinghead #speech2video
❤8🔥3
Media is too big
VIEW IN TELEGRAM
TC4D: Trajectory-Conditioned Text-to-4D Generation
Генератор видео движущихся 3D объектов по тексту + траектории.
Под капотом #nerf
Код
#text2video #textto3D
Генератор видео движущихся 3D объектов по тексту + траектории.
Под капотом #nerf
Код
#text2video #textto3D
🤔4🔥1
matrix_city_watermarked.mp4
47.1 MB
Octree-GS: Towards Consistent Real-time Rendering with LOD-Structured 3D Gaussians
Реконструкция 3D сцен на гауссианах с LOD - тридешники поймут, это уровни детализации по удаленности от камеры.
Код ждем
#gaussian #optimization
Реконструкция 3D сцен на гауссианах с LOD - тридешники поймут, это уровни детализации по удаленности от камеры.
Код ждем
#gaussian #optimization
❤6
GeoWizard: Unleashing the Diffusion Priors for 3D Geometry Estimation from a Single Image
Похоже, крутой генератор глубины и нормалей по изображению. На сайте сравнение с DepthAnything и Marigold
Код
Демо
ComfyUI
#image2depth #image2normal
Похоже, крутой генератор глубины и нормалей по изображению. На сайте сравнение с DepthAnything и Marigold
Код
Демо
ComfyUI
#image2depth #image2normal
❤6👍2🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
Semantic Gaussians: Open-Vocabulary Scene Understanding with 3D Gaussian Splatting
Семантическая сегментация сцен на гауссианах
Код ждем
#gaussian #segmentation
Семантическая сегментация сцен на гауссианах
Код ждем
#gaussian #segmentation
❤3