SDXS: Real-Time One-Step Latent Diffusion Models with Image Conditions
Одношаговая генерация изображений в реальном времени с визуальным промптингом (как в Controlnet, IPadapter)
Представлены две модели, SDXS-512 и SDXS-1024, обеспечивающие скорость вывода примерно 100 кадров в секунду (в 30 раз быстрее, чем SD v1.5) и 30 кадров в секунду (в 60 раз быстрее, чем SDXL) на одном графическом процессоре соответственно
Код, пре-релизные веса для diffusers
#realtime #text2image #conditioning #SDXS
Одношаговая генерация изображений в реальном времени с визуальным промптингом (как в Controlnet, IPadapter)
Представлены две модели, SDXS-512 и SDXS-1024, обеспечивающие скорость вывода примерно 100 кадров в секунду (в 30 раз быстрее, чем SD v1.5) и 30 кадров в секунду (в 60 раз быстрее, чем SDXL) на одном графическом процессоре соответственно
Код, пре-релизные веса для diffusers
#realtime #text2image #conditioning #SDXS
👍8
InTeX: Interactive Text-to-Texture Synthesis via Unified Depth-aware Inpainting
Интерактивное текстурирование 3D на базе SD
Код
#texture #text2texture #3Dtotexture #texturing
Интерактивное текстурирование 3D на базе SD
Код
#texture #text2texture #3Dtotexture #texturing
👍5
Media is too big
VIEW IN TELEGRAM
Gaussian-SLAM: Photo-realistic Dense SLAM with Gaussian Splatting
Реконструкция сцен реального мира по RGBD - видео на гауссианах. Канал глубины решает, ну и архитектура тоже
Код
#gaussian #video2scene #rendering #videoto3D
Реконструкция сцен реального мира по RGBD - видео на гауссианах. Канал глубины решает, ну и архитектура тоже
Код
#gaussian #video2scene #rendering #videoto3D
This media is not supported in your browser
VIEW IN TELEGRAM
Говорят, Google Photos обновился ИИ-фичами
- Magic Eraser - самое интересное, удаление объектов
- Photo Stacks - группирование похожих фото
- Highlight video - автомонтаж видеоклипов
- Best Take - выбор лучшего варианта фото
- Организация документов и чеков в отдельные альбомы
#inpainting
- Magic Eraser - самое интересное, удаление объектов
- Photo Stacks - группирование похожих фото
- Highlight video - автомонтаж видеоклипов
- Best Take - выбор лучшего варианта фото
- Организация документов и чеков в отдельные альбомы
#inpainting
🔥7
AniPortrait: Audio-Driven Synthesis of Photorealistic Portrait Animations
Анимация портрета по звуку речи. Для референса мимики можно еще и видео на вход подать
Код
#image2video #talkinghead #speech2video
Анимация портрета по звуку речи. Для референса мимики можно еще и видео на вход подать
Код
#image2video #talkinghead #speech2video
❤8🔥3
Media is too big
VIEW IN TELEGRAM
TC4D: Trajectory-Conditioned Text-to-4D Generation
Генератор видео движущихся 3D объектов по тексту + траектории.
Под капотом #nerf
Код
#text2video #textto3D
Генератор видео движущихся 3D объектов по тексту + траектории.
Под капотом #nerf
Код
#text2video #textto3D
🤔4🔥1
matrix_city_watermarked.mp4
47.1 MB
Octree-GS: Towards Consistent Real-time Rendering with LOD-Structured 3D Gaussians
Реконструкция 3D сцен на гауссианах с LOD - тридешники поймут, это уровни детализации по удаленности от камеры.
Код ждем
#gaussian #optimization
Реконструкция 3D сцен на гауссианах с LOD - тридешники поймут, это уровни детализации по удаленности от камеры.
Код ждем
#gaussian #optimization
❤6
GeoWizard: Unleashing the Diffusion Priors for 3D Geometry Estimation from a Single Image
Похоже, крутой генератор глубины и нормалей по изображению. На сайте сравнение с DepthAnything и Marigold
Код
Демо
ComfyUI
#image2depth #image2normal
Похоже, крутой генератор глубины и нормалей по изображению. На сайте сравнение с DepthAnything и Marigold
Код
Демо
ComfyUI
#image2depth #image2normal
❤6👍2🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
Semantic Gaussians: Open-Vocabulary Scene Understanding with 3D Gaussian Splatting
Семантическая сегментация сцен на гауссианах
Код ждем
#gaussian #segmentation
Семантическая сегментация сцен на гауссианах
Код ждем
#gaussian #segmentation
❤3
Советую вам толковый канал, автор которого реально занимается AI и опубликовал 15+ статей на топовых конфах.
Артем — Staff Research Scientist в элитной лабе по генеративному AI, Meta GenAI в Цюрихе и ещё находит время вести канал!
Например, там он рассказывал о новой text-2-image модели Emu, к которой приложил свою руку и ускорил генерацию до 5 секунд. Или вот пост про модель для генерации стикеров, котороую Артем лично оптимизировал. Моделька уже крутится в Инсте и Whatsup в проде.
Артем в целом пишет о нейронках, AR/VR и генеративном AI, добавляя свое критическое мнение, а также травит байки о работе AI ресерчера в Meta. Недавно Артем писал о том, как он запромоутился до Staff Research Scientist.
Мало у кого из авторов каналов есть такой мощный полевой опыт в AI как у Артема, так что его канал точно стоит читать: @ai_newz
Артем — Staff Research Scientist в элитной лабе по генеративному AI, Meta GenAI в Цюрихе и ещё находит время вести канал!
Например, там он рассказывал о новой text-2-image модели Emu, к которой приложил свою руку и ускорил генерацию до 5 секунд. Или вот пост про модель для генерации стикеров, котороую Артем лично оптимизировал. Моделька уже крутится в Инсте и Whatsup в проде.
Артем в целом пишет о нейронках, AR/VR и генеративном AI, добавляя свое критическое мнение, а также травит байки о работе AI ресерчера в Meta. Недавно Артем писал о том, как он запромоутился до Staff Research Scientist.
Мало у кого из авторов каналов есть такой мощный полевой опыт в AI как у Артема, так что его канал точно стоит читать: @ai_newz
Telegram
эйай ньюз
ICCV 2023: Воркшопы и туториалы
Конференция в Париже началась уже с понедельника, но только сейчас удалось написать пост. Наиплотнейше ложится информация, а параллельно идет постоянный нетворкинг.
В первые два дня идут воркшопы и туториалы - это такие…
Конференция в Париже началась уже с понедельника, но только сейчас удалось написать пост. Наиплотнейше ложится информация, а параллельно идет постоянный нетворкинг.
В первые два дня идут воркшопы и туториалы - это такие…
🔥5👍3💯2❤1
Stable Assistant
По сообщению реддитора, Stability AI тестируют чат-бота с бета-версией #SD3
Записаться в вейтлист
#assistant #text2image #chatbot
По сообщению реддитора, Stability AI тестируют чат-бота с бета-версией #SD3
Записаться в вейтлист
#assistant #text2image #chatbot
🔥8
Forwarded from Ai molodca (Dobrokotov)
This media is not supported in your browser
VIEW IN TELEGRAM
Ох, ребята, иногда у меня подгорает с твиттерских "аи-блогеров" (ex. криптобро), обожающих бомбить громкими заголовками ради репостов, не проверяя информацию, а потом это мощно тиражируется.
Люди на видео реальны, вы даже можете нанять их, чтобы сделать видео здесь, например:
https://fiverr.com/amarie1717
Другими словами, "стартап", получил лицензию на нескольких людей "говорилок" и подключил HeyGen (пруф) для их анимации/кастомизации.
Все.
😁5❤1👍1
Кто хотел попробовать AniPortrait?
Держите подгон
Демо
Колаб
AniPortrait for windows - работает на 11GB VRAM
#image2video #talkinghead #speech2video
Держите подгон
Демо
Колаб
AniPortrait for windows - работает на 11GB VRAM
#image2video #talkinghead #speech2video
Telegram
Нейронавт | Нейросети в творчестве
AniPortrait: Audio-Driven Synthesis of Photorealistic Portrait Animations
Анимация портрета по звуку речи. Для референса мимики можно еще и видео на вход подать
Код
#image2video #talkinghead #speech2video
Анимация портрета по звуку речи. Для референса мимики можно еще и видео на вход подать
Код
#image2video #talkinghead #speech2video
👍2
This media is not supported in your browser
VIEW IN TELEGRAM
BrushNet : A Plug-and-Play Image Inpainting Model with Decomposed Dual-Branch Diffusion
Плагин к диффузным моделям для инпейнтинга по попиксельной маске
Код
Демо
#inpainting
Плагин к диффузным моделям для инпейнтинга по попиксельной маске
Код
Демо
#inpainting
👍7
This media is not supported in your browser
VIEW IN TELEGRAM
DesignEdit: Multi-Layered Latent Decomposition and Fusion for Unified & Accurate Image Editing
Microsoft изобрел еще одну модель для манипуляций с изображением. Главное, что опенсорс, и можно сразу попробовать
Код
#imageediting #image2image #inpainting
Microsoft изобрел еще одну модель для манипуляций с изображением. Главное, что опенсорс, и можно сразу попробовать
Код
#imageediting #image2image #inpainting
❤6👍4
This media is not supported in your browser
VIEW IN TELEGRAM
ObjectDrop: Bootstrapping Counterfactuals for Photorealistic Object Removal and Insertion
Google тоже кое-что придумал. Фотореалистичное удаление и вставка объектов. Но пока есть только сайт и препринт
#inpainting
Google тоже кое-что придумал. Фотореалистичное удаление и вставка объектов. Но пока есть только сайт и препринт
#inpainting
👍5
Structure Reference
Adobe выкатили свой Controlnet в Firefly.
Меня туда не пускают. родился не в той стране
#textimage #image2image #conditioning
Adobe выкатили свой Controlnet в Firefly.
Меня туда не пускают. родился не в той стране
#textimage #image2image #conditioning
😭7💩1
Нейронавт | Нейросети в творчестве
Обновился генератор 3D объектов Rodin Gen-1 На видео сравнение с предыдущей версией. Авторы претендуют ни много ни мало на роль Sora в 3D. Уже можно записаться в вейтлист #tetxtto3D #text2scene #realtime
Пришло приглашение в бету 3D генератора Rodin Gen-1
Вернее, письмо о том что меня выбрали для бета теста, но перед этим надо пройти опросник. Внимательно читайте условия в опроснике чтобы вас не кикнули с беты.
Ну а если вы еще не вписались, попробуйте:
записаться в вейтлист
#tetxtto3D #text2scene #realtime
Вернее, письмо о том что меня выбрали для бета теста, но перед этим надо пройти опросник. Внимательно читайте условия в опроснике чтобы вас не кикнули с беты.
Ну а если вы еще не вписались, попробуйте:
записаться в вейтлист
#tetxtto3D #text2scene #realtime
❤1