This media is not supported in your browser
VIEW IN TELEGRAM
Локальный Qwen 2.5 Omni распознает аккорды по звуку с микрофона
Сделано в Gabber - Real-time AI Engine
Реддит
#assistant #music2text #realtime
Сделано в Gabber - Real-time AI Engine
Реддит
#assistant #music2text #realtime
👍11
This media is not supported in your browser
VIEW IN TELEGRAM
Distilled-3DGS: Distilled 3D Gaussian Splatting
Сокращает примерно в десять раз количество гауссиан необходимых для высококачественного рендеринга сцен, без потери качества изображения.
Обеспечивает качество рендеринга, сравнимое с лучшими существующими методами (#SOTA) или даже превосходящее их
Код ждем
#gaussian #rendering #novelview
Сокращает примерно в десять раз количество гауссиан необходимых для высококачественного рендеринга сцен, без потери качества изображения.
Обеспечивает качество рендеринга, сравнимое с лучшими существующими методами (#SOTA) или даже превосходящее их
Код ждем
#gaussian #rendering #novelview
1👍12🔥4
MagicTryOn: Harnessing Diffusion Transformer for Garment-Preserving Video Virtual Try-on
Видеопримерочная на VideoX-Fun / Wan2.1-I2V-14B
Для описания одежды используют Qwen2.5-VL-7B-Instruct.
Ну и еще там под капотом openpose, densepose и прочее.
Короче если ктото хотел затюнить WAN 2.1 под примерку то вот оно
Код
#tryon #image2video
Видеопримерочная на VideoX-Fun / Wan2.1-I2V-14B
Для описания одежды используют Qwen2.5-VL-7B-Instruct.
Ну и еще там под капотом openpose, densepose и прочее.
Короче если ктото хотел затюнить WAN 2.1 под примерку то вот оно
Код
#tryon #image2video
👍7❤2
OmniTry: Virtual Try-On Anything without Masks
Еще примерочная. Работает не только с одеждой, но и с аксессуарами
Под капотом FLUX.1-Fill-dev и лора. Вот так новый продукт делают, оказывается👀
В BF16 требует 28Гб VRAM
Потыкал - смотрите сами что вышло
Код
Демо
#tryon
Еще примерочная. Работает не только с одеждой, но и с аксессуарами
Под капотом FLUX.1-Fill-dev и лора. Вот так новый продукт делают, оказывается
В BF16 требует 28Гб VRAM
Потыкал - смотрите сами что вышло
Код
Демо
#tryon
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
😁5👍4❤1
Tripо 3.0
Обновка 3D генератора.
Под капотом TripoSF - не знаю та ли версия что была выложена в марте.
Картинки генерятся силами Flux Kontext и GPT-4o
#SOTA PBR текстуры
Обещают сделать 3D видеогенератор
Попробовать
#3d #textto3d #imageto3d #pbr
Обновка 3D генератора.
Под капотом TripoSF - не знаю та ли версия что была выложена в марте.
Картинки генерятся силами Flux Kontext и GPT-4o
#SOTA PBR текстуры
Обещают сделать 3D видеогенератор
Попробовать
#3d #textto3d #imageto3d #pbr
❤3👍2🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
Made by Google ‘25
Идет презентация Google.
—————————
Google Photos внедряет новую функцию редактирования изображений с помощью ИИ. Пользователи смогут описывать желаемые изменения текстом или голосом, а Gemini будет вносить правки автоматически. Сначала функция появится на Pixel 10 в США. Также в Google Photos добавят поддержку C2PA Content Credentials — это позволит видеть, как изображение было отредактировано с помощью ИИ. Редизайн редактора уже упрощает редактирование, предлагая AI-подсказки и объединяя инструменты в одном месте. С новой функцией можно будет делать как корректирующие правки (например, убрать отвлекающие элементы или исправить освещение), так и более креативные изменения (поменять фон, добавить предметы и т. д.).
#news #imageediting
Идет презентация Google.
—————————
Google Photos внедряет новую функцию редактирования изображений с помощью ИИ. Пользователи смогут описывать желаемые изменения текстом или голосом, а Gemini будет вносить правки автоматически. Сначала функция появится на Pixel 10 в США. Также в Google Photos добавят поддержку C2PA Content Credentials — это позволит видеть, как изображение было отредактировано с помощью ИИ. Редизайн редактора уже упрощает редактирование, предлагая AI-подсказки и объединяя инструменты в одном месте. С новой функцией можно будет делать как корректирующие правки (например, убрать отвлекающие элементы или исправить освещение), так и более креативные изменения (поменять фон, добавить предметы и т. д.).
#news #imageediting
⚡3👀2
4DNeX: Feed-Forward 4D Generative Modeling Made Easy
Генератор 4D-сцен (динамические 3D-сцены) из одного изображения или видео. Позволяет смотреть на изображение или видео с новых ракурсов/
Под капотом затюненный диффузный видеогенератор
Работает с единым 6D-представлением видео - для каждой RGB точки известны ее XYZ координаты
Код ждем
#4d #imageto4d #videoto4d #image2depth #video2depth
Генератор 4D-сцен (динамические 3D-сцены) из одного изображения или видео. Позволяет смотреть на изображение или видео с новых ракурсов/
Под капотом затюненный диффузный видеогенератор
Работает с единым 6D-представлением видео - для каждой RGB точки известны ее XYZ координаты
Код ждем
#4d #imageto4d #videoto4d #image2depth #video2depth
👍6❤2👎2
DiT4SR: Taming Diffusion Transformer for Real-World Image Super-Resolution
Наш чатик принес прекрасное.
Повышение разрешения и четкости изображений реального мира.
Работает с текстовым промптом, для этого в демо есть LLAVA
Склонен в светлых областях съедать яркость. Это пока все к чему я могу придраться не считая лого Адидас
Код
Демо
Спасибо @iNevestenko
#superresolution #upscale #imagerestoration
Наш чатик принес прекрасное.
Повышение разрешения и четкости изображений реального мира.
Работает с текстовым промптом, для этого в демо есть LLAVA
Склонен в светлых областях съедать яркость. Это пока все к чему я могу придраться не считая лого Адидас
Код
Демо
Спасибо @iNevestenko
#superresolution #upscale #imagerestoration
🔥12👍5🤔1