DiffPortrait360: Consistent Portrait Diffusion for 360 View Synthesis
Вид головы с любой стороны по одному входному портрету.
Код ждем
Демо ждем
#head #novelview
Вид головы с любой стороны по одному входному портрету.
Код ждем
Демо ждем
#head #novelview
👍8
Hi3DGen: High-fidelity 3D Geometry Generation from Images via Normal Bridging
Генератор 3D моделей по изображению через оценку нормалей
Файнтюн Trellis
Код ждем
Демо
#imageto3d #image2normal
Генератор 3D моделей по изображению через оценку нормалей
Файнтюн Trellis
Код ждем
Демо
#imageto3d #image2normal
👍8🔥5
This media is not supported in your browser
VIEW IN TELEGRAM
DAI: Dereflection Any Image with Diffusion Priors and Diversified Data
Удаление отражений с изображений
В этой области помню только StableDelight
Код
Демо
Колаб
#reflectionremoval #image2image
Удаление отражений с изображений
В этой области помню только StableDelight
Код
Демо
Колаб
#reflectionremoval #image2image
👍12
😁17🔥4🎃2👍1
mirage-ghibli
Гиблификация быстрее и дешевле чем в ChatGPT
Лора Flux.dev
Должно работать прямо на HF но не работает
У авторов есть офсайт с анонсом ИИ-фоторамки с гиблификацией. Регаетесь в вейтлист, постите реферральную ссылку в свой канал и становитесь участником розыгрыша фоторамки стоимостью $160
#stylize #image2image #lora
Гиблификация быстрее и дешевле чем в ChatGPT
Лора Flux.dev
Должно работать прямо на HF но не работает
У авторов есть офсайт с анонсом ИИ-фоторамки с гиблификацией. Регаетесь в вейтлист, постите реферральную ссылку в свой канал и становитесь участником розыгрыша фоторамки стоимостью $160
#stylize #image2image #lora
👍6
This media is not supported in your browser
VIEW IN TELEGRAM
DeepSite
Кодинг в браузере на базе DeepSeek-V3-0324
Сразу можно и хостить созданное приложение
#vibecoding #coding
Кодинг в браузере на базе DeepSeek-V3-0324
Сразу можно и хостить созданное приложение
#vibecoding #coding
👍11🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
VideoMind: A Chain-of-LoRA Agent for Long Video Reasoning
Пониматор видео, мультимодальный агентный фреймворк, который улучшает понимание видеое за счет имитации человекоподобных процессов, таких как разбиение задач, локализация и проверка моментов, а также синтез ответов. Этот подход решает уникальные проблемы, связанные с рассуждениями, основанными на времени
Код
Демо
HF
#vlm #reasoning
Пониматор видео, мультимодальный агентный фреймворк, который улучшает понимание видеое за счет имитации человекоподобных процессов, таких как разбиение задач, локализация и проверка моментов, а также синтез ответов. Этот подход решает уникальные проблемы, связанные с рассуждениями, основанными на времени
Код
Демо
HF
#vlm #reasoning
👍8
This media is not supported in your browser
VIEW IN TELEGRAM
TripoSG / TripoSF
Новые модели Tripo
TripoSG 1.5B преобразует картинку в меш
TripoSF работает с более сложными топологиями/сценами, может моделировать внутренние детали объектов
Гитхаб
Веса
Демо
#imageto3d
Новые модели Tripo
TripoSG 1.5B преобразует картинку в меш
TripoSF работает с более сложными топологиями/сценами, может моделировать внутренние детали объектов
Гитхаб
Веса
Демо
#imageto3d
👍8❤3
This media is not supported in your browser
VIEW IN TELEGRAM
CFG-Zero★: Improved Classifier-Free Guidance for Flow Matching Models
улучшенный метод генерации картинок и видео вместо обычного CFG, который направляет генерацию по неправильному пути.
Поддерживает wan2.1-14B генерацию видео по картинке, а также Flux, SD, Lumina
Уже есть в #ComfyUI нодах Kijai
Код
Демо
#text2image #image2image #image2video #text2video
улучшенный метод генерации картинок и видео вместо обычного CFG, который направляет генерацию по неправильному пути.
Поддерживает wan2.1-14B генерацию видео по картинке, а также Flux, SD, Lumina
Уже есть в #ComfyUI нодах Kijai
Код
Демо
#text2image #image2image #image2video #text2video
👍11❤1
This media is not supported in your browser
VIEW IN TELEGRAM
TokenHSI: Unified Synthesis of Physical Human-Scene Interactions through Task Tokenization
унифицированная модель, которая позволяет персонажам, основанным на физике, выполнять разнообразные задачи взаимодействия человека со сценой. Для 3D персонажей и роботов
Код ждем
#HSI #humananimation
унифицированная модель, которая позволяет персонажам, основанным на физике, выполнять разнообразные задачи взаимодействия человека со сценой. Для 3D персонажей и роботов
Код ждем
#HSI #humananimation
👍9
This media is not supported in your browser
VIEW IN TELEGRAM
Не прошло и года с июля 2024
Опубликован код и веса (~8Гб) GenXD - генератора 3D и 4D (с движением) сцен по одному или нескольким ракурсам
Код
Веса
#videoto3d #videoto4d
Опубликован код и веса (~8Гб) GenXD - генератора 3D и 4D (с движением) сцен по одному или нескольким ракурсам
Код
Веса
#videoto3d #videoto4d
❤3👍1