LIA-X: Interpretable Latent Portrait Animator
Оживлятор портретов по видеообразцу.
Позволяет также редактировать изображения и видео.
Умеет менять ракурс на персонажа в 3D пространстве.
Разбирает движения лица на простые элементы.
Контроль глаз, рта.
Похоже что проект на своей модели, нет упоминаний ни WAN, ни CogVideo, ничего такого
Код
Демо
Веса - 3.6 Gb
#portrainanimation #motion2video #imageediting #videoediting
Оживлятор портретов по видеообразцу.
Позволяет также редактировать изображения и видео.
Умеет менять ракурс на персонажа в 3D пространстве.
Разбирает движения лица на простые элементы.
Контроль глаз, рта.
Похоже что проект на своей модели, нет упоминаний ни WAN, ни CogVideo, ничего такого
Код
Демо
Веса - 3.6 Gb
#portrainanimation #motion2video #imageediting #videoediting
1🔥8👍3🥴1
Please open Telegram to view this post
VIEW IN TELEGRAM
😁12
DINOv3: Self-supervised learning for vision at unprecedented scale
Новая версия модели от запрещенной в РФ Meta AI
Модель универсальная, подходит почти для любых задач компьютерного зрения: детекция, сегментация, предсказание глубины, плотности
Использует метод самообучения (SSL) без необходимости в данных с метками, что позволяет ей обучаться на огромных объёмах изображений без человеческого участия.
Благодаря этому превосходит даже специализированные модели
Есть несколько вариантов весов под разные вычислительные мощности
Гитхаб
HF
#image2depth #segmentation #video2mask #video2depth
Новая версия модели от запрещенной в РФ Meta AI
Модель универсальная, подходит почти для любых задач компьютерного зрения: детекция, сегментация, предсказание глубины, плотности
Использует метод самообучения (SSL) без необходимости в данных с метками, что позволяет ей обучаться на огромных объёмах изображений без человеческого участия.
Благодаря этому превосходит даже специализированные модели
Есть несколько вариантов весов под разные вычислительные мощности
Гитхаб
HF
#image2depth #segmentation #video2mask #video2depth
🔥8👍2❤1
Пришло письмо счастья от ИИ-генератора песен Producer AI
Проверьте почту
Есть голосовой режим, назовем его вайб-композинг. Пытался ему напеть мелодию, но он, похоже, переводит все в текст. Сказал что слышит ритм. Но в генерации ничего похожего. Но это я играл в лентяя. На самом деле можно и загрузить кусок музыки, и записать в микрофон звук, только не в голосовом режиме
Да, выдали один инвайт, поделюсь в коментах
Накидывайте свои генерации и инвайты в коменты
Producer.ai
#music #musicediting #text2music #agent #assistant
Проверьте почту
Есть голосовой режим, назовем его вайб-композинг. Пытался ему напеть мелодию, но он, похоже, переводит все в текст. Сказал что слышит ритм. Но в генерации ничего похожего. Но это я играл в лентяя. На самом деле можно и загрузить кусок музыки, и записать в микрофон звук, только не в голосовом режиме
Да, выдали один инвайт, поделюсь в коментах
Накидывайте свои генерации и инвайты в коменты
Producer.ai
#music #musicediting #text2music #agent #assistant
👍4👎1
This media is not supported in your browser
VIEW IN TELEGRAM
wan2_2_14B_fun_control_pose
Просто еще один воркфлоу #WAN22 FUN с контролем позы
Веса можно взять тут
Воркфлоу
#pose2video #workflow
Просто еще один воркфлоу #WAN22 FUN с контролем позы
Веса можно взять тут
Воркфлоу
#pose2video #workflow
👍14
Self-Forcing: Making AI Video Generation Endless
Эксперимент по достижению бесконечной видеогенерации без деградации.
Для эксперимента автор выбрал архитектуру Self-Forcing
Контекст Self-Forcing ограничен 81 кадром, что жестко прописано в кодовой базе, что автор и пытался преодолеть.
В процессе ему удалось реализовать интересную идею: редактирование видео в реальном времени, вернее на лету, в процессе генерации
И выложил все в опенсорс
Требования: 24Gb VRAM, 64Gb RAM, Linux
Гитхаб
Реддит
#optimization #video2video #videoediting #realtime #text2video
Эксперимент по достижению бесконечной видеогенерации без деградации.
Для эксперимента автор выбрал архитектуру Self-Forcing
Контекст Self-Forcing ограничен 81 кадром, что жестко прописано в кодовой базе, что автор и пытался преодолеть.
В процессе ему удалось реализовать интересную идею: редактирование видео в реальном времени, вернее на лету, в процессе генерации
И выложил все в опенсорс
Требования: 24Gb VRAM, 64Gb RAM, Linux
Гитхаб
Реддит
#optimization #video2video #videoediting #realtime #text2video
🔥7👍5
Hunyuan World Model 1.0-Lite
Облегченная версия генератора 3D миров HunyuanWorld-1.0
Требования к VRAM снизили с 26 до 17 ГБ благодаря FP8-квантованию. Ну могли бы и до 16 уж дотянуть🤩
SageAttention уже прикручен.
Гитхаб
Hugging Face
Демо
#text2world #image2world #text2panorama #image2panorama #360 #text2scene #image2scene #world
Облегченная версия генератора 3D миров HunyuanWorld-1.0
Требования к VRAM снизили с 26 до 17 ГБ благодаря FP8-квантованию. Ну могли бы и до 16 уж дотянуть
SageAttention уже прикручен.
Гитхаб
Hugging Face
Демо
#text2world #image2world #text2panorama #image2panorama #360 #text2scene #image2scene #world
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍11❤1😁1
Qwen-Image-Edit: Image Editing with Higher Quality and Efficiency
Редактирующая модель #qwenimage опубликована
Семантическое и визуальное редактирование: модель поддерживает как низкоуровневое редактирование внешнего вида (добавление, удаление или изменение элементов с сохранением остальных частей изображения), так и высокоуровневое семантическое редактирование (создание интеллектуальной собственности, поворот объектов, перенос стиля).
Точное редактирование текста: возможность добавлять, удалять и изменять текст на изображениях на китайском и английском языках с сохранением шрифта, размера и стиля.
Гитхаб
HF ~57 Gb, смотрите не надорвитесь
Попробовать в чате
#imageediting
Редактирующая модель #qwenimage опубликована
Семантическое и визуальное редактирование: модель поддерживает как низкоуровневое редактирование внешнего вида (добавление, удаление или изменение элементов с сохранением остальных частей изображения), так и высокоуровневое семантическое редактирование (создание интеллектуальной собственности, поворот объектов, перенос стиля).
Точное редактирование текста: возможность добавлять, удалять и изменять текст на изображениях на китайском и английском языках с сохранением шрифта, размера и стиля.
Гитхаб
HF ~57 Gb, смотрите не надорвитесь
Попробовать в чате
#imageediting
👍12🔥6😁2❤1🤯1