Крутанские лоры Qwen-Image от нашего подписчика @Danrisi
Воркфлоу там же
Lenovo_Qwen - бустер реализма, ждем версию под Chrome
adorablegirls_qwen - с фокусом на женскую красоту
Реддит - не скупитесь на лайки
#text2image #lora #workflow
Воркфлоу там же
Lenovo_Qwen - бустер реализма, ждем версию под Chrome
adorablegirls_qwen - с фокусом на женскую красоту
Реддит - не скупитесь на лайки
#text2image #lora #workflow
🔥22👍5❤4👎1
This media is not supported in your browser
VIEW IN TELEGRAM
Pika audio-driven performance model
Оживлятор картинок по звуку от Pika.
В 20 раз быстрее и дешеле предыдущей модели.
Создает видео за 6 секунд.
Похоже что доступно (или будет доступно) только в мобильном приложении
AppStore
#lipsync #portraitanimation #characteranimation #speech2video #mobile #ios
Оживлятор картинок по звуку от Pika.
В 20 раз быстрее и дешеле предыдущей модели.
Создает видео за 6 секунд.
Похоже что доступно (или будет доступно) только в мобильном приложении
AppStore
#lipsync #portraitanimation #characteranimation #speech2video #mobile #ios
👍2
Qwen-Image-Lightning-4steps-V1.0
А вот и четырехшаговая лора Qwen-Image
Гитхаб
Воркфлоу
#workflow #text2image #optimization #lora
А вот и четырехшаговая лора Qwen-Image
Гитхаб
Воркфлоу
#workflow #text2image #optimization #lora
🔥6👍3😁1👨💻1
StableAvatar: Infinite-Length Audio-Driven Avatar Video Generation
🥁🥁🥁 барабанная дробь
И у нас еще один оживлятор картинок по звуку от Microsoft Research Asia, Hunyuan, Tencent
Много примеров с пением, видимо фокус на эту нишу. Но есть и просто речь.
Обещают неограниченный по длительности оживляж с сохранением идентичности персонажа.
Мне кажется или липсинк не такой уж и синк, не попадает в речь?
Ну и конечно есть видео превосходства над #SOTA моделями-конкурентами
Построен на базе Wan2.1-1.3B
Разрешение: 512x512, 480x832, 832x480
5-секундное видео (480x832, fps=25) генерируется 3 минуты на 4090 и требует 18GB VRAM
Код
#lipsync #portraitanimation #characteranimation #speech2video #avatar
🥁🥁🥁 барабанная дробь
И у нас еще один оживлятор картинок по звуку от Microsoft Research Asia, Hunyuan, Tencent
Много примеров с пением, видимо фокус на эту нишу. Но есть и просто речь.
Обещают неограниченный по длительности оживляж с сохранением идентичности персонажа.
Мне кажется или липсинк не такой уж и синк, не попадает в речь?
Ну и конечно есть видео превосходства над #SOTA моделями-конкурентами
Построен на базе Wan2.1-1.3B
Разрешение: 512x512, 480x832, 832x480
5-секундное видео (480x832, fps=25) генерируется 3 минуты на 4090 и требует 18GB VRAM
Код
#lipsync #portraitanimation #characteranimation #speech2video #avatar
👍6🔥4❤1
Jan-v1
Модель для агентского мышления и решения задач, в частности для веб-поиска.
Опенсорсная альтернатива Perplexity
Построена на базе их же модели для мобильного веб-поиска Lucy и Qwen3-4B-thinking
Интегрируется с Jan App или llama.cpp
#macos / #windows / #linux
Веса
Веса GGUF
Гитхаб
#search #GGUF #agent #assistant
Модель для агентского мышления и решения задач, в частности для веб-поиска.
Опенсорсная альтернатива Perplexity
Построена на базе их же модели для мобильного веб-поиска Lucy и Qwen3-4B-thinking
Интегрируется с Jan App или llama.cpp
#macos / #windows / #linux
Веса
Веса GGUF
Гитхаб
#search #GGUF #agent #assistant
👍8❤3🔥3
Matrix-Game 2.0: An Open-Source, Real-Time, and Streaming Interactive World Model
Вторая версия интерактивного генератора игровых миров от Skywork
Работает в реальном времени, 25 fps на A100 / H100, 24ГБ VRAM. Управление клавиатурой и мышью.
Опенсоросный ответ Genie 3
Основан на WanX, но без текстовой ветки, предсказывает следующие кадры только на основе визуала и действий.
Моделирует динамику сцен и создавать длительные видео
Код
HF
#image2world #image2game #realtime
Вторая версия интерактивного генератора игровых миров от Skywork
Работает в реальном времени, 25 fps на A100 / H100, 24ГБ VRAM. Управление клавиатурой и мышью.
Опенсоросный ответ Genie 3
Основан на WanX, но без текстовой ветки, предсказывает следующие кадры только на основе визуала и действий.
Моделирует динамику сцен и создавать длительные видео
Код
HF
#image2world #image2game #realtime
🔥5👍3👎2👨💻1
ViPE: Video Pose Engine for 3D Geometric Perception
Трекер камеры и плотностной глубины видео от NVIDIA.
Скорость 3-5 кадров в секунду, обрабатывает кинематографические шоты, материал с видеорегистраторов и даже панорамы на 360°.
Уже используется в Gen3c и Cosmos. Вот решили выпустить в опенсорс
Под капотом есть Video Depth Anything но для экономии VRAM можно запускать без него с флагом
На сайте проекта есть интерактивный вьюер 4D-облаком точек, полюбопытствуйте
Код
#video2depth #tracking #camera
Трекер камеры и плотностной глубины видео от NVIDIA.
Скорость 3-5 кадров в секунду, обрабатывает кинематографические шоты, материал с видеорегистраторов и даже панорамы на 360°.
Уже используется в Gen3c и Cosmos. Вот решили выпустить в опенсорс
Под капотом есть Video Depth Anything но для экономии VRAM можно запускать без него с флагом
--pipeline no_vdaНа сайте проекта есть интерактивный вьюер 4D-облаком точек, полюбопытствуйте
Код
#video2depth #tracking #camera
👍6🔥3