Kolors IP-Adapter-Plus
В репозитории Kwai-Kolors опубликован код обучения и веса IP-Adapter-Plus для базовой модели Kolors.
Теперь можно даже тренить свои айпиадаптеры
Гитхаб
ComfyUI
Вокрфлоу
#text2image #conditioning #personalization
В репозитории Kwai-Kolors опубликован код обучения и веса IP-Adapter-Plus для базовой модели Kolors.
Теперь можно даже тренить свои айпиадаптеры
Гитхаб
ComfyUI
Вокрфлоу
#text2image #conditioning #personalization
❤8👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Ultralytics upscaler
Tile-upscaler завезли на бесплатный сервис tost.ai
Здесь он называется Ultralytics upscaler
А чтобы им воспользоваться, надо выбрать в меню Upscaler 2.0
Да, вот так 🤷♂️
#upscale
Tile-upscaler завезли на бесплатный сервис tost.ai
Здесь он называется Ultralytics upscaler
А чтобы им воспользоваться, надо выбрать в меню Upscaler 2.0
Да, вот так 🤷♂️
#upscale
🔥10👍4
Media is too big
VIEW IN TELEGRAM
👍5🥴3⚡1👎1🔥1
Media is too big
VIEW IN TELEGRAM
Shape of Motion: 4D Reconstruction from a Single Video
Вам понравится.
Реконструкция динамической 3D сцены по видео с одного ракурса. Реконструкция построена на объединении точек в жесткие группы по векторам движения, трекинге, оценке глубины.
Код
#videoto3d #video2scene #video2video #novelview
Вам понравится.
Реконструкция динамической 3D сцены по видео с одного ракурса. Реконструкция построена на объединении точек в жесткие группы по векторам движения, трекинге, оценке глубины.
Код
#videoto3d #video2scene #video2video #novelview
❤7🔥6👍3
Media is too big
VIEW IN TELEGRAM
Streetscapes: Large-scale Consistent Street View Generation Using Autoregressive Video Diffusion
Шикарный проект студентов-исследователей Google Research.
Генератор видео проездов по улицам по входным картам.
Может интерполировать набор картинок Google Street (или просто набор фото локации) в длинное видео. Автор еще по видео собирает #nerf - на видео справа
Текстовым промптом можно задать нужные погодные условия, время суток, антураж города.
Представьте, у вас есть сцена проезда на автомобиле, снятая на хромаке, а подходящего задника не хватает. Расчехляете Streetscapes и вперед собирать идеальный задник (пустой улицы)
К сожалению без кода
#map2video #map2scene #image2video
Шикарный проект студентов-исследователей Google Research.
Генератор видео проездов по улицам по входным картам.
Может интерполировать набор картинок Google Street (или просто набор фото локации) в длинное видео. Автор еще по видео собирает #nerf - на видео справа
Текстовым промптом можно задать нужные погодные условия, время суток, антураж города.
Представьте, у вас есть сцена проезда на автомобиле, снятая на хромаке, а подходящего задника не хватает. Расчехляете Streetscapes и вперед собирать идеальный задник (пустой улицы)
К сожалению без кода
#map2video #map2scene #image2video
❤5👍2
😁18👍1
Media is too big
VIEW IN TELEGRAM
StyleSplat: 3D Object Style Transfer with Gaussian Splatting
Стилизация 3D объектов на гауссианах по референсу стиля.
Код ждем
#styletrasfer #gaussian
Стилизация 3D объектов на гауссианах по референсу стиля.
Код ждем
#styletrasfer #gaussian
👍6❤1
PowerPaint v2
Обновка прошлогоднего инпейнтера/оуатпейнтера.
Обновили веса, код и веса полностью в аутсорсе, что-то допили по UI в gradio.
#inpainting #outpainting
Обновка прошлогоднего инпейнтера/оуатпейнтера.
Обновили веса, код и веса полностью в аутсорсе, что-то допили по UI в gradio.
#inpainting #outpainting
👍12
Live2Diff: Live Stream Translation via Uni-directional Attention in Video Diffusion Models
Стилизация видео в реальном времени, 512*512, 16 кадров в секунду на RTX 4090
Код
Демо
#video2video #realtime #stylization
Стилизация видео в реальном времени, 512*512, 16 кадров в секунду на RTX 4090
Код
Демо
#video2video #realtime #stylization
👍9👎1
This media is not supported in your browser
VIEW IN TELEGRAM
Follow-Your-Emoji: Fine-Controllable and Expressive Freestyle Portrait Animation
Портретный оживлятор обзавелся кодом и колаб ноутбуком с WebUI
Код
Колаб
#image2video #humananimation #pose2video
Портретный оживлятор обзавелся кодом и колаб ноутбуком с WebUI
Код
Колаб
#image2video #humananimation #pose2video
❤2
Forwarded from Data Secrets
Как вы помните, вчера модель слили на 4chan. А ночью в сеть просочились и бенчмарки. Выглядит очень сочно, на многих тестах моделька обгоняет даже взрослую GPT-4o.
Вместе с llama 3.1 на 405В параметров выходят 3.1 на 70В и на 8В. Посмотрите в таблице, какой у них мощный прирост относительно обычных троек на то же количество параметров. Есть предположение, что это получилось потому что это не дотренированные или дотюненные с нуля модели, а дестилляции моделей покрупнее.
То есть ученые не сразу обучили модель с 70В или 8В параметрами, а обучили модель с Х параметрами, где Х>>8/70В, а потом провели дистилляцию. Очень интересный подход.
Кажется, у нас наконец будет опенсорс уровня GPT-4o
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥16👍4😐1
This media is not supported in your browser
VIEW IN TELEGRAM
PhotoMaker V2
Обновка фоторедактора от Tencent.
Повысили точность, улучшили контроль.
Есть скрипты для интеграции ControlNet, T2I-Adapter, IP-Adapter.
Можно прикрутить LCM, IP-Adapter-FaceID, InstantID
Код
Демо
#personalization #faceswap #image2image #imageediting #stylization
Обновка фоторедактора от Tencent.
Повысили точность, улучшили контроль.
Есть скрипты для интеграции ControlNet, T2I-Adapter, IP-Adapter.
Можно прикрутить LCM, IP-Adapter-FaceID, InstantID
Код
Демо
#personalization #faceswap #image2image #imageediting #stylization
👍11
SD3 снова разрешен на Civitai после запрета
Но только размещение. Генерировать в #SD3 на сайте не дадут.
#news
Но только размещение. Генерировать в #SD3 на сайте не дадут.
#news
🔥7🤔2