Mistral-Small-3.1
Производительная ( 150 токенов в секунду) мультимодалка от Mistral на 24B параметров, контекст 128K.
Мультиязычная, платформа для продвинутых рассуждений. Визуальные задачи, агентные.
В квантизованном виде влезет на RTX 4090 или 32GB RAM MacBook
Веса Base
Веса Instruct
API
#assistant #reasoning #vlm
Производительная ( 150 токенов в секунду) мультимодалка от Mistral на 24B параметров, контекст 128K.
Мультиязычная, платформа для продвинутых рассуждений. Визуальные задачи, агентные.
В квантизованном виде влезет на RTX 4090 или 32GB RAM MacBook
Веса Base
Веса Instruct
API
#assistant #reasoning #vlm
👍13🔥4
VideoPainter: Any-length Video Inpainting and Editing with Plug-and-Play Context Control
Инпейнтинг видео любой длины с контролем контекста. От Tencent.
Умеет не только заполнять заданные области, но и заменять объекты по текстовому промпту.
Судя по сравнениям уделывает ProPainter одной левой. Но зачем они выставили кейс с заменой девушки на Энн Хэтеуэй, ведь это провал?
Код
Веса
#inpainting #videoediting
Инпейнтинг видео любой длины с контролем контекста. От Tencent.
Умеет не только заполнять заданные области, но и заменять объекты по текстовому промпту.
Судя по сравнениям уделывает ProPainter одной левой. Но зачем они выставили кейс с заменой девушки на Энн Хэтеуэй, ведь это провал?
Код
Веса
#inpainting #videoediting
👍4❤1🔥1
DDCM: Compressed Image Generation with Denoising Diffusion Codebook Models
Метод генерации и реставрации изображений
Код ждем
Демо
#text2image #imagerestoration #enhance #facerestoration #upscale #image2image
Метод генерации и реставрации изображений
Код ждем
Демо
#text2image #imagerestoration #enhance #facerestoration #upscale #image2image
👍4
Forwarded from CGIT_Vines (Marvin Heemeyer)
Andrew Price затестил текущие модели для генерации 3D. Тест не идеальный, так как некоторые игроки не представлены на тестах. Но, тем не менее, это дает представление о текущем положении дел.
Главное — помнить, что где-то использовались PRO-версии генераторов, которые, как я подозреваю, просто наваливают больше геометрии, и точность вырастает именно из-за этого. Стоит ли пользоваться или переживать — решать вам.
Главное — помнить, что где-то использовались PRO-версии генераторов, которые, как я подозреваю, просто наваливают больше геометрии, и точность вырастает именно из-за этого. Стоит ли пользоваться или переживать — решать вам.
👍7🔥1👏1
ReCamMaster: Camera-Controlled Generative Rendering from A Single Video
Изменяем траекторию камеры для видео, получаем то же видео с другого ракурса.
Применимо для 4D реконструкций, стабилизации видео, обучения роботов и автопилотов
Код ждем (но это неточно)
Демо - сюда загружаем свое видео, ждем пока его обработают и пришлют вам на почту.
Варианты движения камеры такие:
1 Pan Right
2 Pan Left
3 Tilt Up
4 Tilt Down
5 Zoom In
6 Zoom Out
7 Translate Up (with rotation)
8 Translate Down (with rotation)
9 Arc Left (with rotation)
10 Arc Right (with rotation)
#cameracontrol #novelview #video2video #stabilization
Изменяем траекторию камеры для видео, получаем то же видео с другого ракурса.
Применимо для 4D реконструкций, стабилизации видео, обучения роботов и автопилотов
Код ждем (но это неточно)
Демо - сюда загружаем свое видео, ждем пока его обработают и пришлют вам на почту.
Варианты движения камеры такие:
1 Pan Right
2 Pan Left
3 Tilt Up
4 Tilt Down
5 Zoom In
6 Zoom Out
7 Translate Up (with rotation)
8 Translate Down (with rotation)
9 Arc Left (with rotation)
10 Arc Right (with rotation)
#cameracontrol #novelview #video2video #stabilization
👍9
Gemini Image Editing NextJS Quickstart
Официальный шаблон интеграции в ваш сервис редактора/генератора картинок Gemini 2.0 Flash
Вот например в Freepik уже прикручено
Демо, и даже без впн
Код
#assistant #mlm #vlm #imageediting #text2image
Официальный шаблон интеграции в ваш сервис редактора/генератора картинок Gemini 2.0 Flash
Вот например в Freepik уже прикручено
Демо, и даже без впн
Код
#assistant #mlm #vlm #imageediting #text2image
❤4🔥1
Проверьте почту если записывались в вейтлист Mago
Не уверен что такой перенос стиля на видео будет актуален при всех возможностях видеогенераторов которые нам уже доступны.
Но посмотрим что сможет предложить Mago
#news #styletransfer
Не уверен что такой перенос стиля на видео будет актуален при всех возможностях видеогенераторов которые нам уже доступны.
Но посмотрим что сможет предложить Mago
#news #styletransfer
👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Stable Virtual Camera (Seva): Multi-View Video Generation with 3D Camera Control
Генератор видео по картинке с контролем камеры от Stability AI. На вход от 1 до 32 картинок. Камера идет по заданной пользователем траектории
1.3B параметров
Обещают консисентность вплоть до бесшовного зацикливания если камера возвращается в ту же точку. Причем 1000 кадров как с куста
Код
Демо
#cameracontrol #image2video #image2scene #novelview
Генератор видео по картинке с контролем камеры от Stability AI. На вход от 1 до 32 картинок. Камера идет по заданной пользователем траектории
1.3B параметров
Обещают консисентность вплоть до бесшовного зацикливания если камера возвращается в ту же точку. Причем 1000 кадров как с куста
Код
Демо
#cameracontrol #image2video #image2scene #novelview
🔥8👍4❤1