В Krea.ai завезли вчерашний Kling 2.0
На бесплатном аккаунте не потестить, разве что на новом если при регистрации дают приветственные кредиты
#text2video #image2video #text2image
На бесплатном аккаунте не потестить, разве что на новом если при регистрации дают приветственные кредиты
#text2video #image2video #text2image
👍4
OpenAI выпустили новые модели o3 и o4-mini
o3 самая мощная
o4-mini быстрая и дешевая
Модели "думают с картинками" - интегрируют визуальную информацию в процесс рассуждений
Самостоятельно используют все инструменты ChatGPT (веб-поиск, Python, генерацию изображений)
Решают сложные многоэтапные задачи без помощи человека
Доступ сначала дадут платным подписанам и разрабам в API
#news #assistant
o3 самая мощная
o4-mini быстрая и дешевая
Модели "думают с картинками" - интегрируют визуальную информацию в процесс рассуждений
Самостоятельно используют все инструменты ChatGPT (веб-поиск, Python, генерацию изображений)
Решают сложные многоэтапные задачи без помощи человека
Доступ сначала дадут платным подписанам и разрабам в API
#news #assistant
❤3👍3
В инпейнтер картинок LanPaint добавлена поддержка генератора картинок HiDream
Для установки в #ComfyUI следуйте инструкции
Гитхаб
#inpainting #image2image
Для установки в #ComfyUI следуйте инструкции
Гитхаб
#inpainting #image2image
Telegram
Нейронавт | Нейросети в творчестве
LanPaint
Точный инпейнтинг, заставляющий модель "думать" перед итерациями денойза.
Не требует дообучения.
Работает с любой моделью SD, в том числе с лорами
Есть ноды #ComfyUI
Гитхаб
Воркфлоу
#inpainting #image2image
Точный инпейнтинг, заставляющий модель "думать" перед итерациями денойза.
Не требует дообучения.
Работает с любой моделью SD, в том числе с лорами
Есть ноды #ComfyUI
Гитхаб
Воркфлоу
#inpainting #image2image
👍3
HiDream-I1_fp8/fp16
Квантизованная версия
Веса fp8
Веса на ComfyUI fp8/fp16
ComfyUI_examples
#comfyUI #text2image
Квантизованная версия
Веса fp8
Веса на ComfyUI fp8/fp16
ComfyUI_examples
#comfyUI #text2image
👍4❤2👎1🎃1
HiDream-I1-Dev-gguf
Еще квантизованные версии
Работает на RTX3060 с SageAttention и Torch Complie, 768x1344 100s 18steps
Веса
GGUF Loader
TEXT Encoders
VAE
workflow
#workflow #text2image
Еще квантизованные версии
Работает на RTX3060 с SageAttention и Torch Complie, 768x1344 100s 18steps
Веса
GGUF Loader
TEXT Encoders
VAE
workflow
#workflow #text2image
👍8❤1🔥1
Nunchaku v0.2.0
Обновился движок для запуска 4-битных диффузных моделей
Добавлена поддержка нескольких лор и контролнета
На 3060 12gb Flux Dev выдает 1024x1024 30 шагов euler за 14-15 секунд
Код
Демо
ComfyUI
Туториал (youtube)
#text2image #optimization #tutorial
Обновился движок для запуска 4-битных диффузных моделей
Добавлена поддержка нескольких лор и контролнета
На 3060 12gb Flux Dev выдает 1024x1024 30 шагов euler за 14-15 секунд
Код
Демо
ComfyUI
Туториал (youtube)
#text2image #optimization #tutorial
👍12❤5
Media is too big
VIEW IN TELEGRAM
FramePack
Метод генерации длинных (1000+ кадров) видео от звезды опенсорсных моделей lllyasviel
480p @ 30 FPS на 6 ГБ VRAM, Hunyuan 13B
Поддерживает PyTorch, xformers, flash-attn, sage-attention
Ждем однокликовый установщик для Windows, возможно даже завтра
Код
#optimization #text2video #image2video
Метод генерации длинных (1000+ кадров) видео от звезды опенсорсных моделей lllyasviel
480p @ 30 FPS на 6 ГБ VRAM, Hunyuan 13B
Поддерживает PyTorch, xformers, flash-attn, sage-attention
Ждем однокликовый установщик для Windows, возможно даже завтра
Код
#optimization #text2video #image2video
❤25🔥2👍1🤔1
Wan2.1-FLF2V-14B
Выпустили модель генерации видео по первому и последнему кадру, 14B параметров
Только 720p
Веса
Веса у Kijai
Гитхаб
Kijai Workflow
#image2video
Выпустили модель генерации видео по первому и последнему кадру, 14B параметров
Только 720p
Веса
Веса у Kijai
Гитхаб
Kijai Workflow
#image2video
🔥23
InstantCharacter : Personalize Any Characters with a Scalable Diffusion Transformer Framework
Персонализотор картинок по одному образцу от Tencent
Прикручено к Flux, работает с лорами
Код
Демо
#personalization #text2image #image2image
Персонализотор картинок по одному образцу от Tencent
Прикручено к Flux, работает с лорами
Код
Демо
#personalization #text2image #image2image
🔥10
Media is too big
VIEW IN TELEGRAM
LTXVideo 0.9.6
Обновка видеогенератора, две модели
ltxv-2b-0.9.6-dev-04-25 - улучшили качество
ltxv-2b-0.9.6-distilled-04-25 - быстрый как саморазборка старшипа в верхних слоях атмосферы, в 15 раз быстрее недистиллированного брата
Сэмплирование за 8 (рекомендовано), 4, 2 или 1 шаг
Новое разрешение по умолчанию 1216 × 704 @ 30 FPS
воркфлоу
Гитхаб
#image2video #text2video #workflow
Обновка видеогенератора, две модели
ltxv-2b-0.9.6-dev-04-25 - улучшили качество
ltxv-2b-0.9.6-distilled-04-25 - быстрый как саморазборка старшипа в верхних слоях атмосферы, в 15 раз быстрее недистиллированного брата
Сэмплирование за 8 (рекомендовано), 4, 2 или 1 шаг
Новое разрешение по умолчанию 1216 × 704 @ 30 FPS
воркфлоу
Гитхаб
#image2video #text2video #workflow
👍15
This media is not supported in your browser
VIEW IN TELEGRAM
SHeaP: Self-Supervised Head Geometry Predictor Learned via 2D Gaussians
Реконструкция головы по монокулярному видео от Toyota
Модель предсказывает меш и натягивает на него набор гауссиан так чтобы на рендере получить исходную картинку
Кода нет🤩
Спасибо @m_franz
#head #image2head #video2head #videoto4d #video2mesh #image2mesh #gaussian
Реконструкция головы по монокулярному видео от Toyota
Модель предсказывает меш и натягивает на него набор гауссиан так чтобы на рендере получить исходную картинку
Кода нет
Спасибо @m_franz
#head #image2head #video2head #videoto4d #video2mesh #image2mesh #gaussian
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6❤2🔥1
FLUX.1-dev-ControlNet-Union-Pro-2.0
Поддерживает разные режимы включая canny, soft edge, depth, pose, gray
Обучен на 512x512
Демо
#controlnet #conditioning @text2image #image2image
Поддерживает разные режимы включая canny, soft edge, depth, pose, gray
Обучен на 512x512
Демо
#controlnet #conditioning @text2image #image2image
🔥9