Stable Diffusion 3 API
Архитектура SD3 еще сырая, и саму модель выкладывать пока не собираются.
Но.
Stability AI открыли зарегистрированным пользователям API доступ к Stable Diffusion 3.
Там каждое телодвижение стоит кредитов. У меня с момента регистрации валяются 25 кредитов. Предполагаю, что и у вас они могут быть. Так что, для тех кто не боится кода - можно попробовать.
Документация
Цены и колаб-ноутбуки
#news #text2image #image2image
Архитектура SD3 еще сырая, и саму модель выкладывать пока не собираются.
Но.
Stability AI открыли зарегистрированным пользователям API доступ к Stable Diffusion 3.
Там каждое телодвижение стоит кредитов. У меня с момента регистрации валяются 25 кредитов. Предполагаю, что и у вас они могут быть. Так что, для тех кто не боится кода - можно попробовать.
Документация
Цены и колаб-ноутбуки
#news #text2image #image2image
❤2
Animatable Gaussians: Learning Pose-dependent Gaussian Mapsfor High-fidelity Human Avatar Modeling
Анимируемые аватары человеков на гауссианах по исходному видео с нескольких ракурсов.
Из входного обучающего видео вытаскивает параметрические заготовки для вида спереди и со спины. Далее для динамического моделирования поз прикручен StyleGAN. Модель подстраивается под одежду, все дела.
И, конечно же,
Код
#humanavatar #gaussian #videoto3D #video2avatar #poseto3D
Анимируемые аватары человеков на гауссианах по исходному видео с нескольких ракурсов.
Из входного обучающего видео вытаскивает параметрические заготовки для вида спереди и со спины. Далее для динамического моделирования поз прикручен StyleGAN. Модель подстраивается под одежду, все дела.
И, конечно же,
Эксперименты показывают, что наш метод превосходит другие современные подходы
Код
#humanavatar #gaussian #videoto3D #video2avatar #poseto3D
🔥10🤯2
OneDiff v1.0.0
Обновка ускорителя SD и SVD OneDiff
Ускорение генерации одной строчкой кода
Гитхаб
#text2image #text2video #tools
Обновка ускорителя SD и SVD OneDiff
Ускорение генерации одной строчкой кода
Гитхаб
#text2image #text2video #tools
❤4
This media is not supported in your browser
VIEW IN TELEGRAM
Dough
Управление генерацией видео через Steerable Motion и Motion Director
Код
Дискорд
#video2video #video2motion #motion2video #conditioning
Управление генерацией видео через Steerable Motion и Motion Director
Код
Дискорд
#video2video #video2motion #motion2video #conditioning
🔥22❤3
This media is not supported in your browser
VIEW IN TELEGRAM
Llama 3
Meta AI выпустили мощную языковую модель. Кроме того что она крутая и бесплатная, она еще умеет шустро рисовать. Но пока только для США
Попробовать здесь (включаем VPN США)
Альтернативная ссылка для всех (только генератор текста)
#assistant #chatbot #text2image #llm #vlm
Meta AI выпустили мощную языковую модель. Кроме того что она крутая и бесплатная, она еще умеет шустро рисовать. Но пока только для США
Попробовать здесь (включаем VPN США)
Альтернативная ссылка для всех (только генератор текста)
#assistant #chatbot #text2image #llm #vlm
👍5
ControlNet++: Improving Conditional Controlswith Efficient Consistency Feedback
Новый улучшенный контролнет.
Новый подход, который улучшает контроль генерации на уровне пикселей.
Доступны модели:
- LineArt
- Depth
- Segmentation
- Hed (SoftEdge)
- Canny
Код
Демо
#conditioning #image2image #text2image
Новый улучшенный контролнет.
Новый подход, который улучшает контроль генерации на уровне пикселей.
Доступны модели:
- LineArt
- Depth
- Segmentation
- Hed (SoftEdge)
- Canny
Код
Демо
#conditioning #image2image #text2image
👍8❤2
Нейронавт | Нейросети в творчестве
Инструкция по запуску SD3 через API в ComfyUI #tutorial #text2image
Basic Stable Diffusion API GUI
А вот оболочка для запуска #SD3 и без ComfyUI
Скачать релиз
#text2image #tools
А вот оболочка для запуска #SD3 и без ComfyUI
Скачать релиз
#text2image #tools
Дисклеймер: я не поддерживаю ни фашизм, ни Гитлера, кейс считаю скандальным.
В Мичигане кто-то ухитрился всунуть изображение Гитлера на биллборд, да еще и написать ему зашифрованное поздравление. Биллборд находится на заправочной станции Marathon
Изображение, очевидно, сделано при помощи Controlnet.
Выглядит как поздравление некоего дяди Ади с 88 восхождением.
На реддите текст расшифровывают так:
88 - Hail Hitler (H - восьмая буква алфавита)
Adi - прозвище сами знаете кого
GDL - лига защиты язычников
GTV - “GoyimTV”, онлайн-видеоканал, управляемый GDL.
ХТ - Jon_Minadeo_II
WLM - White Lives Matter
реддит
#news
В Мичигане кто-то ухитрился всунуть изображение Гитлера на биллборд, да еще и написать ему зашифрованное поздравление. Биллборд находится на заправочной станции Marathon
Изображение, очевидно, сделано при помощи Controlnet.
Выглядит как поздравление некоего дяди Ади с 88 восхождением.
На реддите текст расшифровывают так:
88 - Hail Hitler (H - восьмая буква алфавита)
Adi - прозвище сами знаете кого
GDL - лига защиты язычников
GTV - “GoyimTV”, онлайн-видеоканал, управляемый GDL.
ХТ - Jon_Minadeo_II
WLM - White Lives Matter
реддит
#news
😁9🤡6😱5🍾1
Опубликован код конкурента InstanID, персонализатора FlashFace
Код
Колаб
#personalization #stylization #image2image
Код
Колаб
#personalization #stylization #image2image
😁8👍4❤1
Hyper-SD: Trajectory Segmented Consistency Model for Efficient Image Synthesis
Новый метод дистилляции (ускорения) SD от ByteDance.
Сохраняет качество практически без потерь при сокращении шагов. Что позволяет делать генерацию по эскизу практически в реальном времени
Код/веса
Демо t2i
Демо Scribble
#optimization #text2image #image2image #realtime
Новый метод дистилляции (ускорения) SD от ByteDance.
Сохраняет качество практически без потерь при сокращении шагов. Что позволяет делать генерацию по эскизу практически в реальном времени
Код/веса
Демо t2i
Демо Scribble
#optimization #text2image #image2image #realtime
❤10
AutoCrawler: A Progressive Understanding Web Agent for Web Crawler Generation
Агент для автоматического выполнения заданий в интернете. На основе языковой модели, естественно. Давно жду пригодную модель для этих целей.
Пока есть только экспериментальный код. Авторы планируют адаптировать свою модель к работе с реальными сайтами. Наверно, обучали на игрушечных, я не знаю.
Код
#assistant #agent
Агент для автоматического выполнения заданий в интернете. На основе языковой модели, естественно. Давно жду пригодную модель для этих целей.
Пока есть только экспериментальный код. Авторы планируют адаптировать свою модель к работе с реальными сайтами. Наверно, обучали на игрушечных, я не знаю.
Код
#assistant #agent
😁7❤1
MoMA: Multimodal LLM Adapter for Fast PersonalizedImage Generation
Мультимодальный LLM-адаптер (#MLLM), специализируется на создании персонализированных изображений с учетом тематики.
Умеет редактировать контекст (погода, локация), текстуры.
От кого? Правильно, от ByteDance
Код
Модель
#text2image #text2image
Мультимодальный LLM-адаптер (#MLLM), специализируется на создании персонализированных изображений с учетом тематики.
Умеет редактировать контекст (погода, локация), текстуры.
От кого? Правильно, от ByteDance
Код
Модель
#text2image #text2image
🔥5❤2
This media is not supported in your browser
VIEW IN TELEGRAM
LGM: Large Multi-View Gaussian Model for High-Resolution 3D Content Creation
Генератор 3D моделей по тексту и по одному изображению на гауссианах
Код
Демо
#gaussian #textto3D #imageto3D
Генератор 3D моделей по тексту и по одному изображению на гауссианах
Код
Демо
#gaussian #textto3D #imageto3D
👏6🔥3