Forwarded from Мишин Лернинг
This media is not supported in your browser
VIEW IN TELEGRAM
🛼 Microsoft представили Designer — первый профессиональный Text-to-Image инструмент основанный на DALL•E2
Представьте, “ламантины группой плещутся на закате”. Или “старый слепой китаец красиво делает свое ушу.” Добавьте artstation и 4K, Выберите шрифты и стили, создавайте открытки, постеры, иллюстрации и слайды за мгновения!
Microsoft 🛼 Designer является частью пакета Office 365! То есть он находится в одном ряду с Microsoft Word, Microsoft Excel, и обладает тесной интеграцией с PowerPoint!
А еще вдумайтесь в то, насколько громкое это название — 🛼 Designer! AI революция наступила, это уже не будущее, это уже сейчас.
И изменения ландшафта рабочих мест — лишь одно проявление этой революции. Такие инструменты как 🛼 Designer привнесут AI в массы и сделают Text-to-Image новым стандартом, новой нормой создания визуального контента.
К тому же поговаривают, что скоро в открытом доступе появитсянечто на голову превосходящее DALL•E 2, не говоря уже о стебле . Так что 🛼 Designer не будет единственным таким инструментом.
🛼 Designer (уже можно оставить заявку)
🤖🎓 м и ш и н л е р н и н г
Представьте, “ламантины группой плещутся на закате”. Или “старый слепой китаец красиво делает свое ушу.” Добавьте artstation и 4K, Выберите шрифты и стили, создавайте открытки, постеры, иллюстрации и слайды за мгновения!
Microsoft 🛼 Designer является частью пакета Office 365! То есть он находится в одном ряду с Microsoft Word, Microsoft Excel, и обладает тесной интеграцией с PowerPoint!
А еще вдумайтесь в то, насколько громкое это название — 🛼 Designer! AI революция наступила, это уже не будущее, это уже сейчас.
И изменения ландшафта рабочих мест — лишь одно проявление этой революции. Такие инструменты как 🛼 Designer привнесут AI в массы и сделают Text-to-Image новым стандартом, новой нормой создания визуального контента.
К тому же поговаривают, что скоро в открытом доступе появится
🛼 Designer (уже можно оставить заявку)
🤖🎓 м и ш и н л е р н и н г
👍11🔥3❤1
Forwarded from CGIT_Vines (Marvin Heemeyer)
This media is not supported in your browser
VIEW IN TELEGRAM
Знакомьтесь с генеративной архитектурой. Наконец-то можно будет выбирать дизайн шаурмичной по своему вкусу.
Если честно, это лучшее, что происходило с графикой за последнее время.
С нетерпением жду, когда всё это перейдёт в объём и будет продакшн реди.
Если честно, это лучшее, что происходило с графикой за последнее время.
С нетерпением жду, когда всё это перейдёт в объём и будет продакшн реди.
👍28😢4
Stable diffusion at 1024x512 when you prompt it with "a singular building"
(an actual photo from Iran)
@derplearning
(an actual photo from Iran)
@derplearning
🔥22😱4😁3❤1
This media is not supported in your browser
VIEW IN TELEGRAM
Auto-masking tests going fine.
#warpfusion
#warpfusion
❤22🔥6👍3
Forwarded from эйай ньюз
This media is not supported in your browser
VIEW IN TELEGRAM
Все ещё офигеваю, какие полотна теперь можно рисовать с помощью нейронок.
А вот и новый бесплатный интерфейс для новой версии модели Stable Diffusion, которая умеет в хороший inpainting. Качество генерации больших полотен существенно выросло.
❱❱ Код интерфейса
❱❱ Демка на хагинфейсе
@ai_newz
А вот и новый бесплатный интерфейс для новой версии модели Stable Diffusion, которая умеет в хороший inpainting. Качество генерации больших полотен существенно выросло.
❱❱ Код интерфейса
❱❱ Демка на хагинфейсе
@ai_newz
🔥25👍6
Forwarded from 80 Level
This media is not supported in your browser
VIEW IN TELEGRAM
Technical Artist Sean Simon presented DiffusionCraft AI, a Stable Diffusion-powered version of Minecraft which allows turning placed blocks into beautiful concepts.
Full video and more info: https://80.lv/articles/stable-diffusion-powered-minecraft-with-image-to-image-capabilities/?utm_source=telegram
Full video and more info: https://80.lv/articles/stable-diffusion-powered-minecraft-with-image-to-image-capabilities/?utm_source=telegram
❤34👍2
Forwarded from Мишин Лернинг
🚀 Встречайте новую SOTA Text-2-Image eDiffi: Диффузионные "Эксперты" от NVIDIA
Новый Text-to-Image. В данном случае на классических диффузионных пиксельных каскадах. Модель является гибридом DALL-E от OpenAI 2 и Imagen от Google.
Модель по прежнему использует 3 каскада:
1) Text-To-64pix
2) 64pix-To-256pix
3) 256pix-to-1024pix
Но в данном случае все три модели могут брать любую комбинацию кондишенов из следующих моделей:
— T5 XXL
— CLIP-L/14 Text
— CLIP-L/14 Image
Это позволяет использовать сеть в режиме генерации вариаций (Привет DALL-E 2), а так же юзать легковесный CLIP вместо T5 XXL (который имхо весит неоправданно много). Вообще интересно показано, что T5 работает в связке с CLIP-L/14 Text лучше, чем просто T5. И (спойлер) это действительно так (не скажу откуда знаю).
Кроме того, сеть использует модели — Диффузионные Эксперты для разных этапов денойзинга. Тут смысл такой, если не жалко видеопамять, то можно сделать моделт под разные этапы денойза, например одну под первые 256 шагов, вторую под следующие 256 и так далее. Такие 4 модели буду работать лучше, чем одна. Но и в памяти нужно будет держать их всех.
👑 Используя все эти фишки Karrasи компания добились того, что
eDiffi-Config-D 9.1B (Вместе с CLIP-L/14 и T5-XXL Enc) бьет Zero-shot FID ↓ на COCO-30K 2014 valid SOTA:
GLIDE : 5B - 12.24 FID ↓
MakeAScene : 4B - 11.84 FID ↓
DALL·E 2 : 6.5B - 10.39 FID ↓
StableD : 1.4B - 8.59 FID ↓
Imagen : 7.9B - 7.27 FID ↓
Parti : 20B - 7.23 FID ↓
eDiffi D: 9.1B - 7.04 FID ↓
Ну вот такие новости. Очень много полезных вещей попробовали, советую почитать статью.
🥑 eDiffi от NVIDIA
📇 Paper eDiffi
@ м и ш и н л е р н и н г
Новый Text-to-Image. В данном случае на классических диффузионных пиксельных каскадах. Модель является гибридом DALL-E от OpenAI 2 и Imagen от Google.
Модель по прежнему использует 3 каскада:
1) Text-To-64pix
2) 64pix-To-256pix
3) 256pix-to-1024pix
Но в данном случае все три модели могут брать любую комбинацию кондишенов из следующих моделей:
— T5 XXL
— CLIP-L/14 Text
— CLIP-L/14 Image
Это позволяет использовать сеть в режиме генерации вариаций (Привет DALL-E 2), а так же юзать легковесный CLIP вместо T5 XXL (который имхо весит неоправданно много). Вообще интересно показано, что T5 работает в связке с CLIP-L/14 Text лучше, чем просто T5. И (спойлер) это действительно так (не скажу откуда знаю).
Кроме того, сеть использует модели — Диффузионные Эксперты для разных этапов денойзинга. Тут смысл такой, если не жалко видеопамять, то можно сделать моделт под разные этапы денойза, например одну под первые 256 шагов, вторую под следующие 256 и так далее. Такие 4 модели буду работать лучше, чем одна. Но и в памяти нужно будет держать их всех.
👑 Используя все эти фишки Karrasи компания добились того, что
eDiffi-Config-D 9.1B (Вместе с CLIP-L/14 и T5-XXL Enc) бьет Zero-shot FID ↓ на COCO-30K 2014 valid SOTA:
GLIDE : 5B - 12.24 FID ↓
MakeAScene : 4B - 11.84 FID ↓
DALL·E 2 : 6.5B - 10.39 FID ↓
StableD : 1.4B - 8.59 FID ↓
Imagen : 7.9B - 7.27 FID ↓
Parti : 20B - 7.23 FID ↓
eDiffi D: 9.1B - 7.04 FID ↓
Ну вот такие новости. Очень много полезных вещей попробовали, советую почитать статью.
🥑 eDiffi от NVIDIA
📇 Paper eDiffi
@ м и ш и н л е р н и н г
🔥11👍4🎉2