NEW BOT Телеграм, страница

Forwarded from 80 Level

This media is not supported in your browser

Technical Artist Sean Simon presented DiffusionCraft AI, a Stable Diffusion-powered version of Minecraft which allows turning placed blocks into beautiful concepts.

Full video and more info: https://80.lv/articles/stable-diffusion-powered-minecraft-with-image-to-image-capabilities/?utm_source=telegram

❤34👍2

3.38K views06:30

Derp Learning

0:04

This media is not supported in your browser

VIEW IN TELEGRAM

0:04

This media is not supported in your browser

VIEW IN TELEGRAM

Warpin' around
#stablediffusion #warpfusion

❤17

3.28K views20:29

Derp Learning

0:09

This media is not supported in your browser

VIEW IN TELEGRAM

Более длинный хайрез вариант
#stablediffusion #warpfusion

🔥10❤1

3.13K viewsedited 16:15

Derp Learning

0:09

This media is not supported in your browser

VIEW IN TELEGRAM

И немного кринжа из Dreambooth. Those hips don't lie!
#stablediffusion #warpfusion #dreambooth

😁15😱1

3.55K views16:16

Derp Learning

0:04

This media is not supported in your browser

VIEW IN TELEGRAM

Test shots #warpfusion #stablediffusion

🔥33👍4😢1

8.23K views10:32

Вариант подлиннее, где очки не перезагружают лицо :D

🔥38👍5❤4

6.59K views14:45

Derp Learning

This media is not supported in your browser

VIEW IN TELEGRAM

Chad @elonmusk first day at twitter HQ
#warpfusion #stablediffusion

🔥30🎉3👍2😁2😢1

3.52K views21:22

Derp Learning

0:12

This media is not supported in your browser

VIEW IN TELEGRAM

Chad @elonmusk second day at twitter HQ. This time more consistent.
#warpfusion #stablediffusion

🔥18👍3😁1😢1

3.29K views13:22

Derp Learning

👀😅

😁25

3.06K views11:29

Derp Learning

Тюн #stablediffusion на tron legacy.

https://huggingface.co/dallinmackay/Tron-Legacy-diffusion

❤29🔥7😱2

3.15K views12:39

Derp Learning

Forwarded from Мишин Лернинг

🚀 Встречайте новую SOTA Text-2-Image eDiffi: Диффузионные "Эксперты" от NVIDIA

Новый Text-to-Image. В данном случае на классических диффузионных пиксельных каскадах. Модель является гибридом DALL-E от OpenAI 2 и Imagen от Google.

Модель по прежнему использует 3 каскада:
1) Text-To-64pix
2) 64pix-To-256pix
3) 256pix-to-1024pix

Но в данном случае все три модели могут брать любую комбинацию кондишенов из следующих моделей:
— T5 XXL
— CLIP-L/14 Text
— CLIP-L/14 Image

Это позволяет использовать сеть в режиме генерации вариаций (Привет DALL-E 2), а так же юзать легковесный CLIP вместо T5 XXL (который имхо весит неоправданно много). Вообще интересно показано, что T5 работает в связке с CLIP-L/14 Text лучше, чем просто T5. И (спойлер) это действительно так (не скажу откуда знаю).

Кроме того, сеть использует модели — Диффузионные Эксперты для разных этапов денойзинга. Тут смысл такой, если не жалко видеопамять, то можно сделать моделт под разные этапы денойза, например одну под первые 256 шагов, вторую под следующие 256 и так далее. Такие 4 модели буду работать лучше, чем одна. Но и в памяти нужно будет держать их всех.

👑 Используя все эти фишки Karrasи компания добились того, что
eDiffi-Config-D 9.1B (Вместе с CLIP-L/14 и T5-XXL Enc) бьет Zero-shot FID ↓ на COCO-30K 2014 valid SOTA:

GLIDE : 5B - 12.24 FID ↓
MakeAScene : 4B - 11.84 FID ↓
DALL·E 2 : 6.5B - 10.39 FID ↓
StableD : 1.4B - 8.59 FID ↓
Imagen : 7.9B - 7.27 FID ↓
Parti : 20B - 7.23 FID ↓
eDiffi D: 9.1B - 7.04 FID ↓

Ну вот такие новости. Очень много полезных вещей попробовали, советую почитать статью.

🥑 eDiffi от NVIDIA
📇 Paper eDiffi

@ м и ш и н л е р н и н г

🔥11👍4🎉2

2.55K views05:43

Derp Learning

Forwarded from Alexander Pichugin

😁52🤩4👍1

4.62K views04:34

About

Blog

Apps

Platform