🦁 Parti — Новый Text2Image от Google | DALL-E 1 Наносят ответный удар
Авторегрессионный подход к генерации казался уже в далеком прошлом. Все перекинулись в диффуз, и это вполне ожидаемо, глядя на успехи DALL-E 2 и Imagen. И да, Imagen от Google таки делает DALL-E 2. Но Google не успокоился.. Можно сказать что Google дернул OpenAI дважды:
▪️ Imagen > DALL-E 2
▪️ Parti > DALL-E 1
Встречайте: Pathways Autoregressive Text-to-Image model (Parti). И самое странное то, что Parti бьет Imagen по MS-COCO FID в Zero-Shot!
Всего Google обучил 4 модели:
350M - 14.10 FID
750M - 10.71 FID
3B - 8.10 FID
20B - 7.23 FID
Архитектруно Parti это трансформер энкордер-декодер работающий с текстовыми токенами и токенами ViT-VQGAN. Ну и спасибо LAION за датасет!
p.s.: Субъективно, я уже решил что лучше Parti или Imagen... Вроде текст у Parti лучше, но вот гановские артефакты чуть больше бесят, но вот фиксятся ли они каскадами апскейлеров — хз..
💻 project
📄 paper
👾 GIT
@мишин лернинг
Авторегрессионный подход к генерации казался уже в далеком прошлом. Все перекинулись в диффуз, и это вполне ожидаемо, глядя на успехи DALL-E 2 и Imagen. И да, Imagen от Google таки делает DALL-E 2. Но Google не успокоился.. Можно сказать что Google дернул OpenAI дважды:
▪️ Imagen > DALL-E 2
▪️ Parti > DALL-E 1
Встречайте: Pathways Autoregressive Text-to-Image model (Parti). И самое странное то, что Parti бьет Imagen по MS-COCO FID в Zero-Shot!
Всего Google обучил 4 модели:
350M - 14.10 FID
750M - 10.71 FID
3B - 8.10 FID
20B - 7.23 FID
Архитектруно Parti это трансформер энкордер-декодер работающий с текстовыми токенами и токенами ViT-VQGAN. Ну и спасибо LAION за датасет!
p.s.: Субъективно, я уже решил что лучше Parti или Imagen... Вроде текст у Parti лучше, но вот гановские артефакты чуть больше бесят, но вот фиксятся ли они каскадами апскейлеров — хз..
💻 project
📄 paper
👾 GIT
@мишин лернинг
❤18👍9🔥5👎2
👍12👎4
Forwarded from Denis Sexy IT 🤖
This media is not supported in your browser
VIEW IN TELEGRAM
Я понимаю, что я всех достал с Dalle, но простите:
Сходил специально в галерею современного искусства, чтобы показать насколько просто и быстро нейронка генерирует разные варианты одной работы, делаешь фото, ждешь 20 секунд и готово.
Предвижу огромный срач в мире искусства на тему кто у кого что украл или позаимствовал когда Dalle откроют всем 🌚 это прям в промышленных масштабах можно идеи «перепридумывать», а потом рисовать по скетчу нейронки
Сходил специально в галерею современного искусства, чтобы показать насколько просто и быстро нейронка генерирует разные варианты одной работы, делаешь фото, ждешь 20 секунд и готово.
Предвижу огромный срач в мире искусства на тему кто у кого что украл или позаимствовал когда Dalle откроют всем 🌚 это прям в промышленных масштабах можно идеи «перепридумывать», а потом рисовать по скетчу нейронки
❤32🔥14👍7👎1
💩 Телеграмм бот худшей сети 2022: dall-e mini
👉 @DALLEminiBot
👉 @CraiyonArtBot (зеркало)
p.s.: сгенерил эту тварь за вас, можете не тратить время..
👉 @DALLEminiBot
👉 @CraiyonArtBot (зеркало)
p.s.: сгенерил эту тварь за вас, можете не тратить время..
🔥71👎23❤3