shonenkov AI – Telegram
shonenkov AI
3.53K subscribers
269 photos
9 videos
2 files
77 links
🎨 + 🤖 + 👨‍🎨 = 🖼

Kaggle GM, author of models IF, ruDALLE (Malevich, Emojich, Kandinsky-1.0), ruDOLPH, ruCLIP. Graduated from MIPT. Working with StabilityAI.

https://linktr.ee/shonenkovAI
Download Telegram
Сделал релиз, теперь можно с помощью моделей ruDALLE генерить изображения с произвольным соотношением сторон

Обучать не нужно, все работает в zero-shot

Идея супер-простая: динамически менять размер контекстного окна пропорционально текущей позиции, чтобы попытаться хоть как-то сохранить правильную геометрию. Работает, черри-пикать тоже нужно, как и всю рудалю. А для горизонтальных картинок (из-за низкой скорости) пришлось оставить статическое контекстное окно - но получается тоже весьма неплохо - генерил себе шапки для NFT коллекций

Также, чтобы немного сгладить геометрию, затюнил модельку на сюрреализме, веса прикладываю ruDALLE Surrealist XL

Kaggle и Colab рабочие тоже собрал 🤝

Paper | Github | Weights | Colab | Kaggle | Twitter
👍23🔥52
есть рабочая идея как сделать динамическое контекстное окно одновременно по двум осям 😈🔥 ожидается дополнительный эффект super-resolution + более быстрая генерация горизонтальных изображений

мне вчера скинули колаб от @neverix, где довольно круто работает кеширование 🤝
🔥5👍2
скрестил свою идею rudalle-aspect-ratio с кешированием @neverix , о котором писал в предыдущем посте - посмотрите первые результаты генераций 1024x1024 рудалей only, ожидаемый эффект super-resolution выглядит сладко 😋😋😋 в след посте сделаю что-то с сюрреализмом 😈

вопрос:

1. делать релиз и забить на arxiv, начать вести свои тех-репорты на google drive? 😂

2. или все же как-то поспамить твиттер arxiv’а за отклонение тех-репорта с причиной: “недостаточно значимый научный результат”? тут, конечно, до результатов openai DALLE-2 далеко, но не отклонять же теперь все другие работы … 😳

[Twitter]
🔥151👍1
Forwarded from Kali Novskaya (Tatiana Shavrina)
Вместе с командой AGI NLP выпустили mGPT: GPT-3 на 61 языке мира

mGPT: Few-Shot Learners Go Multilingual

- Модель HuggningFace
- Репа
- Google Colab с примерами генерации, тюнинга
- Arxiv: подробнее о всей процедуре оценки и обучении

https://habr.com/ru/post/662195/
🔥6👍2
“лицо девушки” rudalle-aspect-ratio 48x48 sequence (384x384 px) - без realesrgan 😋
🔥10
“горное озеро” 2048x2048px (256x256) - на А100 генерилось 1 час 20 мин 😋 какая прорисовка и геометрия 😋 оригинальный файл закинул в комменты к посту, можно поразглядывать
🔥162
“красивая роза” rudalle-aspect-ratio
7🎉5
хм, Чат, выпускаем NFT коллекцию с таким стилем? назовем “overload”?

P.S. жалко только, что на бинанс не пускают - три заявки отклонили за последние 4 месяца 😂 если кто может помочь с пермитом, напишите в личку плз
27
multimodalart запилил Spaces App на rudalle-aspect-ratio:

https://huggingface.co/spaces/multimodalart/rudalle

вроде бы все работает, можно поиграться с Surrealist XL генерациями “24:9”, “9:24” 👍
👍6
однажды на выходных попытался немного отвлечься и скрестил "Kandinsky x Emojich x poKemons" --> KEKemons + затюнил ruDOLPH'а 🦌 кепшенить таланты и имена сгенеренных кекемонов 🤯🤣 вопрос зачем, а главное *@для чего@* оставьте, пожалуйста, риторическим 🤣

проект изначально - большой рофл - но почему-то несколько знакомых NFT мейкеров начали предлагать услуги продаж. НО я отказался от простых 10k$, решил закрепить авторство за собой 🐒🙈🙊🙉🐒

https://opensea.io/collection/kekemons

сейчас коллекция доступна для всех, а еще вы можете за один цент (фактически бесплатно) самостоятельно заминтить себе случайных кекемонов
🔥9😁3