И в продолжение тематики наступившего года - карты таро с черным водяным тигром.
Сгенерировать своего тигра
Сгенерировать своего тигра
❤4
Forwarded from AbstractDL
This media is not supported in your browser
VIEW IN TELEGRAM
GPT для чайников: от токенизации до файнтюнинга
Сделал для вас небольшой colab туториал про GPT. Там подробно и с примерами разобраны такие темы как:
1. Устройство GPT-1,2,3
2. Токенизация
3. Методы генерации текста
4. Файнтюнинг (прям в колабе)
Если вы давно хотели поиграться с GPT, но всё не доходили руки, то новогодние праздники — самое время 😉
Colab
Сделал для вас небольшой colab туториал про GPT. Там подробно и с примерами разобраны такие темы как:
1. Устройство GPT-1,2,3
2. Токенизация
3. Методы генерации текста
4. Файнтюнинг (прям в колабе)
Если вы давно хотели поиграться с GPT, но всё не доходили руки, то новогодние праздники — самое время 😉
Colab
🔥17👍3❤1
Forwarded from Мишин Лернинг
🎆 V Objective Diffusion: Код, Модель, Веса + Colab
Королева генеративного искусства Rivers Have Wings выложила аккуратно обученную диффузионную модель, кондишн на текстовых эмбедингах собственно обученного 602M CLIP. По факту подход classifier-free guidance похож на недавний GLIDE от OpenAI.
Генерации просто на высшем уровне. И понимание текста, и целостность (консистентность) изображений, и стилистика. Доступны 481M и 968M модели, обученные на 33M пар изображения-текст, сабсет Yahoo Flickr Creative Commons 100 Million.
💻 Code: https://github.com/crowsonkb/v-diffusion-pytorch
🔮 Unofficial Colab: https://colab.research.google.com/drive/10k7h49_5LDXgJquxTRAmqCMKprTwKOw_?usp=sharing
Королева генеративного искусства Rivers Have Wings выложила аккуратно обученную диффузионную модель, кондишн на текстовых эмбедингах собственно обученного 602M CLIP. По факту подход classifier-free guidance похож на недавний GLIDE от OpenAI.
Генерации просто на высшем уровне. И понимание текста, и целостность (консистентность) изображений, и стилистика. Доступны 481M и 968M модели, обученные на 33M пар изображения-текст, сабсет Yahoo Flickr Creative Commons 100 Million.
💻 Code: https://github.com/crowsonkb/v-diffusion-pytorch
🔮 Unofficial Colab: https://colab.research.google.com/drive/10k7h49_5LDXgJquxTRAmqCMKprTwKOw_?usp=sharing
👍7🔥2
Forwarded from Neural Shit
This media is not supported in your browser
VIEW IN TELEGRAM
Там колаб Disco Diffusion v4 вышел.
Генерирует крутые штуки, но ооооочень долго. Генерация видео выше заняла у меня около 8-ми часов.
Ссылка на колаб
Генерирует крутые штуки, но ооооочень долго. Генерация видео выше заняла у меня около 8-ми часов.
Ссылка на колаб
🔥10👍6❤5
This media is not supported in your browser
VIEW IN TELEGRAM
Там запилили опенсорсную аппку с этими нашими ArcaneGAN, AnimeGANv2, JoJoGAN и иже с ними.
По факту это просто обертка вокруг API huggingface, но для конечного пользователя разницы особой нет. (кроме того, что нужен инторнет)
Код
Аппка
По факту это просто обертка вокруг API huggingface, но для конечного пользователя разницы особой нет. (кроме того, что нужен инторнет)
Код
Аппка
👍1
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn)
This media is not supported in your browser
VIEW IN TELEGRAM
Нвидия Канвас (в девичестве Гоген) обновился до версии 1.1.
И там уже появились первые признаки (очень первичные) pipeline ready инструмента.
В 4 раза большее разрешение, новая ИИ модель с улучшенным качеством и минимизацией артефактов.
И там появился экспорт в Фотошоп!
Где все ваши безумные мазки раскиданы по слоям.
В общем ИИ настойчиво рекомендует "spend more time visualizing ideas" или "ИИ все дорисует за вас".
Пробуем тут: https://www.nvidia.com/en-us/studio/canvas/
И там уже появились первые признаки (очень первичные) pipeline ready инструмента.
В 4 раза большее разрешение, новая ИИ модель с улучшенным качеством и минимизацией артефактов.
И там появился экспорт в Фотошоп!
Где все ваши безумные мазки раскиданы по слоям.
В общем ИИ настойчиво рекомендует "spend more time visualizing ideas" или "ИИ все дорисует за вас".
Пробуем тут: https://www.nvidia.com/en-us/studio/canvas/
👍2
This media is not supported in your browser
VIEW IN TELEGRAM
Из океана Айвазовского - в Имперский город из Звездных Войн
Сделать самим тут
Сделать самим тут
🔥2👍1
This media is not supported in your browser
VIEW IN TELEGRAM
А вот тот же запрос, но без вращения. Как по мне, переход от мачты посреди океана к шпилю башни в пустынном городе шикарен.
🔥31
Forwarded from Мишин Лернинг
🦌🎄One Hyper-Modal Transformer can be
Creative as DALL-E and Smart as CLIP
Встречайте, RuDOLPH! Текстово-визуальный гипермодальный GPT-3 (350M), сочетающий в себе генеративные возможности текстового GPT-3 и текст-картиночного DALL-E с Reranking & Zero-Shot способностями CLIP.
👀 см картинки к посту
Гипермодальный RuDolph может:
▪️ Генерировать текст
▪️ Генерировать изображения по тексту
▪️ «Проявлять» диффузией в высоком качестве и разрешении сгенерированные изображения
▪️ Изменять (inpainting) изображения по описанию
▪️ Генерировать текстовые описания для изображений
▪️ Быть Feature Extractor’ом для few-shot и linear probe классификации
▪️ Ранжировать изображения по текстовому описанию
▪️ Классифицировать изображения в режиме Zero-Shot
💻 Git Код + Веса
📰 Paper [soon]
🦌 HF demo (только 4 картинки)
🤗 Model Card
🔮 Colab со всеми возможностями
Creative as DALL-E and Smart as CLIP
Встречайте, RuDOLPH! Текстово-визуальный гипермодальный GPT-3 (350M), сочетающий в себе генеративные возможности текстового GPT-3 и текст-картиночного DALL-E с Reranking & Zero-Shot способностями CLIP.
👀 см картинки к посту
Гипермодальный RuDolph может:
▪️ Генерировать текст
▪️ Генерировать изображения по тексту
▪️ «Проявлять» диффузией в высоком качестве и разрешении сгенерированные изображения
▪️ Изменять (inpainting) изображения по описанию
▪️ Генерировать текстовые описания для изображений
▪️ Быть Feature Extractor’ом для few-shot и linear probe классификации
▪️ Ранжировать изображения по текстовому описанию
▪️ Классифицировать изображения в режиме Zero-Shot
💻 Git Код + Веса
📰 Paper [soon]
🦌 HF demo (только 4 картинки)
🤗 Model Card
🔮 Colab со всеми возможностями
👍5🔥4🎉1