NEW BOT Телеграм, страница

🥑 DALL-E ждали? Всем ruDALL-E!

Высшая точка генерации text2image: DALL-E. В отличие от CLIP + (VQGAN / Diffusion / StyleGAN3), модели DALL-E изначально созданы (а не приспособлены) для генерации изображений из текста, архитектурно являясь GPT.

При обучении таких моделей большие изображения (256x256 или 512х512) сжимаются при помощи энкодеров dVAE или VQGAN до последовательности визуальных токенов (e.g.: 32x32). GPT теперь может работать как и текстовыми, так и с визуальными токенам. Это можно интерпретировать как последовательность, длинную строку.

Потом GPT-like архитектура принимает текстовое описание и учится генерировать эти визуальные токены, которые потом “проявляются” в высоком разрешении при помощи декодеров dVAE или VQGAN.

Запустить колаб и получить свою генерацию очень просто! Достаточно прейти по ссылке и, вписав что-то свое в поле текст (вместо text = 'изображение радуги на фоне ночного города’), выбрать Runtime -> Run all (среда выполнения -> выполнить все).

🔮colab 💻Git

750 views10:04

Derp Learning

Очень крутой результат!
Тыкать тут, но нужно запастись терпением.

з.ы. вы не могли бы пока банкинг в сбере выключить, штоб быстрее картинки генерилиьс?

1.27K viewsedited 10:46

Derp Learning

Ну, что я могу сказать. Это просто топчик!

1.21K views10:59

Derp Learning

Мемы норм. Пяп, новый конкурент ъуъ!

1.22K views12:03

Derp Learning

Очень круто, все-таки. Не обошлось без фотостоков и, видимо, князя Гвидона.

1.31K views13:09

Derp Learning

Лучше и не придумаешь :D

1.31K views15:12

Derp Learning

простити
@derplearning

25.6K viewsedited 07:25

Derp Learning

Для поддержания баланса фото и рисунков в мире я конвертирую обратно фотки из этого поста. AI-Thanos.

1.13K views09:57

Derp Learning

Сегодня я узнал, что все это время в colab/jupyter/python shell можно было вызывать функции через слеш, передавая аргументы без скобочек, разделяя пробелами.
/print 'FML' 'Facepalm' ':D'

1.13K viewsedited 15:25

Derp Learning

Forwarded from Мишин Лернинг

👾 EfficientZero: Быстрый, Умный и Доступный RL

RL добился успеха во многих задачах. Однако известные методы требуют для обучения миллионов (или даже миллиардов) шагов.

В последнее время мы наблюдаем прогресс в разработке эффективных алгоритмов RL, но работа таких эффективных (по количеству семплов) алгоритмов не дотягивала до человеческого уровня даже в Atari

В пейпере предлагается RL модель основанная на MuZero, которую назвали EfficientZero.

Метод достигает 116% от медианной производительности человека в тесте Atari 100k всего за два часа игры в реальном времен!

Это первый раз, когда алгоритм достигает сверхчеловеческой производительности в играх Atari, используя относительно небольшой объём данных для обучения.

Производительность EfficientZero также близка к производительности DQN (200 миллионов кадров), при этом требует в 500 раз меньше семплов самой игры.

💻 code soon 📰 paper

925 views16:25

Derp Learning

Там сбер диджейский пульт выкатил!
Генерирует музыку из параметров, го тыкать!

Колаб
Гит

👍2

1.47K viewsedited 16:55

About

Blog

Apps

Platform