NEW BOT Телеграм, страница

Братья и сéстры, золотой молоток U-Net вернулся к нам в новом виде! Теперь в шкуре трансформера.

Берем self-attention блоки, разбавляем их даунсэмплингами, апсэмплингами и depth-wise конволюциями. Ну, и, по классике, пробрасываем скип-конэкшены между энкодером и декодером. И вот, у нас получился U-former.

Китайцы предлагают его использовать для низкоуровневых vision задач, как то: восстановление изображений, энхансинг, деблюринг, денойзинг. Улучшения кажутся маргинальными, но я не супер эксперт в теме восстановления изображений (может я чего-то не понял?). Все равно архитектура стоит внимания.

Статья | GitHub

620 views21:54

Derp Learning

Запилил для вас колаб с DeepStyle. Исходнику уже лет 5, а алгоритмам в его основе - и того больше.
Однако это не мешает этим вашим тиктокерам в данный момент хайповать на этом психоделе.
Данный подход лежит в основе ostagram.me и аппки, с помощью которой всех превращали в макароны пару лет назад.

Юзать просто - загружаем пачкой сначала фото, потом - образцы стилей. На выходе получаем архив с результатами.

🗒 Колаб
🐈 Гитхаб

896 views09:58

Derp Learning

Forwarded from AI для Всех (Artemii)

0:30

This media is not supported in your browser

VIEW IN TELEGRAM

Как написать целый абзац для статьи на английском языке, всего лишь из одного предложения на русском?

Пишем одно предложение, переводим его на английский с помощью DeepL. Подаем его на вход в GPT-J, затем перефразируем его с помощью Wordtune и проверим грамматику Grammarly.

Поздравляю - у вас есть целый абзац текста. Нейросети рулят!

#ScientificML #writing

560 views11:02

Derp Learning

0:09

This media is not supported in your browser

VIEW IN TELEGRAM

9 секунд наркомании
neural-style + ebsynth

780 views19:07

Derp Learning

Там полгода назад вышла модель для стилизации видео в 4к. В реалтайме. Модель весит 2мб.
Звучит овер заманчиво, будем посмотреть. С виду это обычная unet, только они выкинули части с апскейлом и даунскейлом и заменили на Laplacian Pyramid, сэкономив львиную долю параметров.

Основная идея состоит в том, что изображение можно разделить на низкочастотную (основа) и высокочастотную (мелкие детали) части, которые можно обработать отдельно, и потом объединить. Те, кто профессионально занимаются ретушью, понимают, о чем это. При этом низкочастотную часть можно обработать в очень низком разрешении, сэкономив на вычислениях.

Код
Доклад
Выжимка

689 viewsedited 06:15

Derp Learning

0:09

This media is not supported in your browser

VIEW IN TELEGRAM

А вот родное видео через neural style. Да, лучше, чем ebsynth.

И дольше раз в 20. Для плавности нужно просчитать optical flow в обе стороны для каждого кадра, а потом все прогнать через нейронку. Суммарно занимает часов 6 для видео 280х512, 9сек. Судите сами 😢

Возьмём это за точку отсчёта, и посмотрим, что там с тех пор наваяли в этой области.

1.38K viewsedited 12:16

Derp Learning

Forwarded from parhelia / иногда

Нашёл классный сайт - вебморду для нейросетки Hi-Fi-Gan, озвучивающей введённый текст одним из предсобранных голосов. Датасетов очень много - писатели, актёры рэперы, президенты.
Отличный инструмент для генерации вокальных безделушек заместо киношных сэмплов.

https://vo.codes/tts/

Fakeyou

FakeYou Celebrity AI Voice and Video Generator

FakeYou lets you generate voices and videos using AI technology

574 views15:09

Derp Learning

Forwarded from Denis Sexy IT 🤖

Но мои результаты конечно пока все еще хуже чем выходят у программистки которая сделала этот метод генерации – результат по запросу «Киберпанк-церковь напоминающая карту таро "Смерть" в стиле Грега Рутковски»

Реально хоть в игры бери, готовые концепт-арты.

606 views21:39

Derp Learning

Там просто кладезь, котаны. Концепт-художники, АЛЯРМА!
https://twitter.com/RiversHaveWings/status/1443948191871684617

Twitter

Rivers Have Wings

"a landscape resembling The Lovers tarot card by Greg Rutkowski" (CLIP guided diffusion)

1.81K views21:40

Derp Learning