Derp Learning – Telegram
Derp Learning
13.1K subscribers
3.16K photos
912 videos
9 files
1.32K links
Используем ИИ строго не по назначению.
Заметки про ИИ, IT, компьютерные игры, и всякие инженерные интересности.
Download Telegram
Forwarded from Denis Sexy IT 🤖
Спасибо всяким генеративным AI, диффузионным моделям и GPU-серверам, теперь можно взять старые обои для Windows 95/Me и сделать их современными, вертикальными и подходящими для телефонов

Обработал коллекцию заставок на рабочий стол из прошлого, скачать в HD качестве можно тут (в посте пожатые версии).

P.S. Улучшение качества было сделано диффузионной моделью для апскейла, поэтому обошлось без GAN-артефактов, по ссылке чуть детальнее о технической части. Края длрисованы нашим тулзом и Photoshop Generative Fill.

P.P.S. Каждая картинка обмазана разаными нейронками, буквально, но я постарался оставить изначальную эстетику всех картинок
21👍5🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
И, в продолжение предыдущего поста, дорисованные мемы

@derplearning
48🔥19👍10😱5😁1
Твит

Сорс

Япония решила вступиться за все эти ваши аниме модели и разрешила обучать нейронки на чем угодно - копирайты исходных картинок при этом могут идти лесом 😺

(Поправка: на самом деле пока решила не вступаться за владельцев материалов, которые попадают в датасет, т.к. по текущему законодательству "анализировать информацию" можно у чего угодно, даже полученного преступным путем)

@derplearning
🔥456😢1
🤩17😁102🎉2👍1
Я думаю, что все, кто когда-либо погружался в компьютерное зрение, знакомы с тремя основными задачами сегментации изображения: семантическая сегментация, инстанс-сегментация и паноптическая сегментация. Но много ли этих людей знакомы с таким видом сегментации, где ты можешь взаимодействовать с моделью для уточнения её работы? Да, я говорю про задачу интерактивной сегментации.

Модели интерактивной сегментации, как и привычные нам модели семантической сегментации, в качестве результата возвращают предсказанную сегментационную маску. Но для этого им нужно не только входное изображение, но и дополнительная информация от пользователя:

🟣 координаты выбранной прямоугольной области изображения, где нужно сегментировать объект с целевым классом;
🟣 каракули по выбранному объекту с целевым классом, далее эти каракули должны трансформироваться до маски с попиксельной точностью в качестве результата;
🟣 текстовые запросы;
🟣 клики;
🟣 комбинация вышеупомянутых способов.

Каждый из этих способов представления дополнительной информации имеет свои преимущества и недостатки, но последние подходы в интерактивной сегментации сосредоточены именно на взаимодействии через клики, т.к. это меньше всего нагружает пользователя и позволяет получить наиболее точные результаты сегментации. Существует два типа кликов: положительные, которые отрисовывают маску заданного класса, и отрицательные, с помощью которых можно уточнить исходную маску.

Текущие state-of-the-art подходы в интерактивной сегментации позволяют получить за 1-3 клика сегментационные маски, точность предсказания которых достигает значений метрики IoU в диапазоне 80-90.

В рамках рабочей задачи я написала на Хабр и Medium обзор этих state-of-the-art моделей для интерактивной сегментации и рассказала, как её можно использовать для ускорения процесса разметки. Там я подробнее постаралась объяснить принцип работы интерактивной сегментации через клики, а также разобрала такие подходы как RITM, SimpleClick и Segment Anything.

Так что вперёд читать и ставить плюсики моей статье! Обязательно задавайте вопросы и делитесь своими мыслями насчёт такой редкой задачи компьютерного зрения. 💟

А также подписывайтесь на телеграм-канал нашей команды, чтобы оставаться в курсе последних новостей и свежих вакансий. 🔥
Please open Telegram to view this post
VIEW IN TELEGRAM
10😁2
Forwarded from Vasya Stepanov
Классика
😱29😁23👍32🤩2
Когда увидел классную сгенеренную картинку, смотришь промт, а там:
😁46👍3😱1😢1
👍213
Forwarded from Design Board
styledrop.github.io — хочу иллюстрацию/логотип/3Д иконку в стиле, как у [...].
🔥47
Forwarded from CGIT_Vines (Marvin Heemeyer)
This media is not supported in your browser
VIEW IN TELEGRAM
Похоже, на поле программ для обработки сканов произойдет монополизация. Nvidia решила потеснить всех новой софтиной Neuralangelo.

На основе технологии Instant NeRF, Nvidia добилась воссоздания мельчайших деталей. Причем, на вход можно подавать видео.

Сорс
🔥182
My typical changelog
😁17🤩4