Derp Learning – Telegram
Derp Learning
13.2K subscribers
3.21K photos
931 videos
9 files
1.35K links
Используем ИИ строго не по назначению.
Заметки про ИИ, IT, компьютерные игры, и всякие инженерные интересности.
Download Telegram
Media is too big
VIEW IN TELEGRAM
"Безусловная генерация человеческого изображения является важной задачей в области зрения и графики, которая позволяет использовать различные приложения в творческой индустрии." - это первая строчка представления StyleGAN Human.

Новый ГАН позволяет генерировать не только лица, но и людей с различной одеждой. В отличие от других схожих ганов, авторы выделяют основные преимущества - 40 тысяч изображений, еще и в разных позах, центрирования в телах и упор на положение лиц и глаз.

А как изюминка, мы с @too_motion сделали тест в старом колабе LSD, и да, с костылями, но работает!

Танцуем! 💃
🔥16👍2
"НЕ БОЙТЕСЬ!"
- Библейски точная Скрепка

сорс
👍16😁9😱2🔥1
Forwarded from Хабр
Media is too big
VIEW IN TELEGRAM
Группа исследователей из Университета Карнеги-Меллона в Питтсбурге смогла модифицировать VR-гарнитуру Oculus Quest 2 с помощью комплекта ультразвуковых излучателей. Теперь шлем позволяет имитировать контакт со ртом пользователя.

В гарнитуру встроили 64 излучателя, которые передают импульсы на рот, губы и зубы человека, когда тот выполняет определённые действия в игре.

Как отмечают авторы разработки, такие ультразвуковые излучатели можно разместить на любом современном VR-шлеме. По их словам, отклик происходит бесконтактно, и игрокам не нужно прикреплять к своему лицу дополнительные аксессуары.
🔥7👍1
Finally, капча для защиты от людей
😁422
😁25👍21
Тем временем умельцы из LAION уже учат свой DALLE-2

Мальчик: ждет очереди в вейтлисте DALL-E
Мужчина: пилит свой с нуля

На счет генератора не знаю, но prior точно. За text/image encoder, скорее всего, взяли готовый CLIP.

Страничка на wandb
Код
👍13
Каждому цвету - свой вайб.
Любопытно, что у разных названий одних и тех же (или похожих) цветов разная атмосфера и содержание.

#discodiffusion

сорс
15🔥5👍2😁2
Forwarded from DLStories
Google Research выложили открытый GitHub-репо с кодом всех своих vision моделей

В репо будет публиковаться код различный моделей компьютерного зрения от гугл — ViT, LiT, MLP-Mixer и прочих. Код оптимизирован так, что обучать модели можно будет на любом железе — CPU, GPU, TPU с разными конфигурациями.

Наполнение еще в процессе, за планами релизов можно следить тут.

К коду прилагается отличный Readme с подробными описаниями модулей и инструкциями к подготовке данных, обучению и тестам моделей.
Выглядит как очень handy и полезная штука 😋
👍10🔥6
Тем временем продолжаем пополнять библиотеку ключевых слов для CLIP guided <что угодно>

По ссылке ниже - Более 560 художников по версии CLIP
Тут
👍14😁1
Карты "Жреца" и "Колесницы" в стиле киберпанк.
#discodiffusion
🔥23👍3🎉1
Forwarded from Denis Sexy IT 🤖
Media is too big
VIEW IN TELEGRAM
В феврале 2022 года интернет чувак бросил вызов 3D-художникам всего мира, где в качестве тематики предложил свою анимацию из движущегося «транспортного средства».

3D-художники согласились, вот вам подборка из 100 лучших работ «Infinity journeys» (они же в 4K на ютубе).

Лучше так, чем кукухой
👍24🔥76
Прогресс, тем временем, не стоит на месте, и народный DALLE-2 походу запилят раньше, чем openai выдаст доступ очередному генератору хомяков :D

Все пока очень сыро, все самое интересное в issues и дискорде.
Такими темпами полностью рабочий прототип будет уже через месяц.
(картинка из народной версии)
Код
👍21🔥4
Когда сгенерил датасет, но сохранял не ту переменную.
😁45