NEW BOT Телеграм, страница

Video-P2P
Нейросеть для редактирования видео по тексту от Adobe и Гонконгского китайского Университета. Информации мало.
Код обещают позже с намеками на публичный доступ к модели.

[UPDATE]
Код
Демо

#text2video #video2video #videop2p

👍1

211 viewsedited 06:17

Нейронавт | Нейросети в творчестве

2:19

Media is too big

VIEW IN TELEGRAM

ODISE: Open-vocabulary DIffusion-based panoptic SEgmentation

Сегментатор изображений от NVIDIA и Университета Калифорнии.
Что-то пишут про объединение дискриминаторных и диффузионных генераторов изображений по тексту для неограниченной сегментации. Обычно сегментаторы знают ограниченное количество объектов которые они могут выделить масками на изображении. Судя по всему, ODISE сегментирует все что угодно что попадалось в обучающем датасете генераторов tex2image.

Это похоже на следующий шаг к точной генерации text2image, ведь обычно их обучают на картинках с текстовым описанием, но без сегментных масок. А тут вот скрестили.

Код обещают позже

Зато уже можно потыркать демо

#segmentation #text2image

238 viewsedited 06:39

Нейронавт | Нейросети в творчестве

0:06

This media is not supported in your browser

VIEW IN TELEGRAM

GigaGAN: Scaling up GANs for Text-to-Image Synthesis

GAN'ы возвращаются.
GigaGAN генерирует картинку 512 x 512 за 0.13 секунды, превосходит Stable Diffusion v1.5, DALL·E 2, и Parti-750M по FID (сам не знаю что это). Под капотом миллиард параметров, и работает все это на порядки быстрее авторегрессионных и диффузионных моделей. Ну и конечно, бонусом все прелести непрерывного латентного пространства - красивая анимация без этих всех кипящих фликеров.

А еще волшебный апскейлер!
Смешивание текстовых промптов
Замена грубого стиля на детальный

Кода нет 😢

#gan #text2image #image2image #upscale

295 views06:57

Нейронавт | Нейросети в творчестве

0:28

Media is too big

VIEW IN TELEGRAM

VideoLoop3D: 3D Video Loops from Asynchronous Input

Генератор зацикленного видео с новых ракурсов.
На вход нужно несколько видео

Код
Демка (покрутите мышкой)

#video2video #videoto3D

237 views07:05

Нейронавт | Нейросети в творчестве

0:01

This media is not supported in your browser

VIEW IN TELEGRAM

0:01

This media is not supported in your browser

VIEW IN TELEGRAM

PAC-NeRF

К nerf'ам прикрутили физику

Код

#nerf #simulation

225 views07:08

Нейронавт | Нейросети в творчестве

Forwarded from Сиолошная

This media is not supported in your browser

VIEW IN TELEGRAM

Visual ChatGPT: Talking, Drawing and Editing with Visual Foundation Models

Работа от команды исследователей Microsoft, предлагающая объединить ChatGPT и множество моделей, работающих с другой модальностью - изображениями.

Под капотом доступно более 15 разных моделей и задач ("тулов", tools), которые позволяют пользователю взаимодействовать с ChatGPT путем:
1) отправки и получения не только текстовых сообщений, но и изображений
2) предоставления сложных визуальных вопросов или инструкции по редактированию, которые требуют совместной работы нескольких моделей ИИ с несколькими шагами. Фотошоп на максималках!
3) предоставление обратной связи и запрос исправлений.

Никакого дообучения не производится, всё делается исключительно промптами, то есть текстовыми командами, которые либо были созданы людьми и подаются в ChatGPT, либо были созданы ChatGPT и подаются в другие модели (то есть она ими как бы управляет).

Все картиночные модели качаются и запускаются локально (те же StableDiffusion или ControlNet), а ChatGPT дёргается по API. Таким образом, можно развернуть чатбота на своем компьютере, и получать команды от текстовой нейронки (но вскоре, с первым публичным релизом конкурента ChatGPT, можно будет делать локально всё от начала и до конца).

Самый понятный юзкейс - это заменить дизайнера на правках от заказчика 🙂, хех, когда говорят "ну давайте поиграем со шрифтами и цветами" или "поменяем объект А на Б?"

GitHub проекта: https://github.com/microsoft/visual-chatgpt

Please open Telegram to view this post

VIEW IN TELEGRAM

167 views07:22

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

X-Avatar: Expressive Human Avatars

Анимируемый аватар человека пригодный для использования в AR/VR и т. п.
На вход принимает 3D скан или RGB-D, то есть, видео с каналом глубины.
Анимацию на аватар можно перенести с другого видео.

Код (пока пусто)

#imageto3D #videoto3D #videoavatar #humananimation #3Davatar

267 views10:37

Нейронавт | Нейросети в творчестве

А вот подъехал код для PV3D

GitHub

GitHub - bytedance/pv3d

Contribute to bytedance/pv3d development by creating an account on GitHub.

281 views10:40

Нейронавт | Нейросети в творчестве

Forwarded from тоже моушн

This media is not supported in your browser

VIEW IN TELEGRAM

ну очень горячие пирожки!

серьезно, чел запостил скрипт для весьма плавной анимации с помощью контролнет - 17 часов назад

го тестить)

богатый может поддержать автора скрипта долларом но если что - скриптик в комментах

@тоже_моушн

🔥2

359 views10:41

Нейронавт | Нейросети в творчестве

2:06

Media is too big

VIEW IN TELEGRAM

Wonder Studio
Магия!
Персонажная анимация, лайтинг, композитинг.
И все это в браузере.
Серьезное кино не вывезет, а для продакшена на коленке или черновых проходов - бомба.
Подробности на английском

Видео 2K на vimeo
Попросить доступ

#characteranimation #compositing #lighting

559 viewsedited 13:30

Нейронавт | Нейросети в творчестве

Вечер пятницы, приехал грузовик с шутками

👍3

431 views18:59

Нейронавт | Нейросети в творчестве

карта инструментов SD

реддит

🔥3

317 views20:02

Нейронавт | Нейросети в творчестве

Видео в аниме от Corridor Digital. Мастер-класс как сделать хорошо там где у всех получается кипящая каша. Но забавно как инновационная часть пайплайна устарела еще две недели назад с появлением #Controlnet. Настала эпоха когда нет времени вынашивать трендовые…

чтобы вы не подумали что аниме теперь делается легко и просто, в свежем видео Нико говорит что работа над этим аниме началась в октябре прошлого года
https://www.youtube.com/watch?v=jQ_DfORb3kw

YouTube

Animators React 11: Mulan, Aladdin, Anime Rock Paper Scissors

Squarespace ► Head to http://squarespace.com/corridorcrew to save 10% off your first purchase!

Our videos are made possible by our amazing website subscribers. Consider joining us! ► http://corridordigital.com/

Niko is joined by Veteran Animators & Directors…

👍2

290 viewsedited 19:26

Нейронавт | Нейросети в творчестве

Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)

0:38

This media is not supported in your browser

VIEW IN TELEGRAM

Кому генеративного 360 и виарчика?

Stable Diffusion + ControlNet + Skybox и вот уже рисуем в 3д и получаем почти 3д.

Выглядит убойно. В комментах обещают глубину и ещё больше 3д.

Яна, тебе понравится.

https://twitter.com/BlockadeLabs/status/1634578058287132674

Здесь ещё слаще:
https://www.blockadelabs.com/

🤯2

230 views05:38

Нейронавт | Нейросети в творчестве

Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)

0:03

This media is not supported in your browser

VIEW IN TELEGRAM

Midjourney V5 + NeRF + RunwayML GEN-1

text-to-3D придет через другую калитку.
И пока #kaedim нанимает кожаных индусов, чтобы за 15 минут моделить меши в блендере по текстовым запросам, в дверь уверенно стучится вот такой пайплайн.

Генерация сцены в 2Д с разных ракурсов.
Запихивание результата в NeRF.
Профит.

Как пишет автор "Большая часть дрожания возникает из-за интерполяции кадров, а не из-за модели. В настоящее время есто ограничение на 95 кадров, поэтому для получения более длинных клипов вам нужно пропускать кадры."

Подвскипание все равно есть, но так как это не соседние кадры, то с этим уже можно что-то делать.

Выглядит многообещающе.
https://twitter.com/giffboake/status/1634373301773451264

202 views16:58

Нейронавт | Нейросети в творчестве

Прилетело!
Кто уже получил доступ к GEN-1, скажите, россиян не банят?

👍2

225 views06:47

Нейронавт | Нейросети в творчестве

Киллер-фича ZOOM ENHANCE теперь в Automatic1111

Появилась она в обновлении расширения unprompted.
При генерации изображения она автоматически находит детали требующие улучшения, такие как лица, глаза, руки (по умолчанию лица) - и отправляет их на генерацию в увеличенном разрешении. Затем встраивает обратно в вашу генерацию. Все это происходит за кулисами. Работает значительно быстрее чем Hires.Fix и не меняет остальную часть изображения.

При этом может потребоваться некоторый промтинг. Описание и инструкция на реддит

А вообще загляните на вкладку доступных расширений в автоматике, там еще интересные штуки появились

#tools

❤4👍1

238 views11:09

About

Blog

Apps

Platform