Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.44K photos
3.71K videos
41 files
4.75K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
Forwarded from НейроПикчи
Анонсировали 5 версию Midjourney, обещают более высокую детализацию и больше стилей, а как выйдет узнаем уже совсем скоро

Платные подписчики могут оценить результаты

И сейчас в дискорде MJ в канале rating-party люди скидывают, что интересного им попалось

НейроПикчи / Новости
🔥2
Премьер министр Румынии назначил чат-бота ION своим почетным советником.

Заместитель будет анализировать трафик в соцсетях на предмет выявления наиболее острых тем, которые обсуждают граждане страны, в частности, социальной и политической направленности. Нейросеть будет собирать сведения о настроениях в обществе, проблемах, запросах, потребностях и претензиях.
🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
Video-P2P
Нейросеть для редактирования видео по тексту от Adobe и Гонконгского китайского Университета. Информации мало.
Код обещают позже с намеками на публичный доступ к модели.

[UPDATE]
Код
Демо

#text2video #video2video #videop2p
👍1
Media is too big
VIEW IN TELEGRAM
ODISE: Open-vocabulary DIffusion-based panoptic SEgmentation

Сегментатор изображений от NVIDIA и Университета Калифорнии.
Что-то пишут про объединение дискриминаторных и диффузионных генераторов изображений по тексту для неограниченной сегментации. Обычно сегментаторы знают ограниченное количество объектов которые они могут выделить масками на изображении. Судя по всему, ODISE сегментирует все что угодно что попадалось в обучающем датасете генераторов tex2image.

Это похоже на следующий шаг к точной генерации text2image, ведь обычно их обучают на картинках с текстовым описанием, но без сегментных масок. А тут вот скрестили.

Код обещают позже

Зато уже можно потыркать демо

#segmentation #text2image
GigaGAN: Scaling up GANs for Text-to-Image Synthesis

GAN'ы возвращаются.
GigaGAN генерирует картинку 512 x 512 за 0.13 секунды, превосходит Stable Diffusion v1.5, DALL·E 2, и Parti-750M по FID (сам не знаю что это). Под капотом миллиард параметров, и работает все это на порядки быстрее авторегрессионных и диффузионных моделей. Ну и конечно, бонусом все прелести непрерывного латентного пространства - красивая анимация без этих всех кипящих фликеров.

А еще волшебный апскейлер!
Смешивание текстовых промптов
Замена грубого стиля на детальный

Кода нет 😢

#gan #text2image #image2image #upscale
Forwarded from Сиолошная
This media is not supported in your browser
VIEW IN TELEGRAM
Visual ChatGPT: Talking, Drawing and Editing with Visual Foundation Models

Работа от команды исследователей Microsoft, предлагающая объединить ChatGPT и множество моделей, работающих с другой модальностью - изображениями.

Под капотом доступно более 15 разных моделей и задач ("тулов", tools), которые позволяют пользователю взаимодействовать с ChatGPT путем:
1) отправки и получения не только текстовых сообщений, но и изображений
2) предоставления сложных визуальных вопросов или инструкции по редактированию, которые требуют совместной работы нескольких моделей ИИ с несколькими шагами. Фотошоп на максималках!
3) предоставление обратной связи и запрос исправлений.

Никакого дообучения не производится, всё делается исключительно промптами, то есть текстовыми командами, которые либо были созданы людьми и подаются в ChatGPT, либо были созданы ChatGPT и подаются в другие модели (то есть она ими как бы управляет).

Все картиночные модели качаются и запускаются локально (те же StableDiffusion или ControlNet), а ChatGPT дёргается по API. Таким образом, можно развернуть чатбота на своем компьютере, и получать команды от текстовой нейронки (но вскоре, с первым публичным релизом конкурента ChatGPT, можно будет делать локально всё от начала и до конца).

Самый понятный юзкейс - это заменить дизайнера на правках от заказчика 🙂, хех, когда говорят "ну давайте поиграем со шрифтами и цветами" или "поменяем объект А на Б?"

GitHub проекта: https://github.com/microsoft/visual-chatgpt
Please open Telegram to view this post
VIEW IN TELEGRAM
X-Avatar: Expressive Human Avatars

Анимируемый аватар человека пригодный для использования в AR/VR и т. п.
На вход принимает 3D скан или RGB-D, то есть, видео с каналом глубины.
Анимацию на аватар можно перенести с другого видео.

Код (пока пусто)

#imageto3D #videoto3D #videoavatar #humananimation #3Davatar
Forwarded from тоже моушн
This media is not supported in your browser
VIEW IN TELEGRAM
ну очень горячие пирожки!

серьезно, чел запостил скрипт для весьма плавной анимации с помощью контролнет - 17 часов назад

го тестить)

богатый может поддержать автора скрипта долларом но если что - скриптик в комментах

@тоже_моушн
🔥2
Media is too big
VIEW IN TELEGRAM
Wonder Studio
Магия!
Персонажная анимация, лайтинг, композитинг.
И все это в браузере.
Серьезное кино не вывезет, а для продакшена на коленке или черновых проходов - бомба.
Подробности на английском

Видео 2K на vimeo
Попросить доступ

#characteranimation #compositing #lighting
Вечер пятницы, приехал грузовик с шутками
👍3