Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.47K photos
3.73K videos
41 files
4.77K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
Media is too big
VIEW IN TELEGRAM
UniVG: Towards UNIfied-modal Video Generation

Генератор видео по тексту от Baidu. Заявлена генерация сложных сцен и превосходство над опенсорсными решениями при оценке на людях. По закрытым нейронкам соответствует Gen2. Что-то мне подсказывает, что это не надолго, где-то на пороге должен быть Gen3

Кода нет

#text2video
5
This media is not supported in your browser
VIEW IN TELEGRAM
TextureDreamer: Image-guided Texture Synthesis through Geometry-aware Diffusion

Текстуровщик мечты от Meta. По фото с нескольких ракурсов грабит с объекта детальные текстуры. Но это еще не все. После этого он может натянуть их на чуть ли не рандомный объект и зарелайтить. Магия?

Кода нет, мы и так знаем что это для VR

#image2texture #relighting #texture
🔥112👍1
GARField: Group Anything with Radiance Fields

Извлекает ассеты разного уровня из #nerf сцены. Затем на них можно испытать симуляцию динамики - см на сайте.
Гарфилд прикручивается в nerfstudio

#simulation #dynamics #tools
🔥5🎃2
Foundry ищет ML инженера с опытом в ротоскопе. Ну ладно, я преувеличил, просто ИИ-энтузиаста с опытом в ротоскопе. Угадайте для чего? Чтобы в нюке наконец сделать авотматический ротоскоп. Надо уж было подождать пока кто-нибудь сделает автоматический композитинг, чего там (сарказм).

А Виктор Перез обещает пиво за решение этой задачи.

линкедин

#news
👍3
Blackout Diffusion

Новый тип генератора изображений. Кто знает, может быть он сменит диффузию из шума как в свое время диффузия сменила GAN.

Суть в том что Blackout Diffusion не нужен изначально шум для проявления картинки. И работает он в дискретном пространстве, а не в непрерывном как SD. Благодаря чему тратит меньше вычислительных ресурсов. Ну и ему прочат какие-то перспективы в статье (RUS). Сайта проекта нет,зато есть

Код
Препринт

[UPDATE] препринт от 18 мая 2023, за это время могло бы уже взлететь.

#text2image #news
👍6🤯3
Для TriplaneGaussian опубликован код/веса и появился сайт проекта.

Примеры с генерациями из MJ и фото объектов из реального мира

Сайт
Код

#gaussian #imageto3D
🔥4👏1
This media is not supported in your browser
VIEW IN TELEGRAM
SHINOBIShape and Illumination using Neural Object Decomposition via BRDF Optimization In-the-wild

Реконструкция 3D объекта с материалами и освещением из набора изображений от Google

Код ждем

#imageto3D
👍6
Forwarded from Data Secrets
Генеративная модель Сбера Kandinsky стала мировым лидером по темпу роста

А вот по популярности среди разработчиков заняла второе место — Stable Diffusion немного опередила отечественную нейронку. Рейтинг представил известный AI-ресурс с open source-решениями Hugging Face.

Еще разрабы Kandinsky впечатлили итогами 2023 года. В прошлом году нейросеть создала более 200 млн изображений для 12 млн юзеров.
🤮23👍13🤡5🔥1👏1
Alibaba запилили демоспейс колоризатора DDColor

Демо

#colorize #image2image
🔥31👍1😎1
Depth Anything: Unleashing the Power of Large-Scale Unlabeled Data

Новый генератор глубины от Tiktok. Неплохо работает на видео. Да чего там неплохо, очень хорошо, но пока еще не идеально. Они еще дообучили на своей модели контролнет и генерят видео (см на сайте). На сравнении в середине Midas, справа Depth Anything

Код
Демо
Колаб

#image2depth #video2depth
🔥9
Metric3D: Towards Zero-shot Metric 3D Prediction from A Single Image

Посмотрим как справляется с этой же задачей чемпион прошлогоднего весеннего челленджа по предсказанию глубины на CVPR 2023.

Кажется, не хуже. Еще и карту нормалей выдает

Код
Демо

#image2depth
👍6
This media is not supported in your browser
VIEW IN TELEGRAM
ActAnywhere: Subject-Aware Video Background Generation

Adobe смастерили генератор видео, который понимает переднеплановый объект и генерит соответствующий задний план под него. Да так, что они еще могут и взаимодействовать! В качестве задания можно подать начальный кадр задника, по видимому текст. Можно заменять и переднеплановый объект.

Короче, это ближе к той кнопке Сделать Красиво, которую мы хотим в кинопроизводстве. Ждем новую фичу в ПО Adobe

#text2video #video2video
🔥51👍1