Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.45K photos
3.71K videos
41 files
4.76K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
TextureDreamer: Image-guided Texture Synthesis through Geometry-aware Diffusion

Текстуровщик мечты от Meta. По фото с нескольких ракурсов грабит с объекта детальные текстуры. Но это еще не все. После этого он может натянуть их на чуть ли не рандомный объект и зарелайтить. Магия?

Кода нет, мы и так знаем что это для VR

#image2texture #relighting #texture
🔥112👍1
GARField: Group Anything with Radiance Fields

Извлекает ассеты разного уровня из #nerf сцены. Затем на них можно испытать симуляцию динамики - см на сайте.
Гарфилд прикручивается в nerfstudio

#simulation #dynamics #tools
🔥5🎃2
Foundry ищет ML инженера с опытом в ротоскопе. Ну ладно, я преувеличил, просто ИИ-энтузиаста с опытом в ротоскопе. Угадайте для чего? Чтобы в нюке наконец сделать авотматический ротоскоп. Надо уж было подождать пока кто-нибудь сделает автоматический композитинг, чего там (сарказм).

А Виктор Перез обещает пиво за решение этой задачи.

линкедин

#news
👍3
Blackout Diffusion

Новый тип генератора изображений. Кто знает, может быть он сменит диффузию из шума как в свое время диффузия сменила GAN.

Суть в том что Blackout Diffusion не нужен изначально шум для проявления картинки. И работает он в дискретном пространстве, а не в непрерывном как SD. Благодаря чему тратит меньше вычислительных ресурсов. Ну и ему прочат какие-то перспективы в статье (RUS). Сайта проекта нет,зато есть

Код
Препринт

[UPDATE] препринт от 18 мая 2023, за это время могло бы уже взлететь.

#text2image #news
👍6🤯3
Для TriplaneGaussian опубликован код/веса и появился сайт проекта.

Примеры с генерациями из MJ и фото объектов из реального мира

Сайт
Код

#gaussian #imageto3D
🔥4👏1
This media is not supported in your browser
VIEW IN TELEGRAM
SHINOBIShape and Illumination using Neural Object Decomposition via BRDF Optimization In-the-wild

Реконструкция 3D объекта с материалами и освещением из набора изображений от Google

Код ждем

#imageto3D
👍6
Forwarded from Data Secrets
Генеративная модель Сбера Kandinsky стала мировым лидером по темпу роста

А вот по популярности среди разработчиков заняла второе место — Stable Diffusion немного опередила отечественную нейронку. Рейтинг представил известный AI-ресурс с open source-решениями Hugging Face.

Еще разрабы Kandinsky впечатлили итогами 2023 года. В прошлом году нейросеть создала более 200 млн изображений для 12 млн юзеров.
🤮23👍13🤡5🔥1👏1
Alibaba запилили демоспейс колоризатора DDColor

Демо

#colorize #image2image
🔥31👍1😎1
Depth Anything: Unleashing the Power of Large-Scale Unlabeled Data

Новый генератор глубины от Tiktok. Неплохо работает на видео. Да чего там неплохо, очень хорошо, но пока еще не идеально. Они еще дообучили на своей модели контролнет и генерят видео (см на сайте). На сравнении в середине Midas, справа Depth Anything

Код
Демо
Колаб

#image2depth #video2depth
🔥9
Metric3D: Towards Zero-shot Metric 3D Prediction from A Single Image

Посмотрим как справляется с этой же задачей чемпион прошлогоднего весеннего челленджа по предсказанию глубины на CVPR 2023.

Кажется, не хуже. Еще и карту нормалей выдает

Код
Демо

#image2depth
👍6
This media is not supported in your browser
VIEW IN TELEGRAM
ActAnywhere: Subject-Aware Video Background Generation

Adobe смастерили генератор видео, который понимает переднеплановый объект и генерит соответствующий задний план под него. Да так, что они еще могут и взаимодействовать! В качестве задания можно подать начальный кадр задника, по видимому текст. Можно заменять и переднеплановый объект.

Короче, это ближе к той кнопке Сделать Красиво, которую мы хотим в кинопроизводстве. Ждем новую фичу в ПО Adobe

#text2video #video2video
🔥51👍1
Forwarded from AI для Всех (Artemii)
This media is not supported in your browser
VIEW IN TELEGRAM
Скрейпинг веб страниц в эпоху GPT-Vision

Последние пару недель, я много эксперементировал с парсингом и скрейпингом веб страниц. В итоге я пришел к выводу, что сайты были сделаны для того что бы на них смотрели глазами, и соответственно парсить их эффкетивнее всего тоже будет глазами.

Собрал для вас старый добрый Colab, с помощью которого можно сделать summary любой страницы в интернете (в пределах того, на что не обидится OpenAI).

Как это работает:

- с помощью selenium я делаю скриншоты сайта

- объединяю их в одну картинку

- отправляю эту картинку в GPT-vision

- получаю summary

🚀 Google Colab

Приглашаю всех попробовать и присылать PR c новыми функциями, исправлением багов и прочими правками.

В качестве бонуса (для продвинутых пользователей), добавил в pipeline создание эмбедингов поверх полученных summary.

Если пойдет, может быть сделаем крутого open-source Web-scrapping Assistant или типа того
14👍4🔥3
dewatermark.ai

Удаление вотермарков с изображений. Говорят что бесплатно. Сервис умный, сам находит вотермарки, но можно выделить и кистью

#tools #inpainting #restoration
5🔥3👍2