NEW BOT Телеграм, страница

Нейронавт | Нейросети в творчестве

LuminaBrush

Экспериментальный проект lllyasviel, похожий на IC-Light
Эффект освещения задаем цветными мазками кисти и текстовым промптом, на выходе получаем наш картинку, где персонаж помещен в другие условия освещения.

Обработка происходит в два этапа. На первом этапе объект приводят к равномерному освещению. Из этого этапа автор сделал отдельную фичу, см второе демо.

Гитхаб - там кода нет, только описание и примеры, так обычно оформляют сайт проекта
Демо
Демо2 равномерное освещение

#relighting

🔥9❤3

2.49K views17:56

Нейронавт | Нейросети в творчестве

0:25

This media is not supported in your browser

VIEW IN TELEGRAM

GaussianCity

Генератор неограниченных городов на гауссианах

Код
Демо

#gaussian

👍3🥴3🤷‍♂1🔥1

1.99K views05:06

Нейронавт | Нейросети в творчестве

Distill Any Depth: Distillation Creates a Stronger Monocular Depth Estimator

И у нас новый лидер (SOTA, если не врут) в оценке глубины изображения

Код
Демо

#image2depth

👍14🔥3

2.17K views05:33

Нейронавт | Нейросети в творчестве

0:54

This media is not supported in your browser

VIEW IN TELEGRAM

Feat2GS: Probing Visual Foundation Models with Gaussian Splatting

Интересная работа, оценка понимания базовыми визуальными моделями объемного мира при помощи гауссовых сплатов

Оценивают рендер новых ракурсов, геометрию, текстуры

При этом, как я понял, Feat2GS и сам умеет воссоздавать сцены на гауссианах, иначе как бы они сравнивали свою модель с InstantSplat

Код
Демо

#gaussian #comparison #shootout #image2scene

👍2

1.9K viewsedited 06:09

Нейронавт | Нейросети в творчестве

0:08

This media is not supported in your browser

VIEW IN TELEGRAM

0:08

This media is not supported in your browser

VIEW IN TELEGRAM

Fast3R: Towards 3D Reconstruction of 1000+ Images in One Forward Pass

Реконструкция 3D сцены за один проход от Facebook Research. Обрабатывает много изображений параллельно, тогда как обычно для этой задачи входные изображения обрабатывают попарно за много проходов.

Код
Демо

#imageto3d #videoto3d #photogrammetry

👍6🔥3

1.8K views06:44

Нейронавт | Нейросети в творчестве

Я смотрел, хороший эксперимент

#кино

1.7K viewsedited 09:26

Нейронавт | Нейросети в творчестве

Forwarded from CGIT_Vines (Marvin Heemeyer)

1:21

This media is not supported in your browser

VIEW IN TELEGRAM

Я буквально три дня назад посмотрел фильм Земекиса — Here, о котором писал вот тут. Фильм снят полностью на статичную камеру.
И я, кстати, не ошибся с точки зрения применения новых генеративных технологий. 🦸
Сам фильм неплох, как эксперимент.

Смотрел я его... Сейчас треснет жопа сэра Ридли Скотта... ДА НА МОБИЛКЕ!
Но даже через маленький экран была видна очень посредственная графика. А сегодня я наткнулся на пост Javi Lopez, фаундера Magnific_AI, о том, как применялись FX для этого фильма.

Ну, во-первых, FaceSwap и DeAge, о которых я думал, подтвердились. Нельзя так плохо сделать классическими пайплайнами. Кстати, упоминается Nuke как тулза для композитинга — хоть тут классика. Задники за окном дома делались на LED и прогонялись через апскейлеры, что тоже очень удобно и логично.

Пайплайн апскейлеров всем знакомый, всего с двумя параметрами:
1. Креативность.
2. Сходство.
Так как в разных шотах легко можно было нарваться на артефакты и галлюцинации, удачные куски объединяли в Photoshop. Это и экономично, и грустно одновременно — даже для фильма не написали никаких более удобных тулзовин.

Среди недостающих инструментов при использовании ИИ в кино не хватало генеративного HDR, чтобы иметь дополнительные возможности в битности и точках чёрного и белого при редактировании. Хоть за PNG и то спасибо.

Почему всё так? Потому что быстро и дёшево. У фильма не было достаточного бюджета на FX.

Добро пожаловать в дешёвое будущее!
YT

@CGIT_Vines

Please open Telegram to view this post

VIEW IN TELEGRAM

❤5🔥4👍3

1.67K views09:26

Нейронавт | Нейросети в творчестве

Microsoft опубликовали код мультимодальной модели агентов Magma

Код

Спасибо @Dmitriy_Ru6ts0v

#agent #vlm

1:00

Нейронавт | Нейросети в творчестве

Magma: A Foundation Model for Multimodal AI Agents

Опенсорсная мультимодальная модель для агентов от Microsoft.

- понимает видео
- ориентируется в пространстве
- управляет компом и роботами

Гитхаб - код ждем

#agent #vlm

❤6🤮1

1.99K views12:28

Нейронавт | Нейросети в творчестве

0:38

This media is not supported in your browser

VIEW IN TELEGRAM

Stable Audio Open + Arm Kleidi

Stability AI объявили о партнерстве с ARM в области генерации аудио на мобильных устройствах.

Вы конечно уже забыли что у них есть генератор звука Stable Audio Open. В самом деле, им кто-нибудь пользовался?

Так вот, женят этот генератор с библиотекой Kleidi для быстрого инференса на процессорах ARM

Ни демо, ни саму библиотеку я не нашел где посмотреть, тем более мобильное приложение...

Продолжаем вялое наблюдение

#news #mobile

👍6🤷‍♂2🔥1

1.92K views22:58

Нейронавт | Нейросети в творчестве

0:58

This media is not supported in your browser

VIEW IN TELEGRAM

ChatGarment: Garment Estimation, Generation and Editing via Large Language Models

Визуально-языковая модель для работы с 3D одеждой: генерация, выкройка, редактирование

Код

#cloth #garment #vlm #assistant

👍7❤1🔥1

2.05K views11:13

Нейронавт | Нейросети в творчестве

Wan2.1 GP

А может и революция

Доступная негерация видео на всего 12 ГБ видеопамяти старшей (14B) моделью генератора Wan2.1, квантизованной или неквантизованной. Хоть по тексту, хоть по картинке

До 5 секунд 720p. А для 5 секунд 480p будет достаточно 8Гб (это все еще 14B)

Уже в Pinokio

#text2video #image2video

GitHub

GitHub - deepbeepmeep/Wan2GP: A fast AI Video Generator for the GPU Poor. Supports Wan 2.1/2.2, Qwen Image, Hunyuan Video, LTX…

A fast AI Video Generator for the GPU Poor. Supports Wan 2.1/2.2, Qwen Image, Hunyuan Video, LTX Video and Flux. - deepbeepmeep/Wan2GP

🔥25🥴1

2.5K views11:34

Нейронавт | Нейросети в творчестве

1:53

This media is not supported in your browser

VIEW IN TELEGRAM

Phidias : A Generative Model for Creating 3D Content from Text, Image, and 3D Conditions with Reference-Augmented Diffusion

генератор 3D моделей по картинке, по тексту, по референсной 3D модели

Код - тестировали на RTX 4090 и A100

#textto3d #imageto3d #3dto3d

🔥7👍6👎1

2.04K views12:08

Нейронавт | Нейросети в творчестве

CogView4-6B

Генератор картинок
Конкурент flux

Поддерживает очень длинный контекст, хорошо следует промпту

Выходное разрешение от 512 до 2048 пикселей с шагом 32

По потреблению памяти терпимо. Главный вопрос что с кастомизацией?

Гитхаб
Демо

#text2image

🔥10👍2

1.95K views13:13

Нейронавт | Нейросети в творчестве

0:05

This media is not supported in your browser

VIEW IN TELEGRAM

Pandora3D

Генератор текстурированных 3D моделей от Tencent.

По тексту, по изображению, по набору изображений с разных ракурсов

В архиве 100Гб

Код

#textto3d #imageto3d

🔥4🥴4👍2

2.16K viewsedited 06:01

Нейронавт | Нейросети в творчестве

MoD ControlNet Tile Upscaler for SDXL

Апскейлер для #SDXL, апскейл происходит прямо в процессе диффузии

Код
Демо

#upscale

❤6

2.2K views06:39

About

Blog

Apps

Platform