Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.45K photos
3.72K videos
41 files
4.76K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
Объявляю субботнюю проверку мемов. Накидывайте в комментарии

#humor
😁41👍1🤯1
This media is not supported in your browser
VIEW IN TELEGRAM
StreamingT2V готовит обновку, показали в твиттере сравнение с Luma.
длинные 2-минутные видео, 1200 кадров

#text2video
👍13
Media is too big
VIEW IN TELEGRAM
Video-Infinity

Еще генератор видео. Качество 🫤
Зато быстрый как понос.
Способен создавать 2300 кадров видео за 5 минут за счет использования нескольких GPU. В 100 раз быстрее конкурентов

Код

#text2video
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7😁2
This media is not supported in your browser
VIEW IN TELEGRAM
LongVA

Конкурент Gemini в понимании длинных видео.
Демо периодически тупит, не видит загруженное видео.
Очень долго колупался пытаясь показать ей длинное видео - не получается. Делает вид что никакого видео не было. Спишем это на кривизну демки.

Иногда в порядке исключения видит и отвечает на вопросы.
Русский на видео, похоже, не понимает.

Гитхаб
Демо

#summary #VLM #video2text
👍5👀2😁1
AutoStudio: Crafting Consistent Subjects in Multi-turn Interactive Image Generation

Мультиагентная платформу для многократной генерации повторяющихся персонажей, не требующая обучения.
Та самая консистентность персонажей, но какой ценой.

AutoStudio использует три агента на основе больших языковых моделей (#LLM) для управления взаимодействиями, а также агент на основе стабильной диффузии (SD) для генерации высококачественных изображений

Уже совместимо с SD1.5 и SDXL.
ConmyUI на подходе

Код

#personalization #consisency #text2image
👍111
CLAY: A Controllable Large-scale Generative Model for Creating High-quality 3D Assets

Срыв покровов. Это внутрянка Rodin Gen-1

ControlNet и LoRA управляют изображением, вокселями облаком точек и баундинг боксом

Обещают релизнуть плагин для блендера

Код ждем
Демо

#imageto3D #tetxtto3D #text2scene #realtime
🔥6👍2
Media is too big
VIEW IN TELEGRAM
Depth Anywhere: Enhancing 360 Monocular Depth Estimation via Perspective Distillation and Unlabeled Data Augmentation

Генератор карт глубины для 360-градусных панорам.
Скажем, есть у вас HDRI с площадки. Приятно будет бесплатно получить еще и грубую модель локации?

Код ждем
Демо

#image2depth #panorama2depth
👍32
ResMaster: Mastering High-Resolution Image Generation via Structural and Fine-Grained Guidance

Бустер разрешения для генеративных моделей, ограниченных небольшим разрешением

Код ждем

#text2imnage #highresolution
👍5👌21