Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.43K photos
3.7K videos
41 files
4.74K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
SpatialGen: Layout-guided 3D Indoor Scene Generation

Cоздает фотореалистичные 3D-сцены интерьеров на основе 3D семантического макета и подсказки в виде текста или изображения

Под капотом FLUX.1-Wireframe-dev-lora и SpatialGen-1.0, который является производным от SD2.1

Код
HF

#segmentation2scene #segmentationto3d #layoutto3d #layout2scene
4👍2
Open-o3 Video: Grounded Video Reasoning with Explicit Spatio-Temporal Evidence

Пониматор видео на базе Qwen2.5-VL

Интегрирует в процесс рассуждений ключевые временные метки и ограничивающие рамки, что позволяет делать выводы более обоснованными и надёжными.

Гитхаб
HF

#vlm #video2text #reasoning #captioning
5👍2
This media is not supported in your browser
VIEW IN TELEGRAM
Stability AI объявили о сотрудничестве с EA чтобы совместно разрабатывать генеративные ИИ-модели, инструменты и рабочие процессы. Их цели:

- ускорить итерации и рабочие процессы в разработке игр

- расширить творческие возможности дизайнеров, разработчиков и художников EA

- внедрить генеративный ИИ в творческие рабочие процессы, чтобы ускорить прототипирование и визуальное повествование

- ускорить создание PBR материалов

- разработать ИИ-системы, которые смогут предварительно визуализировать целые 3D-среды

#news
3👀3👍2
Тем временем ComfyUI вошел в ТОП-100 репозиториев на Гитхабе

#news
1👍24🔥92
Language Models are Injective and Hence Invertible

Исследование языковых моделей на трансформерах показало, что они "ОБРАТИМЫ"

Это означает, что теперь мы можем точно восстановить ИСХОДНЫЙ промпт по скрытым активациям с помощью SIPit, нового алгоритма с гарантиями линейного времени.

Информация о входном тексте почти наверняка сохраняется в скрытых представлениях модели, опровергая мнение о «потере» информации из-за нелинейностей и других факторов.

Картинка из папиры, загадочная и непостижимая для меня, просто для красоты

#news
1👍6🤔4🔥3
Стартапы миллиардеры такие

#humor
😁5👍2🤷‍♂1
YouTube запустил инструмент для поиска фейков, созданных с помощью ИИ. Доступ дали некоторым участникам партнёрской программы.

Авторы роликов могут проверять и удалять видео, в которых несанкционированно использована их внешность

После подтверждения личности авторы могут просматривать помеченные видео во вкладке Content Detection в YouTube Studio

#news
👍1😱1
Если вы устанавливали себе Topaz starlight-mini, сейчас он у вас работает?
Anonymous Poll
6%
Проверил - работает
4%
Проверил, не раоотает
90%
Не устанавливал, посмотрю результаты
🔥2👍1
Mirage Studio бесплатно

Сервис говорящих аватаров от Captions объявил бесплатную генерацию видео на эти выходные, до 11:00 понедельника по московскому времени

Попробовать

#humananimation #speech2video #humanavatar #talkinghead #giveaway
5👍2🔥1
LongCat-Video

Бдительные подписчики не дадут пропустить выход нового видеогенератора даже в выходной

Новая базовая (не является доработкой WAN или другого видеогенератора) опенсорсная модель видеогенерации на 13.6B параметров

Умеет создавать видео по тексту, картинке и продлевать исходное видео. Все это делает одна модель, а не разные ее модицфикации как у WAN

Основная особенность - создает длинные видео (несколько минут) не теряя связности и не деградируя.

Выдает 189 кадров в 720p за 142 секунды на H800. 16/5 шагов с flash attention 3.

Авторы использовали обучение с подкреплением по методу GRPO (как в BLIP3o-NEXT)

Позиционируют модель как "первый шаг к модели мира"

Гитхаб
HF - там только текстовый энкодер весит 23 ГБ, а DIT — 55 ГБ

Ждем кванты и воркфлоу?

Спасибо @m_franz

#text2video #image2video #video2video
🔥24😱62👍1👎1