Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.44K photos
3.71K videos
41 files
4.75K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
Закинул видео своего медведя на реконструкцию в HunyuanWorld-Mirror по 24 отобранным кадрам

Гауссова сцена далека от идеала, на меш интереснее смотреть. Надо увеличивать количество ракурсов.

Закину гауссианы и меш в комменты для интересующихся

#videoto3d #video2scene #gaussian #imageto3d #image2scene #video2gaussian #video2normal #video2depth #image2normal #image2depth
4👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Claude Desktop

Десктопный ИИ-ассистент от Anthropic раздали всем, а то ишь, Атлас отбивает аудиторию

#MacOS / #Windows

#desktop #assistant
🥴10👍5👎1
BLIP3o-NEXT: Advanced Multimodal Foundation Model

Мультимодальная модель, развитие BLIP3o
Гибрид авторегресси и диффузии
Генератор / пониматор картинок от Salesforce

Улучшенное соответствие подсказкам и точность рендеринга текста за счет обучения с подкреплением по методу GRPO

Хорошо справляется с задачами, требующими пространственной структуры (например, рендеринг текста или генерация нескольких объектов

Гитхаб
HF - там целый зоопарк от 3B до 8B

#text2image #image2text #multimodal #ar #captioning
👍61
когда твоя девушка работала через AWS

контекст:
на днях полег облачный сервис AWS прихватив с собой полмира, включая
не только крупнейшие сайты, но и умные матрасы. И это на фоне сообщения о том что Amazon якобы заменил 40% DevOps-инженеров AWS искусственным интеллектом за несколько дней до сбоя

#humor
😁27🤷‍♂2👍1
LTX-2

Новая версия видеогенератора от Lightricks
Создает видео со звуком в 4K, 50 фпс, рилтайм (нет)

На вход можно подать что угодно: текст, изображения, видео, аудио, карты глубины и отснятый материал для управляемой генерации

Поддерживает лоры и генерацию по нескольким ключевым кадрам

Попробовать (кроме россиян), можно на офсайте

Уже есть на Fal.ai, также можно чекнуть Replicate, ComfyUI

Тест человекорыбом частично провалился. Где рыба, Лебовски?

И тоже не умеет делать лунную походку.

Может оно и 4К по количеству пикселей но не по качеству. Ну зато быстрый. Ждем опенсорс

Гитхаб - новую модель опубликуют в конце ноября

Спасибо @m_franz

#any2video #text2video #image2video
🔥8😱211👍1
Media is too big
VIEW IN TELEGRAM
HoloCine: Holistic Generation of Cinematic Multi-Shot Long Video Narratives

Еще один Enlarge your video
Генератор многоплановых монтажных видеонарративов на базе Wan 2.2.

Как и MoGa способен генерировать связные истории, а не только отдельные клипы.

Может воссоздавать знаковые сцены из классических фильмов, демонстрируя понимание кинематографического наследия и стиля

Код
HF - полные веса 2*57 ГБ, sparse - 1*57 ГБ. Обещают версии 14B-full-l (длинее 1 минуты) и 5B для VRAM-бедняков

#text2movie #text2film #movie #text2video #image2video
8👍2🤔1
This media is not supported in your browser
VIEW IN TELEGRAM
SpatialGen: Layout-guided 3D Indoor Scene Generation

Cоздает фотореалистичные 3D-сцены интерьеров на основе 3D семантического макета и подсказки в виде текста или изображения

Под капотом FLUX.1-Wireframe-dev-lora и SpatialGen-1.0, который является производным от SD2.1

Код
HF

#segmentation2scene #segmentationto3d #layoutto3d #layout2scene
4👍2
Open-o3 Video: Grounded Video Reasoning with Explicit Spatio-Temporal Evidence

Пониматор видео на базе Qwen2.5-VL

Интегрирует в процесс рассуждений ключевые временные метки и ограничивающие рамки, что позволяет делать выводы более обоснованными и надёжными.

Гитхаб
HF

#vlm #video2text #reasoning #captioning
5👍2