NEW BOT Телеграм, страница

Нейронавт | Нейросети в творчестве

BLIP3o-NEXT: Advanced Multimodal Foundation Model

Мультимодальная модель, развитие BLIP3o
Гибрид авторегресси и диффузии
Генератор / пониматор картинок от Salesforce

Улучшенное соответствие подсказкам и точность рендеринга текста за счет обучения с подкреплением по методу GRPO

Хорошо справляется с задачами, требующими пространственной структуры (например, рендеринг текста или генерация нескольких объектов

Гитхаб
HF - там целый зоопарк от 3B до 8B

#text2image #image2text #multimodal #ar #captioning

👍6❤1

2.11K views16:12

Нейронавт | Нейросети в творчестве

когда твоя девушка работала через AWS

контекст:
на днях полег облачный сервис AWS прихватив с собой полмира, включая

не только крупнейшие сайты, но и умные матрасы

. И это на фоне сообщения о том что Amazon якобы заменил 40% DevOps-инженеров AWS искусственным интеллектом за несколько дней до сбоя

#humor

😁27🤷‍♂2👍1

2.01K views17:21

Нейронавт | Нейросети в творчестве

Claude Desktop Десктопный ИИ-ассистент от Anthropic раздали всем, а то ишь, Атлас отбивает аудиторию #MacOS / #Windows #desktop #assistant

#Humor

😁21👍1

1.7K views06:37

Нейронавт | Нейросети в творчестве

0:08

This media is not supported in your browser

VIEW IN TELEGRAM

0:08

This media is not supported in your browser

VIEW IN TELEGRAM

0:08

This media is not supported in your browser

VIEW IN TELEGRAM

0:06

This media is not supported in your browser

VIEW IN TELEGRAM

LTX-2

Новая версия видеогенератора от Lightricks
Создает видео со звуком в 4K, 50 фпс, рилтайм (нет)

На вход можно подать что угодно: текст, изображения, видео, аудио, карты глубины и отснятый материал для управляемой генерации

Поддерживает лоры и генерацию по нескольким ключевым кадрам

Попробовать (кроме россиян), можно на офсайте

Уже есть на Fal.ai, также можно чекнуть Replicate, ComfyUI

Тест человекорыбом частично провалился. Где рыба, Лебовски?

И тоже не умеет делать лунную походку.

Может оно и 4К по количеству пикселей но не по качеству. Ну зато быстрый. Ждем опенсорс

Гитхаб - новую модель опубликуют в конце ноября

Спасибо @m_franz

#any2video #text2video #image2video

🔥8😱2❤1⚡1👍1

1.74K views07:10

Нейронавт | Нейросети в творчестве

ахах!
лайтрикс что за намеки?

#humor

😁12👍1

1.58K views07:29

Нейронавт | Нейросети в творчестве

Sa2VA-Qwen3-VL-4B

ByteDance выпустил Sa2VA на Qwen3-VL-4B
Модель объединяет SAM2 и LLaVA для глубокого понимания изображений и видео

Гитхаб

#segmentation #vlm #assistant #video2text #vide2mask #captiopning

huggingface.co

ByteDance/Sa2VA-Qwen3-VL-4B · Hugging Face

We’re on a journey to advance and democratize artificial intelligence through open source and open science.

🔥10👍2🤔1

2.13K views08:11

Нейронавт | Нейросети в творчестве

1:25

Media is too big

VIEW IN TELEGRAM

HoloCine: Holistic Generation of Cinematic Multi-Shot Long Video Narratives

Еще один Enlarge your video
Генератор многоплановых монтажных видеонарративов на базе Wan 2.2.

Как и MoGa способен генерировать связные истории, а не только отдельные клипы.

Может воссоздавать знаковые сцены из классических фильмов, демонстрируя понимание кинематографического наследия и стиля

Код
HF - полные веса 2*57 ГБ, sparse - 1*57 ГБ. Обещают версии 14B-full-l (длинее 1 минуты) и 5B для VRAM-бедняков

#text2movie #text2film #movie #text2video #image2video

❤8👍2🤔1

1.8K views10:13

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

SpatialGen: Layout-guided 3D Indoor Scene Generation

Cоздает фотореалистичные 3D-сцены интерьеров на основе 3D семантического макета и подсказки в виде текста или изображения

Под капотом FLUX.1-Wireframe-dev-lora и SpatialGen-1.0, который является производным от SD2.1

Код
HF

#segmentation2scene #segmentationto3d #layoutto3d #layout2scene

❤4👍2

2.21K views11:14

Нейронавт | Нейросети в творчестве

1:00

This media is not supported in your browser

VIEW IN TELEGRAM

0:20

This media is not supported in your browser

VIEW IN TELEGRAM

1:11

This media is not supported in your browser

VIEW IN TELEGRAM

0:24

This media is not supported in your browser

VIEW IN TELEGRAM

Open-o3 Video: Grounded Video Reasoning with Explicit Spatio-Temporal Evidence

Пониматор видео на базе Qwen2.5-VL

Интегрирует в процесс рассуждений ключевые временные метки и ограничивающие рамки, что позволяет делать выводы более обоснованными и надёжными.

Гитхаб
HF

#vlm #video2text #reasoning #captioning

❤5👍2

2.21K views12:16

Нейронавт | Нейросети в творчестве

0:07

This media is not supported in your browser

VIEW IN TELEGRAM

Stability AI объявили о сотрудничестве с EA чтобы совместно разрабатывать генеративные ИИ-модели, инструменты и рабочие процессы. Их цели:

- ускорить итерации и рабочие процессы в разработке игр

- расширить творческие возможности дизайнеров, разработчиков и художников EA

- внедрить генеративный ИИ в творческие рабочие процессы, чтобы ускорить прототипирование и визуальное повествование

- ускорить создание PBR материалов

- разработать ИИ-системы, которые смогут предварительно визуализировать целые 3D-среды

#news

⚡3👀3👍2

2.14K views13:14

Нейронавт | Нейросети в творчестве

Тем временем ComfyUI вошел в ТОП-100 репозиториев на Гитхабе

#news

1👍24🔥9❤2

1.8K views18:21

Нейронавт | Нейросети в творчестве

Тем временем ComfyUI вошел в ТОП-100 репозиториев на Гитхабе #news

ТОП 25 причин пользоваться ComfyUI

😁18👍4

1.85K views18:51

Нейронавт | Нейросети в творчестве

Language Models are Injective and Hence Invertible

Исследование языковых моделей на трансформерах показало, что они "ОБРАТИМЫ"

Это означает, что теперь мы можем точно восстановить ИСХОДНЫЙ промпт по скрытым активациям с помощью SIPit, нового алгоритма с гарантиями линейного времени.

Информация о входном тексте почти наверняка сохраняется в скрытых представлениях модели, опровергая мнение о «потере» информации из-за нелинейностей и других факторов.

Картинка из папиры, загадочная и непостижимая для меня, просто для красоты

#news

1👍6🤔4🔥3

1.83K views07:11

About

Blog

Apps

Platform