Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.45K photos
3.72K videos
41 files
4.76K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
Awesome World Models

Гитхаб, где собраны актуальные работы на тему моделей понимания/моделирования мира.

#world
2👍1
This media is not supported in your browser
VIEW IN TELEGRAM
IGGT: Instance-Grounded Geometry Transformer for Semantic 3D Reconstruction

Семантический реконструктор 3D сцен от StepFun и Ко.
#SOTA в 3D реконструкции и понимании сцен по 2D изображениям.

На вход принимает видео, набор изображений или RGBD

Сначала модель получает изображения и преобразует их в особый вид представления — токены. Для этого используется DINOv2. Потом эти токены обрабатываются 24 модулями внимания. Они анализируют изображения с разных точек зрения и объединяют информацию в единое представление.

Дальше это представление разделяется на два потока:

— один поток (Geometry Head) занимается геометрией: вычисляет параметры камеры, создаёт карты глубины и облака точек;

— другой поток (Instance Head) выделяет отдельные объекты в сцене, определяя их границы и особенности.

Чтобы лучше связать геометрию и объекты, используется специальный блок — Cross-Modal Fusion Block. Он помогает потоку с объектами «понимать» геометрию сцены, улучшая определение границ объектов. 1

Затем модель группирует найденные объекты в кластеры, используя метод HDBSCAN. Это позволяет создать маски, которые показывают, где в сцене находятся разные объекты. Эти маски можно использовать с разными языковыми моделями, чтобы задавать вопросы о сцене, сегментировать объекты или отслеживать их движение.

Код ждем

#video2scene #rgbd2scene #videoto3d #rgbdto3d #scenereconstruction
🔥53👍2
Forwarded from CG дневничок
This media is not supported in your browser
VIEW IN TELEGRAM
Coca-Cola перевыпустила свою легендарную новогоднюю рекламу — снова сгенерирована нейросетью. Но есть и хорошие новости, в отличие от прошлогодней рекламы — колеса у грузовиков теперь крутятся!

Судя по словам представителей бренда, в создании этого ролика участвовало около 100 человек.

99 продюсеров и 1 дизайнер 🤩
Please open Telegram to view this post
VIEW IN TELEGRAM
😁215🥴5👍3🔥1
В среду для запуска LLM Ollama завезли поддержку Qwen3-VL
В LM Studio, llama.cpp и Unsloth.ai - тоже

#assistant
👍12🔥1
BindWeave: Subject-Consistent Video Generation via Cross-Modal Integration

Горшочек не вари!

Генератор персонализированных видео от ByteDance

Умеет работать с промптами, описывающими сложные пространственные отношения, временную логику и взаимодействия между несколькими объектами.

Якобы превосходит существующие открытые и коммерческие модели по согласованности объектов, естественности и соответствию тексту. Ну посмотрим

Код лежит в бранчах, приз за внимательность @p0lygon
HF ~67 ГБ

#personalization #text2video #image2video #referencing
👍13🤔21
Forwarded from Stefan
Привет, комрады

https://civitai.com/models/2100616/wan-22-i2v-10-steps-nsfw-fp8-model

Вчера выпустил модель тюненую. Это все тот же Ван 2.2 10 шагов, только фп8 .... Потому что эта модель специально заточена под NSFW генерацию

Чтоб вам было проще - указал какие триггерные слова юзать, чтоб контроль был легче

На 5080 скорость генерации такая

480п - 2.30 минуты
1024х576 - 4 минуты

Квантизированные модели не ждите - это все же специфичная модель, которая лучше всего под nsfw подходит, да и круче модель нет смысла ставить под такое

Наслаждайтесь
🍌9👍2
Нейронавт | Нейросети в творчестве
NOF1 Лидерборд и живой график Здесь можно посмотреть как языковые модели справляются с трейдингом Проект использует финансовые рынки для обучения новых базовых моделей ИИ. Утверждается, что финансовые рынки являются лучшим бенчмарком для ИИ, так как они…
Финита ля комедия. Эксперимент завершен.

Лучшим трейдером оказался Qwen 3 MAX - с убытком всего -3.57%
Cледом за ним идет DeepSeek Chat v1.3 - с убытком -37%, ему в спину дышит Gemini 2.5 PRO

Последний - GPT 5, он прос*ал больше половины депозита, -57.92%

Напомню, что трейдинг это казино, где гарантированно выигрывает только казино. На другом интервале результат был бы другой. Например 26 октября Дипсик всех опустил наторговав до $23000

#leaderboard #arena #trading #agent #news
😁233👍3👨‍💻1
Превью Qwen3-Max-Thinking

Предварительную версию можно попробовать в Qwen Chat и Alibaba Cloud API

Qwen Chat
Alibaba Cloud API

#assistant #reasoning
7👍2🔥1
Forwarded from CG Kung Fu
Вот оно начало конца.
Сегодня у нас был мит по ИИ, Дисней апрувнул использования ИИ в работе. Но пока как показ драфт концепт версий в ФХ департаменте своих симуляций и утверждать их с супервайзером, и в нашем енвире генерить апрезы и как картинки прожектить на локации или скалы или землю чтоб добавить деталей. То есть либо концепт версии либо апрез.

Дали нам все ссылки и материалы и доступы, будут обучать нас комфи UI.
И уже разрабатывают тулзы чтоб контролить ИИ по максимуму и юзать в шотах, делают тесты и тд, весь след год будет этому посвящен.

К слову скоро курсы по гуде запускать буду хаха. Вот такой у меня прогрев.
👍9