Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.45K photos
3.72K videos
41 files
4.76K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
Media is too big
VIEW IN TELEGRAM
VastGaussian: Vast 3D Gaussians for Large Scene Reconstruction

Реконструкция больших сцен гауссианами. Бьет всех конкурентов, с которыми решил померяться. Рендерит в реальном времени. Под капотом дробление сцены на ячейки.

Код ждем

#gaussian #rendering #nivelview #realtime
👍9🔥5😱1
This media is not supported in your browser
VIEW IN TELEGRAM
ComfyUI_NetDist

Запуск ComfyUI на нескольких локальных видеокартах/сетевых машинах.
У кого-то праздник сегодня.

#tools #SD
👏13🔥10👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Read Aloud

ChatGPT на iOS и Android теперь может произносить вам свои ответы вслух

#news
👍4
OneDiff v0.12.1

Обновка ускорителя диффузных генераторов OneDiff

Поддержка diffusers, ComfyUI, A1111

Гитхаб

#text2image #text2video #tools
👍4
Emad в твиттере намекнул на грядущий доступ (всеобщий? для избранных?) к Stable diffusion 3

#news
🔥9
С празником, прекрасные💖
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥15
#оффтоп
Посмотрел Дюну 2

Вопреки прочитанным отзывам, фильм не показался динамичнее первой части. Так же затянут и нетороплив. Обещанный экшен появляется только в последние полчаса почти трехчасового фильма. Раньше - мелкими эпизодами. Впрочем, я мог забыть насколько нетороплива первая часть.

В целом хорош, не хуже первой части. Конфликты и мотивация персонажей четко обозначены. Кроме предательства, которое мы видим в конце. Но его причины, полагаю, нам раскроют в третьей части.

А теперь ложка спойлеров дегтя.

Сцена где Пол должен пересечь пустыню обрывается совершенно внезапно. Мы больше ни разу не вспомним об опасностях пустыни, о которых его предупреждали при инструктаже. Видимо, этой сценой пожертвовали на монтаже. Имхо, стоило бы так же поступить с еще 30 минутами там и сям.

Почему Харконнены нашли и разбомбили фрименов только в середине фильма? В чем причина их неожиданной осведомленности о месте их дислокации? Сцены шпионки, видимо, тоже покромсали.

Почему добытчики специи, имея радары, не могут иметь тепловизоры чтобы обнаружить засаду фрименов? Откуда у фрименов такое технологичное оружие? Как фримены узнают место куда прилетят добытчики чтобы устроить засаду?

Как и у Нолана,
ядерный взрыв не выглядит ядерным. И радиацию отменили

Коллективные катания на черве позабавили. Сначала нам показывают что катание на нем недоступно обычному человеку, доступно только фрименам. Потом вижу колотушку и толпу фрименов - говорю: очередь на автобус. И оказалось что угадал. Оказывается, на черве можно не только кататься всем цыганским табором, но еще и легко перевозить паланкин с беременной женщиной.

Короче, кому понравилась первая часть - понравится и вторая если не идти с великими ожиданиями. В целом отличное кино, но как говорит мой друг, есть вопросики.

Наверно надо добавить еще тег #набрюзжал
👍83😁3🤔2🔥1
PIXART-Σ:Weak-to-Strong Training of Diffusion Transformer for 4K Text-to-Image Generation

Генератор картинок от Huawei. 4K, хорошее понимание промпта.
Демки и колаб которые вам показывают - с предыдущей версией модели - PixArt-α

Код ждем

#text2image
👍1
This media is not supported in your browser
VIEW IN TELEGRAM
VideoCutLER

К CutLER прикрутили простую обработку видеопотока, и теперь он может сегментировать объекты на видео.

Код

#image2mask #segmentation
👍5🤔1
This media is not supported in your browser
VIEW IN TELEGRAM
HDRFlow: Real-Time HDR Video Reconstruction with Large Motions

Реконструкция в реальном времени HDR видео из видео с переменной экспозицией

Код

#realtive #video #hdr
👍12
ELLA: Equip Diffusion Models with LLM for Enhanced Semantic Alignment

Ультимативное решение для понимания диффузными моделями промпта. Вместо CLIP интегрировать в модель мощную языковую модель (LLM)

Код ждем

#text2image
👍16🔥4😎3
Forwarded from CGIT_Vines (Marvin Heemeyer)
This media is not supported in your browser
VIEW IN TELEGRAM
Вышел в доступ инструмент для управления поведением цифровых агентов.

🧠 Первый, SAGA (Skill to Action Generation), который настраивает поведение.

Агенты сначала сообщают контекстуальные метаданные SAGA о себе и своем мире посредством сопутствующей симуляции: кто они; что они знают; какие у них «навыки»; и каковы их цели. Затем, когда агент решает, что делать дальше, SAGA генерирует набор «действий», которые лучше всего служат целям агента в данный момент. Эти варианты действий затем оцениваются и возвращаются в симуляцию, чтобы дать указания агенту. Этот процесс повторяется каждый раз, когда агент решает свое следующее действие, и может быть масштабирован для одновременной работы нескольких агентов.

🧠 И второй, MAGE (Multi-Agent Gym Environment), представляет среду, песочницу для взаимодействия агентов. По сути, это окружение, в котором агенты существуют, выполненное в стиле городка Дикого Запада (хех, совпадения с Westworld случайны).

Для вас на выбор 15 агентов со своей историей, что называется метавоспоминания. Далее вы можете моделировать события, на которые агенты будут реагировать исходя из набора своих навыков и подобия "воли".

Подозреваю, что прямо сейчас профессия нарративщика обрастает новыми навыками: теперь не просто нужно написать историю, но и в достаточной степени натренировать и настроить модули ИИ поведения для агентов, его характер, прописать метавоспоминания и цели.

Я бы с удовольствием сделал бы подкаст с людьми, которые глубоко окунулись в моделирование поведения игрового ИИ с помощью подобных инструментов. Пишите!
Please open Telegram to view this post
VIEW IN TELEGRAM
9
This media is not supported in your browser
VIEW IN TELEGRAM
InstaSwap

Не знаю есть ли тут какая-то инновация, за фейссвоперами уже не успеваю следить. Но вот держите заменятор лиц

InstaSwap standalone
InstaSwap ComfyUI

#faceswap #personalize
😁113👍1🤔1🎃1
PeRFlow: Piecewise Rectified Flow as Universal Plug-and-Play Accelerator

Ускоритель генерации. Для работы потребуется предварительно дообучить ускоряемую модель. Но получаем и плюсы в виде качества генерации.

Код
Демо PeRFlow-T2I
Демо PeRFlow-T2I с TripoSR

#optimization #text2image
🔥5👍1