SMPLer-X: Scaling Up Expressive Human Pose and Shape Estimation
Определение 3D позы по одному ракурсу
Код
Демо
#image2pose #video2pose #poseestimation
Определение 3D позы по одному ракурсу
Код
Демо
#image2pose #video2pose #poseestimation
🔥4👍2
Media is too big
VIEW IN TELEGRAM
VastGaussian: Vast 3D Gaussians for Large Scene Reconstruction
Реконструкция больших сцен гауссианами. Бьет всех конкурентов, с которыми решил померяться . Рендерит в реальном времени. Под капотом дробление сцены на ячейки.
Код ждем
#gaussian #rendering #nivelview #realtime
Реконструкция больших сцен гауссианами. Бьет всех конкурентов
Код ждем
#gaussian #rendering #nivelview #realtime
👍9🔥5😱1
This media is not supported in your browser
VIEW IN TELEGRAM
ComfyUI_NetDist
Запуск ComfyUI на нескольких локальных видеокартах/сетевых машинах.
У кого-то праздник сегодня.
#tools #SD
Запуск ComfyUI на нескольких локальных видеокартах/сетевых машинах.
У кого-то праздник сегодня.
#tools #SD
👏13🔥10👍1
OneDiff v0.12.1
Обновка ускорителя диффузных генераторов OneDiff
Поддержка diffusers, ComfyUI, A1111
Гитхаб
#text2image #text2video #tools
Обновка ускорителя диффузных генераторов OneDiff
Поддержка diffusers, ComfyUI, A1111
Гитхаб
#text2image #text2video #tools
👍4
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥15
#оффтоп
Посмотрел Дюну 2
Вопреки прочитанным отзывам, фильм не показался динамичнее первой части. Так же затянут и нетороплив. Обещанный экшен появляется только в последние полчаса почти трехчасового фильма. Раньше - мелкими эпизодами. Впрочем, я мог забыть насколько нетороплива первая часть.
В целом хорош, не хуже первой части. Конфликты и мотивация персонажей четко обозначены. Кроме предательства, которое мы видим в конце. Но его причины, полагаю, нам раскроют в третьей части.
А теперь ложкаспойлеров дегтя.
Сцена где Пол должен пересечь пустыню обрывается совершенно внезапно. Мы больше ни разу не вспомним об опасностях пустыни, о которых его предупреждали при инструктаже. Видимо, этой сценой пожертвовали на монтаже. Имхо, стоило бы так же поступить с еще 30 минутами там и сям.
Почему Харконнены нашли и разбомбили фрименов только в середине фильма? В чем причина их неожиданной осведомленности о месте их дислокации? Сцены шпионки, видимо, тоже покромсали.
Почему добытчики специи, имея радары, не могут иметь тепловизоры чтобы обнаружить засаду фрименов? Откуда у фрименов такое технологичное оружие? Как фримены узнают место куда прилетят добытчики чтобы устроить засаду?
Как и у Нолана,
ядерный взрыв не выглядит ядерным. И радиацию отменили
Коллективные катания на черве позабавили. Сначала нам показывают что катание на нем недоступно обычному человеку, доступно только фрименам. Потом вижу колотушку и толпу фрименов- говорю: очередь на автобус. И оказалось что угадал. Оказывается, на черве можно не только кататься всем цыганским табором, но еще и легко перевозить паланкин с беременной женщиной.
Короче, кому понравилась первая часть - понравится и вторая если не идти с великими ожиданиями. В целом отличное кино, но как говорит мой друг, есть вопросики.
Наверно надо добавить еще тег #набрюзжал
Посмотрел Дюну 2
Вопреки прочитанным отзывам, фильм не показался динамичнее первой части. Так же затянут и нетороплив. Обещанный экшен появляется только в последние полчаса почти трехчасового фильма. Раньше - мелкими эпизодами. Впрочем, я мог забыть насколько нетороплива первая часть.
В целом хорош, не хуже первой части. Конфликты и мотивация персонажей четко обозначены. Кроме предательства, которое мы видим в конце. Но его причины, полагаю, нам раскроют в третьей части.
А теперь ложка
Сцена где Пол должен пересечь пустыню обрывается совершенно внезапно. Мы больше ни разу не вспомним об опасностях пустыни, о которых его предупреждали при инструктаже. Видимо, этой сценой пожертвовали на монтаже. Имхо, стоило бы так же поступить с еще 30 минутами там и сям.
Почему Харконнены нашли и разбомбили фрименов только в середине фильма? В чем причина их неожиданной осведомленности о месте их дислокации? Сцены шпионки, видимо, тоже покромсали.
Почему добытчики специи, имея радары, не могут иметь тепловизоры чтобы обнаружить засаду фрименов? Откуда у фрименов такое технологичное оружие? Как фримены узнают место куда прилетят добытчики чтобы устроить засаду?
Коллективные катания на черве позабавили. Сначала нам показывают что катание на нем недоступно обычному человеку, доступно только фрименам. Потом вижу колотушку и толпу фрименов
Короче, кому понравилась первая часть - понравится и вторая если не идти с великими ожиданиями. В целом отличное кино, но как говорит мой друг, есть вопросики.
Наверно надо добавить еще тег #набрюзжал
👍8❤3😁3🤔2🔥1
PIXART-Σ:Weak-to-Strong Training of Diffusion Transformer for 4K Text-to-Image Generation
Генератор картинок от Huawei. 4K, хорошее понимание промпта.
Демки и колаб которые вам показывают - с предыдущей версией модели - PixArt-α
Код ждем
#text2image
Генератор картинок от Huawei. 4K, хорошее понимание промпта.
Демки и колаб которые вам показывают - с предыдущей версией модели - PixArt-α
Код ждем
#text2image
👍1
This media is not supported in your browser
VIEW IN TELEGRAM
VideoCutLER
К CutLER прикрутили простую обработку видеопотока, и теперь он может сегментировать объекты на видео.
Код
#image2mask #segmentation
К CutLER прикрутили простую обработку видеопотока, и теперь он может сегментировать объекты на видео.
Код
#image2mask #segmentation
👍5🤔1
This media is not supported in your browser
VIEW IN TELEGRAM
HDRFlow: Real-Time HDR Video Reconstruction with Large Motions
Реконструкция в реальном времени HDR видео из видео с переменной экспозицией
Код
#realtive #video #hdr
Реконструкция в реальном времени HDR видео из видео с переменной экспозицией
Код
#realtive #video #hdr
👍12
ELLA: Equip Diffusion Models with LLM for Enhanced Semantic Alignment
Ультимативное решение для понимания диффузными моделями промпта. Вместо CLIP интегрировать в модель мощную языковую модель (LLM)
Код ждем
#text2image
Ультимативное решение для понимания диффузными моделями промпта. Вместо CLIP интегрировать в модель мощную языковую модель (LLM)
Код ждем
#text2image
👍16🔥4😎3
Forwarded from CGIT_Vines (Marvin Heemeyer)
This media is not supported in your browser
VIEW IN TELEGRAM
Вышел в доступ инструмент для управления поведением цифровых агентов.
🧠 Первый, SAGA (Skill to Action Generation), который настраивает поведение.
Агенты сначала сообщают контекстуальные метаданные SAGA о себе и своем мире посредством сопутствующей симуляции: кто они; что они знают; какие у них «навыки»; и каковы их цели. Затем, когда агент решает, что делать дальше, SAGA генерирует набор «действий», которые лучше всего служат целям агента в данный момент. Эти варианты действий затем оцениваются и возвращаются в симуляцию, чтобы дать указания агенту. Этот процесс повторяется каждый раз, когда агент решает свое следующее действие, и может быть масштабирован для одновременной работы нескольких агентов.
🧠 И второй, MAGE (Multi-Agent Gym Environment), представляет среду, песочницу для взаимодействия агентов. По сути, это окружение, в котором агенты существуют, выполненное в стиле городка Дикого Запада (хех, совпадения с Westworld случайны).
Для вас на выбор 15 агентов со своей историей, что называется метавоспоминания. Далее вы можете моделировать события, на которые агенты будут реагировать исходя из набора своих навыков и подобия "воли".
Подозреваю, что прямо сейчас профессия нарративщика обрастает новыми навыками: теперь не просто нужно написать историю, но и в достаточной степени натренировать и настроить модули ИИ поведения для агентов, его характер, прописать метавоспоминания и цели.
Я бы с удовольствием сделал бы подкаст с людьми, которые глубоко окунулись в моделирование поведения игрового ИИ с помощью подобных инструментов. Пишите!
Агенты сначала сообщают контекстуальные метаданные SAGA о себе и своем мире посредством сопутствующей симуляции: кто они; что они знают; какие у них «навыки»; и каковы их цели. Затем, когда агент решает, что делать дальше, SAGA генерирует набор «действий», которые лучше всего служат целям агента в данный момент. Эти варианты действий затем оцениваются и возвращаются в симуляцию, чтобы дать указания агенту. Этот процесс повторяется каждый раз, когда агент решает свое следующее действие, и может быть масштабирован для одновременной работы нескольких агентов.
Для вас на выбор 15 агентов со своей историей, что называется метавоспоминания. Далее вы можете моделировать события, на которые агенты будут реагировать исходя из набора своих навыков и подобия "воли".
Подозреваю, что прямо сейчас профессия нарративщика обрастает новыми навыками: теперь не просто нужно написать историю, но и в достаточной степени натренировать и настроить модули ИИ поведения для агентов, его характер, прописать метавоспоминания и цели.
Я бы с удовольствием сделал бы подкаст с людьми, которые глубоко окунулись в моделирование поведения игрового ИИ с помощью подобных инструментов. Пишите!
Please open Telegram to view this post
VIEW IN TELEGRAM
❤9
This media is not supported in your browser
VIEW IN TELEGRAM
InstaSwap
Не знаю есть ли тут какая-то инновация, за фейссвоперами уже не успеваю следить. Но вот держите заменятор лиц
InstaSwap standalone
InstaSwap ComfyUI
#faceswap #personalize
Не знаю есть ли тут какая-то инновация, за фейссвоперами уже не успеваю следить. Но вот держите заменятор лиц
InstaSwap standalone
InstaSwap ComfyUI
#faceswap #personalize
😁11❤3👍1🤔1🎃1
PeRFlow: Piecewise Rectified Flow as Universal Plug-and-Play Accelerator
Ускоритель генерации. Для работы потребуется предварительно дообучить ускоряемую модель. Но получаем и плюсы в виде качества генерации.
Код
Демо PeRFlow-T2I
Демо PeRFlow-T2I с TripoSR
#optimization #text2image
Ускоритель генерации. Для работы потребуется предварительно дообучить ускоряемую модель. Но получаем и плюсы в виде качества генерации.
Код
Демо PeRFlow-T2I
Демо PeRFlow-T2I с TripoSR
#optimization #text2image
🔥5👍1