PERSONA: Personalized Whole-Body 3D Avatar with Pose-Driven Deformations from a Single Image
Полный 3D аватар человека по одной картинке, управляемый позой - переносом движения с образца.
Код
Спасибо @m_franz
#humanavatar #characteranimation #pose2video
Полный 3D аватар человека по одной картинке, управляемый позой - переносом движения с образца.
Код
Спасибо @m_franz
#humanavatar #characteranimation #pose2video
❤9👍2😁1
Mirage 2
Новая версия генератора игровых миров игрового движка от Dynamycs Lab
Можно загрузить свою картинку с описанием или без описания - создаст игру в вашей картинке.
Помимо направления движения можно крутить камеру курсорами, прыгать, атаковать. Ну и потом скачать видео игрового процесса.
Если персонаж затупил жмем Shift
Ну и можно делиться ссылкой на свой мир https://demo.dynamicslab.ai/chaos?init_id=aec81151-9a6b-48db-9c9a-2debd6ea7cbc
Подрезал у @cgevent
#game #realtime #world #text2world
Новая версия генератора игровых миров игрового движка от Dynamycs Lab
Можно загрузить свою картинку с описанием или без описания - создаст игру в вашей картинке.
Помимо направления движения можно крутить камеру курсорами, прыгать, атаковать. Ну и потом скачать видео игрового процесса.
Если персонаж затупил жмем Shift
Ну и можно делиться ссылкой на свой мир https://demo.dynamicslab.ai/chaos?init_id=aec81151-9a6b-48db-9c9a-2debd6ea7cbc
Подрезал у @cgevent
#game #realtime #world #text2world
👍8
Media is too big
VIEW IN TELEGRAM
Qoder
Агентная платформа для вайбкодинга от Alibaba
Понимает архитектуру проекта.
Есть два режима
Chat Mode - быстрые задачи в чате
Quest Mode - расписываем ТЗ и делегируем агенту
Есть бесплатный ограниченный тариф с двухнедельной триалкой Pro тарифа
Устанавливается локально #macos / #windows
#vibecoding #agent #coding #desktop
Агентная платформа для вайбкодинга от Alibaba
Понимает архитектуру проекта.
Есть два режима
Chat Mode - быстрые задачи в чате
Quest Mode - расписываем ТЗ и делегируем агенту
Есть бесплатный ограниченный тариф с двухнедельной триалкой Pro тарифа
Устанавливается локально #macos / #windows
#vibecoding #agent #coding #desktop
👍4❤1🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
DeepSeek-V3.1 уже в официальном чате.
21 августа опубликовали релиз.
- гибридный вывод: два режима — Think (с мышлением) и Non-Think;
- ускоренное получение ответов в режиме Think по сравнению с DeepSeek-R1-0528;
- улучшенные навыки агента: после обучения модель лучше использует инструменты и справляется с многошаговыми задачами;
- API-обновления: поддерживаются формат Anthropic API и строгий вызов функций в бета-API;
- контекст до 128K для режимов deepseek-chat (Non-Think) и deepseek-reasoner (Think); 1
- обновления в области инструментов и агентов: улучшены результаты в тестах SWE и Terminal-Bench, повышена эффективность многошагового рассуждения и мышления;
Попробовать в чате
#news #assistant
21 августа опубликовали релиз.
- гибридный вывод: два режима — Think (с мышлением) и Non-Think;
- ускоренное получение ответов в режиме Think по сравнению с DeepSeek-R1-0528;
- улучшенные навыки агента: после обучения модель лучше использует инструменты и справляется с многошаговыми задачами;
- API-обновления: поддерживаются формат Anthropic API и строгий вызов функций в бета-API;
- контекст до 128K для режимов deepseek-chat (Non-Think) и deepseek-reasoner (Think); 1
- обновления в области инструментов и агентов: улучшены результаты в тестах SWE и Terminal-Bench, повышена эффективность многошагового рассуждения и мышления;
Попробовать в чате
#news #assistant
👍8❤1😁1
Нейронавт | Нейросети в творчестве
Qwen-Image-DiffSynth-ControlNets Контролнеты от DyffSynth под #qwenimage лежат в репозитории Comfy-Org Поддержка контролнетов под Qwen в #ComfyUI же, да? О нативной поддержке самого Qwen-Image написали вчера: Qwen-Image-Edit ComfyUI Native Support #news…
А теперь и лора #qwenimage лежит в репозитории Comfy-Org
Похоже, понимает любые управляющие изображения, только не контролнет, а лора
qwen_image_union_diffsynth_lora
Реддит
#lora
Похоже, понимает любые управляющие изображения, только не контролнет, а лора
qwen_image_union_diffsynth_lora
Реддит
#lora
👍9
This media is not supported in your browser
VIEW IN TELEGRAM
Streaming Sortformer
Модель от NVIDIA для диаризации в реальном времени, которая позволяет определять, кто говорит в многоголосных аудиозаписях.
Возможности модели:
- диаризация на уровне кадров с тегами (например, spk_0, spk_1);
- точные временные метки для каждого помеченного высказывания;
- отслеживание 2–4+ говорящих с минимальной задержкой;
- оптимизация для английского языка, но успешное тестирование на мандаринском и других языках.
Пример на видео конечно дурацкий, все друг друга ждут чтобы сказать свою реплику, в жизни оно не так работает
HF
#ASR #speech2text #stt
Модель от NVIDIA для диаризации в реальном времени, которая позволяет определять, кто говорит в многоголосных аудиозаписях.
Возможности модели:
- диаризация на уровне кадров с тегами (например, spk_0, spk_1);
- точные временные метки для каждого помеченного высказывания;
- отслеживание 2–4+ говорящих с минимальной задержкой;
- оптимизация для английского языка, но успешное тестирование на мандаринском и других языках.
Пример на видео конечно дурацкий, все друг друга ждут чтобы сказать свою реплику, в жизни оно не так работает
HF
#ASR #speech2text #stt
👍10❤1🍌1
3DGS-LM: Faster Gaussian-Splatting Optimization with Levenberg-Marquardt
Еще одна оптимизированная модель для реконструкции сцен на гауссианах. От запрещенной Meta
Оптимизация достигается за счет путём замены оптимизатора ADAM (на втором этапе) на адаптированный алгоритм Левенберга-Маркварта (LM)
Модель ускоряет процесс оптимизации на 20 % по сравнению с оригинальным 3DGS, сохраняя при этом качество реконструкции.
Казалось бы, жиденькое ускорение. Но метод можно комбинировать с другими подходами для ускорения 3DGS, что позволяет достигать ещё более высоких скоростей обработки.
Код
#gaussian #novelview
Еще одна оптимизированная модель для реконструкции сцен на гауссианах. От запрещенной Meta
Оптимизация достигается за счет путём замены оптимизатора ADAM (на втором этапе) на адаптированный алгоритм Левенберга-Маркварта (LM)
Модель ускоряет процесс оптимизации на 20 % по сравнению с оригинальным 3DGS, сохраняя при этом качество реконструкции.
Казалось бы, жиденькое ускорение. Но метод можно комбинировать с другими подходами для ускорения 3DGS, что позволяет достигать ещё более высоких скоростей обработки.
Код
#gaussian #novelview
👍9
This media is not supported in your browser
VIEW IN TELEGRAM
Raylight
МультиGPU в #ComfyUI
Поддерживаются некоторые модели Wan (например, Wan 1.3B T2V и Wan 14B T2V), а также есть частичная поддержка других моделей (Flux, Qwen, Hunyuan). Для работы требуется FlashAttention. Есть известные проблемы, например, ошибки OOM при работе с большими моделями
Нет поддержки Non-DiT моделей
Не тестировано на Windows
спасибо @nightkraw13r
#optimization #gpu
МультиGPU в #ComfyUI
Поддерживаются некоторые модели Wan (например, Wan 1.3B T2V и Wan 14B T2V), а также есть частичная поддержка других моделей (Flux, Qwen, Hunyuan). Для работы требуется FlashAttention. Есть известные проблемы, например, ошибки OOM при работе с большими моделями
Нет поддержки Non-DiT моделей
Не тестировано на Windows
спасибо @nightkraw13r
#optimization #gpu
🔥6👍2
ATLAS: Decoupling Skeletal and Shape Parameters for Expressive Parametric Human Modeling
3D-реконструкция человека от запрещенной Meta по одной картинке, видео или 3D скану.
Разделяет скелет и внешнюю поверхность тела, чтобы отдельно настраивать форму тела и параметры скелета. Может изменять параметры скелета, например, увеличивать ширину плеч или длину рук, сохраняя реалистичность изображения.
На выходе меши, рендер, параметрические фигуры с позами
Код ждем
#humanreconstruction #imageto3D #videoto3d
3D-реконструкция человека от запрещенной Meta по одной картинке, видео или 3D скану.
Разделяет скелет и внешнюю поверхность тела, чтобы отдельно настраивать форму тела и параметры скелета. Может изменять параметры скелета, например, увеличивать ширину плеч или длину рук, сохраняя реалистичность изображения.
На выходе меши, рендер, параметрические фигуры с позами
Код ждем
#humanreconstruction #imageto3D #videoto3d
👍11🔥7❤1
😁13👍1
Аттракцион невиданной щедрости 🚩
Всем бесплатно дают аж 3 генерации в VEO 3 до конца выходных
У вас есть три желания, не продешевите!
Я сказал всем? Не забудьте спрятаться за три буквы и заходить с американского гуглоаккаунта
Забрать 3 бесплатных видео
#text2video #image2video #giveaway
Всем бесплатно дают аж 3 генерации в VEO 3 до конца выходных
У вас есть три желания, не продешевите!
Я сказал всем? Не забудьте спрятаться за три буквы и заходить с американского гуглоаккаунта
Забрать 3 бесплатных видео
#text2video #image2video #giveaway
Please open Telegram to view this post
VIEW IN TELEGRAM
👍11❤1😁1
Культовые фотографии + редактирующая модель + немного фантазии
Кидайте в комменты работы которые вам понравились
Реддит
Админ на выходных
Кидайте в комменты работы которые вам понравились
Реддит
Админ на выходных
👍18