ZenCtrl
Еще одна альтернатива #controlnet от Fotographer AI
Умеет генерить разные ракурсы сцены/объекта, фон под объект. Из привычного - Canny, Depth
Разрешение до 1024×1024, в будущем 2К и 4К
Есть пара моделек под #flux и одна под Ominicontrol (деблюр)
Код ждем
Демо
Веса
API
Статья
#conditioning #deblur #image2image #personalization #multiview #novelview
Еще одна альтернатива #controlnet от Fotographer AI
Умеет генерить разные ракурсы сцены/объекта, фон под объект. Из привычного - Canny, Depth
Разрешение до 1024×1024, в будущем 2К и 4К
Есть пара моделек под #flux и одна под Ominicontrol (деблюр)
Код ждем
Демо
Веса
API
Статья
#conditioning #deblur #image2image #personalization #multiview #novelview
❤8👍1🔥1
TriplaneTurbo: Progressive Rendering Distillation: Adapting Stable Diffusion for Instant Text-to-Mesh Generation without 3D Data
#SD адаптировали для генерации 3D моделей по тексту за 4 шага.
Должен же быть легковесный генератор 3D, да?
Код
Демо
#textto3d
#SD адаптировали для генерации 3D моделей по тексту за 4 шага.
Должен же быть легковесный генератор 3D, да?
Код
Демо
#textto3d
🔥4👍2
Easi3R: Estimating Disentangled Motion from DUSt3R Without Training
Ловкость рук, и вот уже реконструктор 3D сцены по картинке DUSt3R реконструирует динамические сцены в 4D по видео
Нэо потешный получился
Код
Посмотреть результаты интерактивно
#videoto4d #scenereconstruction #4d #novelview #imageto3d #image2scene #video2scene
Ловкость рук, и вот уже реконструктор 3D сцены по картинке DUSt3R реконструирует динамические сцены в 4D по видео
Нэо потешный получился
Код
Посмотреть результаты интерактивно
#videoto4d #scenereconstruction #4d #novelview #imageto3d #image2scene #video2scene
❤2
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
GeometryCrafter: Consistent Geometry Estimation for Open-world Videos with Diffusion Priors
И еще один похожий инструмент, реконструкция 4D сцены по видео.
C тучей примеров на сайте, с демонстрацией работы (своего?) генератора глубины, с примерами работы по аниме
Кажется, в прошлом месяце такая штука могла бы сэкономить мне неделю на клинапе
Код
Демо
#videoto4d #scenereconstruction #4d #novelview #imageto3d #image2scene #video2scene
И еще один похожий инструмент, реконструкция 4D сцены по видео.
C тучей примеров на сайте, с демонстрацией работы (своего?) генератора глубины, с примерами работы по аниме
Кажется, в прошлом месяце такая штука могла бы сэкономить мне неделю на клинапе
Код
Демо
#videoto4d #scenereconstruction #4d #novelview #imageto3d #image2scene #video2scene
❤3🔥1
DSO: Aligning 3D Generators with Simulation Feedback for Physical Soundness
К 3D генераторам приставили обратную связь от симуляции физики чтобы модельки получались более устойчивыми. Даже напечатали модельку на 3D принтере в доказательство
Интересно, кто из подписанов использовал сгенерированные модельки с физикой или для 3D печати, что скажете?
Код
DSO-finetuned-TRELLIS
#simulation #textto3D #imageto3d
К 3D генераторам приставили обратную связь от симуляции физики чтобы модельки получались более устойчивыми. Даже напечатали модельку на 3D принтере в доказательство
Интересно, кто из подписанов использовал сгенерированные модельки с физикой или для 3D печати, что скажете?
Код
DSO-finetuned-TRELLIS
#simulation #textto3D #imageto3d
👍6❤1
Опубликован код и пара моделей видеогенератора VACE
VACE-Wan2.1-1.3B-Preview и VACE-LTX-Video-0.9
Код
Веса
#text2video #video2video #personalization #videoediting
VACE-Wan2.1-1.3B-Preview и VACE-LTX-Video-0.9
Код
Веса
#text2video #video2video #personalization #videoediting
Telegram
Нейронавт | Нейросети в творчестве
VACE: All-in-One Video Creation and Editing
Видеогенератор от Alibaba / Tongyi Lab
Они прикрутили туда максимум ништяков: Move-Anything, Swap-Anything, Reference-Anything, Expand-Anything, Animate-Anything
VACE может пересоздать видео с сохранением содержимого…
Видеогенератор от Alibaba / Tongyi Lab
Они прикрутили туда максимум ништяков: Move-Anything, Swap-Anything, Reference-Anything, Expand-Anything, Animate-Anything
VACE может пересоздать видео с сохранением содержимого…
👍7💩1
Sparrow-0: Advancing Conversational Responsiveness in Video Agents with Transformer-Based Turn-Taking
Видео-ассистент от Tavus, который понимает когда его очередь говорить, не полагаясь на молчание собеседника. Таким образом устраняются раздражающие паузы
Здесь можно создать говорящий аватар, есть библиотека аватаров, называются Replica
Sparrow-0 обучен на базе BERT и поддерживает более 100 языков.
Есть бесплатный тариф
#assistant #voicemode #talkinghead #humanavatar
Видео-ассистент от Tavus, который понимает когда его очередь говорить, не полагаясь на молчание собеседника. Таким образом устраняются раздражающие паузы
Здесь можно создать говорящий аватар, есть библиотека аватаров, называются Replica
Sparrow-0 обучен на базе BERT и поддерживает более 100 языков.
Есть бесплатный тариф
#assistant #voicemode #talkinghead #humanavatar
👍3🤡1
Новости по агентам
Genspark super agent - универсальный агент
Под капотом GPT-4o, o1, Claude, Gemini, DeepSeek, ElevenLabs, Kling 1.6, PixVerse 3.5, DreamMachine, Veo 2, Hunyuan,FLUX, Ideogram, Recraft, Dall-e 3, Imagen 3
——————————————
Agent S2 - опенсорсный агент на вашем компе
——————————————
Elevenlabs MCP - Озвучка, клонирование голоса, транскрибация, генерация звуков - всё работает в Claude, Cursor, Windsurf и др
——————————————
MCP Studio - легкое создание MCP серверов, нужен Anthropic API key
——————————————
unreal-mcp - MCP для создания игр на #UE
——————————————
Nanobrowser - мультиагентная ИИ-ситсема для веб-автоматизации, локальная альтернатива OpenAI Operator
——————————————
На HF появился пустой репозиторий Manus AI
#agent #mcp
Genspark super agent - универсальный агент
Под капотом GPT-4o, o1, Claude, Gemini, DeepSeek, ElevenLabs, Kling 1.6, PixVerse 3.5, DreamMachine, Veo 2, Hunyuan,FLUX, Ideogram, Recraft, Dall-e 3, Imagen 3
——————————————
Agent S2 - опенсорсный агент на вашем компе
——————————————
Elevenlabs MCP - Озвучка, клонирование голоса, транскрибация, генерация звуков - всё работает в Claude, Cursor, Windsurf и др
——————————————
MCP Studio - легкое создание MCP серверов, нужен Anthropic API key
——————————————
unreal-mcp - MCP для создания игр на #UE
——————————————
Nanobrowser - мультиагентная ИИ-ситсема для веб-автоматизации, локальная альтернатива OpenAI Operator
——————————————
На HF появился пустой репозиторий Manus AI
#agent #mcp
www.genspark.ai
Genspark - Your All-in-One AI Workspace
AI Slides, AI Sheets, AI Docs, AI Developer, AI Designer, AI Chat, AI Image, AI Video — powered by the best models. One prompt, job done.
👍11🤮1