Add-it: Training-Free Object Insertion in Images With Pretrained Diffusion Models
Добавление объектов на изображение от NVIDIA
По текстовому описанию
Код
Демо
#imageediting #inpainting
Добавление объектов на изображение от NVIDIA
По текстовому описанию
Код
Демо
#imageediting #inpainting
❤8👍4
CLiFT: Compressive Light-Field Tokens for Compute-Efficient and Adaptive Neural Rendering
Метод представления (и рендеринга) 3D сцен в виде сжатых токенов светового поля (CLiFT). Метод хорошо сохраняет геометрическую информацию.
На сайте есть сравнение с методами LVSM от Adobe и DepthSplat от Microsoft
Код ждем к 1 августа
#image2scene #rendering #novelview
Метод представления (и рендеринга) 3D сцен в виде сжатых токенов светового поля (CLiFT). Метод хорошо сохраняет геометрическую информацию.
На сайте есть сравнение с методами LVSM от Adobe и DepthSplat от Microsoft
Код ждем к 1 августа
#image2scene #rendering #novelview
🔥4👍1
PUSA V1.0: Surpassing Wan-I2V-14B with $500 Training Cost
Новый видеогенератор, использующий особый метод управления временем в видео (vectorized timestep adaptation). Благодаря этому при генерации использует меньше данных и ресурсов по сравнению с другими моделями.
Это затюненный всего за $500 Wan-T2V-14B на 4K датасете.
Побил своего папу Wan-T2V-14B на VBench-I2V с 10 шагами инференса.
Возможности:
- создание видео из одного или нескольких изображений
- продление существующих видео
- генерация по начальному и конечному кадрам
- ну и создание видео по текстовому описанию.
Ждем кванты и дистиллы
Код
Веса
#text2video #image2video #videoediting
Новый видеогенератор, использующий особый метод управления временем в видео (vectorized timestep adaptation). Благодаря этому при генерации использует меньше данных и ресурсов по сравнению с другими моделями.
Это затюненный всего за $500 Wan-T2V-14B на 4K датасете.
Побил своего папу Wan-T2V-14B на VBench-I2V с 10 шагами инференса.
Возможности:
- создание видео из одного или нескольких изображений
- продление существующих видео
- генерация по начальному и конечному кадрам
- ну и создание видео по текстовому описанию.
Ждем кванты и дистиллы
Код
Веса
#text2video #image2video #videoediting
👍13🔥3🤔3❤1
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
This media is not supported in your browser
VIEW IN TELEGRAM
Тут Антропик ввел Connections
Я долго читал, чем они отличаются от MCP-серверов.
Поправьте меня, если я неправ, но они позиционируют Connections как "проверенные" и "улучшенные" mcp-сервера, прошедшие модерацию Антропика.
Часть из них написаны Антропиком, часть партнерами (connect these reviewed and recommended tools from Anthropic’s trusted partners)
Ну то есть они занялись хорошим делом - модерацией всех эти тысяч MCP-коннекторов.
Есть локальные Коннекторы: Канва, Фигма, Страйп и даже Виндовс и Макось. Можно из Клода творить всякую дичь в открытых приложениях и в самой операционке.
Есть Remote Connections - для облачных сервисов: Asana, Atlassian, Paypal, Zapier
Можно написать свой и подать заявку на утверждение - модерация в действии.
Локально работает очень хорошо - Клод видит табы в браузере, разбирается с Ноушеном.
В общем, все это похоже на модерируемый и надежный магазин MCP-серверов, которые теперь встроены в Клод (локальные) или прошли проверку(удаленные).
https://claude.ai/directory
Тут подробнее: https://www.techradar.com/computing/artificial-intelligence/you-dont-have-to-explain-everything-to-claude-anymore-its-finally-in-your-apps
@cgevent
Я долго читал, чем они отличаются от MCP-серверов.
Поправьте меня, если я неправ, но они позиционируют Connections как "проверенные" и "улучшенные" mcp-сервера, прошедшие модерацию Антропика.
Часть из них написаны Антропиком, часть партнерами (connect these reviewed and recommended tools from Anthropic’s trusted partners)
Ну то есть они занялись хорошим делом - модерацией всех эти тысяч MCP-коннекторов.
Есть локальные Коннекторы: Канва, Фигма, Страйп и даже Виндовс и Макось. Можно из Клода творить всякую дичь в открытых приложениях и в самой операционке.
Есть Remote Connections - для облачных сервисов: Asana, Atlassian, Paypal, Zapier
Можно написать свой и подать заявку на утверждение - модерация в действии.
Локально работает очень хорошо - Клод видит табы в браузере, разбирается с Ноушеном.
В общем, все это похоже на модерируемый и надежный магазин MCP-серверов, которые теперь встроены в Клод (локальные) или прошли проверку(удаленные).
https://claude.ai/directory
Тут подробнее: https://www.techradar.com/computing/artificial-intelligence/you-dont-have-to-explain-everything-to-claude-anymore-its-finally-in-your-apps
@cgevent
👍2❤1
This media is not supported in your browser
VIEW IN TELEGRAM
ALG: Enhancing Motion Dynamics of Image-to-Video Models via Adaptive Low-Pass Guidance
Улучшение динамики движения в видео, создаваемых на основе изображений. Решает проблему излишней статичности видео путём адаптивного применения низкочастотной фильтрации на начальных этапах обработки изображения. Это позволяет сначала усилить динамику движения, а затем восстановить детали изображения, сохраняя при этом высокое качество видео.
Прикручено к
CogVideoX
Wan 2.1
HunyuanVideo
LTX-Video - ждем
Код
#image2video
Улучшение динамики движения в видео, создаваемых на основе изображений. Решает проблему излишней статичности видео путём адаптивного применения низкочастотной фильтрации на начальных этапах обработки изображения. Это позволяет сначала усилить динамику движения, а затем восстановить детали изображения, сохраняя при этом высокое качество видео.
Прикручено к
CogVideoX
Wan 2.1
HunyuanVideo
LTX-Video - ждем
Код
#image2video
🔥7👍3❤2
This media is not supported in your browser
VIEW IN TELEGRAM
MoVieS: Motion-Aware 4D Dynamic View Synthesis in One Second
Создает динамические 4D-изображения из обычных видео всего за одну секунду. При участии ByteDance
Умеет:
- видео с нового ракурса
- реконструкция геометрии сцены
- отслеживание 3D-точек
- оценка потока сцены (не знаю о чем речь)
- сегментация движущихся объектов
Код ждем
#novelview #stabilize #video2scene #video2mask #segmentation #tracking #video2depth
Создает динамические 4D-изображения из обычных видео всего за одну секунду. При участии ByteDance
Умеет:
- видео с нового ракурса
- реконструкция геометрии сцены
- отслеживание 3D-точек
- оценка потока сцены (не знаю о чем речь)
- сегментация движущихся объектов
Код ждем
#novelview #stabilize #video2scene #video2mask #segmentation #tracking #video2depth
👍12
Обновлены WAN T2V / I2V дистил лоры от lightx2
Не теряет движение, лучше следует промпту
I2V
T2V
#text2video #image2video #lora
Не теряет движение, лучше следует промпту
I2V
T2V
#text2video #image2video #lora
Telegram
Нейронавт | Нейросети в творчестве
Wan 14B Self Forcing T2V Lora by Kijai
720x480 97кадров выдает за ~100 секунд на 4070ti super 16 vram, 4 steps, lcm, 1 cfg, 8 shift
Берете стандартный T2V воркфлоу от Kijai
Wan2.1-T2V-14B-StepDistill-CfgDistill - дистиллированная модель на 4-8 шагов,…
720x480 97кадров выдает за ~100 секунд на 4070ti super 16 vram, 4 steps, lcm, 1 cfg, 8 shift
Берете стандартный T2V воркфлоу от Kijai
Wan2.1-T2V-14B-StepDistill-CfgDistill - дистиллированная модель на 4-8 шагов,…
👍7
Palliadium Mac OS support
Palliadium - аддон для использования всевозможных нейросетей в Блендере, теперь ограниченно работает на Mac OS
Поскольку у главного разработчика нет доступа к макоси, поддержка осуществляется силами других контрибьюторов
статус поддержки по ссылке
#blender #plugin #macos
Palliadium - аддон для использования всевозможных нейросетей в Блендере, теперь ограниченно работает на Mac OS
Поскольку у главного разработчика нет доступа к макоси, поддержка осуществляется силами других контрибьюторов
статус поддержки по ссылке
#blender #plugin #macos
👍4🔥4
MVAR: Auto-Regressively Generating Multi-View Consistent Images
Генерация изображения с разных ракурсов, согласованных между собой на основе авторегресиию По тексту, по картинке, по геометрии
Код
#multiview #novelview #text2image #image2image
Генерация изображения с разных ракурсов, согласованных между собой на основе авторегресиию По тексту, по картинке, по геометрии
Код
#multiview #novelview #text2image #image2image
👍6