NEW BOT Телеграм, страница

0:59

1:26

CLiFT: Compressive Light-Field Tokens for Compute-Efficient and Adaptive Neural Rendering

Метод представления (и рендеринга) 3D сцен в виде сжатых токенов светового поля (CLiFT). Метод хорошо сохраняет геометрическую информацию.

На сайте есть сравнение с методами LVSM от Adobe и DepthSplat от Microsoft

Код ждем к 1 августа

#image2scene #rendering #novelview

🔥4👍1

1.79K views09:12

Опубликован код апскейлера UltraZoom

Код

Спасибо @p0lygon

#upscale

0:17

UltraZoom: Generating Gigapixel Images from Regular Photos

Апскейлер, превращает обычные фотки в картинки с высоким разрешением.

Модель берёт несколько снимков объекта — один общий и парочку крупных планов — и делает из них одно большое изображение с кучей…

❤12👍3

2.01K viewsedited 12:34

0:05

1:00

PUSA V1.0: Surpassing Wan-I2V-14B with $500 Training Cost

Новый видеогенератор, использующий особый метод управления временем в видео (vectorized timestep adaptation). Благодаря этому при генерации использует меньше данных и ресурсов по сравнению с другими моделями.

Это затюненный всего за $500 Wan-T2V-14B на 4K датасете.
Побил своего папу Wan-T2V-14B на VBench-I2V с 10 шагами инференса.

Возможности:
- создание видео из одного или нескольких изображений

- продление существующих видео

- генерация по начальному и конечному кадрам

- ну и создание видео по текстовому описанию.

Ждем кванты и дистиллы

Код
Веса

#text2video #image2video #videoediting

👍13🔥3🤔3❤1

2.01K views14:20

Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)

0:39

Тут Антропик ввел Connections

Я долго читал, чем они отличаются от MCP-серверов.
Поправьте меня, если я неправ, но они позиционируют Connections как "проверенные" и "улучшенные" mcp-сервера, прошедшие модерацию Антропика.
Часть из них написаны Антропиком, часть партнерами (connect these reviewed and recommended tools from Anthropic’s trusted partners)
Ну то есть они занялись хорошим делом - модерацией всех эти тысяч MCP-коннекторов.
Есть локальные Коннекторы: Канва, Фигма, Страйп и даже Виндовс и Макось. Можно из Клода творить всякую дичь в открытых приложениях и в самой операционке.
Есть Remote Connections - для облачных сервисов: Asana, Atlassian, Paypal, Zapier
Можно написать свой и подать заявку на утверждение - модерация в действии.
Локально работает очень хорошо - Клод видит табы в браузере, разбирается с Ноушеном.
В общем, все это похоже на модерируемый и надежный магазин MCP-серверов, которые теперь встроены в Клод (локальные) или прошли проверку(удаленные).

https://claude.ai/directory

Тут подробнее: https://www.techradar.com/computing/artificial-intelligence/you-dont-have-to-explain-everything-to-claude-anymore-its-finally-in-your-apps

@cgevent

👍2❤1

1.07K views06:20

ALG: Enhancing Motion Dynamics of Image-to-Video Models via Adaptive Low-Pass Guidance

Улучшение динамики движения в видео, создаваемых на основе изображений. Решает проблему излишней статичности видео путём адаптивного применения низкочастотной фильтрации на начальных этапах обработки изображения. Это позволяет сначала усилить динамику движения, а затем восстановить детали изображения, сохраняя при этом высокое качество видео.

Прикручено к
CogVideoX
Wan 2.1
HunyuanVideo
LTX-Video - ждем

Код

#image2video

🔥7👍3❤2

1.55K views07:11

MoVieS: Motion-Aware 4D Dynamic View Synthesis in One Second

Создает динамические 4D-изображения из обычных видео всего за одну секунду. При участии ByteDance

Умеет:
- видео с нового ракурса

- реконструкция геометрии сцены

- отслеживание 3D-точек

- оценка потока сцены (не знаю о чем речь)

- сегментация движущихся объектов

Код ждем

#novelview #stabilize #video2scene #video2mask #segmentation #tracking #video2depth

👍12

1.78K viewsedited 08:11

Обновлены WAN T2V / I2V дистил лоры от lightx2

Не теряет движение, лучше следует промпту

I2V
T2V

#text2video #image2video #lora

Wan 14B Self Forcing T2V Lora by Kijai

720x480 97кадров выдает за ~100 секунд на 4070ti super 16 vram, 4 steps, lcm, 1 cfg, 8 shift

Берете стандартный T2V воркфлоу от Kijai

Wan2.1-T2V-14B-StepDistill-CfgDistill - дистиллированная модель на 4-8 шагов,…

👍7

1.69K views09:12

1:31

Palliadium Mac OS support

Palliadium - аддон для использования всевозможных нейросетей в Блендере, теперь ограниченно работает на Mac OS

Поскольку у главного разработчика нет доступа к макоси, поддержка осуществляется силами других контрибьюторов

статус поддержки по ссылке

#blender #plugin #macos

👍4🔥4

1.93K views12:07

MVAR: Auto-Regressively Generating Multi-View Consistent Images

Генерация изображения с разных ракурсов, согласованных между собой на основе авторегресиию По тексту, по картинке, по геометрии

Код

#multiview #novelview #text2image #image2image

👍6

1.96K views13:16