NEW BOT Телеграм, страница

GVHMR: World-Grounded Human Motion Recovery viaGravity-View Coordinates

Реконструкция позы человека в динамике по одному видео. При расчете учитывается направление гравитации

Код
Демо
Колаб

#video2pose #videoto3d #video2mesh

🔥7❤2

1.73K views07:39

0:10

0:18

DualGS: Robust Dual Gaussian Splatting for Immersive Human-centric Volumetric Videos

новая модель представления данных на гауссианах для объемных видео человеков, с высокой точностью захвата действия и рендера.
Говорят что работает на недорогих мобилках и VR

Выглядит очешуительно, кода нет

#gaussian #novelview #video2scene #realtime #mobile

👍6❤1

1.76K views08:02

ControlNet Tile для SDXL

Никто не ждал, но xinsir сделал контролнет для SDXL.
На странице модели примеры деблюра, апскейла, вариаций

#controlned #sdxl #deblur #upscale #variation

👍14

1.81K views08:13

0:35

DrawingSpinUp: 3D Animation from Single Character Drawings

Привет аниматорам. Анимация 2D персонажа из одного рисунка. Модель создает соответствующего текстурированного 3D персонажа, удаляя контуры. Затем автоматический риг в MIxamo. Ретаргетинг анимации также в Mixamo или rokoko-studio-live-blender. И затем обратная стилизация в 2D

Код

#image2video #drawing2animation #animation

🔥15

1.85K views08:24

InstantDrag: Improving Interactivity in Drag-based Image Editing

Еще одна попытка сделать редактирование картинок путем указания что куда передвинуть. Может в этот раз взлетит

Код ждем

#imageediting #drag

👍4

1.79K viewsedited 08:34

1:03

Media is too big

A Diffusion Approach to Radiance Field Relighting using Multi-Illumination Synthesis

Реконструкция сцен с релайтингом на гауссианах. Среди разработчиков Adobe Research

Код ждем

#relighting #gaussian #novelview

❤5

1.56K views10:17

0:06

Dream Machine API

Lumalabs выкатили API для видеогенератора Dream Machine

Расценки: $0,0032 за 1 млн сгенерированных пикселей
Это составляет $0,0032 за кадр или около $0,35 за 5-секундное видео 24fps при разрешении 1280×720p

На HuggingFace уже есть демо, там вам понадобится API токен от Lumalabs

Демо

#text2video #image2video #api

👍3

1.56K viewsedited 10:29

2:51

Media is too big

Seed-Music

Генератор-редактор музыки. В деле замешан ByteDance.

Генерит хоть песни хоть инструментал, хоть вокал.
Споет что угодно заданным голосом по 10-секундному образцу.

Умеет редактировать слова оставляя мелодию, мелодию оставляя слова. Подозреваю, умеет редактировать что угодно

Есть препринт, нет ни кода, ни демки, ни сервиса.
Только надежда

#text2music #musicediting #music2music

❤11🔥10👍1

2K viewsedited 10:49

diffusion-e2e-ft: Fine-Tuning Image-Conditional Diffusion Models is Easier than You Think

Тут придумали как эффективно файнтюнить диффузные генераторы на кондиционные задачи типа предсказания глубины или нормалей в один шаг.
Показывают на примере Marigold, заявляют что дообученная версия работает в 200 раз быстрее.

Я перечитал описание несколько раз и так и не уверен что понял все правильно, если что поправьте меня

Код
Демо глубина
Демо нормали

#image2normal #image2depth

🔥7❤4

1.59K viewsedited 08:04

EzAudio: Enhancing Text-to-Audio Generation with Efficient Diffusion Transformer|

Генератор звука по тексту. Заданные фразы от него будет трудно получить, а звуковые эффекты - норм

Код ждем
Демо

#text2audio

🔥5❤1👍1

1.74K views08:14

Forwarded from CG дневничок (Sergey Frolov)

Runway и Lionsgate заключили партнерское соглашение, чтобы изучить возможности использования искусственного интеллекта в кинопроизводстве.

Первое в своем роде партнерство, направленное на создание и обучение новой модели искусственного интеллекта, разработанной на основе фирменного каталога Lionsgate. Эта модель, разработанная специально для того, чтобы помочь создателям фильмов, режиссерам-постановщикам и другим творческим талантам улучшить свою работу.

Новая нейросеть будет создавать кинематографическое видео, которое в дальнейшем можно редактировать с помощью набора управляемых инструментов Runway.

Что это означает для индустрии? Да в целом никакого шока от этой новости нет. AI отличный инструмент для ускорения работы, а т.к. с юридической точки зрения сгенерированный контент сложно считать "очищенным" по правам, то подобное соглашение как раз позволит студии использовать свои же проекты и наработки для внутренних разработок.

Ждем нейросетевого Джона Уика? 🔫

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥4

1.75K views15:10

1:21

Tripo 2.0

Новый генератор 3D моделей с PBR текстурами по тексту и по изображению.

Генерация занимает несколько минут, и вы получаете 4 варианта модели.

На старте дают 600 кредитов, это на 10 генераций по 60 кредитов.
После генерации вам предлагают сделать риг за 20 кредитов и можно назначить на модель анимацию.
Конвертирование и сохранение модели, кстати, тоже стоит - 10 кредитов.

Можно сделать ретопологию.
Короче, инструмент серьезный+-

Тест Бендера - хорошо.

Го тестить!

#textto3d #imageto3d

❤10

12K views07:52

Forwarded from Psy Eyes

0:37

Media is too big

Kling: обновили генератор видео до версии V 1.5.

Что нового:
* Видео в 1080p, которые оптимизированы генериться под широкоформат
* Улучшилось следование промту
* Повысились качество, динамичность, и эстетичность картинки
* High-Quality (Professional) режим по той же цене

Также появился инструмент Motion Brush для выделения до 6 объектов на видео и их анимации по указанной траектории. Или можно задать, что должно остаться статичным. Такая же фича есть у Runway (не Gen-3) и Kaiber. Максимальная длительность видео из Motion Brush — 5 сек.

Пока контроль камеры и Motion Brush есть только в V 1. В версию V 1.5 они подъедут позже.

В обычном image-2-video режиме выдаётся видео длиной до 10 сек. Одновременно в Kling может генериться до 4 видео.

Анонс

❤1🔥1

1.27K views09:45