NEW BOT Телеграм, страница

TextBoost: Towards One-Shot Personalization of Text-to-Image Models via Fine-tuning Text Encoder

Новый подход к персонализации и стилизации изображений через манипуляции с текстовым энкодером (админ не шарит в этом)

Код

#personalization #styletransfer

👍9❤1

1.66K views06:53

Out of Focus v1.0

Редактирование изображений по тексту.
Сначала описываем исходное изображение. Потом пишем новое описание того что хотим получить в результате.

Работает на 15GB VRAM

Гитхаб
Демо

#imageediting #image2image

🔥12👍4

1.89K viewsedited 07:09

0:43

Персонализатор PuLID FLUX завезли на tost.ai

Попробовать

#personalization #text2image #image2image

👍7🤯1

1.98K viewsedited 08:24

Появились репозиторий и демоспейс видеогенератора Vchitect
Го тестить

Код
Демо

#text2video #image2video

0:36

Vchitect

Новый видеогенератор по картинке и по тексту от авторов VEnhancer - улучшайзера сгенерированного видео. Кстати, он тоже обновился

Vchitect позволяет генерить в любом соотношении сторон.
5-20 секунд видео разрешением до 720*480 (помним про VEnhancer).…

👍1😁1

1.82K viewsedited 08:32

GVHMR: World-Grounded Human Motion Recovery viaGravity-View Coordinates

Реконструкция позы человека в динамике по одному видео. При расчете учитывается направление гравитации

Код
Демо
Колаб

#video2pose #videoto3d #video2mesh

🔥7❤2

1.73K views07:39

0:10

0:18

DualGS: Robust Dual Gaussian Splatting for Immersive Human-centric Volumetric Videos

новая модель представления данных на гауссианах для объемных видео человеков, с высокой точностью захвата действия и рендера.
Говорят что работает на недорогих мобилках и VR

Выглядит очешуительно, кода нет

#gaussian #novelview #video2scene #realtime #mobile

👍6❤1

1.76K views08:02

ControlNet Tile для SDXL

Никто не ждал, но xinsir сделал контролнет для SDXL.
На странице модели примеры деблюра, апскейла, вариаций

#controlned #sdxl #deblur #upscale #variation

👍14

1.81K views08:13

0:35

DrawingSpinUp: 3D Animation from Single Character Drawings

Привет аниматорам. Анимация 2D персонажа из одного рисунка. Модель создает соответствующего текстурированного 3D персонажа, удаляя контуры. Затем автоматический риг в MIxamo. Ретаргетинг анимации также в Mixamo или rokoko-studio-live-blender. И затем обратная стилизация в 2D

Код

#image2video #drawing2animation #animation

🔥15

1.85K views08:24

InstantDrag: Improving Interactivity in Drag-based Image Editing

Еще одна попытка сделать редактирование картинок путем указания что куда передвинуть. Может в этот раз взлетит

Код ждем

#imageediting #drag

👍4

1.79K viewsedited 08:34

1:03

Media is too big

A Diffusion Approach to Radiance Field Relighting using Multi-Illumination Synthesis

Реконструкция сцен с релайтингом на гауссианах. Среди разработчиков Adobe Research

Код ждем

#relighting #gaussian #novelview

❤5

1.56K views10:17

0:06

Dream Machine API

Lumalabs выкатили API для видеогенератора Dream Machine

Расценки: $0,0032 за 1 млн сгенерированных пикселей
Это составляет $0,0032 за кадр или около $0,35 за 5-секундное видео 24fps при разрешении 1280×720p

На HuggingFace уже есть демо, там вам понадобится API токен от Lumalabs

Демо

#text2video #image2video #api

👍3

1.56K viewsedited 10:29

2:51

Media is too big

Seed-Music

Генератор-редактор музыки. В деле замешан ByteDance.

Генерит хоть песни хоть инструментал, хоть вокал.
Споет что угодно заданным голосом по 10-секундному образцу.

Умеет редактировать слова оставляя мелодию, мелодию оставляя слова. Подозреваю, умеет редактировать что угодно

Есть препринт, нет ни кода, ни демки, ни сервиса.
Только надежда

#text2music #musicediting #music2music

❤11🔥10👍1

2K viewsedited 10:49

diffusion-e2e-ft: Fine-Tuning Image-Conditional Diffusion Models is Easier than You Think

Тут придумали как эффективно файнтюнить диффузные генераторы на кондиционные задачи типа предсказания глубины или нормалей в один шаг.
Показывают на примере Marigold, заявляют что дообученная версия работает в 200 раз быстрее.

Я перечитал описание несколько раз и так и не уверен что понял все правильно, если что поправьте меня

Код
Демо глубина
Демо нормали

#image2normal #image2depth

🔥7❤4

1.59K viewsedited 08:04

EzAudio: Enhancing Text-to-Audio Generation with Efficient Diffusion Transformer|

Генератор звука по тексту. Заданные фразы от него будет трудно получить, а звуковые эффекты - норм

Код ждем
Демо

#text2audio

🔥5❤1👍1

1.74K views08:14