This media is not supported in your browser
VIEW IN TELEGRAM
GVHMR: World-Grounded Human Motion Recovery viaGravity-View Coordinates
Реконструкция позы человека в динамике по одному видео. При расчете учитывается направление гравитации
Код
Демо
Колаб
#video2pose #videoto3d #video2mesh
Реконструкция позы человека в динамике по одному видео. При расчете учитывается направление гравитации
Код
Демо
Колаб
#video2pose #videoto3d #video2mesh
🔥7❤2
DualGS: Robust Dual Gaussian Splatting for Immersive Human-centric Volumetric Videos
новая модель представления данных на гауссианах для объемных видео человеков, с высокой точностью захвата действия и рендера.
Говорят что работает на недорогих мобилках и VR
Выглядит очешуительно, кода нет
#gaussian #novelview #video2scene #realtime #mobile
новая модель представления данных на гауссианах для объемных видео человеков, с высокой точностью захвата действия и рендера.
Говорят что работает на недорогих мобилках и VR
Выглядит очешуительно, кода нет
#gaussian #novelview #video2scene #realtime #mobile
👍6❤1
ControlNet Tile для SDXL
Никто не ждал, но xinsir сделал контролнет для SDXL.
На странице модели примеры деблюра, апскейла, вариаций
#controlned #sdxl #deblur #upscale #variation
Никто не ждал, но xinsir сделал контролнет для SDXL.
На странице модели примеры деблюра, апскейла, вариаций
#controlned #sdxl #deblur #upscale #variation
👍14
This media is not supported in your browser
VIEW IN TELEGRAM
DrawingSpinUp: 3D Animation from Single Character Drawings
Привет аниматорам. Анимация 2D персонажа из одного рисунка. Модель создает соответствующего текстурированного 3D персонажа, удаляя контуры. Затем автоматический риг в MIxamo. Ретаргетинг анимации также в Mixamo или rokoko-studio-live-blender. И затем обратная стилизация в 2D
Код
#image2video #drawing2animation #animation
Привет аниматорам. Анимация 2D персонажа из одного рисунка. Модель создает соответствующего текстурированного 3D персонажа, удаляя контуры. Затем автоматический риг в MIxamo. Ретаргетинг анимации также в Mixamo или rokoko-studio-live-blender. И затем обратная стилизация в 2D
Код
#image2video #drawing2animation #animation
🔥15
This media is not supported in your browser
VIEW IN TELEGRAM
InstantDrag: Improving Interactivity in Drag-based Image Editing
Еще одна попытка сделать редактирование картинок путем указания что куда передвинуть. Может в этот раз взлетит
Код ждем
#imageediting #drag
Еще одна попытка сделать редактирование картинок путем указания что куда передвинуть. Может в этот раз взлетит
Код ждем
#imageediting #drag
👍4
Media is too big
VIEW IN TELEGRAM
A Diffusion Approach to Radiance Field Relighting using Multi-Illumination Synthesis
Реконструкция сцен с релайтингом на гауссианах. Среди разработчиков Adobe Research
Код ждем
#relighting #gaussian #novelview
Реконструкция сцен с релайтингом на гауссианах. Среди разработчиков Adobe Research
Код ждем
#relighting #gaussian #novelview
❤5
This media is not supported in your browser
VIEW IN TELEGRAM
Dream Machine API
Lumalabs выкатили API для видеогенератора Dream Machine
Расценки: $0,0032 за 1 млн сгенерированных пикселей
Это составляет $0,0032 за кадр или около $0,35 за 5-секундное видео 24fps при разрешении 1280×720p
На HuggingFace уже есть демо, там вам понадобится API токен от Lumalabs
Демо
#text2video #image2video #api
Lumalabs выкатили API для видеогенератора Dream Machine
Расценки: $0,0032 за 1 млн сгенерированных пикселей
Это составляет $0,0032 за кадр или около $0,35 за 5-секундное видео 24fps при разрешении 1280×720p
На HuggingFace уже есть демо, там вам понадобится API токен от Lumalabs
Демо
#text2video #image2video #api
👍3
Media is too big
VIEW IN TELEGRAM
Seed-Music
Генератор-редактор музыки. В деле замешан ByteDance.
Генерит хоть песни хоть инструментал, хоть вокал.
Споет что угодно заданным голосом по 10-секундному образцу.
Умеет редактировать слова оставляя мелодию, мелодию оставляя слова. Подозреваю, умеет редактировать что угодно
Есть препринт, нет ни кода, ни демки, ни сервиса.
Только надежда
#text2music #musicediting #music2music
Генератор-редактор музыки. В деле замешан ByteDance.
Генерит хоть песни хоть инструментал, хоть вокал.
Споет что угодно заданным голосом по 10-секундному образцу.
Умеет редактировать слова оставляя мелодию, мелодию оставляя слова. Подозреваю, умеет редактировать что угодно
Есть препринт, нет ни кода, ни демки, ни сервиса.
Только надежда
#text2music #musicediting #music2music
❤11🔥10👍1
diffusion-e2e-ft: Fine-Tuning Image-Conditional Diffusion Models is Easier than You Think
Тут придумали как эффективно файнтюнить диффузные генераторы на кондиционные задачи типа предсказания глубины или нормалей в один шаг.
Показывают на примере Marigold, заявляют что дообученная версия работает в 200 раз быстрее.
Я перечитал описание несколько раз и так и не уверен что понял все правильно, если что поправьте меня
Код
Демо глубина
Демо нормали
#image2normal #image2depth
Тут придумали как эффективно файнтюнить диффузные генераторы на кондиционные задачи типа предсказания глубины или нормалей в один шаг.
Показывают на примере Marigold, заявляют что дообученная версия работает в 200 раз быстрее.
Я перечитал описание несколько раз и так и не уверен что понял все правильно, если что поправьте меня
Код
Демо глубина
Демо нормали
#image2normal #image2depth
🔥7❤4
EzAudio: Enhancing Text-to-Audio Generation with Efficient Diffusion Transformer|
Генератор звука по тексту. Заданные фразы от него будет трудно получить, а звуковые эффекты - норм
Код ждем
Демо
#text2audio
Генератор звука по тексту. Заданные фразы от него будет трудно получить, а звуковые эффекты - норм
Код ждем
Демо
#text2audio
🔥5❤1👍1
Forwarded from CG дневничок (Sergey Frolov)
Runway и Lionsgate заключили партнерское соглашение, чтобы изучить возможности использования искусственного интеллекта в кинопроизводстве.
Первое в своем роде партнерство, направленное на создание и обучение новой модели искусственного интеллекта, разработанной на основе фирменного каталога Lionsgate. Эта модель, разработанная специально для того, чтобы помочь создателям фильмов, режиссерам-постановщикам и другим творческим талантам улучшить свою работу.
Новая нейросеть будет создавать кинематографическое видео, которое в дальнейшем можно редактировать с помощью набора управляемых инструментов Runway.
Что это означает для индустрии? Да в целом никакого шока от этой новости нет. AI отличный инструмент для ускорения работы, а т.к. с юридической точки зрения сгенерированный контент сложно считать "очищенным" по правам, то подобное соглашение как раз позволит студии использовать свои же проекты и наработки для внутренних разработок.
Ждем нейросетевого Джона Уика?🔫
Первое в своем роде партнерство, направленное на создание и обучение новой модели искусственного интеллекта, разработанной на основе фирменного каталога Lionsgate. Эта модель, разработанная специально для того, чтобы помочь создателям фильмов, режиссерам-постановщикам и другим творческим талантам улучшить свою работу.
Новая нейросеть будет создавать кинематографическое видео, которое в дальнейшем можно редактировать с помощью набора управляемых инструментов Runway.
Что это означает для индустрии? Да в целом никакого шока от этой новости нет. AI отличный инструмент для ускорения работы, а т.к. с юридической точки зрения сгенерированный контент сложно считать "очищенным" по правам, то подобное соглашение как раз позволит студии использовать свои же проекты и наработки для внутренних разработок.
Ждем нейросетевого Джона Уика?
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥4
Tripo 2.0
Новый генератор 3D моделей с PBR текстурами по тексту и по изображению.
Генерация занимает несколько минут, и вы получаете 4 варианта модели.
На старте дают 600 кредитов, это на 10 генераций по 60 кредитов.
После генерации вам предлагают сделать риг за 20 кредитов и можно назначить на модель анимацию.
Конвертирование и сохранение модели, кстати, тоже стоит - 10 кредитов.
Можно сделать ретопологию.
Короче, инструмент серьезный+-
Тест Бендера - хорошо.
Го тестить!
#textto3d #imageto3d
Новый генератор 3D моделей с PBR текстурами по тексту и по изображению.
Генерация занимает несколько минут, и вы получаете 4 варианта модели.
На старте дают 600 кредитов, это на 10 генераций по 60 кредитов.
После генерации вам предлагают сделать риг за 20 кредитов и можно назначить на модель анимацию.
Конвертирование и сохранение модели, кстати, тоже стоит - 10 кредитов.
Можно сделать ретопологию.
Короче, инструмент серьезный+-
Тест Бендера - хорошо.
Го тестить!
#textto3d #imageto3d
❤10
Forwarded from Psy Eyes
Media is too big
VIEW IN TELEGRAM
Kling: обновили генератор видео до версии V 1.5.
Что нового:
* Видео в 1080p, которые оптимизированы генериться под широкоформат
* Улучшилось следование промту
* Повысились качество, динамичность, и эстетичность картинки
* High-Quality (Professional) режим по той же цене
Также появился инструмент Motion Brush для выделения до 6 объектов на видео и их анимации по указанной траектории. Или можно задать, что должно остаться статичным. Такая же фича есть у Runway (не Gen-3) и Kaiber. Максимальная длительность видео из Motion Brush — 5 сек.
Пока контроль камеры и Motion Brush есть только в V 1. В версию V 1.5 они подъедут позже.
В обычном image-2-video режиме выдаётся видео длиной до 10 сек. Одновременно в Kling может генериться до 4 видео.
Анонс
Что нового:
* Видео в 1080p, которые оптимизированы генериться под широкоформат
* Улучшилось следование промту
* Повысились качество, динамичность, и эстетичность картинки
* High-Quality (Professional) режим по той же цене
Также появился инструмент Motion Brush для выделения до 6 объектов на видео и их анимации по указанной траектории. Или можно задать, что должно остаться статичным. Такая же фича есть у Runway (не Gen-3) и Kaiber. Максимальная длительность видео из Motion Brush — 5 сек.
Пока контроль камеры и Motion Brush есть только в V 1. В версию V 1.5 они подъедут позже.
В обычном image-2-video режиме выдаётся видео длиной до 10 сек. Одновременно в Kling может генериться до 4 видео.
Анонс
❤1🔥1
Опубликован код и демоспейс генератора картинок ультравысокого разрешения UltraPixel
Генерация 2560×5120 на RTX 4090 занимает 60 секунд
Код
Демо
#image2image #text2image #personalization
Генерация 2560×5120 на RTX 4090 занимает 60 секунд
Код
Демо
#image2image #text2image #personalization
👍8❤3👎2