Stable Audio 2.0
Обновился генератор коммерческой музыки по промпту от Stability AI
В блоге написано что модель доступна на сайте, но при попытке ею воспользоваться мне показывают условия использования январской Version 1.2. Что это,наипало обман или забыли обновить текст?
На вход можно подать просто текстовое описание или аудиофайл. Продолжительность трека до 3 минут.
Заявлена генерация структурно полноценных инструментальных композиций с интро, развитием и финалом.
10 треков в месяц бесплатно.
Обещают доступ по API
Попробовать
бесконечный стрим
#text2music #text2audio #music2music #audio2music
Обновился генератор коммерческой музыки по промпту от Stability AI
В блоге написано что модель доступна на сайте, но при попытке ею воспользоваться мне показывают условия использования январской Version 1.2. Что это,
На вход можно подать просто текстовое описание или аудиофайл. Продолжительность трека до 3 минут.
Заявлена генерация структурно полноценных инструментальных композиций с интро, развитием и финалом.
10 треков в месяц бесплатно.
Обещают доступ по API
Попробовать
бесконечный стрим
#text2music #text2audio #music2music #audio2music
🔥3
Нейронавт | Нейросети в творчестве
Народ, у меня сегодня будет ознакомительная демо-сессия с представителем Rodin Gen-1 Накидайте срочно картинок для теста генерации 3D объектов! [UPDATE] Спасибо, картинки отправил #imageto3D #tetxtto3D #text2scene #realtime
Впечатления о Rodin Gen-1 со вчерашней демосессии.
Признаю, он неидеален, но впечатляет! Лучше всего что я видел до сих пор. Для иллюстрации прилагаю ваши картинки, о которых речь
- Генерит объекты по тексту и по изображению
- генерит текстуры
- может смешивать два и более объектов, есть рулька смешивания. Гибрид Бендера с автомобилем вышел бесполезный но смешной
- Я в 3D дилетант, по мне сетка хорошая в сравнении с остальными генераторами, даже отличная для железки. Есть три варианта поликаунта для чистового прохода- 5000, 10000, 30000 полигонов
- умеет генерить воксели из геометрии и геометрию из вокселей. Для меня юзкейсы тут неочевидны были. Короче, так можно делать вариации геометрии или что-то детальное из грубого 3D наброска.
- умеет генерить объект из облака точек. Чую, это будет отличная замена нюковому генератору меша из облака точек
- Крышесносная фича - 3D инпейнтинг - можно на модельке выделить боксом область под замену. Правда, не знаю насколько полезная
- ну и конечно генерация сцены по боксам как было в изначальной презентации
Теперь о слабых местах
- не справляется с нестандартными позами персонажей. Бендера со скрещенными на груди руками не смог. Вернее, Бендер вышел отлично, а руки слились в один шланг. Игривого котэ смог, но в другой позе, с лапками поставленными вместе. Но было бы и странно, кому нужны статичные персонажи в странных позах? Думаю, с Т-позой для бипеда и стандартной позой для квадрапеда все будет ок.
- не справляется с мелкими детальными структурами. Эйфелеву башню порвал на кусочки. Из вот этого мелкоструктурного лица вообще сделал какой-то чле н, оставив пустоту вместо щек
- не справился с очками на жабе, оптические эффекты тяжеловато ему даются. Со второй или третьей попытки почти справился.
Ну и опять же, то что не получилось - экстремальные случаи, мне трудно себе представить кейсы когда такие вещи потребуется сделать с нуля.
Стол, пистолет, мозг получились отлично.
Обещают сначала открыть web-версию, потом API
#imageto3D #tetxtto3D #text2scene #test #inpainting
Признаю, он неидеален, но впечатляет! Лучше всего что я видел до сих пор. Для иллюстрации прилагаю ваши картинки, о которых речь
- Генерит объекты по тексту и по изображению
- генерит текстуры
- может смешивать два и более объектов, есть рулька смешивания. Гибрид Бендера с автомобилем вышел бесполезный но смешной
- Я в 3D дилетант, по мне сетка хорошая в сравнении с остальными генераторами, даже отличная для железки. Есть три варианта поликаунта для чистового прохода- 5000, 10000, 30000 полигонов
- умеет генерить воксели из геометрии и геометрию из вокселей. Для меня юзкейсы тут неочевидны были. Короче, так можно делать вариации геометрии или что-то детальное из грубого 3D наброска.
- умеет генерить объект из облака точек. Чую, это будет отличная замена нюковому генератору меша из облака точек
- Крышесносная фича - 3D инпейнтинг - можно на модельке выделить боксом область под замену. Правда, не знаю насколько полезная
- ну и конечно генерация сцены по боксам как было в изначальной презентации
Теперь о слабых местах
- не справляется с нестандартными позами персонажей. Бендера со скрещенными на груди руками не смог. Вернее, Бендер вышел отлично, а руки слились в один шланг. Игривого котэ смог, но в другой позе, с лапками поставленными вместе. Но было бы и странно, кому нужны статичные персонажи в странных позах? Думаю, с Т-позой для бипеда и стандартной позой для квадрапеда все будет ок.
- не справляется с мелкими детальными структурами. Эйфелеву башню порвал на кусочки. Из вот этого мелкоструктурного лица вообще сделал какой-то ч
- не справился с очками на жабе, оптические эффекты тяжеловато ему даются. Со второй или третьей попытки почти справился.
Ну и опять же, то что не получилось - экстремальные случаи, мне трудно себе представить кейсы когда такие вещи потребуется сделать с нуля.
Стол, пистолет, мозг получились отлично.
Обещают сначала открыть web-версию, потом API
#imageto3D #tetxtto3D #text2scene #test #inpainting
❤17🤔4🤯1
This media is not supported in your browser
VIEW IN TELEGRAM
VIDIM: Video Interpolation With Diffusion Models
Диффузная интерполяция кадров (слоумоушен) от Google Research и DeepMind. Затыкает за пояс и RIFE, и FILM (гугловский же)
Что с кодом, Гугл?
#frameinterpolation #slowmotion
Диффузная интерполяция кадров (слоумоушен) от Google Research и DeepMind. Затыкает за пояс и RIFE, и FILM (гугловский же)
Что с кодом, Гугл?
#frameinterpolation #slowmotion
👍7
This media is not supported in your browser
VIEW IN TELEGRAM
Higgsfield AI Diffuse
Базовая модель персонализации видео.
Записаться в вейтлист
Diffuse для iOS (в российском AppStore недоступен)
#personalization
Базовая модель персонализации видео.
Записаться в вейтлист
Diffuse для iOS (в российском AppStore недоступен)
#personalization
🥴6🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
Readout Guidance: Learning Controlfrom Diffusion Features
опубликован код и веса гугловского манипулятора над изображениями
Гитхаб
#image2image #conditioning #imageediting
опубликован код и веса гугловского манипулятора над изображениями
Гитхаб
#image2image #conditioning #imageediting
❤8👍1
This media is not supported in your browser
VIEW IN TELEGRAM
DINO-Tracker: Taming DINO for Self-Supervised Point Tracking in a Single Video
Трекер группы точек, в том числе перекрытых переднеплановыми объектами. На приведенных примерах показывает себя лучше чем CoTracker
Код
#tracking #opticalflow
Трекер группы точек, в том числе перекрытых переднеплановыми объектами. На приведенных примерах показывает себя лучше чем CoTracker
Код
#tracking #opticalflow
👍10
This media is not supported in your browser
VIEW IN TELEGRAM
ASH: Animatable Gaussian Splats for Efficient and Photoreal Human Rendering
Управляемые фотореалистичные аватары на гауссианах в реальном времени.
Код
#humanavatar #realtime #gaussian
Управляемые фотореалистичные аватары на гауссианах в реальном времени.
Код
#humanavatar #realtime #gaussian
👍8❤1
InstantStyle : Free Lunch towards Style-Preserving in Text-to-Image Generation
Новый адаптер стиля для генерации изображений
Код
Демо
#conditioning #text2image #image2image
Новый адаптер стиля для генерации изображений
Код
Демо
#conditioning #text2image #image2image
❤5👍1
This media is not supported in your browser
VIEW IN TELEGRAM
InstantSplat: Unbounded Sparse-view Pose-free Gaussian Splatting in 40 Seconds
Реконструкция крупных сцен на гауссинах за 40 секунд
Код ждем
#gaussian #novelview #rendering
Реконструкция крупных сцен на гауссинах за 40 секунд
Код ждем
#gaussian #novelview #rendering
👍6
COMO: Compact Mapping and Odometry
Восстановление 3D сцены и трекинг камеры по одному ракурсу. Камера-мэппинг на максималках
Код
#tracking #videoto3D #imageto3D #novelview
Восстановление 3D сцены и трекинг камеры по одному ракурсу. Камера-мэппинг на максималках
Код
#tracking #videoto3D #imageto3D #novelview
🔥4❤1👌1
HAHA: Highly Articulated Gaussian Human Avatars with Textured Mesh Prior
Легкие рилтаймовые фотореалистичные аватары все ближе. Вот еще один проект управляемых аватаров на гауссианах. Вернее, тут гибрид гауссиан и текстурированной геометрии. Обучается на одноракукрсном видео
Код
#humanavatar #gaussiuan
Легкие рилтаймовые фотореалистичные аватары все ближе. Вот еще один проект управляемых аватаров на гауссианах. Вернее, тут гибрид гауссиан и текстурированной геометрии. Обучается на одноракукрсном видео
Код
#humanavatar #gaussiuan
❤7🔥3👍1