Нейронавт | Нейросети в творчестве
Народ, у меня сегодня будет ознакомительная демо-сессия с представителем Rodin Gen-1 Накидайте срочно картинок для теста генерации 3D объектов! [UPDATE] Спасибо, картинки отправил #imageto3D #tetxtto3D #text2scene #realtime
Впечатления о Rodin Gen-1 со вчерашней демосессии.
Признаю, он неидеален, но впечатляет! Лучше всего что я видел до сих пор. Для иллюстрации прилагаю ваши картинки, о которых речь
- Генерит объекты по тексту и по изображению
- генерит текстуры
- может смешивать два и более объектов, есть рулька смешивания. Гибрид Бендера с автомобилем вышел бесполезный но смешной
- Я в 3D дилетант, по мне сетка хорошая в сравнении с остальными генераторами, даже отличная для железки. Есть три варианта поликаунта для чистового прохода- 5000, 10000, 30000 полигонов
- умеет генерить воксели из геометрии и геометрию из вокселей. Для меня юзкейсы тут неочевидны были. Короче, так можно делать вариации геометрии или что-то детальное из грубого 3D наброска.
- умеет генерить объект из облака точек. Чую, это будет отличная замена нюковому генератору меша из облака точек
- Крышесносная фича - 3D инпейнтинг - можно на модельке выделить боксом область под замену. Правда, не знаю насколько полезная
- ну и конечно генерация сцены по боксам как было в изначальной презентации
Теперь о слабых местах
- не справляется с нестандартными позами персонажей. Бендера со скрещенными на груди руками не смог. Вернее, Бендер вышел отлично, а руки слились в один шланг. Игривого котэ смог, но в другой позе, с лапками поставленными вместе. Но было бы и странно, кому нужны статичные персонажи в странных позах? Думаю, с Т-позой для бипеда и стандартной позой для квадрапеда все будет ок.
- не справляется с мелкими детальными структурами. Эйфелеву башню порвал на кусочки. Из вот этого мелкоструктурного лица вообще сделал какой-то чле н, оставив пустоту вместо щек
- не справился с очками на жабе, оптические эффекты тяжеловато ему даются. Со второй или третьей попытки почти справился.
Ну и опять же, то что не получилось - экстремальные случаи, мне трудно себе представить кейсы когда такие вещи потребуется сделать с нуля.
Стол, пистолет, мозг получились отлично.
Обещают сначала открыть web-версию, потом API
#imageto3D #tetxtto3D #text2scene #test #inpainting
Признаю, он неидеален, но впечатляет! Лучше всего что я видел до сих пор. Для иллюстрации прилагаю ваши картинки, о которых речь
- Генерит объекты по тексту и по изображению
- генерит текстуры
- может смешивать два и более объектов, есть рулька смешивания. Гибрид Бендера с автомобилем вышел бесполезный но смешной
- Я в 3D дилетант, по мне сетка хорошая в сравнении с остальными генераторами, даже отличная для железки. Есть три варианта поликаунта для чистового прохода- 5000, 10000, 30000 полигонов
- умеет генерить воксели из геометрии и геометрию из вокселей. Для меня юзкейсы тут неочевидны были. Короче, так можно делать вариации геометрии или что-то детальное из грубого 3D наброска.
- умеет генерить объект из облака точек. Чую, это будет отличная замена нюковому генератору меша из облака точек
- Крышесносная фича - 3D инпейнтинг - можно на модельке выделить боксом область под замену. Правда, не знаю насколько полезная
- ну и конечно генерация сцены по боксам как было в изначальной презентации
Теперь о слабых местах
- не справляется с нестандартными позами персонажей. Бендера со скрещенными на груди руками не смог. Вернее, Бендер вышел отлично, а руки слились в один шланг. Игривого котэ смог, но в другой позе, с лапками поставленными вместе. Но было бы и странно, кому нужны статичные персонажи в странных позах? Думаю, с Т-позой для бипеда и стандартной позой для квадрапеда все будет ок.
- не справляется с мелкими детальными структурами. Эйфелеву башню порвал на кусочки. Из вот этого мелкоструктурного лица вообще сделал какой-то ч
- не справился с очками на жабе, оптические эффекты тяжеловато ему даются. Со второй или третьей попытки почти справился.
Ну и опять же, то что не получилось - экстремальные случаи, мне трудно себе представить кейсы когда такие вещи потребуется сделать с нуля.
Стол, пистолет, мозг получились отлично.
Обещают сначала открыть web-версию, потом API
#imageto3D #tetxtto3D #text2scene #test #inpainting
❤17🤔4🤯1
This media is not supported in your browser
VIEW IN TELEGRAM
VIDIM: Video Interpolation With Diffusion Models
Диффузная интерполяция кадров (слоумоушен) от Google Research и DeepMind. Затыкает за пояс и RIFE, и FILM (гугловский же)
Что с кодом, Гугл?
#frameinterpolation #slowmotion
Диффузная интерполяция кадров (слоумоушен) от Google Research и DeepMind. Затыкает за пояс и RIFE, и FILM (гугловский же)
Что с кодом, Гугл?
#frameinterpolation #slowmotion
👍7
This media is not supported in your browser
VIEW IN TELEGRAM
Higgsfield AI Diffuse
Базовая модель персонализации видео.
Записаться в вейтлист
Diffuse для iOS (в российском AppStore недоступен)
#personalization
Базовая модель персонализации видео.
Записаться в вейтлист
Diffuse для iOS (в российском AppStore недоступен)
#personalization
🥴6🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
Readout Guidance: Learning Controlfrom Diffusion Features
опубликован код и веса гугловского манипулятора над изображениями
Гитхаб
#image2image #conditioning #imageediting
опубликован код и веса гугловского манипулятора над изображениями
Гитхаб
#image2image #conditioning #imageediting
❤8👍1
This media is not supported in your browser
VIEW IN TELEGRAM
DINO-Tracker: Taming DINO for Self-Supervised Point Tracking in a Single Video
Трекер группы точек, в том числе перекрытых переднеплановыми объектами. На приведенных примерах показывает себя лучше чем CoTracker
Код
#tracking #opticalflow
Трекер группы точек, в том числе перекрытых переднеплановыми объектами. На приведенных примерах показывает себя лучше чем CoTracker
Код
#tracking #opticalflow
👍10
This media is not supported in your browser
VIEW IN TELEGRAM
ASH: Animatable Gaussian Splats for Efficient and Photoreal Human Rendering
Управляемые фотореалистичные аватары на гауссианах в реальном времени.
Код
#humanavatar #realtime #gaussian
Управляемые фотореалистичные аватары на гауссианах в реальном времени.
Код
#humanavatar #realtime #gaussian
👍8❤1
InstantStyle : Free Lunch towards Style-Preserving in Text-to-Image Generation
Новый адаптер стиля для генерации изображений
Код
Демо
#conditioning #text2image #image2image
Новый адаптер стиля для генерации изображений
Код
Демо
#conditioning #text2image #image2image
❤5👍1
This media is not supported in your browser
VIEW IN TELEGRAM
InstantSplat: Unbounded Sparse-view Pose-free Gaussian Splatting in 40 Seconds
Реконструкция крупных сцен на гауссинах за 40 секунд
Код ждем
#gaussian #novelview #rendering
Реконструкция крупных сцен на гауссинах за 40 секунд
Код ждем
#gaussian #novelview #rendering
👍6
COMO: Compact Mapping and Odometry
Восстановление 3D сцены и трекинг камеры по одному ракурсу. Камера-мэппинг на максималках
Код
#tracking #videoto3D #imageto3D #novelview
Восстановление 3D сцены и трекинг камеры по одному ракурсу. Камера-мэппинг на максималках
Код
#tracking #videoto3D #imageto3D #novelview
🔥4❤1👌1
HAHA: Highly Articulated Gaussian Human Avatars with Textured Mesh Prior
Легкие рилтаймовые фотореалистичные аватары все ближе. Вот еще один проект управляемых аватаров на гауссианах. Вернее, тут гибрид гауссиан и текстурированной геометрии. Обучается на одноракукрсном видео
Код
#humanavatar #gaussiuan
Легкие рилтаймовые фотореалистичные аватары все ближе. Вот еще один проект управляемых аватаров на гауссианах. Вернее, тут гибрид гауссиан и текстурированной геометрии. Обучается на одноракукрсном видео
Код
#humanavatar #gaussiuan
❤7🔥3👍1
This media is not supported in your browser
VIEW IN TELEGRAM
MuseV
Анимация картинок, аватары.
Совместим с LoRa, ControlNet, другими адаптерами
Демо
Гитхаб
#image2video #video2video #personalization
Анимация картинок, аватары.
Совместим с LoRa, ControlNet, другими адаптерами
Демо
Гитхаб
#image2video #video2video #personalization
👍7❤4