Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.47K photos
3.73K videos
41 files
4.77K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
Нейронавт | Нейросети в творчестве
Народ, у меня сегодня будет ознакомительная демо-сессия с представителем Rodin Gen-1 Накидайте срочно картинок для теста генерации 3D объектов! [UPDATE] Спасибо, картинки отправил #imageto3D #tetxtto3D #text2scene #realtime
Впечатления о Rodin Gen-1 со вчерашней демосессии.

Признаю, он неидеален, но впечатляет! Лучше всего что я видел до сих пор. Для иллюстрации прилагаю ваши картинки, о которых речь

- Генерит объекты по тексту и по изображению
- генерит текстуры
- может смешивать два и более объектов, есть рулька смешивания. Гибрид Бендера с автомобилем вышел бесполезный но смешной
- Я в 3D дилетант, по мне сетка хорошая в сравнении с остальными генераторами, даже отличная для железки. Есть три варианта поликаунта для чистового прохода- 5000, 10000, 30000 полигонов
- умеет генерить воксели из геометрии и геометрию из вокселей. Для меня юзкейсы тут неочевидны были. Короче, так можно делать вариации геометрии или что-то детальное из грубого 3D наброска.
- умеет генерить объект из облака точек. Чую, это будет отличная замена нюковому генератору меша из облака точек
- Крышесносная фича - 3D инпейнтинг - можно на модельке выделить боксом область под замену. Правда, не знаю насколько полезная
- ну и конечно генерация сцены по боксам как было в изначальной презентации

Теперь о слабых местах

- не справляется с нестандартными позами персонажей. Бендера со скрещенными на груди руками не смог. Вернее, Бендер вышел отлично, а руки слились в один шланг. Игривого котэ смог, но в другой позе, с лапками поставленными вместе. Но было бы и странно, кому нужны статичные персонажи в странных позах? Думаю, с Т-позой для бипеда и стандартной позой для квадрапеда все будет ок.

- не справляется с мелкими детальными структурами. Эйфелеву башню порвал на кусочки. Из вот этого мелкоструктурного лица вообще сделал какой-то член, оставив пустоту вместо щек

- не справился с очками на жабе, оптические эффекты тяжеловато ему даются. Со второй или третьей попытки почти справился.

Ну и опять же, то что не получилось - экстремальные случаи, мне трудно себе представить кейсы когда такие вещи потребуется сделать с нуля.

Стол, пистолет, мозг получились отлично.

Обещают сначала открыть web-версию, потом API

#imageto3D #tetxtto3D #text2scene #test #inpainting
17🤔4🤯1
This media is not supported in your browser
VIEW IN TELEGRAM
VIDIM: Video Interpolation With Diffusion Models

Диффузная интерполяция кадров (слоумоушен) от Google Research и DeepMind. Затыкает за пояс и RIFE, и FILM (гугловский же)

Что с кодом, Гугл?

#frameinterpolation #slowmotion
👍7
This media is not supported in your browser
VIEW IN TELEGRAM
Higgsfield AI Diffuse

Базовая модель персонализации видео.

Записаться в вейтлист
Diffuse для iOS (в российском AppStore недоступен)

#personalization
🥴6🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
DINO-Tracker: Taming DINO for Self-Supervised Point Tracking in a Single Video

Трекер группы точек, в том числе перекрытых переднеплановыми объектами. На приведенных примерах показывает себя лучше чем CoTracker

Код

#tracking #opticalflow
👍10
HAHA: Highly Articulated Gaussian Human Avatars with Textured Mesh Prior

Легкие рилтаймовые фотореалистичные аватары все ближе. Вот еще один проект управляемых аватаров на гауссианах. Вернее, тут гибрид гауссиан и текстурированной геометрии. Обучается на одноракукрсном видео

Код

#humanavatar #gaussiuan
7🔥3👍1
This media is not supported in your browser
VIEW IN TELEGRAM
MuseV

Анимация картинок, аватары.
Совместим с LoRa, ControlNet, другими адаптерами

Демо
Гитхаб

#image2video #video2video #personalization
👍74
#оффтоп
Признайтесь, на каких видео вы ржали с краткого пересказа?
😁21👎1
This media is not supported in your browser
VIEW IN TELEGRAM
C4AI Command R+

Мощная языковая модель на 104B параметров. Умеет в рассуждения, суммаризацию, ответы на вопросы и другое

Демо
Код/веса

#llm #assistant #chatbot #summary
🔥5
SSR-Encoder: Encoding Selective Subject Representation for Subject-Driven Generation

Генерация изоюражения по образцу, в том числе нескольких разных объектов. Применимо также и к видео.

Код

#conditioning #text2image #image2image #personalization
🔥3👌1
This media is not supported in your browser
VIEW IN TELEGRAM
Face-to-All

Генерация портретов по образцу персонажа. Персонализация, иначе говоря. Вдохновлено face-to-many

#personalization @image2image #text2image #stylization
🔥4👎1