Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.45K photos
3.72K videos
41 files
4.76K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
OmniHuman-1: Rethinking the Scaling-Up of One-Stage Conditioned Human Animation Models

ByteDance снова что-то анимируют

Оживлятор человеческих (и не только) портретов любой крупности (лицо, поясной, полный рост) и соотношения сторон. Анимирует как фото, так и рисунки.

На вход помимо собственно портрета нужен сигнал для извлечения движения: звук, видео или их комбинация

Выглядит круто,
Кода нет

#portraitanimation #audio2video #audio2motion #motion2video #talkinghead #lipsync
🔥216👍4🥴1👀1
This media is not supported in your browser
VIEW IN TELEGRAM
Хорошие новости для недомузыкантов вроде меня

Генератор музыки YuE можно установить локально в пару кликов в Pinokio

Для работы достаточно 10Гб VRAM, только Nvidia

Умеет принимать ваше аудио на вход!

#text2music #music #audio2music #music2music
👍104
MatAnyone: Stable Video Matting with Consistent Memory Propagation

Создает маску на заданного человека на видео
На вход принимает маску в первом кадре. Но потеть не придется, целевая маска создается в несколько кликов.

Пока еще далеко от идеала, но надеюсь станет подспорьем в композе

Код и демо ждем на следующей неделе

#segmentation #matting #video2matte #video2mask
🔥111👎1
Media is too big
VIEW IN TELEGRAM
Prompting Depth Anything for 4K Resolution Accurate Metric Depth Estimation

Генератор глубины разрешением до 4К для видео. Но не для любого, нужны данные с лидара. У потребительских лидаров, таких как в айфоне, например, очень кислое разрешение, что-то вроде 256x192. Эти данные плюс RGB видео используются как промпт для генерации высококачественной карты глубины

Код
Демо
Код неофициальный
Пример результата на rerun.io покрутить

#rgbd #video2depth
8
Media is too big
VIEW IN TELEGRAM
DiffVSR: Enhancing Real-World Video Super-Resolution with Diffusion Models for Advanced Visual Quality and Temporal Consistency

Ну-ка, ну-ка
Еще один апскейлер для видео от китайцев, хвалится консистентностью, на черрипиках хорош

Препринт (Ссылка на сайте не работает)
Код ждем

#upscale #upscalevideo #enhance
👍6🔥1
MVGD: Zero-Shot Novel View and Depth Synthesis with Multi-View Geometric Diffusion

Диффузный генератор новых консистентных ракурсов с картой глубины заданной сцены. На вход - любое количество ракурсов сцены.

Код ждем

#image2depth #novelview
👍4🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
Open Deep Research

Опенсорсный клон Deep Reserach вышел спустя 12 часов после презентации Open AI агента для исследований

Экономим $200 на подписке

#assistant #agent
👍9😁4🤔1
This media is not supported in your browser
VIEW IN TELEGRAM
Срочные (нет) новости (нет)

Слышали про квадрат на Марсе?
Так вот, там целый датацентр уже построен и даже нанесен на гуглмапс с панорамами самим Гуглом 1 апреля 2017 года

#оффтоп #humor
😁27🔥6🤡2👍1