Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.45K photos
3.71K videos
41 files
4.76K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
Мемов на сон грядущий

#humor
😁30👎6💩5🤡3😐2
не зашло) 🤷‍♂️
🤡5
This media is not supported in your browser
VIEW IN TELEGRAM
Inference Providers

HuggingFace запустил Inference Providers - бессерверный запуск моделей.

Теперь не надо никуда ходить чтобы потестить интересную модель, даже на Spaces.

Обеспечивают этот праздник партнеры - fal, Replicate, Sambanova, Together AI. Можете в аккаунте указать их API ключи если у вас есть. А можете и не указывать, тогда инференс будет на мощностях HF

Бесплатным пользователям отсыпают немножко токенов в день

#news
6👍2
This media is not supported in your browser
VIEW IN TELEGRAM
Появился демоспейс генератора музыки YuE, можно потыкать

Демо

#text2music #music
7
Stable Flow: Vital Layers for Training-Free Image Editing

Редактирование изображений без обучения

Нежесткое редактирование, добавление объектов, удаление объектов и глобальное редактирование сцены

Жрет 80ГБ

Код

#imageediting
🔥7😎1
OmniHuman-1: Rethinking the Scaling-Up of One-Stage Conditioned Human Animation Models

ByteDance снова что-то анимируют

Оживлятор человеческих (и не только) портретов любой крупности (лицо, поясной, полный рост) и соотношения сторон. Анимирует как фото, так и рисунки.

На вход помимо собственно портрета нужен сигнал для извлечения движения: звук, видео или их комбинация

Выглядит круто,
Кода нет

#portraitanimation #audio2video #audio2motion #motion2video #talkinghead #lipsync
🔥216👍4🥴1👀1
This media is not supported in your browser
VIEW IN TELEGRAM
Хорошие новости для недомузыкантов вроде меня

Генератор музыки YuE можно установить локально в пару кликов в Pinokio

Для работы достаточно 10Гб VRAM, только Nvidia

Умеет принимать ваше аудио на вход!

#text2music #music #audio2music #music2music
👍104
MatAnyone: Stable Video Matting with Consistent Memory Propagation

Создает маску на заданного человека на видео
На вход принимает маску в первом кадре. Но потеть не придется, целевая маска создается в несколько кликов.

Пока еще далеко от идеала, но надеюсь станет подспорьем в композе

Код и демо ждем на следующей неделе

#segmentation #matting #video2matte #video2mask
🔥111👎1
Media is too big
VIEW IN TELEGRAM
Prompting Depth Anything for 4K Resolution Accurate Metric Depth Estimation

Генератор глубины разрешением до 4К для видео. Но не для любого, нужны данные с лидара. У потребительских лидаров, таких как в айфоне, например, очень кислое разрешение, что-то вроде 256x192. Эти данные плюс RGB видео используются как промпт для генерации высококачественной карты глубины

Код
Демо
Код неофициальный
Пример результата на rerun.io покрутить

#rgbd #video2depth
8
Media is too big
VIEW IN TELEGRAM
DiffVSR: Enhancing Real-World Video Super-Resolution with Diffusion Models for Advanced Visual Quality and Temporal Consistency

Ну-ка, ну-ка
Еще один апскейлер для видео от китайцев, хвалится консистентностью, на черрипиках хорош

Препринт (Ссылка на сайте не работает)
Код ждем

#upscale #upscalevideo #enhance
👍6🔥1
MVGD: Zero-Shot Novel View and Depth Synthesis with Multi-View Geometric Diffusion

Диффузный генератор новых консистентных ракурсов с картой глубины заданной сцены. На вход - любое количество ракурсов сцены.

Код ждем

#image2depth #novelview
👍4🔥1