Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.45K photos
3.72K videos
41 files
4.76K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
Media is too big
VIEW IN TELEGRAM
Viggle

Контроль персонажа на видео - замена персонажа, анимация изображения

Попробовать в дискорде

#image2video #video2video #personalization
🔥9
Media is too big
VIEW IN TELEGRAM
One-step Diffusion with
Distribution Matching Distillation


Еще один метод ускорения генерации изображений от MIT и Adobe. Генерация за один шаг и 0.09 сек против 2.5 сек и 50 шагов в обычном SD

Кода нет

#text2image #optimization
🔥14👍1
AnyV2V: A Plug-and-Play Framework For Any Video-to-Video Editing Tasks

Редактирование видео по образцу, по текстовым указаниям, перенос стиля, персонализация

Работает это все пока только на A100, и чтобы попробовать на своих видео нужно менять конфиги:
template.yaml
group_config.json
- @monkeyinlaw

Код
Демо
Колаб

#video2video #personalization #videoediting #styletransfer
🔥4🥴2👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Stable Code Instruct 3B

Stability AI выкатили инженерную LLM, затюненную на инструкциях, на основе Stable Code 3B.

Умеет писать код, умеет в математику, умеет выполнять другие софт-инженерные задачи.

Бьет CodeLlama 7B Instruct и сопоставим с StarChat 15B

Доступно для коммерческого использования

Веса

#coding #llm
👍101👎1👏1
Sora: First Impressions

OpenAI опубликовали работы и первые впечатления избранных представителей творческих профессий от Sora

#news
🔥17
ComfyUI IPAdapter plus

Обновление IPAdapter для ComfyUI. В IPAdapter V2 полностью переписан код, старые воркфлоу не будут работать после обновления.

- multiple new IPAdapter nodes: regular (named "IPAdapter"), advanced ("IPAdapter Advanced"), and faceID ("IPAdapter FaceID);

- there's no need for a separate CLIPVision Model Loader node anymore, CLIPVision can be applied in a "IPAdapter Unified Loader" node;

- CLIPVision can be applied separately if "IPAdapter Unified Loader" is not used;

- new Weight Types;

- new Combine Embed types for multiple images inside of one IPAdapter node.

#text2image #image2image
👍5
FlashFace: Human Image Personalization with High-fidelity Identity Preservation

Персонализация лучше чем InstantID, FaceID
- изменение возраста, пола
- делает реалистичные версии фантастических персонажей
- интерполяция персонажей
- стилизация
- контроль текстосвыми указаниями

Код ждем
Демо ждем

#personalization #stylization #image2image
👍2
Forwarded from эйай ньюз
This media is not supported in your browser
VIEW IN TELEGRAM
🔥RadSplat - качество рендеринга как NeRF, но в 900FPS!

Переносить реальные пространства в VR в высоком разрешении - это то к чему многие ресерчеры стремятся. Но для реального применения, тут важно уметь быстро рендерить реалистичную картинку отсканированных объектов.

Концептуально в новом методе RadSplat всё очень просто: сначала тренируем нерф и запекаем его в гауссовый сплат. Потом, сравнивая с нерфом, определяем важность каждого элемента сплата и обрезаем ненужные. От такого прунинга качество, внезапно, даже растёт.

Для ускорения на больших сценах предлагают разбить сцену на несколько кластеров, определить что из каждого кластера видно и рендерить только это. В чём-то это похоже на VastGaussian, о котором я рассказывал пару недель назад.

В целом оно быстрее обычных нерфов вплоть до 3 тысяч раз(!), что по скорости примерно на уровне метода Re-ReND от нашей команды, где мы запекали нерф в light-field на меши, что позволяло рендерить со скоростью до 1000FPS на GPU и 74 FPS на шлеме Oculus Pro.

Сайт проекта

@ai_newz
🔥8👎1
SDXS: Real-Time One-Step Latent Diffusion Models with Image Conditions

Одношаговая генерация изображений в реальном времени с визуальным промптингом (как в Controlnet, IPadapter)

Представлены две модели, SDXS-512 и SDXS-1024, обеспечивающие скорость вывода примерно 100 кадров в секунду (в 30 раз быстрее, чем SD v1.5) и 30 кадров в секунду (в 60 раз быстрее, чем SDXL) на одном графическом процессоре соответственно

Код, пре-релизные веса для diffusers

#realtime #text2image #conditioning #SDXS
👍8
Media is too big
VIEW IN TELEGRAM
Gaussian-SLAM: Photo-realistic Dense SLAM with Gaussian Splatting

Реконструкция сцен реального мира по RGBD - видео на гауссианах. Канал глубины решает, ну и архитектура тоже

Код

#gaussian #video2scene #rendering #videoto3D
This media is not supported in your browser
VIEW IN TELEGRAM
Говорят, Google Photos обновился ИИ-фичами

- Magic Eraser - самое интересное, удаление объектов
- Photo Stacks - группирование похожих фото
- Highlight video - автомонтаж видеоклипов
- Best Take - выбор лучшего варианта фото
- Организация документов и чеков в отдельные альбомы

#inpainting
🔥7