Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.45K photos
3.72K videos
41 files
4.76K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
Gaussian Head Avatar: Ultra High-fidelity Head Avatar via Dynamic Gaussians

Сегодня пройдемся по головам.
Реконструкция аватара головы по нескольким ракурсам, вместе с мимикой и деформациями. В деле замешаны гауссианы.
На выходе - рендер разрешением 2К, не без помощи апскейлера. Но вы его тут видите?

Код ждем есть

#gaussian #image2head #rendering #imageto3D #head
🔥9👍2
GAIA: Zero-shot Talking Avatar Generation

Теперь разработка Microsoft.
Говорящая голова. На вход нужна одна картинка и звук речи. Можно управлять позой, подать на вход управляющее видео или текст. А что еще можно придумать для управления говорящей головой?

Код ждем

#talkinghead #humananimation #humanavatar #image2head #image2video #head
6👍1
Diffusion AvatarsDeferred Diffusion for High-fidelity 3D Head Avatars

Управляемый аватар головы с реалистичной мимикой.
Анимацей управляет управляющее видео или параметрическая модель (NPHM).
Diffusion Avatars обучали на датасете голов, снятых 16 камерами с разных ракурсов. Предположительно, для того чтобы использовать Diffusion Avatars на своих задачах, понадобится или многоракурсный датасет или соответствующий набор 3D данных.

[Update] Код
Полное видео, 3 минуты

#talkinghead #humananimation #humanavatar #image2head #image2video #head
И снова Gemini.
Мне удалось зайти в обновленный Bard по инструкции Сиолошной. Есть плагин для анализа видео с YouTube. Но он упрямо не может получить доступ к большинству видео. Пятое видео согласился обработать, задумался уже минут на 5. Так что пока печально. Зато бесплатный анализ видео. Ну и в Барде сейчас не старшая модель, а старшую выкатят позже.

Теперь о хорошем. Если вы не видели вот это видео с официального канала Google, обязательно посмотрите, у меня сносит крышу
https://youtu.be/UIZAiXYceBI?si=kVlJjRIbbXxdHUde
This media is not supported in your browser
VIEW IN TELEGRAM
Marigold: Repurposing Diffusion-Based Image Generators for Monocular Depth Estimation

Новый инструмент точной оценки глубины на основе SD. Круче чем все что я видел

Код
Демо
Колаб

#image2depth
🔥12
This media is not supported in your browser
VIEW IN TELEGRAM
PatchFusion: An End-to-End Tile-Based Framework for High-Resolution Monocular Metric Depth Estimation

И его конкурент. Берет грубое предсказание глубины, например от ZoeDepth. Бьет картинку на патчи и поверх грубого делает более точную оценку.

Есть желающие экспериментально выяснить кто лучший из этих двух?

Код
Демо

#image2depth
🔥5
This media is not supported in your browser
VIEW IN TELEGRAM
pose.rip

Пляшем. Magic Animate для всех.
Тут можно сделать и DensePose и анимацию.

Накидывайте результаты в комменты

#tools #image2video #video2motion #video2pose
1👍1
Поздравляю всех причастных к VFX индустрии! Сегодня наш официальный праздник!

Организаторы запланировали бесчисленное количество лекций и стримов, подробности: worldvfxday.com
👍4
This media is not supported in your browser
VIEW IN TELEGRAM
А праздник-то настоящий.
Пришел триал-доступ к Cuebrick
Проверьте свою почту
This media is not supported in your browser
VIEW IN TELEGRAM
Aura

Deepgram, известный своим транскрибатором Nova2, представил голосовой движок реального времени Aura. Задержка всего 200мс.

В комплекте API для голосовых агентов искусственного интеллекта. Много языков, в том числе русский

Записаться в вейтлист

#text2speech
👍1🔥1
Forwarded from AI для Всех (Artemii)
S-LoRA: матрица намного ближе, чем кажется

S-LoRA превращает любую большую языковую модель в "Матрицу", где каждый Агент Смит может быть адаптирован в уникального персонажа, создавая целый мир на одной платформе.

Представьте, если бы Агент Смит из "Матрицы" мог превращаться в любого уникального персонажа по вашему желанию. Вот рецепт:

1. Базовая модель - Агент Смит: LLaMA, наша базовая модель, аналогична Агенту Смиту - мощной и адаптируемой форме ИИ, готовой к изменениям.

2. LoRA-адаптеры - Настройки персонажей: Каждый LoRA-адаптер добавляет свои уникальные характеристики к базовой модели, превращая стандартного Агента Смита в множество разнообразных персонажей.

3. S-LoRA - Матрица: S-LoRA действует как "Матрица", в рамках которой все эти преобразования происходят. Она позволяет масштабировать и управлять множеством адаптированных персонажей, поддерживая сложную сеть взаимодействующих и эволюционирующих форм.

S-LoRA открывает новые горизонты в использовании LLMs, позволяя нам не только создавать уникальные характеристики базовой модели, но и управлять ими в масштабах, сравнимых с "Матрицей".

🤩 Статья
🐙 Код
😱4👍1
This media is not supported in your browser
VIEW IN TELEGRAM
DynamiCrafter: Animating Open-domainImages with Video Diffusion Priors

Анимация изображений по текстовому описанию, интерополяция кадров на видео, закольцовывание видео

Код
Демо

#image2video #video2video #frameinterpolation
👍1
Нейронавт | Нейросети в творчестве
А праздник-то настоящий. Пришел триал-доступ к Cuebrick Проверьте свою почту
Еще пришла месячная триалка на Unity Muse.
Только она требует для бесплатной триалки заграничную кредитку или рабочий PayPal. Палка у меня есть пустая, не прокатило.

Если вдруг кто хочет помочь своей палкой или кредиткой ради теста, пишите в лс
👍1