NEW BOT Телеграм, страница - 778935771

Нейронавт | Нейросети в творчестве

@GreenNeuralRobots

10.6K subscribers

4.45K photos

3.72K videos

41 files

4.76K links

Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111

Download Telegram

About

Blog

Apps

Platform

Нейронавт | Нейросети в творчестве

10.6K subscribers

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

Gaussian Head Avatar: Ultra High-fidelity Head Avatar via Dynamic Gaussians

Сегодня пройдемся по головам.
Реконструкция аватара головы по нескольким ракурсам, вместе с мимикой и деформациями. В деле замешаны гауссианы.
На выходе - рендер разрешением 2К, не без помощи апскейлера. Но вы его тут видите?

Код ~~ждем~~ есть

#gaussian #image2head #rendering #imageto3D #head

🔥9👍2

1.28K views07:13

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

GAIA: Zero-shot Talking Avatar Generation

Теперь разработка Microsoft.
Говорящая голова. На вход нужна одна картинка и звук речи. Можно управлять позой, подать на вход управляющее видео или текст. А что еще можно придумать для управления говорящей головой?

Код ждем

#talkinghead #humananimation #humanavatar #image2head #image2video #head

❤6👍1

1.07K views07:26

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

Diffusion AvatarsDeferred Diffusion for High-fidelity 3D Head Avatars

Управляемый аватар головы с реалистичной мимикой.
Анимацей управляет управляющее видео или параметрическая модель (NPHM).
Diffusion Avatars обучали на датасете голов, снятых 16 камерами с разных ракурсов. Предположительно, для того чтобы использовать Diffusion Avatars на своих задачах, понадобится или многоракурсный датасет или соответствующий набор 3D данных.

[Update] Код
Полное видео, 3 минуты

#talkinghead #humananimation #humanavatar #image2head #image2video #head

1.14K views07:42

Нейронавт | Нейросети в творчестве

И снова Gemini.
Мне удалось зайти в обновленный Bard по инструкции Сиолошной. Есть плагин для анализа видео с YouTube. Но он упрямо не может получить доступ к большинству видео. Пятое видео согласился обработать, задумался уже минут на 5. Так что пока печально. Зато бесплатный анализ видео. Ну и в Барде сейчас не старшая модель, а старшую выкатят позже.

Теперь о хорошем. Если вы не видели вот это видео с официального канала Google, обязательно посмотрите, у меня сносит крышу
https://youtu.be/UIZAiXYceBI?si=kVlJjRIbbXxdHUde

The capabilities of multimodal AI | Gemini Demo

Our natively multimodal AI model Gemini is capable of reasoning across text, images, audio, video and code. Here are favorite moments with Gemini Learn more and try the model: https://deepmind.google/gemini

Explore Gemini: https://goo.gle/how-its-made…

1.19K viewsedited 11:01

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

Marigold: Repurposing Diffusion-Based Image Generators for Monocular Depth Estimation

Новый инструмент точной оценки глубины на основе SD. Круче чем все что я видел

Код
Демо
Колаб

#image2depth

🔥12

1.39K viewsedited 06:39

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

PatchFusion: An End-to-End Tile-Based Framework for High-Resolution Monocular Metric Depth Estimation

И его конкурент. Берет грубое предсказание глубины, например от ZoeDepth. Бьет картинку на патчи и поверх грубого делает более точную оценку.

Есть желающие экспериментально выяснить кто лучший из этих двух?

Код
Демо

#image2depth

🔥5

1.22K viewsedited 06:52

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

pose.rip

Пляшем. Magic Animate для всех.
Тут можно сделать и DensePose и анимацию.

Накидывайте результаты в комменты

#tools #image2video #video2motion #video2pose

❤1👍1

1.33K views07:06

Нейронавт | Нейросети в творчестве

Поздравляю всех причастных к VFX индустрии! Сегодня наш официальный праздник!

Организаторы запланировали бесчисленное количество лекций и стримов, подробности: worldvfxday.com

👍4

1.08K views07:15

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

А праздник-то настоящий.
Пришел триал-доступ к Cuebrick
Проверьте свою почту

1.09K views07:27

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

Aura

Deepgram, известный своим транскрибатором Nova2, представил голосовой движок реального времени Aura. Задержка всего 200мс.

В комплекте API для голосовых агентов искусственного интеллекта. Много языков, в том числе русский

Записаться в вейтлист

#text2speech

👍1🔥1

1.14K views07:39

Нейронавт | Нейросети в творчестве

Forwarded from AI для Всех (Artemii)

S-LoRA: матрица намного ближе, чем кажется

S-LoRA превращает любую большую языковую модель в "Матрицу", где каждый Агент Смит может быть адаптирован в уникального персонажа, создавая целый мир на одной платформе.

Представьте, если бы Агент Смит из "Матрицы" мог превращаться в любого уникального персонажа по вашему желанию. Вот рецепт:

1. Базовая модель - Агент Смит: LLaMA, наша базовая модель, аналогична Агенту Смиту - мощной и адаптируемой форме ИИ, готовой к изменениям.

2. LoRA-адаптеры - Настройки персонажей: Каждый LoRA-адаптер добавляет свои уникальные характеристики к базовой модели, превращая стандартного Агента Смита в множество разнообразных персонажей.

3. S-LoRA - Матрица: S-LoRA действует как "Матрица", в рамках которой все эти преобразования происходят. Она позволяет масштабировать и управлять множеством адаптированных персонажей, поддерживая сложную сеть взаимодействующих и эволюционирующих форм.

S-LoRA открывает новые горизонты в использовании LLMs, позволяя нам не только создавать уникальные характеристики базовой модели, но и управлять ими в масштабах, сравнимых с "Матрицей".

🤩 Статья
🐙 Код

😱4👍1

1.02K views09:21

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

Можно попробовать DemoFusion в колабе

Колаб

#upscale #text2image

👍2

1.24K views10:43

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

VMC: Video Motion Customization using Temporal Attention Adaption for Text-to-Video Diffusion Models

Генерация видео с движением, заданным образцом из другого видео

Код

#video2video #motion2video #text2video

👍1

1.21K views10:50

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

DynamiCrafter: Animating Open-domainImages with Video Diffusion Priors

Анимация изображений по текстовому описанию, интерополяция кадров на видео, закольцовывание видео

Код
Демо

#image2video #video2video #frameinterpolation

👍1

1.23K views10:59

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

HumanGaussian: Text-Driven 3D Human Generation with Gaussian Splatting

Генерация 3D-человеков гауссианами по текстовому описанию. А заодно еще и анимация. По сравнениям лучше чем DreamGaussian

Код

#textto3D #text2gaussian #humanavatar #humananimation

🔥3

1.21K views11:11

Нейронавт | Нейросети в творчестве

Нейронавт | Нейросети в творчестве

А праздник-то настоящий. Пришел триал-доступ к Cuebrick Проверьте свою почту

Еще пришла месячная триалка на Unity Muse.
Только она требует для бесплатной триалки заграничную кредитку или рабочий PayPal. Палка у меня есть пустая, не прокатило.

Если вдруг кто хочет помочь своей палкой или кредиткой ради теста, пишите в лс

👍1

1.18K views11:20