Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.43K photos
3.7K videos
41 files
4.74K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
3D Gaussian Splatting for Real-Time Radiance Field Rendering

3DGS - очередной прорыв в качестве и скорости рендеринга #nerf сцен. Авторы утверждают что их разработка превосходит все известные методы. Рендеринг 1080p со скоростью 100 кадров в секунду на A6000. А также быстрое обучение, менее чем за час.

Достигается это оптимизацией сцены при помощи 3D-гауссиан. При этом удается также избежать рендера пустого пространства. Все это чем-то напоминает мне оптимизации изобретенные когда-то в Doom, давшие в свое время мощный толчок 3D графике.

Код
Видео

#rendering #gaussian #3dgs
👍4
This media is not supported in your browser
VIEW IN TELEGRAM
TEMPEH: Instant Multi-View Head Capture through Learnable Registration

Реконструкция головы в 3D за долю секунды. На вход нужно видео с нескольких камер. Выходной меш согласован во времени. TEMPEH может предсказывать выражения лица и положения головы, которых не было в исходном материале.

Код

#videoto3D #image2head #video2head #humanavatar #head
Forwarded from Stable Diffusion | Text2img
This media is not supported in your browser
VIEW IN TELEGRAM
На данный момент в Лос-Анджелесе проходит 50-я ежегодная конференция по компьютерной графике и применению интерактивных технологий - SIGGRAPH.

В одном из докладов SIGGRAPH основатель и генеральный директор NVIDIA Дженсен Хуанг объявил о новой функции Picasso для создания фотореалистичных карт среды 360 HDRi для освещения 3D-сцен с помощью простых текстовых или графических подсказок.

В демонстрации исследователи NVIDIA экспериментируют со сценой в гостиной, как это может сделать дизайнер интерьеров с помощью ИИ в любом приложении для 3D-рендеринга. В этом случае исследователи используют NVIDIA Omniverse USD Composer — эталонное приложение для сборки и композиции сцен с использованием универсального описания сцены, известного как OpenUSD , — чтобы добавить стену с кирпичной текстурой, создать и изменить выбор ткани для дивана и декоративных подушек, а также чтобы включить абстрактный рисунок животного в определенную область стены.

Наш чат👌: @text2image
🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
Shutterstock запустил новый инструмент генерации 8K 360 HDRi панорам по тексту на базе Picasso от NVIDIA

Autodesk интегрирует Picasso в Maya

твиттер

#text2image #text2panorama #HDRI #rendering
3👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Heygen

Известен уже не первый день анимацией говорящих голов Гарри Поттера из Midjourney. Но наделал шума на днях с этим видео. И слева и справа - генерация видео по тексту. Для обучения на каждого персонажа требуется всего пара минут материала.

Записаться в вейтлист

#text2video #humananimation #TTS #humanavatar #talkinghead
🔥6
This media is not supported in your browser
VIEW IN TELEGRAM
AudioCraft

Meta представила пакет нейросетей для генерации звука

- MusicGen: Создание музыки из текста
- AudioGen: Создание реалистичных звуков из текста, таких как лай собаки или гудок автомобиля
- EnCodec: Последнее обновление обеспечивает высококачественную генерацию музыки с минимальным количеством артефактов

Код
Демо

#text2music #text2audio
3
This media is not supported in your browser
VIEW IN TELEGRAM
И еще отличная новость.
AudioCraft, AudioLDM 2 и некоторые другие нейросетки можно установить локольно к себе на компьютер в один клик через специальный браузер Pinokio.

Устанавливаете браузер, нажимаете кнопку Discover и выбираете из доступных нейросетей.

❗️Имейте ввиду, что при установке нейросетей браузер скачает увесистые файлы, для AudioLDM 2 это 8+ Гб

Скачать Pinokio

Статья от автора устновщика на английском с инструкцией и примерами

#text2music #text2audio #tools
👍2🤔2
🎉 Сегодня праздник у ребят.
Сегоооодня будут танцы с бубном

Вышел #ControlNet для SDXL. Пока только Canny

Гитхаб
Опиcание и веса на huggingface
Сетап для ComfyUI Описан здесь

#image2image #text2image
👍8
Вторая жизнь сберовского GigaChat'а, с блэкджеком и картинками

Чтобы начать пользоваться, нужно перейти по ссылке и получить инвайт (предварительно надо зарегистрироваться на платформе)

#chatbot #llm #text2image #multimodal
🔥1
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
Если кто-то хочет погенерить в SDXL 1.0, причем (о, боги) на NVidia A100 40(!)GB, то вот вам аттракцион невиданной щедрости от китайцев.
Они подняли Automatic1111 на сервере и бахнули ссылку в общий доступ.
Позавчера у меня 1024х1024 считалось примерно три секунды(!).
Сегодня уже приподвзлегло, но все равно пыхтит и считает.
http://openxlab.org.cn/apps/detail/camenduru/stable-diffusion-webui
👍10
This media is not supported in your browser
VIEW IN TELEGRAM
SSIF: Single-shot Implicit Morphable Faces with Consistent Texture Parameterization

NVIDIA лютует на SIGGRAPH 2023. Удобная для анимации модель, способная реконструировать 3D-лицо по одному изображению.

Наши неявно изменяемые модели лиц можно использовать для рендеринга аватара в новых ракурсах, анимации выражений лица путем изменения кодов выражений и редактирования текстур путем непосредственного рисования на изученных картах UV-текстур.

Кода нет

#imageto3D #image2face #talkinghead #humananimation #image2head #humanavatar
🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
PlayHT2.0

Новая модель генерации речи, в закрытом бета-тестировании.

• Может генерировать речь менее чем за 800 мс и мгновенно клонировать голоса с разными акцентами.
• PlayHT2.0 понимает эмоции и стили разговора и применяет их к любому голосу в режиме реального времени.
• Модель доступна через студию и API в альфа-версии, ожидаются крупные обновления

Студия
API

#voicecloning #tts #text2speech

Бесплатно доступно 2500 слов
👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Обновленный RunwayML поддерживает генерацию видео продолжительностью 18 секунд

reddit
🔥7
Что если бы Stable Diffusion был так же прост в использовании как MidJourney, но при этом оставался бесплатным и его можно было локально запустить на 4Gb VRAM?

Fooocus - ответ на этот вопрос от автора ControlNet.
Легкая установка. Модель SDXL скачается при первом запуске. Благодаря куче оптимизаций, никаких плясок с настройками, только промты и картинки.

Скачать установщик
Гитхаб

#image2image #text2image #tools
👍11
SDXL-controlnet: OpenPose (v2)

А вот и OpenPose подвезли.
Ждем мануалов от первопроходцев
4