Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.43K photos
3.7K videos
41 files
4.74K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
ScaleCrafter: Tuning-free Higher-Resolution Visual Generationwith Diffusion Models

А вот этот генератор видео и картинок на основе #StableDiffusion поинтереснее. Акцент на высоком разрешении и произвольном соотношении сторон без дообучения и оптимизаций. Результаты крутые

Код

#text2image #text2video
🔥5👍3
DA-CLIP: Controlling Vision-Language Models for Universal Image Restoration

Восстановление изображений. DA-CLIP с высокой точностью предсказывает эмбеддинги повреждений и выдает высококачественные детали для восстановления.

Код
Демо

#image2image #imagerestoration #deblur #denoise #restoration
🤔3
4K4D: Real-Time 4D View Synthesis at 4K Resolution

Рилтаймовый рендеринг динамических 3D сцен в высоком разрешении.
400 FPS на датасете DNA-Rendering 1080p. 80 FPS на датасете ENeRF-Outdoor 4K. Замеряли на RTX 4090 GPU

Бонусом - алгоритм изучения сцены по глубине на основе RGB - видео

Код

#rendering
Latent Consistency Models: Synthesizing High-Resolution Images with Few-step Inference

Помните диффузную генерацию картинок за один шаг?
Появилось новое решение для сокращения шагов. Любую модель SD дистиллируют за 4000 шагов, на выходе модель которая дает хороший результат 768*768 за 4 шага. За 1 шаг выдает картинку примерно голого SD v1.5

Код
Модель
Демо
Колаб

#text2image
🔥9👍1
FreeU : Free Lunch in Diffusion U-Net

Ну и раз открыл тему про ускорение инференса, пора упомянуть этот активно развивающийся проект. Улучшение и ускорение генерации изображений и видео без дообучения и лишних телодвижений.

Код
Демо

#text2image #text2video #optimization
👍42
Там Nvidia выпустили расширение и новый драйвер под Stable Diffusion, позволяющие получить до x2 прироста в генерациях за счёт использования тензорных ядер в видеокартах серий RTX.

Скачать само расширение можно тут: Github

По требованиям:
- Видеокарта RTX (RTX 20xx, 30xx, 40xx) на 8 Gb видеопамяти
- Установленный драйвер 537.58 и старше
- от 16 гигабайт RAM

Подробнее об установке и настройке можно прочесть в официальном гайде от Nvidia
4
3D-GPT: 3D MODELING WITH LARGE LANGUAGE MODELS

Генератор 3D сцен, использующий LLM для детального описания объектов.
3D-GPT состоит из агентов: агент отправки задач, агент концептуализации и модельный агент.
Он превращает ваш начальный промт в детальное описание. И легко интегрируется с 3D-софтом.

Кода пока нет

#text2scene #textto3D
This media is not supported in your browser
VIEW IN TELEGRAM
Loop Copilot: Conducting AI Ensembles for Music Generation and Iterative Editing

Система генерации и изменения музыки через указания на естественном языке.
За понимание указаний, разумеется, отвечает языковая модель. Ну а для собственно музыки под капотом присутствуют генератор MusicGen, экстрактор стемов (отдельных источников звука) Demucs, генератор VampNet и описатель LP-MusCaps

Тренд интеграции разных нейросеток в один инструмент продолжает усиливаться.

Кода пока нет

#LLM #text2music #music2music #audio2audio
This media is not supported in your browser
VIEW IN TELEGRAM
MIDIjourney: Your GPS for Groove and Pitch

И еще один композитор. На этот раз генератор MIDI по тексту в виде плагина для Ableton Live v10 и v11. Умеет сочинять как небольшие фразы, так и сложные композиции. Есть тут пользователи Ableton? Ждем ваши отзывы

Гитхаб

#text2music #text2midi #midi
HyperWrite

ИИ-ассистент с доступом в интернет. Умеет суммировать видео в YouTube, писать посты, письма и еще что-то. Бесплатный тариф какой-то грустный

Попробовать (сразу включайте VPN)

#LLM #assistant