NEW BOT Телеграм, страница

ScaleCrafter: Tuning-free Higher-Resolution Visual Generationwith Diffusion Models

А вот этот генератор видео и картинок на основе #StableDiffusion поинтереснее. Акцент на высоком разрешении и произвольном соотношении сторон без дообучения и оптимизаций. Результаты крутые

Код

#text2image #text2video

🔥5👍3

981 views10:41

Нейронавт | Нейросети в творчестве

DA-CLIP: Controlling Vision-Language Models for Universal Image Restoration

Восстановление изображений. DA-CLIP с высокой точностью предсказывает эмбеддинги повреждений и выдает высококачественные детали для восстановления.

Код
Демо

#image2image #imagerestoration #deblur #denoise #restoration

🤔3

1.01K views10:55

Нейронавт | Нейросети в творчестве

0:07

This media is not supported in your browser

VIEW IN TELEGRAM

0:09

This media is not supported in your browser

VIEW IN TELEGRAM

4K4D: Real-Time 4D View Synthesis at 4K Resolution

Рилтаймовый рендеринг динамических 3D сцен в высоком разрешении.
400 FPS на датасете DNA-Rendering 1080p. 80 FPS на датасете ENeRF-Outdoor 4K. Замеряли на RTX 4090 GPU

Бонусом - алгоритм изучения сцены по глубине на основе RGB - видео

Код

#rendering

1.13K views11:47

Нейронавт | Нейросети в творчестве

Latent Consistency Models: Synthesizing High-Resolution Images with Few-step Inference

Помните диффузную генерацию картинок за один шаг?
Появилось новое решение для сокращения шагов. Любую модель SD дистиллируют за 4000 шагов, на выходе модель которая дает хороший результат 768*768 за 4 шага. За 1 шаг выдает картинку примерно голого SD v1.5

Код
Модель
Демо
Колаб

#text2image

🔥9👍1

1.16K views06:37

Нейронавт | Нейросети в творчестве

FreeU : Free Lunch in Diffusion U-Net

Ну и раз открыл тему про ускорение инференса, пора упомянуть этот активно развивающийся проект. Улучшение и ускорение генерации изображений и видео без дообучения и лишних телодвижений.

Код
Демо

#text2image #text2video #optimization

👍4❤2

1.03K views07:10

Нейронавт | Нейросети в творчестве

Forwarded from Neurogen / Прикладной ИИ и нейросети

Там Nvidia выпустили расширение и новый драйвер под Stable Diffusion, позволяющие получить до x2 прироста в генерациях за счёт использования тензорных ядер в видеокартах серий RTX.

Скачать само расширение можно тут: Github

По требованиям:
- Видеокарта RTX (RTX 20xx, 30xx, 40xx) на 8 Gb видеопамяти
- Установленный драйвер 537.58 и старше
- от 16 гигабайт RAM

Подробнее об установке и настройке можно прочесть в официальном гайде от Nvidia

❤4

901 views12:05

Нейронавт | Нейросети в творчестве

Кто-то собрал неофициальную имплементацию RealFill

Код (неофициальный)

#image2image #inpainting #outpainting

Нейронавт | Нейросети в творчестве

RealFillReference-Driven Generation for Authentic Image Completion

Прикольная штука. Дополняет изображение по референсам. Например, из нескольких фото одно было бы самым удачным если б не неудачное кадрирование. RealFill посмотрит остальные фотки и дорисует…

1.19K views15:40

Нейронавт | Нейросети в творчестве

0:02

This media is not supported in your browser

VIEW IN TELEGRAM

0:04

This media is not supported in your browser

VIEW IN TELEGRAM

3D-GPT: 3D MODELING WITH LARGE LANGUAGE MODELS

Генератор 3D сцен, использующий LLM для детального описания объектов.
3D-GPT состоит из агентов: агент отправки задач, агент концептуализации и модельный агент.
Он превращает ваш начальный промт в детальное описание. И легко интегрируется с 3D-софтом.

Кода пока нет

#text2scene #textto3D

1.26K views09:08

Нейронавт | Нейросети в творчестве

3:15

This media is not supported in your browser

VIEW IN TELEGRAM

Loop Copilot: Conducting AI Ensembles for Music Generation and Iterative Editing

Система генерации и изменения музыки через указания на естественном языке.
За понимание указаний, разумеется, отвечает языковая модель. Ну а для собственно музыки под капотом присутствуют генератор MusicGen, экстрактор стемов (отдельных источников звука) Demucs, генератор VampNet и описатель LP-MusCaps

Тренд интеграции разных нейросеток в один инструмент продолжает усиливаться.

Кода пока нет

#LLM #text2music #music2music #audio2audio

1.07K viewsedited 15:31

Нейронавт | Нейросети в творчестве

0:13

This media is not supported in your browser

VIEW IN TELEGRAM

MIDIjourney: Your GPS for Groove and Pitch

И еще один композитор. На этот раз генератор MIDI по тексту в виде плагина для Ableton Live v10 и v11. Умеет сочинять как небольшие фразы, так и сложные композиции. Есть тут пользователи Ableton? Ждем ваши отзывы

Гитхаб

#text2music #text2midi #midi

1.21K views15:49

Нейронавт | Нейросети в творчестве

0:33

This media is not supported in your browser

VIEW IN TELEGRAM

HyperWrite

ИИ-ассистент с доступом в интернет. Умеет суммировать видео в YouTube, писать посты, письма и еще что-то. Бесплатный тариф какой-то грустный

Попробовать (сразу включайте VPN)

#LLM #assistant

1.11K views15:30

About

Blog

Apps

Platform