ScaleCrafter: Tuning-free Higher-Resolution Visual Generationwith Diffusion Models
А вот этот генератор видео и картинок на основе #StableDiffusion поинтереснее. Акцент на высоком разрешении и произвольном соотношении сторон без дообучения и оптимизаций. Результаты крутые
Код
#text2image #text2video
А вот этот генератор видео и картинок на основе #StableDiffusion поинтереснее. Акцент на высоком разрешении и произвольном соотношении сторон без дообучения и оптимизаций. Результаты крутые
Код
#text2image #text2video
🔥5👍3
DA-CLIP: Controlling Vision-Language Models for Universal Image Restoration
Восстановление изображений. DA-CLIP с высокой точностью предсказывает эмбеддинги повреждений и выдает высококачественные детали для восстановления.
Код
Демо
#image2image #imagerestoration #deblur #denoise #restoration
Восстановление изображений. DA-CLIP с высокой точностью предсказывает эмбеддинги повреждений и выдает высококачественные детали для восстановления.
Код
Демо
#image2image #imagerestoration #deblur #denoise #restoration
🤔3
4K4D: Real-Time 4D View Synthesis at 4K Resolution
Рилтаймовый рендеринг динамических 3D сцен в высоком разрешении.
400 FPS на датасете DNA-Rendering 1080p. 80 FPS на датасете ENeRF-Outdoor 4K. Замеряли на RTX 4090 GPU
Бонусом - алгоритм изучения сцены по глубине на основе RGB - видео
Код
#rendering
Рилтаймовый рендеринг динамических 3D сцен в высоком разрешении.
400 FPS на датасете DNA-Rendering 1080p. 80 FPS на датасете ENeRF-Outdoor 4K. Замеряли на RTX 4090 GPU
Бонусом - алгоритм изучения сцены по глубине на основе RGB - видео
Код
#rendering
Latent Consistency Models: Synthesizing High-Resolution Images with Few-step Inference
Помните диффузную генерацию картинок за один шаг?
Появилось новое решение для сокращения шагов. Любую модель SD дистиллируют за 4000 шагов, на выходе модель которая дает хороший результат 768*768 за 4 шага. За 1 шаг выдает картинку примерно голого SD v1.5
Код
Модель
Демо
Колаб
#text2image
Помните диффузную генерацию картинок за один шаг?
Появилось новое решение для сокращения шагов. Любую модель SD дистиллируют за 4000 шагов, на выходе модель которая дает хороший результат 768*768 за 4 шага. За 1 шаг выдает картинку примерно голого SD v1.5
Код
Модель
Демо
Колаб
#text2image
🔥9👍1
FreeU : Free Lunch in Diffusion U-Net
Ну и раз открыл тему про ускорение инференса, пора упомянуть этот активно развивающийся проект. Улучшение и ускорение генерации изображений и видео без дообучения и лишних телодвижений.
Код
Демо
#text2image #text2video #optimization
Ну и раз открыл тему про ускорение инференса, пора упомянуть этот активно развивающийся проект. Улучшение и ускорение генерации изображений и видео без дообучения и лишних телодвижений.
Код
Демо
#text2image #text2video #optimization
👍4❤2
Forwarded from Neurogen / Прикладной ИИ и нейросети
Там Nvidia выпустили расширение и новый драйвер под Stable Diffusion, позволяющие получить до x2 прироста в генерациях за счёт использования тензорных ядер в видеокартах серий RTX.
Скачать само расширение можно тут: Github
По требованиям:
- Видеокарта RTX (RTX 20xx, 30xx, 40xx) на 8 Gb видеопамяти
- Установленный драйвер 537.58 и старше
- от 16 гигабайт RAM
Подробнее об установке и настройке можно прочесть в официальном гайде от Nvidia
Скачать само расширение можно тут: Github
По требованиям:
- Видеокарта RTX (RTX 20xx, 30xx, 40xx) на 8 Gb видеопамяти
- Установленный драйвер 537.58 и старше
- от 16 гигабайт RAM
Подробнее об установке и настройке можно прочесть в официальном гайде от Nvidia
❤4
Кто-то собрал неофициальную имплементацию RealFill
Код (неофициальный)
#image2image #inpainting #outpainting
Код (неофициальный)
#image2image #inpainting #outpainting
Telegram
Нейронавт | Нейросети в творчестве
RealFillReference-Driven Generation for Authentic Image Completion
Прикольная штука. Дополняет изображение по референсам. Например, из нескольких фото одно было бы самым удачным если б не неудачное кадрирование. RealFill посмотрит остальные фотки и дорисует…
Прикольная штука. Дополняет изображение по референсам. Например, из нескольких фото одно было бы самым удачным если б не неудачное кадрирование. RealFill посмотрит остальные фотки и дорисует…
3D-GPT: 3D MODELING WITH LARGE LANGUAGE MODELS
Генератор 3D сцен, использующий LLM для детального описания объектов.
3D-GPT состоит из агентов: агент отправки задач, агент концептуализации и модельный агент.
Он превращает ваш начальный промт в детальное описание. И легко интегрируется с 3D-софтом.
Кода пока нет
#text2scene #textto3D
Генератор 3D сцен, использующий LLM для детального описания объектов.
3D-GPT состоит из агентов: агент отправки задач, агент концептуализации и модельный агент.
Он превращает ваш начальный промт в детальное описание. И легко интегрируется с 3D-софтом.
Кода пока нет
#text2scene #textto3D
This media is not supported in your browser
VIEW IN TELEGRAM
Loop Copilot: Conducting AI Ensembles for Music Generation and Iterative Editing
Система генерации и изменения музыки через указания на естественном языке.
За понимание указаний, разумеется, отвечает языковая модель. Ну а для собственно музыки под капотом присутствуют генератор MusicGen, экстрактор стемов (отдельных источников звука) Demucs, генератор VampNet и описатель LP-MusCaps
Тренд интеграции разных нейросеток в один инструмент продолжает усиливаться.
Кода пока нет
#LLM #text2music #music2music #audio2audio
Система генерации и изменения музыки через указания на естественном языке.
За понимание указаний, разумеется, отвечает языковая модель. Ну а для собственно музыки под капотом присутствуют генератор MusicGen, экстрактор стемов (отдельных источников звука) Demucs, генератор VampNet и описатель LP-MusCaps
Тренд интеграции разных нейросеток в один инструмент продолжает усиливаться.
Кода пока нет
#LLM #text2music #music2music #audio2audio
This media is not supported in your browser
VIEW IN TELEGRAM
MIDIjourney: Your GPS for Groove and Pitch
И еще один композитор. На этот раз генератор MIDI по тексту в виде плагина для Ableton Live v10 и v11. Умеет сочинять как небольшие фразы, так и сложные композиции. Есть тут пользователи Ableton? Ждем ваши отзывы
Гитхаб
#text2music #text2midi #midi
И еще один композитор. На этот раз генератор MIDI по тексту в виде плагина для Ableton Live v10 и v11. Умеет сочинять как небольшие фразы, так и сложные композиции. Есть тут пользователи Ableton? Ждем ваши отзывы
Гитхаб
#text2music #text2midi #midi
HyperWrite
ИИ-ассистент с доступом в интернет. Умеет суммировать видео в YouTube, писать посты, письма и еще что-то. Бесплатный тариф какой-то грустный
Попробовать (сразу включайте VPN)
#LLM #assistant
ИИ-ассистент с доступом в интернет. Умеет суммировать видео в YouTube, писать посты, письма и еще что-то. Бесплатный тариф какой-то грустный
Попробовать (сразу включайте VPN)
#LLM #assistant