Воскресный опрос. Сколько у вас VRAM?
Anonymous Poll
11%
0-6 ГБ
17%
8-10 ГБ
20%
12 ГБ
23%
16 ГБ
0%
20ГБ
17%
24 ГБ
12%
Больше. Я олигарх
😭9😁8🤔1🌚1
This media is not supported in your browser
VIEW IN TELEGRAM
OmniInsert: Mask-Free Video Insertion of Any Reference via Diffusion Transformer Models
Вставляет что угодно на видео из одного или нескольких источников
генерация одного 5-секундного видео (121 кадр) в разрешении 480p занимает примерно 90 секунд при использовании 8 видеокарт NVIDIA A100
Код ждем
Спасибо @m_franz
#videoediting #video2video #videoinpainting
Вставляет что угодно на видео из одного или нескольких источников
генерация одного 5-секундного видео (121 кадр) в разрешении 480p занимает примерно 90 секунд при использовании 8 видеокарт NVIDIA A100
Код ждем
Спасибо @m_franz
#videoediting #video2video #videoinpainting
🔥8👍3😁1
Нейронавт | Нейросети в творчестве
Воскресный опрос. Сколько у вас VRAM?
Завышать бесполезно. Девушкам неважно сколько у парня VRAM
1😁31🍌4
This media is not supported in your browser
VIEW IN TELEGRAM
А что если настанет светлое будущее, мы все переедем в светлый VR. Как в Матрице только светлый. Но там также как и во сне для справления естественных нужд придется выходить в реал. Кто не вышел - тот обосрамился
#оффтоп #humor
#оффтоп #humor
😁20
Media is too big
VIEW IN TELEGRAM
Tunee
Сервис для создания музыки в режиме диалога
- создает песни на основе настроения пользователя
- имитируеи стиль заданной музыкальной композиции с вокалом
- переделывает песни в новые версии, сохраняя суть
- ищет актуальные музыкальные тренды в режиме реального времени
- есть заготовки скриптов для разных сценариев создания музыки
- прицепом создает видеоклипы
На старте выдали 450 кредитов - еще недавно давали по 1000 - не тормозим
#text2music #music2music #musicediting
Сервис для создания музыки в режиме диалога
- создает песни на основе настроения пользователя
- имитируеи стиль заданной музыкальной композиции с вокалом
- переделывает песни в новые версии, сохраняя суть
- ищет актуальные музыкальные тренды в режиме реального времени
- есть заготовки скриптов для разных сценариев создания музыки
- прицепом создает видеоклипы
На старте выдали 450 кредитов - еще недавно давали по 1000 - не тормозим
#text2music #music2music #musicediting
👍3
Media is too big
VIEW IN TELEGRAM
Lyra: Generative 3D Scene Reconstruction via Video Diffusion Model Self-Distillation
Модель от NVIDIA для генерации 3D и 4D сцен на гауссианах из текста, одного изображения или видео с использованием видеодиффузионной модели
Для начального изображения из текста используют Flux. А также под капотом NVIDIA Cosmos и GEN3C
Вот и представьте себе сколько ресурсов оно жрет
Код
#image2scene #videoto4d #videoto3d #gaussian #4d #video2scene
Модель от NVIDIA для генерации 3D и 4D сцен на гауссианах из текста, одного изображения или видео с использованием видеодиффузионной модели
Для начального изображения из текста используют Flux. А также под капотом NVIDIA Cosmos и GEN3C
Вот и представьте себе сколько ресурсов оно жрет
Код
#image2scene #videoto4d #videoto3d #gaussian #4d #video2scene
👍5🔥2
Media is too big
VIEW IN TELEGRAM
LongLive: Real-time Interactive Long Video Generation
Еще один проект NVIDIA
Генерация видео в реальном времени.
Позволяет генерировать видео с различными переходами: действиями, сменой окружения, введением объектов и персонажей, при этом переходы плавные, долго удерживает согласованность
В базе - Wan2.1-T2V-1.3B
На сайте куча 60-секундных примеров, несколько 240-секундных
Скорость генерации 20,7 FPS на одном H100 и 24,8 FPS при квантовании FP8 с незначительной потерей качества
Код
HF - модель с лорой весят 8.5 ГБ
#text2video #realtime
Еще один проект NVIDIA
Генерация видео в реальном времени.
Позволяет генерировать видео с различными переходами: действиями, сменой окружения, введением объектов и персонажей, при этом переходы плавные, долго удерживает согласованность
В базе - Wan2.1-T2V-1.3B
На сайте куча 60-секундных примеров, несколько 240-секундных
Скорость генерации 20,7 FPS на одном H100 и 24,8 FPS при квантовании FP8 с незначительной потерей качества
Код
HF - модель с лорой весят 8.5 ГБ
#text2video #realtime
👍7🔥3❤1
LetzAI
Платформа генерации и редактирования изображений/видео
добавлены видеомодели (VEO3 и Wan), сейчас только для избранных тестеров, а позже станут доступны всем
новый редактор изображений, который поддерживает до 9 референсных изображений и функцию «Guided Creation» (она заменила «Inpainting»)
эксклюзивный апскейлер с рулькой креативности, способный увеличивать разрешение изображений до 12 МП при фиксированной цене 20 кредитов (0,04 доллара) за любое разрешение
На старте выдали 500 кредитов.
Стоимость одного изображения составляет 5 кредитов, один апскейл - 20 кредитов, а одно редактирование - 30 кредитов.
Есть рефералка, за регу по моей ссылке обещают +240 кредитов. Но я не знаю какое базовое количество кредитов.
Поклянчить ранний доступ: contact@letz.ai
#imageediting #text2video #image2video #text2image #referencing #upscale #online
Платформа генерации и редактирования изображений/видео
добавлены видеомодели (VEO3 и Wan), сейчас только для избранных тестеров, а позже станут доступны всем
новый редактор изображений, который поддерживает до 9 референсных изображений и функцию «Guided Creation» (она заменила «Inpainting»)
эксклюзивный апскейлер с рулькой креативности, способный увеличивать разрешение изображений до 12 МП при фиксированной цене 20 кредитов (0,04 доллара) за любое разрешение
На старте выдали 500 кредитов.
Стоимость одного изображения составляет 5 кредитов, один апскейл - 20 кредитов, а одно редактирование - 30 кредитов.
Есть рефералка, за регу по моей ссылке обещают +240 кредитов. Но я не знаю какое базовое количество кредитов.
Поклянчить ранний доступ: contact@letz.ai
#imageediting #text2video #image2video #text2image #referencing #upscale #online
1👍4
This media is not supported in your browser
VIEW IN TELEGRAM
VolSplat: Rethinking Feed-Forward 3D Gaussian Splatting with Voxel-Aligned Prediction
Модель улучшает качество сцен на гауссианах, делая их более согласованными и точными. Она работает так:
— берёт несколько изображений объекта с разных ракурсов
— анализирует их, выделяя ключевые особенности
— создаёт 3D-модель, учитывая глубину и расположение объектов
— адаптирует уровень детализации в зависимости от сложности сцены
— позволяет генерировать новые виды объекта на основе созданной 3D-модели
Код ждем
Веса ждем
#gaussian
Модель улучшает качество сцен на гауссианах, делая их более согласованными и точными. Она работает так:
— берёт несколько изображений объекта с разных ракурсов
— анализирует их, выделяя ключевые особенности
— создаёт 3D-модель, учитывая глубину и расположение объектов
— адаптирует уровень детализации в зависимости от сложности сцены
— позволяет генерировать новые виды объекта на основе созданной 3D-модели
Код ждем
Веса ждем
#gaussian
🔥4❤1
Krea-CSG (Krea Foundation)
Вышла модификация FLUX.1 Krea весом всего 6.5 ГБ, жестко оптимизированная под Nvidia, GGUF
Дружественная к VRAM-беднякам
Настройки:
CFG 1 , Steps 30 - 45 , Eular , Sample / Beta
(res2 pref)
#gguf #text2image #optimization #workflow
Вышла модификация FLUX.1 Krea весом всего 6.5 ГБ, жестко оптимизированная под Nvidia, GGUF
Дружественная к VRAM-беднякам
Настройки:
CFG 1 , Steps 30 - 45 , Eular , Sample / Beta
(res2 pref)
#gguf #text2image #optimization #workflow
👍18
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
Sparse VideoGen2: Accelerate Video Generation with Sparse Attention via Semantic-Aware Permutation (SVG2)
Вторая версия ускорятора видеогенерации без дообучения
Использует технику семантически осознанной перестановки (Semantic-Aware Permutation) и эффективные динамические ядра внимания
Прикручено к Wan 2.1 14B, ускорение до x2
Возможно, совместим с lightx2
Код
#optimiozation #text2video
Вторая версия ускорятора видеогенерации без дообучения
Использует технику семантически осознанной перестановки (Semantic-Aware Permutation) и эффективные динамические ядра внимания
Прикручено к Wan 2.1 14B, ускорение до x2
Возможно, совместим с lightx2
Код
#optimiozation #text2video
🔥5