Sparse VideoGen: Accelerating Video Generation with Spatial-Temporal Sparse Attention by 2x with High Fidelity
Ускорение генерации видео вдвое без видимой потери качества.
Прикручено к Hunyuan и CogVideoX v1.5. В будущем обещают Wan, и Cosmos
Код
#optimiozation #text2video
Ускорение генерации видео вдвое без видимой потери качества.
Прикручено к Hunyuan и CogVideoX v1.5. В будущем обещают Wan, и Cosmos
Код
#optimiozation #text2video
🔥9👍3
This media is not supported in your browser
VIEW IN TELEGRAM
PC-Agent: A Hierarchical Multi-Agent Collaboration Framework for Complex Task Automation on PC
Мультиагентная платформа для автоматизации задач на десктопе от авторов Mobile-Agent (Alibaba)
Код
#agent
Мультиагентная платформа для автоматизации задач на десктопе от авторов Mobile-Agent (Alibaba)
Код
#agent
🔥6
This media is not supported in your browser
VIEW IN TELEGRAM
Sesame CSM 1B
На прошлой неделе Sesame AI Labs показали интерактивную демку крышесносной голосовой модели, вам еще предлагали практиковать на ней английский.
Сейчас уже доступны веса и код
Модель генерирует RVQ аудио коды по входному тексту и аудио. Плюс, под капотом помогает Llama с декодером
Возможен файнтюн на разные голоса
На русский из коробки не стоит рассчитывать. В датасете был в основном английский.
Код
Веса
#voicemode #text2speech #csm
На прошлой неделе Sesame AI Labs показали интерактивную демку крышесносной голосовой модели, вам еще предлагали практиковать на ней английский.
Сейчас уже доступны веса и код
Модель генерирует RVQ аудио коды по входному тексту и аудио. Плюс, под капотом помогает Llama с декодером
Возможен файнтюн на разные голоса
На русский из коробки не стоит рассчитывать. В датасете был в основном английский.
Код
Веса
#voicemode #text2speech #csm
❤10🔥1
Lara
Новый переводчик
Все пишут что убийца DeepL, но я думаю что это просто маркетинг такой
На бесплатном тарифе:
- Перевод текста без форматирования: до 5000 символов в день.
- Перевод речи с микрофона, до 2 минут за сеанс
- Перевод документов: до 4 страниц в день (без ограничений по количеству документов размером до 200 МБ каждый).
- Режим инкогнито: текст удаляется сразу после перевода.
- Использование API: до 10 000 символов в месяц.
Есть три режима: точный, литературный и творческий;
Для качественного перевода можно добавить к фразе контекст
#translation #text2text
Новый переводчик
Все пишут что убийца DeepL, но я думаю что это просто маркетинг такой
На бесплатном тарифе:
- Перевод текста без форматирования: до 5000 символов в день.
- Перевод речи с микрофона, до 2 минут за сеанс
- Перевод документов: до 4 страниц в день (без ограничений по количеству документов размером до 200 МБ каждый).
- Режим инкогнито: текст удаляется сразу после перевода.
- Использование API: до 10 000 символов в месяц.
Есть три режима: точный, литературный и творческий;
Для качественного перевода можно добавить к фразе контекст
#translation #text2text
🥴4👍1👎1
Perplexity Windows / Perplexity Comet
Тут в коментах выяснилось что я дед, который и переводит браузером и ищет инфу в браузере.
Специально для меня Perplexity выпустили десктопное приложения для Windows (мобильные аппки уже давно есть) и анонсировали свой браузер Comet, записаться в вейтлист можно тут
Авось мягко перееду на современные технологии
#search #news #assistant
Тут в коментах выяснилось что я дед, который и переводит браузером и ищет инфу в браузере.
Специально для меня Perplexity выпустили десктопное приложения для Windows (мобильные аппки уже давно есть) и анонсировали свой браузер Comet, записаться в вейтлист можно тут
Авось мягко перееду на современные технологии
#search #news #assistant
🔥13👍2
LBM: Latent Bridge Matching for Fast Image-to-Image Translation
Универсальный метод преобразования изображений
Примеры применения: удаление объекта, генерация карт нормалей и глубины, релайтинг, реставрация/улучшение
Код
Демо (релайтинг)
#image2image #imageediting #inpainting #objectremoval #relighting #image2depth #image2normal #enhance #imagerestoration
Универсальный метод преобразования изображений
Примеры применения: удаление объекта, генерация карт нормалей и глубины, релайтинг, реставрация/улучшение
Код
Демо (релайтинг)
#image2image #imageediting #inpainting #objectremoval #relighting #image2depth #image2normal #enhance #imagerestoration
❤5👍1🔥1
Sparse Voxels Rasterization: Real-time High-fidelity Radiance Field Rendering
Очередная работа Nvidia в направлении реконструкции/рендера/растеризации объемных сцен.
Выглядит как, ответ Radiant Foam
SVRaster стремится объединить скорость рендеринга гауссиан с преимуществами воксельных сеток без нейросетей и гауссиан (я правильно прочитал?)
Принцип как в nerf и 3DGS - на вход подаем ограниченный набор ракурсов сцены, на выходе вид с любого ракурса.
Код
#gaussian #rendering #novelview #image2scene #video2scene #realtime
Очередная работа Nvidia в направлении реконструкции/рендера/растеризации объемных сцен.
Выглядит как, ответ Radiant Foam
SVRaster стремится объединить скорость рендеринга гауссиан с преимуществами воксельных сеток без нейросетей и гауссиан (я правильно прочитал?)
Принцип как в nerf и 3DGS - на вход подаем ограниченный набор ракурсов сцены, на выходе вид с любого ракурса.
Код
#gaussian #rendering #novelview #image2scene #video2scene #realtime
🔥10
Image-01
Генератор изображений от Hailuo
Ежедневно насыпают 100 кредитов бесплатно, 1 картинка стоит 1 кредит
Попробовать - выбираем вкладку Create Image
#text2image
Генератор изображений от Hailuo
Ежедневно насыпают 100 кредитов бесплатно, 1 картинка стоит 1 кредит
Попробовать - выбираем вкладку Create Image
#text2image
1👍7
KV-Edit: Training-Free Image Editing for Precise Background Preservation
Редактирование изображений по маске и промпту, с упором на сохранение фона неизменным.
Код
Демо
ComfyUI
#imageediting #inpainting
Редактирование изображений по маске и промпту, с упором на сохранение фона неизменным.
Код
Демо
ComfyUI
#imageediting #inpainting
👍9❤1💩1
😁11💩5❤1