This media is not supported in your browser
VIEW IN TELEGRAM
Open Ai представили конструктор агентов Agent Builder
Стрим кажется еще идет
https://www.youtube.com/live/hS1YqcewH0c
#news #agent
Стрим кажется еще идет
https://www.youtube.com/live/hS1YqcewH0c
#news #agent
👍4
lightx2v Qwen-Image-Edit-2509-Lightning
Четырехшаговая и восьмишаговая ускорялка #QIE
Спасибо @john_eod
#lora #optimization #imageediting
Четырехшаговая и восьмишаговая ускорялка #QIE
Спасибо @john_eod
#lora #optimization #imageediting
huggingface.co
lightx2v/Qwen-Image-Lightning at main
We’re on a journey to advance and democratize artificial intelligence through open source and open science.
👍7❤1
ComfyUI 0.3.63
Субграфы теперь можно публиковать - сохранять в бибилиотеку нод
Selection Toolbox был переработан: добавлены новые иконки для упрощения идентификации и расширяемое меню, которое открывает возможности для добавления новых функций в будущем. В дальнейшем может появиться возможность кастомизации функционала Selection Toolbox
#comfyUI
Субграфы теперь можно публиковать - сохранять в бибилиотеку нод
Selection Toolbox был переработан: добавлены новые иконки для упрощения идентификации и расширяемое меню, которое открывает возможности для добавления новых функций в будущем. В дальнейшем может появиться возможность кастомизации функционала Selection Toolbox
#comfyUI
🔥20👍2
Hunyuan-Vision-1.5-Thinking
Самая мощная визуально-языковая модель от Hunyuan-Tencent
Делит 3 место на LMarena с gemini-2.5-flash-preview и Claude-Opus-4
Гитхаб
API
Веса обещают опубликовать
Чат на LMarena
#vlm
Самая мощная визуально-языковая модель от Hunyuan-Tencent
Делит 3 место на LMarena с gemini-2.5-flash-preview и Claude-Opus-4
Гитхаб
API
Веса обещают опубликовать
Чат на LMarena
#vlm
👍7❤1
Qwen-Image-Edit-Rapid-AIO
Мердж ускорителей, VAE и CLIP #QIE для быстрого редактирования изображений. Если использовать без входных изображений, будет просто создавать изображения по тексту.
Три версии по 29 ГБ каждая
V1: Qwen-Image-Edit-2509 и 4-step Lightning v2.0. Присыпано небольшим количеством лор NSFW. Универсальный вариант для SFW и NSFW. рекомендуется использовать sa_solver/beta, но euler_a/beta и er_sde/beta тоже могут дать достойные результаты.
V2: Используется набор ускорителей Qwen-Image-Edit, объединяющий 8- и 4- шаговые в одном. Значительно изменены настройки NSFW LoRa для более эффективного использования в SFW и NSFW. Настоятельно рекомендуется использовать sa_solver/simple.
V3: Используются новые лоры Qwen-Image-Edit lightning. Значительно скорректирован микс NSFW лор, удалены плохие и добавлены лучшие. Настоятельно рекомендуется sa_solver/beta
воркфлоу там же в репозитории
#optimization #imageediting #workflow
Мердж ускорителей, VAE и CLIP #QIE для быстрого редактирования изображений. Если использовать без входных изображений, будет просто создавать изображения по тексту.
Три версии по 29 ГБ каждая
V1: Qwen-Image-Edit-2509 и 4-step Lightning v2.0. Присыпано небольшим количеством лор NSFW. Универсальный вариант для SFW и NSFW. рекомендуется использовать sa_solver/beta, но euler_a/beta и er_sde/beta тоже могут дать достойные результаты.
V2: Используется набор ускорителей Qwen-Image-Edit, объединяющий 8- и 4- шаговые в одном. Значительно изменены настройки NSFW LoRa для более эффективного использования в SFW и NSFW. Настоятельно рекомендуется использовать sa_solver/simple.
V3: Используются новые лоры Qwen-Image-Edit lightning. Значительно скорректирован микс NSFW лор, удалены плохие и добавлены лучшие. Настоятельно рекомендуется sa_solver/beta
воркфлоу там же в репозитории
#optimization #imageediting #workflow
👍8🔥5
Media is too big
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Kaleido
Модель от Meta AI (запрещено в РФ) создает фотореалистичные изображения и видео любых сцен и объектов с любого ракурса. Созданные ракурсы могут быть использованы для реконструкции 3D сцен (авторы используют NeuS2)
На вход можно подать одно изображение, несколько изображений.
Умеет интерпретировать коллажи
Кода нет
#research #novelview #imageto3d #image2scene
Модель от Meta AI (запрещено в РФ) создает фотореалистичные изображения и видео любых сцен и объектов с любого ракурса. Созданные ракурсы могут быть использованы для реконструкции 3D сцен (авторы используют NeuS2)
На вход можно подать одно изображение, несколько изображений.
Умеет интерпретировать коллажи
Кода нет
#research #novelview #imageto3d #image2scene
👍4
This media is not supported in your browser
VIEW IN TELEGRAM
VChain : Chain-of-Visual-Thought for Reasoning in Video Generation
Фреймворк для улучшения генерации видео.
Использует мультимодальные модели (например, GPT-4o) для создания ключевых кадров, которые помогают видеогенератору. Модель настраивает видеогенератор только в ключевые моменты, что позволяет улучшить качество видео без долгого переобучения.
VChain работает в три этапа: сначала генерирует визуальные рассуждения, потом настраивает модель и в конце создаёт видео.
Хорошо справляется со сложными сценариями
В качестве базоваой модели использовали предварительно обученный Wan2.1-T2V-1.3B
Код ждем
Фреймворк для улучшения генерации видео.
Использует мультимодальные модели (например, GPT-4o) для создания ключевых кадров, которые помогают видеогенератору. Модель настраивает видеогенератор только в ключевые моменты, что позволяет улучшить качество видео без долгого переобучения.
VChain работает в три этапа: сначала генерирует визуальные рассуждения, потом настраивает модель и в конце создаёт видео.
Хорошо справляется со сложными сценариями
В качестве базоваой модели использовали предварительно обученный Wan2.1-T2V-1.3B
Код ждем
👍8👀2
This media is not supported in your browser
VIEW IN TELEGRAM
Paper2Video: Automatic Video Generation from Scientific Papers
Генерация презентационных видео из научных статей
Создает слайды, видео презентатора оживлятором портретов по речи, субтитры — и упаковывает все это в видео.
В качестве примера автор создал видео своей статьи
Код
#paper2videio #text2video
Генерация презентационных видео из научных статей
Создает слайды, видео презентатора оживлятором портретов по речи, субтитры — и упаковывает все это в видео.
В качестве примера автор создал видео своей статьи
Код
#paper2videio #text2video
❤7
Windows-HunyuanWorld-Voyager
Порт HunyuanWorld-Voyager полностью оптимизированный под Windows
#world #text2world #imageto3d #text2video #text2scene #windows
Порт HunyuanWorld-Voyager полностью оптимизированный под Windows
#world #text2world #imageto3d #text2video #text2scene #windows
👍6