Qwen 3 Coder
Еще один релиз Qwen, на этот раз для программизма.
Кодит на уровне Sonnet 4 ю
Архитектура #MoE
480B параметров, 35В активных.
Контекст – 256к, скейлится до 1 миллиона токенов.
Бонусом выпустили инструмент командной строки для агентного кодинга Qwen Code - форк Gemini Code
Попробовать
#coding #agent
Еще один релиз Qwen, на этот раз для программизма.
Кодит на уровне Sonnet 4 ю
Архитектура #MoE
480B параметров, 35В активных.
Контекст – 256к, скейлится до 1 миллиона токенов.
Бонусом выпустили инструмент командной строки для агентного кодинга Qwen Code - форк Gemini Code
Попробовать
#coding #agent
🔥7👍3😱1
ObjectClear: Complete Object Removal via Object-Effect Attention
Удаляет объекты с изображения вместе с тенью и отражением.
В основе адаптированная для фотореалистичной ретуши модель SDXL-Inpainting, которая в оригинале не учитывала эффекты объекта такие как тени, отражения и т д.
Указать объект на удаление можно кистью или кликом (за это отвечает SAM)
Отражение Форреста в мокрой плитке удалил - молодец. Тень скамейки тоже чуть удалил и зарисовал не очень чисто - 4/5 учитывая что это с первой же попытки.
Код
Демо
#inpainting #objectremoval
Удаляет объекты с изображения вместе с тенью и отражением.
В основе адаптированная для фотореалистичной ретуши модель SDXL-Inpainting, которая в оригинале не учитывала эффекты объекта такие как тени, отражения и т д.
Указать объект на удаление можно кистью или кликом (за это отвечает SAM)
Отражение Форреста в мокрой плитке удалил - молодец. Тень скамейки тоже чуть удалил и зарисовал не очень чисто - 4/5 учитывая что это с первой же попытки.
Код
Демо
#inpainting #objectremoval
👍22❤1😁1
This media is not supported in your browser
VIEW IN TELEGRAM
Клонирование голоса в Mega TTS3.
Для контекста: некоторое время назад ByteDance выпустила MegaTTS 3 (с исключительными возможностями клонирования голоса), но по разным причинам решила не выпускать кодер WavVAE, необходимый для работы клонирования голоса.
Недавно, кодер WavVAE, совместимый с MegaTTS 3, был выпущен ACoderPassBy на китайской платформе ModelScope с весьма многообещающими результатами.
Некто mrfakename прикрутил этот кодер к байтдэнсовской TTS и оно довольно неплохо работает. В самой Mega TTS нет поддержки русского вроде как, но она работает с моделями от F5 TTS (не подтверждено). При этом если в демке скормить образец голоса на русском и озвучить английский текст, получается очень близкий голос с прикольным русским акцентом.
Демку можно потестить в спейсе на HF.
Спасибо @asleephidden
MegaTTS 3 - сайт проекта
Модель знает английский и китайский
Код
Оригинальный демоспейс - вроде есть клонирование голоса. Видимо подсуетились уже
#tts #text2speech #voicecloning
👍7❤3👎2
Minimax Voice Design завезли на fal.ai
Если есть кредиты, использовать здесь
#voicecloning #tts #text2speech #voicedesign #text2audio #text2music
Если есть кредиты, использовать здесь
#voicecloning #tts #text2speech #voicedesign #text2audio #text2music
👍2
Media is too big
VIEW IN TELEGRAM
SeC: Advancing Complex Video Object Segmentation via Progressive Concept Construction
Сегментатор объектов на видео. Под капотом визуально-языковая модель #vlm
На показанных примерах Точно узнает объект который исчез и снова появился, тогда как SAM 2 теряет его и ошибочно цепляется за другой.
Код
Веса ~15Гб
#segmentation #video2mask
Сегментатор объектов на видео. Под капотом визуально-языковая модель #vlm
На показанных примерах Точно узнает объект который исчез и снова появился, тогда как SAM 2 теряет его и ошибочно цепляется за другой.
Код
Веса ~15Гб
#segmentation #video2mask
👍13😱1
ObjectClear ComfyUI от подписчика!
Заходим в директорию
Открываем PowerShell и клонируем туда оригинальный репозиторий:
После успешного клонирования там появится папка
Закидываем в нее файлы
В воркфлоу ноду
Проверял - работает
Благодарим @GorillaFrame
#workflow #ComfyUI #inpainting #objectremoval #imageediting
Заходим в директорию
ComfyUI\custom_nodesОткрываем PowerShell и клонируем туда оригинальный репозиторий:
git clone https://github.com/zjx0101/ObjectClear.gitПосле успешного клонирования там появится папка
ObjectClearЗакидываем в нее файлы
__init__.py и object_clear_nodes.pyВ воркфлоу ноду
TranslateNodeBeta можно заменить на стандартную PromptПроверял - работает
Благодарим @GorillaFrame
#workflow #ComfyUI #inpainting #objectremoval #imageediting
👍12❤1
This media is not supported in your browser
VIEW IN TELEGRAM
TokensGen: Harnessing Condensed Tokens for Long Video Generation
Метод создания длинных видео, который использует "сжатые токены" для улучшения качества и согласованности видео. Короткие фрагменты плавно соединяются в одно длинное и логичное видео без потери качества и с сохранением общей темы.
Умеет "редактировать" видео. Правда, это выглядит не как отредактированное, а как что-то похожее на испорченное исходное видео
Код ждем
#text2video #video2video #videoediting
Метод создания длинных видео, который использует "сжатые токены" для улучшения качества и согласованности видео. Короткие фрагменты плавно соединяются в одно длинное и логичное видео без потери качества и с сохранением общей темы.
Умеет "редактировать" видео. Правда, это выглядит не как отредактированное, а как что-то похожее на испорченное исходное видео
Код ждем
#text2video #video2video #videoediting
👍5
Higgsfield Steal
Steal позволяет пользователям воссоздавать любое изображение из интернета с помощью ИИ. Пользователь просто выбирает понравившуюся картинку, а система мгновенно переносит ее эстетику (одежду, позу, освещение и атмосферу) на другое изображение.
Работает это все через браузерное расширение
Нейминг ироничный, нравится. Помните волну протестов на артстейшн с перечеркнутым "AI"? Типа пофиг, называйте воровством если хотите.
Спасибо @asleephidden
#referencing #image2video #image2image
Steal позволяет пользователям воссоздавать любое изображение из интернета с помощью ИИ. Пользователь просто выбирает понравившуюся картинку, а система мгновенно переносит ее эстетику (одежду, позу, освещение и атмосферу) на другое изображение.
Работает это все через браузерное расширение
Нейминг ироничный, нравится. Помните волну протестов на артстейшн с перечеркнутым "AI"? Типа пофиг, называйте воровством если хотите.
Спасибо @asleephidden
#referencing #image2video #image2image
👍17👎5❤1
Hedra Live Avatars
Аватары в реальном времени от Hedra
За болтовню на том конце отвечают Gemini, ElevenLabs или OpenAI
Попробовать если у вас есть кредиты
#avatar #realtime #voicemode #image2avatar
Аватары в реальном времени от Hedra
За болтовню на том конце отвечают Gemini, ElevenLabs или OpenAI
Попробовать если у вас есть кредиты
#avatar #realtime #voicemode #image2avatar
👍3❤1👎1🤔1
This media is not supported in your browser
VIEW IN TELEGRAM
ObjectClear можно попробовать запустить в колабе если Comfy для вас не вариант
Jupiter / Colab
#inpainting #objectremoval #imageediting
Jupiter / Colab
#inpainting #objectremoval #imageediting
👍4
kontext-make-person-real
Лора под #Kontext для нормальной непластиковой кожи
Промпт для активации:
Настройки: 30 steps, CFG 2.5
#lora #image2image
Лора под #Kontext для нормальной непластиковой кожи
Промпт для активации:
make this person look realНастройки: 30 steps, CFG 2.5
#lora #image2image
🔥17😁6👍2
Neta_Lumina_Flash_PV.webm
17.9 MB
Neta-Lumina
Генератор анимешных картинок от neta.art
На основе Lumina-Image-2.0
Хорошее следование промпту.
Большое покрытие стилей и персонажей.
Поддерживает теги danbooru, но естественный язык хорошо понимает
Веса
Реддит
#text2image
Генератор анимешных картинок от neta.art
На основе Lumina-Image-2.0
Хорошее следование промпту.
Большое покрытие стилей и персонажей.
Поддерживает теги danbooru, но естественный язык хорошо понимает
Веса
Реддит
#text2image
👍6