CoTyle
Трепещи Миджорни. Стиль изображения по номеру
Новый адаптер (не лора) от Kuaishou превращает обычное число в полноценный визуальный стиль. Даёшь SDXL текст «кот-самурай» и код «42» — получаешь целую серию картинок в одном узнаваемом, но нигде не использованном стиле.
Можно плавно интерполировать между кодами.
Прикручено к SDXL
Гитхаб
HF
Демо
#referencing #stylize
Трепещи Миджорни. Стиль изображения по номеру
Новый адаптер (не лора) от Kuaishou превращает обычное число в полноценный визуальный стиль. Даёшь SDXL текст «кот-самурай» и код «42» — получаешь целую серию картинок в одном узнаваемом, но нигде не использованном стиле.
Можно плавно интерполировать между кодами.
Прикручено к SDXL
Гитхаб
HF
Демо
#referencing #stylize
🔥13🤔5❤1👍1
Media is too big
VIEW IN TELEGRAM
HunyuanVideo-1.5
Претендент на потеснить короля опенсорсной видеогенерации (WAN 2.2) с трона
Всего 8.3В параметров, впихуемые в 14GB VRAM
Что заявлено:
- послушание промпту
- генерация плавного движения
- кинематографичная эстетика
- изображение текстов
- физичность
- владение приемами работы с камерой
- поддержка разных стилей
- консистентность, куда ж без нее
- апскейл в латентном пространстве до 1080p
- поддержка в #ComfyUI
Гитхаб
Веса
Переупакованные тут
Руководство по промптингу (WeChat)
#text2video #image2video
Претендент на потеснить короля опенсорсной видеогенерации (WAN 2.2) с трона
Всего 8.3В параметров, впихуемые в 14GB VRAM
Что заявлено:
- послушание промпту
- генерация плавного движения
- кинематографичная эстетика
- изображение текстов
- физичность
- владение приемами работы с камерой
- поддержка разных стилей
- консистентность, куда ж без нее
- апскейл в латентном пространстве до 1080p
- поддержка в #ComfyUI
Гитхаб
Веса
Переупакованные тут
Руководство по промптингу (WeChat)
#text2video #image2video
❤22👍7🔥4🤯4🤔1
Ну пусть попробуют.
Киноакадемия пересмотрела правила, теперь фильмы созданные с применением ИИ могут претендовать на Оскар
Журналисты The New York Times отмечают, что киноакадемии не требует от студий указывать, использовались ли в работе нейросети. Внимание будут обращать на идею, исполнение и посыл.
#news
Киноакадемия пересмотрела правила, теперь фильмы созданные с применением ИИ могут претендовать на Оскар
Относительно генеративного искусственного интеллекта и других цифровых инструментов, которые используют в создании фильмов. Они не помогают и не мешают получить номинацию. При выборе фильма для награждения, академия и каждое её подразделение будут оценивать работу, обращая внимание на степень, в которой человек был в центре творческого авторства.
Журналисты The New York Times отмечают, что киноакадемии не требует от студий указывать, использовались ли в работе нейросети. Внимание будут обращать на идею, исполнение и посыл.
#news
❤15😁6😈1
Hy1.5-Quantized-Models
Квантизованные веса видеогенератора HV1.5 от lightx2v
Спасибо @StanShumsky
#text2video #image2video #hv1.5
Квантизованные веса видеогенератора HV1.5 от lightx2v
Спасибо @StanShumsky
#text2video #image2video #hv1.5
huggingface.co
lightx2v/Hy1.5-Quantized-Models at main
We’re on a journey to advance and democratize artificial intelligence through open source and open science.
❤7👍4
❤9👍4
Tost UI
Camenduru прикрутил к сервису tost.ai новый интерфейс, холст и API.
Не помню когда последний раз им можно было пользоваться бесплатно.
Но вот сейчас кажется можно в рамках раннего доступа.
Не очень понятно как оно работает, мне удалось вот такую картинку получить.
В холсте доступно 17 операций, в основном с Qwen-Image и Flux. Есть еще Tost upscaler 2.0
API key:
#giveaway #online #imageediting #text2image
Camenduru прикрутил к сервису tost.ai новый интерфейс, холст и API.
Не помню когда последний раз им можно было пользоваться бесплатно.
Но вот сейчас кажется можно в рамках раннего доступа.
Не очень понятно как оно работает, мне удалось вот такую картинку получить.
В холсте доступно 17 операций, в основном с Qwen-Image и Flux. Есть еще Tost upscaler 2.0
API key:
1a46cc42e77ead55db74bb6b31743fbc
8dcb0eaa1e820d92905fb99705d9b685
41f57bfcad4818fc7b6943da50a7c6f1
b51e2613d328a0cba6aaef3a7a780ad2
eae102fdb127a9f1f3b1e2a412e8c0d4
f2f461e90b3b4ed60732e85f0a791e4a
#giveaway #online #imageediting #text2image
❤3👍3
FFGO: First Frame is the Place to Go For Video Content Custimization
Метод подсовывания референсов видеогенераторам через первый кадр
Исследователи показывают: первый кадр видео не просто точка отсчёта, а своего рода «буфер памяти», где хранятся визуальные элементы для дальнейшего использования при генерации. Благодаря этому открытию можно кастомизировать видеоконтент в разных сценариях.
Нужно всего 20–50 примеров для обучения, без масштабных доработок архитектуры или детальной настройки.
Можно кастомизировать контент в разнообразных сценариях.
Работает с разными типами взаимодействий: между несколькими объектами, людьми и объектами, роботами и животными.
Прикручено к Wan2.2-14B-I2V
Hunyuan 1.5 8B и Wan2.2 5B - ждем
Гитхаб
HF
#referencing #image2video #lora #wan22
Метод подсовывания референсов видеогенераторам через первый кадр
Исследователи показывают: первый кадр видео не просто точка отсчёта, а своего рода «буфер памяти», где хранятся визуальные элементы для дальнейшего использования при генерации. Благодаря этому открытию можно кастомизировать видеоконтент в разных сценариях.
Нужно всего 20–50 примеров для обучения, без масштабных доработок архитектуры или детальной настройки.
Можно кастомизировать контент в разнообразных сценариях.
Работает с разными типами взаимодействий: между несколькими объектами, людьми и объектами, роботами и животными.
Прикручено к Wan2.2-14B-I2V
Hunyuan 1.5 8B и Wan2.2 5B - ждем
Гитхаб
HF
#referencing #image2video #lora #wan22
👍7❤1🔥1😁1
Step-Audio-R1
Степан (Step-fun) выпустил первую аудиорассуждалку, в которой реализована цепочка рассуждений (CoT).
Превзошли Gemini 2.5 Pro и поравнялись с Gemini 3 Pro.
Решает проблему «обратного масштабирования», которая характерна для существующих моделей (когда производительность ухудшается с увеличением длины рассуждения)
Демонстрирует, что для аудио, как и для текста и видео, увеличение вычислительных мощностей во время тестирования улучшает производительность.
Примеры работы (на китайском) - на офсайте
Модель выпустят в опенсорс
Гитхаб
HF - ждем
Демо - ждем
#ALM #CoT
Степан (Step-fun) выпустил первую аудиорассуждалку, в которой реализована цепочка рассуждений (CoT).
Превзошли Gemini 2.5 Pro и поравнялись с Gemini 3 Pro.
Решает проблему «обратного масштабирования», которая характерна для существующих моделей (когда производительность ухудшается с увеличением длины рассуждения)
Демонстрирует, что для аудио, как и для текста и видео, увеличение вычислительных мощностей во время тестирования улучшает производительность.
Примеры работы (на китайском) - на офсайте
Модель выпустят в опенсорс
Гитхаб
HF - ждем
Демо - ждем
#ALM #CoT
👍10
(Beta) Minimalistic Comfy Wrapper WebUI
Альтернативный дополнительный безнодовый #GUI для #ComfyUI, который динамически адаптируется к вашим воркфлоу, вам нужно только изменить названия нод, которые вы хотите видеть в минималистичном webui, и нажать кнопку "Refresh".
Альтернативный дополнительный безнодовый #GUI для #ComfyUI, который динамически адаптируется к вашим воркфлоу, вам нужно только изменить названия нод, которые вы хотите видеть в минималистичном webui, и нажать кнопку "Refresh".
👍6🤔6
Хиггсфилд раздает по 10 кредитов в день. Их, естественно, не потратишь на что угодно
Можно потратить на нанобанан 2, Soul, Face swap, Character swap
Бонусом получите щедрый вотермарк размером на всю картинку
Можно потратить на нанобанан 2, Soul, Face swap, Character swap
Бонусом получите щедрый вотермарк размером на всю картинку
😁17❤1