SRPO: Directly Aligning the Full Diffusion Trajectory with Fine-Grained Human Preference
Файнтюн Flux-dev от Tencent-Hunyuan с улучшенным реализмом и эстетикой
Народ уже пилит кванты и выжимает лоры
Гитхаб
HF - 48Гб
bf16 и fp8
#text2image #fluxc
Файнтюн Flux-dev от Tencent-Hunyuan с улучшенным реализмом и эстетикой
Народ уже пилит кванты и выжимает лоры
Гитхаб
HF - 48Гб
bf16 и fp8
#text2image #fluxc
1👍13❤1🔥1
Unlock a world of viewers with multi-language audio
В ближайшие недели YouTube запускает ИИ-дубляж видео на русский (и другие) язык для миллионов блогеров.
Всего будет доступно 30 языков. Переводит и озвучивает Gemini.
Яндекс-браузеру бояться!
#dubbing #news
В ближайшие недели YouTube запускает ИИ-дубляж видео на русский (и другие) язык для миллионов блогеров.
Всего будет доступно 30 языков. Переводит и озвучивает Gemini.
Яндекс-браузеру бояться!
#dubbing #news
blog.youtube
Unlock a world of viewers with multi-language audio
1👍14🔥7❤3
hunyuanimage-2.1 gguf
Кванты вчерашнего HunyuanImage-2.1
воркфлоу есть, но он неполноценный, пока нет рефайнера
#text2image #gguf #workflow
Кванты вчерашнего HunyuanImage-2.1
воркфлоу есть, но он неполноценный, пока нет рефайнера
#text2image #gguf #workflow
🔥10
Так народ!
Я нашел вам где бесплатно потестить Seedream 4.0
Вот порядок действий:
1. Прячемся за три буквы (Польша подходит)
2. Идем на https://yupp.ai/
3. Choose models - выбираем Seedream 4.0 и Nano-Banana. Seedream будет со значком доллара - "платный" - все равно выбираем.
5. Пишем промпт, получаем результат.
6. Голосуем и даем фидбек.
7. Появляется купон - стираем мышкой защитный слой и получаем рандомное количество кредитов. И за каждый фидбек опять могут подарить кредиты.
8. В какой-то момент вас попросят заполнить анкету прежде чем дадут погенерить.
9. Результаты можно отправить наБатл Сидрим-Банана
10. Посылаем админу в карму лучи добра, по желанию - звезды, машины, квартиры.
11. Если где-то запостите эту инфу, помяните добрым словом этот канал 🥰
По мне, банан лучше слушается и делает красивее
#text2image
Я нашел вам где бесплатно потестить Seedream 4.0
Вот порядок действий:
2. Идем на
3. Choose models - выбираем Seedream 4.0 и Nano-Banana. Seedream будет со значком доллара - "платный" - все равно выбираем.
5. Пишем промпт, получаем результат.
6. Голосуем и даем фидбек.
7. Появляется купон - стираем мышкой защитный слой и получаем рандомное количество кредитов. И за каждый фидбек опять могут подарить кредиты.
8. В какой-то момент вас попросят заполнить анкету прежде чем дадут погенерить.
9. Результаты можно отправить на
10. Посылаем админу в карму лучи добра, по желанию - звезды, машины, квартиры.
11. Если где-то запостите эту инфу, помяните добрым словом этот канал 🥰
По мне, банан лучше слушается и делает красивее
#text2image
🔥15👍5💯3🤔1
This media is not supported in your browser
VIEW IN TELEGRAM
Ebsynth V2
Веб-версия легендарного инструмента для так скажем замены текстур на видео. Изменяем что-нибудь в одном кадре любыми доступными средствами. Отдаем это Ebsynth, и он по векторам движения шевелит наш кадр на всем видео.
В веб-версии появилась таймлиния с ключевыми кадрами, рисовалка, удобное управление ключевыми кадрами. И встроенный генератор по изображению с контролнетом
На бесплатном тарифе разрешение ограничено 720p, ограничено количество генрации ключевых кадров, нет экспорта в PNG.
Туториал
#matchmoving #video2video
Веб-версия легендарного инструмента для так скажем замены текстур на видео. Изменяем что-нибудь в одном кадре любыми доступными средствами. Отдаем это Ebsynth, и он по векторам движения шевелит наш кадр на всем видео.
В веб-версии появилась таймлиния с ключевыми кадрами, рисовалка, удобное управление ключевыми кадрами. И встроенный генератор по изображению с контролнетом
На бесплатном тарифе разрешение ограничено 720p, ограничено количество генрации ключевых кадров, нет экспорта в PNG.
Туториал
#matchmoving #video2video
🔥10❤1💯1
Lumina-DiMOO
Открытая мультимодальная модель для генерации и понимания данных, 8B параметров
— генерирует изображения по тексту
— редактирует и преобразует изображения
— распознаёт содержание изображений. И судя по примеру они впихнули в нее какой-то ризонер
— стилизует изображения
— контролнет - контуры, глубина, поза, освещение
— итнпейнтинг и интерполяция (пока не в релизе, ждем)
Гитхаб
HF
Демо ждем
#multimodal #text2image #imageediting #image2texl #vlm
Открытая мультимодальная модель для генерации и понимания данных, 8B параметров
— генерирует изображения по тексту
— редактирует и преобразует изображения
— распознаёт содержание изображений. И судя по примеру они впихнули в нее какой-то ризонер
— стилизует изображения
— контролнет - контуры, глубина, поза, освещение
— итнпейнтинг и интерполяция (пока не в релизе, ждем)
Гитхаб
HF
Демо ждем
#multimodal #text2image #imageediting #image2texl #vlm
🔥9👍1
VibeVoice ComfyUI Nodes теперь поддерживает теги пауз в двух вариантах:
[pause] → вставляет паузу продолжительностью в 1 секунду (по умолчанию)
[pause:ms] → вставляет пользовательскую длительность паузы в миллисекундах (например, [pause:2000] для 2 секунд).
Гитхаб
#podcast #voicecloning #tts #text2speech #text2podcast #comfyui
[pause] → вставляет паузу продолжительностью в 1 секунду (по умолчанию)
[pause:ms] → вставляет пользовательскую длительность паузы в миллисекундах (например, [pause:2000] для 2 секунд).
Гитхаб
#podcast #voicecloning #tts #text2speech #text2podcast #comfyui
🔥7👍1
1GIRL QWEN v2.0
Еще одна лора для #qwenimage имитирующая реалистичное фото на смартфон с фокусом на девушках
#lora #text2image
Еще одна лора для #qwenimage имитирующая реалистичное фото на смартфон с фокусом на девушках
#lora #text2image
🔥11🤯3👍2🍌1