This media is not supported in your browser
VIEW IN TELEGRAM
Topaz's Flagship Upscale Models in ComfyUI
Топаз завезли в комфи.
Объясняю понятным языком: платно, в API ноды
для видео:
- Video Upscale (до 4K)
- Starlight Fast — повышение чёткости видео с помощью диффузионной технологии
- Starlight Creative (Astra) — творческое улучшение видео
- Apollo — интерполяция кадров
для изображений:
- Image Enhance (до 8K)
- Bloom (Reimagine) — креативное улучшение и переработка изображений
#upscale #comfyui #upscalevideo #imagerestoration #frameinterpolation
Топаз завезли в комфи.
Объясняю понятным языком: платно, в API ноды
для видео:
- Video Upscale (до 4K)
- Starlight Fast — повышение чёткости видео с помощью диффузионной технологии
- Starlight Creative (Astra) — творческое улучшение видео
- Apollo — интерполяция кадров
для изображений:
- Image Enhance (до 8K)
- Bloom (Reimagine) — креативное улучшение и переработка изображений
#upscale #comfyui #upscalevideo #imagerestoration #frameinterpolation
👍8😁1🤔1
❤8👍6
ComfyUI-PainterFLF2V
Улучшает динамику генерации WAN, делая движения более плавными и естественными. Динамически усиленная версия оригинальной ноды для генерации по первому-последнему кадру
#wan #comfyui #FLF2V
Улучшает динамику генерации WAN, делая движения более плавными и естественными. Динамически усиленная версия оригинальной ноды для генерации по первому-последнему кадру
#wan #comfyui #FLF2V
👍17
Нейронавт | Нейросети в творчестве
Sa2VA-Qwen3-VL-4B ByteDance выпустил Sa2VA на Qwen3-VL-4B Модель объединяет SAM2 и LLaVA для глубокого понимания изображений и видео Гитхаб #segmentation #vlm #assistant #video2text #vide2mask #captiopning
Sa2VA-Qwen3-VL-2B
ByteDance выпустил сегментатор Sa2VA на Qwen3-VL-2B
4B было тут
Модель объединяет SAM2 и LLaVA для глубокого понимания изображений и видео
Гитхаб
#segmentation #vlm #assistant #video2text #vide2mask #captiopning
ByteDance выпустил сегментатор Sa2VA на Qwen3-VL-2B
4B было тут
Модель объединяет SAM2 и LLaVA для глубокого понимания изображений и видео
Гитхаб
#segmentation #vlm #assistant #video2text #vide2mask #captiopning
huggingface.co
ByteDance/Sa2VA-Qwen3-VL-2B · Hugging Face
We’re on a journey to advance and democratize artificial intelligence through open source and open science.
👍6🔥2
BlockVid: Block Diffusion for High-Fidelity and Coherent Minute-Long Video Generation
Очередной 'enlarge yourvideo '
Видеогенератор высокой чёткости и с хорошей связностью длительностью до минуты от Alibaba.
Много архитектурных ухищрений придумали.
Кода, моделей нет
Зато есть основанный на той же папире
Inferix - движок нового поколения для синтеза иммерсивных миров на базе Wan-1.3B. А по сути - потоковый видеогенератор длинных интерактивных видео. То есть, сюжетом можно управлять на лету
Поддерживает Self Forcing, CausVid, MAGI-1
Гитхаб - тут хоть почти весь функционал еще в планах, но уже не просто красивая статья, а репозиторий в работе.
#text2video #streaming #interactive #longvideo
Очередной 'enlarge your
Видеогенератор высокой чёткости и с хорошей связностью длительностью до минуты от Alibaba.
Много архитектурных ухищрений придумали.
Кода, моделей нет
Зато есть основанный на той же папире
Inferix - движок нового поколения для синтеза иммерсивных миров на базе Wan-1.3B. А по сути - потоковый видеогенератор длинных интерактивных видео. То есть, сюжетом можно управлять на лету
Поддерживает Self Forcing, CausVid, MAGI-1
Гитхаб - тут хоть почти весь функционал еще в планах, но уже не просто красивая статья, а репозиторий в работе.
#text2video #streaming #interactive #longvideo
👍10❤2
Prompting Guide - FLUX.2
Официальный гайд по промптингу Flux.2
Основное:
- поддерживает структурированные промпты в формате JSON, что даёт точный контроль над элементами изображения
- позволяет использовать HEX-коды для точного подбора цветов
- не поддерживает негативные промпты — нужно описывать, что хочется увидеть, а не то, чего хочется избежать
- понимает промпты на разных языках, что помогает создавать культурно аутентичные результаты
- для фотореалистичных изображений можно указывать модели камер, объективы и настройки.
#guide #prompting
Официальный гайд по промптингу Flux.2
Основное:
- поддерживает структурированные промпты в формате JSON, что даёт точный контроль над элементами изображения
- позволяет использовать HEX-коды для точного подбора цветов
- не поддерживает негативные промпты — нужно описывать, что хочется увидеть, а не то, чего хочется избежать
- понимает промпты на разных языках, что помогает создавать культурно аутентичные результаты
- для фотореалистичных изображений можно указывать модели камер, объективы и настройки.
#guide #prompting
👍8❤7🥴1
RIP Suno
Вслед за UDIO, Suno заключил "партнёрство" с крупным лейблом - Warner Music Group
— Suno удалит старые модели
— Создаст новые нейронки на лицензионном контенте
— Запретит скачивание песен в бесплатном тарифе
— Ограничит количество загрузок с подпиской
— Может удалять песни, напоминающие известных исполнителей
— Музыканты смогут давать разрешение на генерацию ИИ-каверов своим голосом за деньги. Или не давать. Но других выплат музыкантам не предусмотрено.
Всё это якобы для защиты музыкантов
Роберт Кинкл забыл добавить "...которая принесёт пользу всем в WMG"
#news
Вслед за UDIO, Suno заключил "партнёрство" с крупным лейблом - Warner Music Group
— Suno удалит старые модели
— Создаст новые нейронки на лицензионном контенте
— Запретит скачивание песен в бесплатном тарифе
— Ограничит количество загрузок с подпиской
— Может удалять песни, напоминающие известных исполнителей
— Музыканты смогут давать разрешение на генерацию ИИ-каверов своим голосом за деньги. Или не давать. Но других выплат музыкантам не предусмотрено.
Всё это якобы для защиты музыкантов
Роберт Кинкл забыл добавить "...которая принесёт пользу всем в WMG"
#news
😭25👎14❤5😁5🤷♂1
MERA
Обычно не пишу про бенчмарки, но вот про это напишу.
MERA — это первый открытый мультимодальный бенчмарк для русского языка, который учитывает культурные особенности РФ и признан сообществом как национальный стандарт. Xто означает последняя фраза про стандарт - понятия не имею.
Оценивает работу с картинками, видео, аудио и мультимодальные задачи в целом.
Есть свой лидерборд
И кто бы вы думали везде в топе?
#Leaderboard
Обычно не пишу про бенчмарки, но вот про это напишу.
MERA — это первый открытый мультимодальный бенчмарк для русского языка, который учитывает культурные особенности РФ и признан сообществом как национальный стандарт. Xто означает последняя фраза про стандарт - понятия не имею.
Оценивает работу с картинками, видео, аудио и мультимодальные задачи в целом.
Есть свой лидерборд
И кто бы вы думали везде в топе?
#Leaderboard
😁7👍6🤔1
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Whisper Thunder (aka) David
На Artificial Arena топ видергенерации по тексту разорвала новая модель неизвестного происхождения Whisper Thunder (aka) David
#text2video #news
На Artificial Arena топ видергенерации по тексту разорвала новая модель неизвестного происхождения Whisper Thunder (aka) David
#text2video #news
👍4🥴4🔥2😁2