Krea-CSG (Krea Foundation)
Вышла модификация FLUX.1 Krea весом всего 6.5 ГБ, жестко оптимизированная под Nvidia, GGUF
Дружественная к VRAM-беднякам
Настройки:
CFG 1 , Steps 30 - 45 , Eular , Sample / Beta
(res2 pref)
#gguf #text2image #optimization #workflow
Вышла модификация FLUX.1 Krea весом всего 6.5 ГБ, жестко оптимизированная под Nvidia, GGUF
Дружественная к VRAM-беднякам
Настройки:
CFG 1 , Steps 30 - 45 , Eular , Sample / Beta
(res2 pref)
#gguf #text2image #optimization #workflow
👍18
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
Sparse VideoGen2: Accelerate Video Generation with Sparse Attention via Semantic-Aware Permutation (SVG2)
Вторая версия ускорятора видеогенерации без дообучения
Использует технику семантически осознанной перестановки (Semantic-Aware Permutation) и эффективные динамические ядра внимания
Прикручено к Wan 2.1 14B, ускорение до x2
Возможно, совместим с lightx2
Код
#optimiozation #text2video
Вторая версия ускорятора видеогенерации без дообучения
Использует технику семантически осознанной перестановки (Semantic-Aware Permutation) и эффективные динамические ядра внимания
Прикручено к Wan 2.1 14B, ускорение до x2
Возможно, совместим с lightx2
Код
#optimiozation #text2video
🔥5
Luma Ray 3 в Adobe Firefly
Помимо Kontext, Gemini, Nano-Banana в фотошопе - Прикрутили Luma RAY 3 в Firefly
Причем с поддержкой HDR 10/12/16 бит, EXR, ACES - заявка на интеграцию в серьезные пайплайны
Доступно без ограничений до 1 октября на платных тарифах Firefly или Creative Cloud Pro
#news #image2video #text2video
Помимо Kontext, Gemini, Nano-Banana в фотошопе - Прикрутили Luma RAY 3 в Firefly
Причем с поддержкой HDR 10/12/16 бит, EXR, ACES - заявка на интеграцию в серьезные пайплайны
Доступно без ограничений до 1 октября на платных тарифах Firefly или Creative Cloud Pro
#news #image2video #text2video
👍9👎1
This media is not supported in your browser
VIEW IN TELEGRAM
Qwen Chat научился произносить свои ответы вслух — при помощи Qwen3-TTS
Работает и на мобилках
#voicemode #assistant
Работает и на мобилках
#voicemode #assistant
👍11❤2
1. Авторизуемся на HF и присоединяемся к LoRA Frenzi organization
2. Идем сюда и жмем Sign in with Hugging Face ->
3. В открывшемся окне выбираем "Grant ostris-ai-toolkit the same access", "lorafrenzi" -> Authorize
4. Ну а дальше жмем Create a training job, соглашаемся с условиями и приступаем
Ограничения:
- не больше 5000 шагов
- больше 5-6 часов тренировки - таск убивают
- не больше 1 тренировки одновременно
- не тренировать NSFW!
- не тренировать внешность без согласия ее владельца
Доступно до 6 октября
#lora #finetuning #giveaway
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥11🌚3❤1👍1
MinerU 2.5
Обновка модели для преобразования PDF документов в машинно-читаемые форматы
Всего 1.2B параметров, но превосходит Gemini 2.5 Pro, GPT-4o и Qwen2.5-VL-72B
— удаляет заголовки, футеры, сноски, номера страниц и другие элементы для обеспечения семантической связности
— выводит текст в порядке, удобном для чтения человеком, подходит для одностолбцовых, многостолбцовых и сложных макетов
— сохраняет структуру исходного документа, включая заголовки, абзацы, списки и прочее
— извлекает изображения, описания изображений, таблицы, заголовки таблиц и сноски
— автоматически идентифицирует и преобразует формулы в документах в формат LaTeX
— преобразует таблицы в HTML
— обнаруживает отсканированные и искажённые PDF-файлы и активирует функцию OCR
— распознает 84 языков с помощью #OCR
— работает с различными форматами вывода, включая мультимодальный и NLP Markdown, JSON, упорядоченный по порядку чтения, и информативные промежуточные формат
— CPU / GPU
— Windows, Linux и Mac
Требует 20 ГБ на диске, рекомендовано от 16 ГБ RAM, от 6 ГБ VRAM
Гитхаб
Колаб
Демо
Попробовать на Mineru.net
HF
#tools #pdf #assistant
Обновка модели для преобразования PDF документов в машинно-читаемые форматы
Всего 1.2B параметров, но превосходит Gemini 2.5 Pro, GPT-4o и Qwen2.5-VL-72B
— удаляет заголовки, футеры, сноски, номера страниц и другие элементы для обеспечения семантической связности
— выводит текст в порядке, удобном для чтения человеком, подходит для одностолбцовых, многостолбцовых и сложных макетов
— сохраняет структуру исходного документа, включая заголовки, абзацы, списки и прочее
— извлекает изображения, описания изображений, таблицы, заголовки таблиц и сноски
— автоматически идентифицирует и преобразует формулы в документах в формат LaTeX
— преобразует таблицы в HTML
— обнаруживает отсканированные и искажённые PDF-файлы и активирует функцию OCR
— распознает 84 языков с помощью #OCR
— работает с различными форматами вывода, включая мультимодальный и NLP Markdown, JSON, упорядоченный по порядку чтения, и информативные промежуточные формат
— CPU / GPU
— Windows, Linux и Mac
Требует 20 ГБ на диске, рекомендовано от 16 ГБ RAM, от 6 ГБ VRAM
Гитхаб
Колаб
Демо
Попробовать на Mineru.net
HF
#tools #pdf #assistant
🔥16❤1👍1