Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.47K photos
3.74K videos
41 files
4.78K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
Krea-CSG (Krea Foundation)

Вышла модификация FLUX.1 Krea весом всего 6.5 ГБ, жестко оптимизированная под Nvidia, GGUF
Дружественная к VRAM-беднякам

Настройки:
CFG 1 , Steps 30 - 45 , Eular , Sample / Beta
(res2 pref)

#gguf #text2image #optimization #workflow
👍18
Luma Ray 3 в Adobe Firefly

Помимо Kontext, Gemini, Nano-Banana в фотошопе - Прикрутили Luma RAY 3 в Firefly

Причем с поддержкой HDR 10/12/16 бит, EXR, ACES - заявка на интеграцию в серьезные пайплайны

Доступно без ограничений до 1 октября на платных тарифах Firefly или Creative Cloud Pro

#news #image2video #text2video
👍9👎1
This media is not supported in your browser
VIEW IN TELEGRAM
Qwen Chat научился произносить свои ответы вслух — при помощи Qwen3-TTS

Работает и на мобилках

#voicemode #assistant
👍112
⚡️Бесплатная тренировка Лор Qwen, Wan или FLUX⚡️

1. Авторизуемся на HF и присоединяемся к LoRA Frenzi organization
2. Идем сюда и жмем Sign in with Hugging Face ->
3. В открывшемся окне выбираем "Grant ostris-ai-toolkit the same access", "lorafrenzi" -> Authorize
4. Ну а дальше жмем Create a training job, соглашаемся с условиями и приступаем

Ограничения:
- не больше 5000 шагов
- больше 5-6 часов тренировки - таск убивают
- не больше 1 тренировки одновременно
- не тренировать NSFW!
- не тренировать внешность без согласия ее владельца

Доступно до 6 октября

⚡️ Бежим тренировать строго пуританские лоры

#lora #finetuning #giveaway
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥11🌚31👍1
MinerU 2.5

Обновка модели для преобразования PDF документов в машинно-читаемые форматы


Всего 1.2B параметров, но превосходит Gemini 2.5 Pro, GPT-4o и Qwen2.5-VL-72B

— удаляет заголовки, футеры, сноски, номера страниц и другие элементы для обеспечения семантической связности

— выводит текст в порядке, удобном для чтения человеком, подходит для одностолбцовых, многостолбцовых и сложных макетов

— сохраняет структуру исходного документа, включая заголовки, абзацы, списки и прочее

— извлекает изображения, описания изображений, таблицы, заголовки таблиц и сноски

— автоматически идентифицирует и преобразует формулы в документах в формат LaTeX

— преобразует таблицы в HTML

— обнаруживает отсканированные и искажённые PDF-файлы и активирует функцию OCR

— распознает 84 языков с помощью #OCR

— работает с различными форматами вывода, включая мультимодальный и NLP Markdown, JSON, упорядоченный по порядку чтения, и информативные промежуточные формат

— CPU / GPU

— Windows, Linux и Mac

Требует 20 ГБ на диске, рекомендовано от 16 ГБ RAM, от 6 ГБ VRAM

Гитхаб
Колаб
Демо
Попробовать на Mineru.net
HF

#tools #pdf #assistant
🔥161👍1