NEW BOT Телеграм, страница

Inpaint4Drag: Repurposing Inpainting Models for Drag-Based Image Editing via Bidirectional Warping

Помните эти многообещающие методы редактирования перетаскиванием?

Вот еще один, заявлена работа в рилтайме
работает быстрее, чем FastDrag (в 14 раз) и DragDiffusion (почти в 600 раз)

совместим с различными моделями inpainting, выступая в роли универсального адаптера без необходимости изменения их архитектуры

А так под капотом
— SAM для масок

— Stable Diffusion 1.5 Inpainting Checkpoint для инпейнтинга

— TinyAutoencoder SD (TAESD) для снижения требований к памяти

— LCM (Latent Consistency Model) LoRA для сокращения количества шагов

Код
Колаб - неинтерактивный, там надо маску отдельно предоставить и координаты точек

#drag #imageediting #realtime

👍9

1.93K views08:45

Нейронавт | Нейросети в творчестве

HunyuanImage-2.1

Новая версия генератора картинок от Tencent

— создаёт изображения в 2K с кинематографичной композицией

— понимает сложные промты длиной до 1000 токенов

— точно контролирует генерацию нескольких объектов в одном изображении

— сохраняет точные тексты и мельчайшие детали в изображениях

— использует двойной текстовый энкодер: общий и учитывающий характеристики персонажей, что помогает лучше понимать описания сцен и действий

— ускоряет вывод данных благодаря технологии Meanflow, сокращая количество шагов с 100 до 8

— улучшайзер промптов Hunyuan PromptEnhancer улучшает семантику генерируемых изображений.

Модель доступна в полной и дистиллированной версиях, каждая из которых занимает около 34 ГБ.

Готовьте 59 GB VRAM под одну картинку 2048x2048

Попробовать на офсайте
Демо на HF лежит без чувств
Гитхаб
HF

#text2image

👍7

1.76K views13:45

Нейронавт | Нейросети в творчестве

Contrastive Flow Matching

Метод обучения диффузных генераторов, позволяющий сократить время обучения (до 9 раз) и количество шагов на инференсе (до 5 раз) и при этом повысить качество изображения

Метод поощряет модель генерировать несхожие потоки для различных входных условий.

Совместим с другими методами, например, с REPA и classifier-free guidance (CFG)

Ну ждем теперь чтобы переобучили заново Flux и Wan если все так радужно

[UPDATE] пишут что воплотить метод в коде можно двумя строчками

cfm_target = torch.roll(flow_target, shifts=1, dims=0)
cfm_loss = -((model_output - cfm_target) ** 2).mean() * λ

вместо официальных 60 строк

Гитхаб

#optimization

💯10👍6😁2🤔1😱1

1.89K viewsedited 06:22

Нейронавт | Нейросети в творчестве

ToonOut: Fine-tuned Background Removal for Anime Characters

Удаление фона с изображений в аниме-стиле.
Создан на основе модели BiRefNet

Код - среда настроена на 2 x 4090, под другое железо вероятно придется что-то перенастроить
HF

#backgroundremoval #segmentation #image2mask #matting

👍7❤1

1.66K views08:55

Нейронавт | Нейросети в творчестве

Seedream 4.0

Генератонр-редактор изображений от ByteDance, конкурент NanoBanana

— объединяет генерацию и редактирование в одной архитектуре

— справляется со сложными задачами

— создаёт изображения в 4K

— обрабатывает несколько изображений сразу

— редактирует изображения по текстовому запросу

— преобразует изображения в разные стили

Fal.ai - платно
Replicate - платно
Krea.ai - платно
Промпт гайд
Арена - тут попадаются работы Seedream 4, можно только голосовать
lmarena - сюда не завезли еще

Короче, не нашел бесплатно попробовать 🤩

#imageediting #text2image #image2image

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥7👍3❤2

1.86K views12:11

Нейронавт | Нейросети в творчестве

0:59

Media is too big

VIEW IN TELEGRAM

Hailuo AI (MiniMax) проводит челлендж, связанный с созданием историй с помощью Hailuo Start/End Frames. Участники должны создать историю длительностью более 15 секунд, поделиться ей в социальных сетях (X, IG, TT, YT), отметить @Hailuo_AI и использовать хэштег #HailuoUnlimitedFrames

Челлендж продлится до 17 сентября 16:00 (UTC+8).

Призы:

- 5 подписок MAX Hailuo для самых вирусных постов;

- 10 наград по 2000 кредитов для самых креативных работ.

Ну и самое главное:

‼️На эти 7 дней всем дают безлимитные бесплатные генерации по первому и последнему кадру. ЧЕСТНЫЕ бесплатные, а не платные бесплатные как у сами знаете кого

Бежим генерить!

#image2video #flf #giveaway

Please open Telegram to view this post

VIEW IN TELEGRAM

👍4

2.45K viewsedited 13:16

Нейронавт | Нейросети в творчестве

Virtual Try On (Seedream V4)

Вот здесь можете попробовать Seedream 4 в переодевании если у вас есть кредиты на glif.app

Заходить через 3 буквы

#tryon

👍3👀2

1.6K views13:46

Нейронавт | Нейросети в творчестве

1:27

This media is not supported in your browser

VIEW IN TELEGRAM

K2 Think

самая быстрая в мире модель искусственного интеллекта с открытым исходным кодом и самая продвинутая система ИИ-рассуждений

Передовая производительность при всего 32B параметров, конкурирует с моделями Open AI и DeepSeek с сотнями миллиардов параметров.

Русский знает, на вопрос ответил моментально

Гитхаб
HF
Демо на HF
Чат на офсайте

#reasoning #assistant #chat

👍9

2.01K views14:17

Нейронавт | Нейросети в творчестве

Qwen3 ASR: Hear clearly, transcribe smartly

Распознавалка речи на базе Qwen3-Omni

— поддерживает 11 языков и множество акцентов, в том числе русский

— даёт персонализированные результаты при предоставлении контекста

— хорошо распознаёт певческий голос, некачественные и шумные записи

Демо на HF
Попробовать в чате

#ASR #speech2text #stt #russian

🔥9👍3❤1

2.16K viewsedited 15:18

Нейронавт | Нейросети в творчестве

nunchaku-qwen-image-edit

Чуть позже обещанного, но все же
Ускоренный Qwen-Image-Edit от/для Nunchaku

HF
воркфлоу

#optimization #imageediting #workflow

👍8❤4

2.22K views16:19

Нейронавт | Нейросети в творчестве

0:40

This media is not supported in your browser

IndexTTS2: A Breakthrough in Emotionally Expressive and Duration-Controlled Auto-Regressive Zero-Shot Text-to-Speech

Вторая версия голосовой модели от Qwen, с контролем длительности, тембра и эмоциональной окраски синтезируемой речи.

На сайте много примеров.

поддерживает два режима генерации: с точным указанием количества токенов для контроля длительности и свободный авторегрессионный режим без указания количества токенов

Поддерживает английский и китайский

HF
Демо

Спасибо @m_franz

#voicecloning #text2speech #tts

🔥11👍3

2.16K views06:52

About

Blog

Apps

Platform