Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.43K photos
3.7K videos
41 files
4.75K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
Forwarded from Great Same New (Sasha Melentev)
Kontext + TTP Upscaler

Апскейлер на базе Flux Kontext лоры для восстановления резкости.

Удивительно точный апскейлер. Вытаскивает из разблюра лицо точно с той мимикой и эмоциями, как в оригинале. А TTP Toolset ноды разгоняют разрешение до 4К.

Всегда была проблема у любого open-source апскейлера, что после увеличения картинки персонаж приходит с немного другим лицом. Лучшие результаты до сего дня давал supir. Новый - с Kontext лорой апскейлер - превосходит качеством.

Ссылка на лору:
https://huggingface.co/chflame163/kontext_hires

Workflow в комментариях:
https://news.1rj.ru/str/GreatSameNew/252?comment=720

Думаю те, кто много генерит датасеты людей, видел, что Flux или Qwen-Edit делают слегка мыльные фотографии, и всегда хочется навести резкость получше.

Или еще способ. Если гонка за реализмом наличествует, то поза персонажа на генерации может выдавать искусственность, тогда стоит сделать видео из картинки, где бы персонаж встал "посвободнее". И тогда придется апскейлить скрин из видео.

Да мало ли что может придтись апскейлить.
Ai #Tools
🔥165👍2😐1
This media is not supported in your browser
VIEW IN TELEGRAM
WebEyeTrack

инструмент для отслеживания взгляда в реальном времени, работает прямо в веб-браузере. Работает лучше чем определятор взгляда на картинке который мы видел пару лет назад

На сайте есть ссылка на демо но браузер на него включает красные мигалки с сиренами, так что на свой страх и риск

#tools #eyetracking #realtime
👍2👀1
Media is too big
VIEW IN TELEGRAM
Гауссианы в Супермэне

В фильме «Супермен» компания Framestore использовала гауссианы для создания "голограмм" с родителями Супермена. В отличие от звездновойновских плоских голограмм, для эффекта поврежденного изображения использовали 3D-деформации

Сцену снимали почти 200 камер одновременно. Это чтобы вы не думали что можете сделать настолько качественно у себя дома. Но кто сказал что у себя дома надо так упарываться? Сами посудите, стоит этот глюк 200 камер и 5-миллионодалларовой смены (цифра от балды, но не думаю что далеко от истины)?

Процесс создания включал следующие этапы:

студия Infinite Realities записала актёров (Брэдли Купера и Анжелу Сарафян) с помощью примерно двухсот камер

данные были обработаны и преобразованы в последовательность PLY-файлов, представляющих дествие в 3D

команда Framestore внесла творческие изменения, например, создала эффект «повреждённой передачи», когда части изображения ненадолго смещаются или сбиваются, а затем снова собираются в такт диалогу

композитинг был выполнен в Nuke с минимальным вмешательством, что позволило сохранить естественность изображения. Использовали плагин Gaussian Splatting for Nuke

Технология якобы позволила избежать затрат на создание цифрового двойника и дала творческую свободу при редактировании материала.

#кино #news #gaussian
🍌85😁5👍2
Inpaint4Drag: Repurposing Inpainting Models for Drag-Based Image Editing via Bidirectional Warping

Помните эти многообещающие методы редактирования перетаскиванием?

Вот еще один, заявлена работа в рилтайме
работает быстрее, чем FastDrag (в 14 раз) и DragDiffusion (почти в 600 раз)

совместим с различными моделями inpainting, выступая в роли универсального адаптера без необходимости изменения их архитектуры

А так под капотом
— SAM для масок

— Stable Diffusion 1.5 Inpainting Checkpoint для инпейнтинга

— TinyAutoencoder SD (TAESD) для снижения требований к памяти

— LCM (Latent Consistency Model) LoRA для сокращения количества шагов

Код
Колаб - неинтерактивный, там надо маску отдельно предоставить и координаты точек

#drag #imageediting #realtime
👍9
HunyuanImage-2.1

Новая версия генератора картинок от Tencent

— создаёт изображения в 2K с кинематографичной композицией

— понимает сложные промты длиной до 1000 токенов

— точно контролирует генерацию нескольких объектов в одном изображении

— сохраняет точные тексты и мельчайшие детали в изображениях

— использует двойной текстовый энкодер: общий и учитывающий характеристики персонажей, что помогает лучше понимать описания сцен и действий

— ускоряет вывод данных благодаря технологии Meanflow, сокращая количество шагов с 100 до 8

— улучшайзер промптов Hunyuan PromptEnhancer улучшает семантику генерируемых изображений.

Модель доступна в полной и дистиллированной версиях, каждая из которых занимает около 34 ГБ.

Готовьте 59 GB VRAM под одну картинку 2048x2048

Попробовать на офсайте
Демо на HF лежит без чувств
Гитхаб
HF

#text2image
👍7
Contrastive Flow Matching

Метод обучения диффузных генераторов, позволяющий сократить время обучения (до 9 раз) и количество шагов на инференсе (до 5 раз) и при этом повысить качество изображения

Метод поощряет модель генерировать несхожие потоки для различных входных условий.

Совместим с другими методами, например, с REPA и classifier-free guidance (CFG)

Ну ждем теперь чтобы переобучили заново Flux и Wan если все так радужно

[UPDA
TE] пишут что воплотить метод в коде можно двумя строчками
cfm_target = torch.roll(flow_target, shifts=1, dims=0)
cfm_loss = -((model_output - cfm_target) ** 2).mean() * λ

вместо официальных 60 строк

Гитхаб

#optimization
💯10👍6😁2🤔1😱1
ToonOut: Fine-tuned Background Removal for Anime Characters

Удаление фона с изображений в аниме-стиле.
Создан на основе модели BiRefNet

Код - среда настроена на 2 x 4090, под другое железо вероятно придется что-то перенастроить
HF

#backgroundremoval #segmentation #image2mask #matting
👍71
Seedream 4.0

Генератонр-редактор изображений от ByteDance, конкурент NanoBanana

— объединяет генерацию и редактирование в одной архитектуре

— справляется со сложными задачами

— создаёт изображения в 4K

— обрабатывает несколько изображений сразу

— редактирует изображения по текстовому запросу

— преобразует изображения в разные стили

Fal.ai - платно
Replicate - платно
Krea.ai - платно
Промпт гайд
Арена - тут попадаются работы Seedream 4, можно только голосовать
lmarena - сюда не завезли еще

Короче, не нашел бесплатно попробовать 🤩

#imageediting #text2image #image2image
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥7👍32
Media is too big
VIEW IN TELEGRAM
Hailuo AI (MiniMax) проводит челлендж, связанный с созданием историй с помощью Hailuo Start/End Frames. Участники должны создать историю длительностью более 15 секунд, поделиться ей в социальных сетях (X, IG, TT, YT), отметить @Hailuo_AI и использовать хэштег #HailuoUnlimitedFrames

Челлендж продлится до 17 сентября 16:00 (UTC+8).

Призы:

- 5 подписок MAX Hailuo для самых вирусных постов;

- 10 наград по 2000 кредитов для самых креативных работ.

Ну и самое главное:

‼️На эти 7 дней всем дают безлимитные бесплатные генерации по первому и последнему кадру. ЧЕСТНЫЕ бесплатные, а не платные бесплатные как у сами знаете кого

Бежим генерить!


#image2video #flf #giveaway
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4