This media is not supported in your browser
VIEW IN TELEGRAM
WebEyeTrack
инструмент для отслеживания взгляда в реальном времени, работает прямо в веб-браузере. Работает лучше чем определятор взгляда на картинке который мы видел пару лет назад
На сайте есть ссылка на демо но браузер на него включает красные мигалки с сиренами, так что на свой страх и риск
#tools #eyetracking #realtime
инструмент для отслеживания взгляда в реальном времени, работает прямо в веб-браузере. Работает лучше чем определятор взгляда на картинке который мы видел пару лет назад
На сайте есть ссылка на демо но браузер на него включает красные мигалки с сиренами, так что на свой страх и риск
#tools #eyetracking #realtime
👍2👀1
Media is too big
VIEW IN TELEGRAM
Гауссианы в Супермэне
В фильме «Супермен» компания Framestore использовала гауссианы для создания "голограмм" с родителями Супермена. В отличие от звездновойновских плоских голограмм, для эффекта поврежденного изображения использовали 3D-деформации
Сцену снимали почти 200 камер одновременно. Это чтобы вы не думали что можете сделать настолько качественно у себя дома.Но кто сказал что у себя дома надо так упарываться? Сами посудите, стоит этот глюк 200 камер и 5-миллионодалларовой смены (цифра от балды, но не думаю что далеко от истины)?
Процесс создания включал следующие этапы:
студия Infinite Realities записала актёров (Брэдли Купера и Анжелу Сарафян) с помощью примерно двухсот камер
данные были обработаны и преобразованы в последовательность PLY-файлов, представляющих дествие в 3D
команда Framestore внесла творческие изменения, например, создала эффект «повреждённой передачи», когда части изображения ненадолго смещаются или сбиваются, а затем снова собираются в такт диалогу
композитинг был выполнен в Nuke с минимальным вмешательством, что позволило сохранить естественность изображения. Использовали плагин Gaussian Splatting for Nuke
Технологияякобы позволила избежать затрат на создание цифрового двойника и дала творческую свободу при редактировании материала.
#кино #news #gaussian
В фильме «Супермен» компания Framestore использовала гауссианы для создания "голограмм" с родителями Супермена. В отличие от звездновойновских плоских голограмм, для эффекта поврежденного изображения использовали 3D-деформации
Сцену снимали почти 200 камер одновременно. Это чтобы вы не думали что можете сделать настолько качественно у себя дома.
Процесс создания включал следующие этапы:
студия Infinite Realities записала актёров (Брэдли Купера и Анжелу Сарафян) с помощью примерно двухсот камер
данные были обработаны и преобразованы в последовательность PLY-файлов, представляющих дествие в 3D
команда Framestore внесла творческие изменения, например, создала эффект «повреждённой передачи», когда части изображения ненадолго смещаются или сбиваются, а затем снова собираются в такт диалогу
композитинг был выполнен в Nuke с минимальным вмешательством, что позволило сохранить естественность изображения. Использовали плагин Gaussian Splatting for Nuke
Технология
#кино #news #gaussian
🍌8❤5😁5👍2
Inpaint4Drag: Repurposing Inpainting Models for Drag-Based Image Editing via Bidirectional Warping
Помните эти многообещающие методы редактирования перетаскиванием?
Вот еще один, заявлена работа в рилтайме
работает быстрее, чем FastDrag (в 14 раз) и DragDiffusion (почти в 600 раз)
совместим с различными моделями inpainting, выступая в роли универсального адаптера без необходимости изменения их архитектуры
А так под капотом
— SAM для масок
— Stable Diffusion 1.5 Inpainting Checkpoint для инпейнтинга
— TinyAutoencoder SD (TAESD) для снижения требований к памяти
— LCM (Latent Consistency Model) LoRA для сокращения количества шагов
Код
Колаб - неинтерактивный, там надо маску отдельно предоставить и координаты точек
#drag #imageediting #realtime
Помните эти многообещающие методы редактирования перетаскиванием?
Вот еще один, заявлена работа в рилтайме
работает быстрее, чем FastDrag (в 14 раз) и DragDiffusion (почти в 600 раз)
совместим с различными моделями inpainting, выступая в роли универсального адаптера без необходимости изменения их архитектуры
А так под капотом
— SAM для масок
— Stable Diffusion 1.5 Inpainting Checkpoint для инпейнтинга
— TinyAutoencoder SD (TAESD) для снижения требований к памяти
— LCM (Latent Consistency Model) LoRA для сокращения количества шагов
Код
Колаб - неинтерактивный, там надо маску отдельно предоставить и координаты точек
#drag #imageediting #realtime
👍9
HunyuanImage-2.1
Новая версия генератора картинок от Tencent
— создаёт изображения в 2K с кинематографичной композицией
— понимает сложные промты длиной до 1000 токенов
— точно контролирует генерацию нескольких объектов в одном изображении
— сохраняет точные тексты и мельчайшие детали в изображениях
— использует двойной текстовый энкодер: общий и учитывающий характеристики персонажей, что помогает лучше понимать описания сцен и действий
— ускоряет вывод данных благодаря технологии Meanflow, сокращая количество шагов с 100 до 8
— улучшайзер промптов Hunyuan PromptEnhancer улучшает семантику генерируемых изображений.
Модель доступна в полной и дистиллированной версиях, каждая из которых занимает около 34 ГБ.
Готовьте 59 GB VRAM под одну картинку 2048x2048
Попробовать на офсайте
Демо на HF лежит без чувств
Гитхаб
HF
#text2image
Новая версия генератора картинок от Tencent
— создаёт изображения в 2K с кинематографичной композицией
— понимает сложные промты длиной до 1000 токенов
— точно контролирует генерацию нескольких объектов в одном изображении
— сохраняет точные тексты и мельчайшие детали в изображениях
— использует двойной текстовый энкодер: общий и учитывающий характеристики персонажей, что помогает лучше понимать описания сцен и действий
— ускоряет вывод данных благодаря технологии Meanflow, сокращая количество шагов с 100 до 8
— улучшайзер промптов Hunyuan PromptEnhancer улучшает семантику генерируемых изображений.
Модель доступна в полной и дистиллированной версиях, каждая из которых занимает около 34 ГБ.
Готовьте 59 GB VRAM под одну картинку 2048x2048
Попробовать на офсайте
Демо на HF лежит без чувств
Гитхаб
HF
#text2image
👍7
Contrastive Flow Matching
Метод обучения диффузных генераторов, позволяющий сократить время обучения (до 9 раз) и количество шагов на инференсе (до 5 раз) и при этом повысить качество изображения
Метод поощряет модель генерировать несхожие потоки для различных входных условий.
Совместим с другими методами, например, с REPA и classifier-free guidance (CFG)
Ну ждем теперь чтобы переобучили заново Flux и Wan если все так радужно
[UPDATE] пишут что воплотить метод в коде можно двумя строчками
вместо официальных 60 строк
Гитхаб
#optimization
Метод обучения диффузных генераторов, позволяющий сократить время обучения (до 9 раз) и количество шагов на инференсе (до 5 раз) и при этом повысить качество изображения
Метод поощряет модель генерировать несхожие потоки для различных входных условий.
Совместим с другими методами, например, с REPA и classifier-free guidance (CFG)
Ну ждем теперь чтобы переобучили заново Flux и Wan если все так радужно
[UPDATE] пишут что воплотить метод в коде можно двумя строчками
cfm_target = torch.roll(flow_target, shifts=1, dims=0)
cfm_loss = -((model_output - cfm_target) ** 2).mean() * λ
вместо официальных 60 строк
Гитхаб
#optimization
💯10👍6😁2🤔1😱1
ToonOut: Fine-tuned Background Removal for Anime Characters
Удаление фона с изображений в аниме-стиле.
Создан на основе модели BiRefNet
Код - среда настроена на 2 x 4090, под другое железо вероятно придется что-то перенастроить
HF
#backgroundremoval #segmentation #image2mask #matting
Удаление фона с изображений в аниме-стиле.
Создан на основе модели BiRefNet
Код - среда настроена на 2 x 4090, под другое железо вероятно придется что-то перенастроить
HF
#backgroundremoval #segmentation #image2mask #matting
👍7❤1
Seedream 4.0
Генератонр-редактор изображений от ByteDance, конкурент NanoBanana
— объединяет генерацию и редактирование в одной архитектуре
— справляется со сложными задачами
— создаёт изображения в 4K
— обрабатывает несколько изображений сразу
— редактирует изображения по текстовому запросу
— преобразует изображения в разные стили
Fal.ai - платно
Replicate - платно
Krea.ai - платно
Промпт гайд
Арена - тут попадаются работы Seedream 4, можно только голосовать
lmarena - сюда не завезли еще
Короче, не нашел бесплатно попробовать🤩
#imageediting #text2image #image2image
Генератонр-редактор изображений от ByteDance, конкурент NanoBanana
— объединяет генерацию и редактирование в одной архитектуре
— справляется со сложными задачами
— создаёт изображения в 4K
— обрабатывает несколько изображений сразу
— редактирует изображения по текстовому запросу
— преобразует изображения в разные стили
Fal.ai - платно
Replicate - платно
Krea.ai - платно
Промпт гайд
Арена - тут попадаются работы Seedream 4, можно только голосовать
lmarena - сюда не завезли еще
Короче, не нашел бесплатно попробовать
#imageediting #text2image #image2image
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥7👍3❤2
Media is too big
VIEW IN TELEGRAM
Hailuo AI (MiniMax) проводит челлендж, связанный с созданием историй с помощью Hailuo Start/End Frames. Участники должны создать историю длительностью более 15 секунд, поделиться ей в социальных сетях (X, IG, TT, YT), отметить @Hailuo_AI и использовать хэштег #HailuoUnlimitedFrames
Челлендж продлится до 17 сентября 16:00 (UTC+8).
Призы:
- 5 подписок MAX Hailuo для самых вирусных постов;
- 10 наград по 2000 кредитов для самых креативных работ.
Ну и самое главное:
‼️ На эти 7 дней всем дают безлимитные бесплатные генерации по первому и последнему кадру. ЧЕСТНЫЕ бесплатные, а не платные бесплатные как у сами знаете кого
Бежим генерить!
#image2video #flf #giveaway
Челлендж продлится до 17 сентября 16:00 (UTC+8).
Призы:
- 5 подписок MAX Hailuo для самых вирусных постов;
- 10 наград по 2000 кредитов для самых креативных работ.
Ну и самое главное:
Бежим генерить!
#image2video #flf #giveaway
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4
Нейронавт | Нейросети в творчестве
Seedream 4.0 Генератонр-редактор изображений от ByteDance, конкурент NanoBanana — объединяет генерацию и редактирование в одной архитектуре — справляется со сложными задачами — создаёт изображения в 4K — обрабатывает несколько изображений сразу — редактирует…
Virtual Try On (Seedream V4)
Вот здесь можете попробовать Seedream 4 в переодевании если у вас есть кредиты на glif.app
Заходить через 3 буквы
#tryon
Вот здесь можете попробовать Seedream 4 в переодевании если у вас есть кредиты на glif.app
Заходить через 3 буквы
#tryon
👍3👀2
K2 Think
Передовая производительность при всего 32B параметров, конкурирует с моделями Open AI и DeepSeek с сотнями миллиардов параметров.
Русский знает, на вопрос ответил моментально
Гитхаб
HF
Демо на HF
Чат на офсайте
#reasoning #assistant #chat
самая быстрая в мире модель искусственного интеллекта с открытым исходным кодом и самая продвинутая система ИИ-рассуждений
Передовая производительность при всего 32B параметров, конкурирует с моделями Open AI и DeepSeek с сотнями миллиардов параметров.
Русский знает, на вопрос ответил моментально
Гитхаб
HF
Демо на HF
Чат на офсайте
#reasoning #assistant #chat
👍9