MoCha: End-to-End Video Character Replacement without Structural Guidance
Замена персонажей на видео на базе WAN 2.1
Насчет названия, есть программа для трекинга с таким названием, и мы уже 15 лет назад насмеялись. Правильное произношение: мока
Итак, что заявлено:
— не требует сложного управляющего контролнет-видео
— работает с одной маской для первого кадра
— поддерживает несколько референсных изображений
— создаёт видео с согласованным освещением, анимацией и выражениями лица
— хорошо справляется со сложными сценариями, позами
— точно воспроизводит действия и выражения исходного видео.
По факту я вижу 3D рендер вместо живых персонажей. Ну и этому инструменту применение найдется
Должно работать в ComfyUI-WanVideoWrapper
Гитхаб
HF
Kijai
воркфлоу
#faceswap #characterswap #wan #workflow
Замена персонажей на видео на базе WAN 2.1
Итак, что заявлено:
— не требует сложного управляющего контролнет-видео
— работает с одной маской для первого кадра
— поддерживает несколько референсных изображений
— создаёт видео с согласованным освещением, анимацией и выражениями лица
— хорошо справляется со сложными сценариями, позами
— точно воспроизводит действия и выражения исходного видео.
По факту я вижу 3D рендер вместо живых персонажей. Ну и этому инструменту применение найдется
Должно работать в ComfyUI-WanVideoWrapper
Гитхаб
HF
Kijai
воркфлоу
#faceswap #characterswap #wan #workflow
👍14❤1😁1
Grokipedia
Состоялся угон википедии.
Википедия теряет живых посетителей, люди все реже обращаются к ней и все чаще к языковым моделям.
Но количество ИИ-обращений растет. И не только почитать но и отредактировать. В связи с чем Википедии пришлось придумывать методы защиты от автоматизированного редактирования статей.
Тем временем Илон Маск выкатил свою википедию с блэкджеком и информацией, проверенной Grok'ом.
Интересно, откуда берется материал для статей
Пока только на английском
#news #tools
Состоялся угон википедии.
Википедия теряет живых посетителей, люди все реже обращаются к ней и все чаще к языковым моделям.
Но количество ИИ-обращений растет. И не только почитать но и отредактировать. В связи с чем Википедии пришлось придумывать методы защиты от автоматизированного редактирования статей.
Тем временем Илон Маск выкатил свою википедию с блэкджеком и информацией, проверенной Grok'ом.
Интересно, откуда берется материал для статей
Пока только на английском
#news #tools
👍8😁3
Что-то я устал от новостей, сегодня в ленивом режиме.
А если вам не хватает новостей, придумайте сами. Самые интересные опубликуем если таковые будут.
С тегом #фейкньюс конечно
А если вам не хватает новостей, придумайте сами. Самые интересные опубликуем если таковые будут.
С тегом #фейкньюс конечно
👍4🌚1
Media is too big
VIEW IN TELEGRAM
Hailuo 2.3
Обновка видеогенератора от Minimax
Два режима:
Hailuo 2.3 — Кинематографический реализм и профессиональная точность изображения
Hailuo 2.3 Fast — Быстрее, легче и доступнее
Дают бесплатно 4 видео ежедневно
#text2video #image2video
Обновка видеогенератора от Minimax
Два режима:
Hailuo 2.3 — Кинематографический реализм и профессиональная точность изображения
Hailuo 2.3 Fast — Быстрее, легче и доступнее
Дают бесплатно 4 видео ежедневно
#text2video #image2video
❤7👍3
Media is too big
VIEW IN TELEGRAM
Odyssey-2
Интерактивный генератор видео в реальном времени, 20fps.
Можно кидать промпты прямо на лету, влияя на дальнейший ход видео
А вот как его потом скачать я не нашел. Но можно шерить ссылки
Поиграть можно здесь
#text2video #realtime #streaming
Интерактивный генератор видео в реальном времени, 20fps.
Можно кидать промпты прямо на лету, влияя на дальнейший ход видео
А вот как его потом скачать я не нашел. Но можно шерить ссылки
Поиграть можно здесь
#text2video #realtime #streaming
👍8
Generative Omnimatte: Learning to Decompose Video into Layers
Модель от Google DeepMind раскладывает видео на слои (omnimatte-слои), где каждый слой содержит полностью видимый объект и связанные с ним эффекты, например, тени и отражения.
Использует генеративные и семантические данные для дополнения скрытых пикселей и точного связывания эффектов с объектами
Код - тут неофициальная реимплементация на основе CogVideoX и Wan2.1, которая, как признают авторы, чуть слабее чем официальная Casper на основе Lumiere
Спасибо @Ildar_Idrisov
#video2matte #video2mask #rgb2rgba #segmentation
Модель от Google DeepMind раскладывает видео на слои (omnimatte-слои), где каждый слой содержит полностью видимый объект и связанные с ним эффекты, например, тени и отражения.
Использует генеративные и семантические данные для дополнения скрытых пикселей и точного связывания эффектов с объектами
Код - тут неофициальная реимплементация на основе CogVideoX и Wan2.1, которая, как признают авторы, чуть слабее чем официальная Casper на основе Lumiere
Спасибо @Ildar_Idrisov
#video2matte #video2mask #rgb2rgba #segmentation
🔥12👍4
This media is not supported in your browser
VIEW IN TELEGRAM
Elevenlabs VOICE ISOLATOR
Elevenlabs запустили функцию очистки голосовых записей от шумов.
Прямой конкурент Adobe podcast
На бесплатном тарифе дают 10 минут обработать бесплатно
Но я смог потестить инкогнито, не логинясь...
Но надо притвориться что вы не в России.
Результат кину в коменты, и для сравнения результат от Adobe
#audio2audio #audiodenoise #audioenhance #enhance #voiceseparation #demix
Elevenlabs запустили функцию очистки голосовых записей от шумов.
Прямой конкурент Adobe podcast
На бесплатном тарифе дают 10 минут обработать бесплатно
Но я смог потестить инкогнито, не логинясь...
Но надо притвориться что вы не в России.
Результат кину в коменты, и для сравнения результат от Adobe
#audio2audio #audiodenoise #audioenhance #enhance #voiceseparation #demix
👍9❤1
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
This media is not supported in your browser
VIEW IN TELEGRAM
Адобченко поднимает веки. Генерация и редактирование по слоям.
Много новостей прилетело изподадоба. На пару постов.
Прежде всего они выпустили Firefly Image Model 5 и там есть редактирование и слои.
Картинка генерится сразу со слоями, каждый слой можно перегенерировать, таскать по картинке, вращать, масштабировать - перегенерация почти мгновенная.
А как он бьет на слои, спросите вы?
А примерно также как в Reve.art - сегментацией картинки на объекты внутри общей композиции. Сколько нашел, cтолько слоев и сделал. Влиять на это нельзя.
Также можно заметить, что при перегенерации\редактировании слоя-объекта он чуть шевелит остальные "слои", что в принципе малозаметно и в пределах погрешностей редактирующих генераторов. Круто, что тени и отражения отрабатываются с учетом "отношений" между объектами.
В общем у Адобченко теперь своя Нанабанана со своим интерфейсом (это не отменяет того факта что гугловая Нанабанана также присутствует в списке "прочих моделей" уже некоторое время).
На видео заметно, что с текстом вообще-то беда. Но в любом случае, чем больше редактирующих моделей, да еще и с хорошим UI\UX - тем лучше.
@cgevent
Много новостей прилетело изподадоба. На пару постов.
Прежде всего они выпустили Firefly Image Model 5 и там есть редактирование и слои.
Картинка генерится сразу со слоями, каждый слой можно перегенерировать, таскать по картинке, вращать, масштабировать - перегенерация почти мгновенная.
А как он бьет на слои, спросите вы?
А примерно также как в Reve.art - сегментацией картинки на объекты внутри общей композиции. Сколько нашел, cтолько слоев и сделал. Влиять на это нельзя.
Также можно заметить, что при перегенерации\редактировании слоя-объекта он чуть шевелит остальные "слои", что в принципе малозаметно и в пределах погрешностей редактирующих генераторов. Круто, что тени и отражения отрабатываются с учетом "отношений" между объектами.
В общем у Адобченко теперь своя Нанабанана со своим интерфейсом (это не отменяет того факта что гугловая Нанабанана также присутствует в списке "прочих моделей" уже некоторое время).
На видео заметно, что с текстом вообще-то беда. Но в любом случае, чем больше редактирующих моделей, да еще и с хорошим UI\UX - тем лучше.
@cgevent
😱7❤3🔥3
10-шаговый WAN 2.2 от подписчика.
Интегрирована лора lightx rank 256 bf16
на данный момент есть модели fp16, fp8 и q8_0
https://huggingface.co/StefanFalkok/Wan_2.2_10steps/tree/main
https://huggingface.co/StefanFalkok/Wan_2.2_10steps_GGUF/tree/main
Спасибо @stefanfalkok
#gguf #optimization
Интегрирована лора lightx rank 256 bf16
на данный момент есть модели fp16, fp8 и q8_0
https://huggingface.co/StefanFalkok/Wan_2.2_10steps/tree/main
https://huggingface.co/StefanFalkok/Wan_2.2_10steps_GGUF/tree/main
Спасибо @stefanfalkok
#gguf #optimization
👍17🔥4❤3
LightVAE и LightTAE
Оптимизация VAE wan 2.1 и wan 2.2 от команды LightX2V
— LightVAE - баланс между качеством, скоростью и памятью, потребляет примерно на 50 % меньше памяти, чем официальные модели, работает в 2–3 раза быстрее
— LightTAE - использует минимум памяти (около 0,4 ГБ), работает быстрее официальных VAE более чем в 10 раз и превосходит открытые TAE-модели
Поддерживают различные форматы, включая BF16 и FP8.
HF
ComfyUI-LightVAE
Спасибо @m_franz
#wan22 #optimization
Оптимизация VAE wan 2.1 и wan 2.2 от команды LightX2V
— LightVAE - баланс между качеством, скоростью и памятью, потребляет примерно на 50 % меньше памяти, чем официальные модели, работает в 2–3 раза быстрее
— LightTAE - использует минимум памяти (около 0,4 ГБ), работает быстрее официальных VAE более чем в 10 раз и превосходит открытые TAE-модели
Поддерживают различные форматы, включая BF16 и FP8.
HF
ComfyUI-LightVAE
Спасибо @m_franz
#wan22 #optimization
👍14🔥6
Media is too big
VIEW IN TELEGRAM
Cursor 2.0
В обновлении ИИ-кодера представлена собственная модель-программист — Composer, в 4 раза быстрее аналогичных моделей, умеет эффективно работать с большими кодовыми базами благодаря встроенному семантическому поиску. По метрикам отстает лишь от от GPT-5 и Sonnet 4.5.
— новый интерфейс, ориентированный на работу с агентами, а не с файлами
— появилась возможность запускать множество агентов параллельно без взаимного влияния, используя git worktrees или удалённые машины
— упрощён процесс просмотра изменений, внесённых агентами, и углублённого анализа кода
— добавлен встроенный инструмент для тестирования работы агентов и итеративного улучшения результатов
— добавлен голосовой режим
Скачать
#coding #windows #macos #linux #desktop #vibecoding
В обновлении ИИ-кодера представлена собственная модель-программист — Composer, в 4 раза быстрее аналогичных моделей, умеет эффективно работать с большими кодовыми базами благодаря встроенному семантическому поиску. По метрикам отстает лишь от от GPT-5 и Sonnet 4.5.
— новый интерфейс, ориентированный на работу с агентами, а не с файлами
— появилась возможность запускать множество агентов параллельно без взаимного влияния, используя git worktrees или удалённые машины
— упрощён процесс просмотра изменений, внесённых агентами, и углублённого анализа кода
— добавлен встроенный инструмент для тестирования работы агентов и итеративного улучшения результатов
— добавлен голосовой режим
Скачать
#coding #windows #macos #linux #desktop #vibecoding
👍3
INFINITE AI WEB
Смотрите какая штука. Этак же можно подсунуть кому-нибудь фейковый интернет.
Динамический генератор веб-контента на Gemini 2.0 Flash
Создаёт контент для любого URL-адреса, достаточно ввести путь в браузере. Потом можно кликнуть на какую-нибудь ссылку на этой странице и перейти на новую сгенерированную страницу
#text2site #text2web
Смотрите какая штука. Этак же можно подсунуть кому-нибудь фейковый интернет.
Динамический генератор веб-контента на Gemini 2.0 Flash
Создаёт контент для любого URL-адреса, достаточно ввести путь в браузере. Потом можно кликнуть на какую-нибудь ссылку на этой странице и перейти на новую сгенерированную страницу
#text2site #text2web
👍7😁2😱1
Forwarded from CGIT_Vines (Marvin Heemeyer)
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Адоб со своими продуктами превратился в нейрокомбайн и фичи которые показывали на конференции реально сильно меняют индустрию, фото и видео. Продукты адоб с нейронками и без это, как компьютер с интернетом и без.
1. Сегментация звука и разбивка по источникам звука которые можно редактировать.
2. Транскрибция голоса и редактирование отдельных слов с сохранением консистентности голоса говорящего 🤌
3. Изменение наративного повествования с добавлением эмоции в голос (шепот, грусть, уверенность и т.д.)
4. Релайт сцены с предварительным переводом сцены в драфт 3D.
5. Выделение некоторых объектов на видео и перевод их в 3D с текстурами, объекты можно вращать, менять перспективу под ракурс и потом апскейлить, если текстурки немного пожались при искажениях ☠️
6. Удаление источника света который дает засвет в кадр, с изменением самого кадра!
Там еще много чего, и так будете опять на меня орать, что видео много качать😭
Всю трех часовую конфу можно посмотреть на YT
@CGIT_Vines
1. Сегментация звука и разбивка по источникам звука которые можно редактировать.
2. Транскрибция голоса и редактирование отдельных слов с сохранением консистентности голоса говорящего 🤌
3. Изменение наративного повествования с добавлением эмоции в голос (шепот, грусть, уверенность и т.д.)
4. Релайт сцены с предварительным переводом сцены в драфт 3D.
5. Выделение некоторых объектов на видео и перевод их в 3D с текстурами, объекты можно вращать, менять перспективу под ракурс и потом апскейлить, если текстурки немного пожались при искажениях ☠️
6. Удаление источника света который дает засвет в кадр, с изменением самого кадра!
Там еще много чего, и так будете опять на меня орать, что видео много качать
Всю трех часовую конфу можно посмотреть на YT
@CGIT_Vines
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥9❤1🤷♂1👍1😁1