LivingSwap. Preserving Source Video Realism: High-Fidelity Face Swapping for Cinematic Quality
"Качественная" замена лиц на видео с сохранением реалистичности исходного видеоматериала.
Фокус на качестве уровня кино.
Использует ключевые кадры как сигналы для внедрения целевой идентичности, что позволяет гибко и контролируемо редактировать видео
— в отличие от GAN-методов не страдает от мерцания и дрожания в длинных последовательностях
— в сравнении с диффузионными моделями лучше сохраняет мелкие детали и избегает несоответствий с претренированными данными
— эффективнее методов на основе инпейнтинга в сохранении мелких деталей и избежании визуальных артефактов
— лучше адаптируется к длинным видео благодаря стратегии временного сшивания и использованию ключевых кадров
Базовая модель — VACE 14B
Код ждем
#faceswap #videoediting
"Качественная" замена лиц на видео с сохранением реалистичности исходного видеоматериала.
Фокус на качестве уровня кино.
Первая модель для замены лиц, которая применяет подход с использованием видеоэталона
Использует ключевые кадры как сигналы для внедрения целевой идентичности, что позволяет гибко и контролируемо редактировать видео
— в отличие от GAN-методов не страдает от мерцания и дрожания в длинных последовательностях
— в сравнении с диффузионными моделями лучше сохраняет мелкие детали и избегает несоответствий с претренированными данными
— эффективнее методов на основе инпейнтинга в сохранении мелких деталей и избежании визуальных артефактов
— лучше адаптируется к длинным видео благодаря стратегии временного сшивания и использованию ключевых кадров
Базовая модель — VACE 14B
Код ждем
#faceswap #videoediting
🔥20👍2
StereoWorld: Geometry-Aware Monocular-to-Stereo Video Generation
#SOTA в создании стереоскопического видео из монокулярного видео с высокой визуальной точностью и геометрической корректностью
Базовая модель — Wan2.1-T2V-1.3B. За оценку глубины отвечает Video Depth Anything
Кто умеет косить глазами для просмотра стерео - ставьте 👀
Кода нет
#novelview #video2video #stereo #mono2stereo
#SOTA в создании стереоскопического видео из монокулярного видео с высокой визуальной точностью и геометрической корректностью
Базовая модель — Wan2.1-T2V-1.3B. За оценку глубины отвечает Video Depth Anything
Кто умеет косить глазами для просмотра стерео - ставьте 👀
Кода нет
#novelview #video2video #stereo #mono2stereo
👀26👍4🔥3😁3❤2
Эпичный тред о потемкинском внедрении Microsoft Copilot в корпорации на 4000+ человек
Copilot был внедрён для 4 000 сотрудников, стоимость составила 30 долларов за место в месяц (1,4 миллиона долларов в год)
Совет директоров быстро одобрил проект, привлечённый фразой «цифровая трансформация», не задавая вопросов о практической пользе.
Через три месяца оказалось, что только 47 человек хотя бы раз воспользовались Copilot, а регулярно его использовали всего 12 человек.
Автор поста использовал Copilot для суммирования письма, которое мог прочитать за 30 секунд, и это заняло у него 45 секунд, плюс время на исправление «галлюцинаций» инструмента.
Несмотря на низкий уровень использования, проект был объявлен успешным, а компания представлена как пример успешного внедрения AI на сайте Microsoft.
Планируется расширение лицензий на 5 000 дополнительных мест, несмотря на то что первые 4 000 практически не используются.
Полный перевод в комментариях
#news #humor
Copilot был внедрён для 4 000 сотрудников, стоимость составила 30 долларов за место в месяц (1,4 миллиона долларов в год)
Совет директоров быстро одобрил проект, привлечённый фразой «цифровая трансформация», не задавая вопросов о практической пользе.
Через три месяца оказалось, что только 47 человек хотя бы раз воспользовались Copilot, а регулярно его использовали всего 12 человек.
Автор поста использовал Copilot для суммирования письма, которое мог прочитать за 30 секунд, и это заняло у него 45 секунд, плюс время на исправление «галлюцинаций» инструмента.
Несмотря на низкий уровень использования, проект был объявлен успешным, а компания представлена как пример успешного внедрения AI на сайте Microsoft.
Планируется расширение лицензий на 5 000 дополнительных мест, несмотря на то что первые 4 000 практически не используются.
Полный перевод в комментариях
#news #humor
😁20❤4👍4🥴1
Qwen3-4B-Z-Image-Engineer: The "Z-Engineer"
ИИ-промптер для Z-Image Turbo на базе Qwen3-4B
Обучен со снятием цензуры по методу Heretic понимать специфические требования этой архитектуры и генерировать детализированные описания
Спасибо @m_franz
#prompting #zimage
ИИ-промптер для Z-Image Turbo на базе Qwen3-4B
Обучен со снятием цензуры по методу Heretic понимать специфические требования этой архитектуры и генерировать детализированные описания
Спасибо @m_franz
#prompting #zimage
huggingface.co
BennyDaBall/qwen3-4b-Z-Image-Engineer · Hugging Face
We’re on a journey to advance and democratize artificial intelligence through open source and open science.
🔥10👍1
Почему все думают что в восстании машин роботы прям сразу захотят убить человеков? Может не сразу. А может и не прям убить
#humor
#humor
😁34😱4🍌3👍1🍾1
RealVideo: A Real-Time Streaming Conversational System Powered by Autoregressive Diffusion Video Generation
Потоковый диалоговый видеогенератор в реальном времени на базе Wan2.2-S2V-14B
На вход подаем свои реплики текстом. Но можно прикрутить и голосовой ввод.
Есть возможность клонирования голоса.
В общем, это видеоперсонаж, с которым можно весити диалог.
Модель авторегрессионная, что позволяет создавать длинные видео без явного продолжения.
Как она AR на базе DiT - понятия не имею.
Голосовыми ответами занимаются GLM-4.5-AirX и GLM-TTS
Гитхаб
HF
#realtime #characteranimation #talkinghead #image2video #audio2video #referencing #wan22
Потоковый диалоговый видеогенератор в реальном времени на базе Wan2.2-S2V-14B
На вход подаем свои реплики текстом. Но можно прикрутить и голосовой ввод.
Есть возможность клонирования голоса.
В общем, это видеоперсонаж, с которым можно весити диалог.
Модель авторегрессионная, что позволяет создавать длинные видео без явного продолжения.
Как она AR на базе DiT - понятия не имею.
Голосовыми ответами занимаются GLM-4.5-AirX и GLM-TTS
Гитхаб
HF
#realtime #characteranimation #talkinghead #image2video #audio2video #referencing #wan22
👍11❤3
BiCo: Composing Concepts from Images and Videos via Concept-prompt Binding
Модель для комбинирования визуальных концептов из изображений и видео на базе Wan2.1-T2V-1.3B
Подаем на вход картинки и видео, описываем что с ними надо сделать.
Гитхаб
#videoediting #compositing #referencing
Модель для комбинирования визуальных концептов из изображений и видео на базе Wan2.1-T2V-1.3B
Подаем на вход картинки и видео, описываем что с ними надо сделать.
Гитхаб
#videoediting #compositing #referencing
👍17❤1
Gaussian Splatting Editing Tutorial with SuperSplat
туториал по работе с гауссианами в SuperSplart
#tutorial #gaussian
туториал по работе с гауссианами в SuperSplart
#tutorial #gaussian
YouTube
Gaussian Splatting Editing Tutorial with SuperSplat
In this tutorial, we explore the completely free to use and open source gaussian splatting editor, SuperSplat.
SuperSplat: https://superspl.at/
SuperSplat GitHub: https://github.com/playcanvas/supersplat
Access the unedited plys here! https://www.patr…
SuperSplat: https://superspl.at/
SuperSplat GitHub: https://github.com/playcanvas/supersplat
Access the unedited plys here! https://www.patr…
🔥4
This media is not supported in your browser
VIEW IN TELEGRAM
Qwen-Image-i2L (Image to LoRA)
Создает лору #qwenimage из одной входной картинки
Есть несколько версий модели, которые можно комбинировать для улучшения результатов:
базовая модель для извлечения стиля, масштабированная версия для сохранения содержания
модель с более высоким разрешением для захвата деталей
и дополнительная модель для приближения сгенерированных изображений к стилю базовой модели Qwen-Image
Демо
#lora #image2lora
Создает лору #qwenimage из одной входной картинки
Есть несколько версий модели, которые можно комбинировать для улучшения результатов:
базовая модель для извлечения стиля, масштабированная версия для сохранения содержания
модель с более высоким разрешением для захвата деталей
и дополнительная модель для приближения сгенерированных изображений к стилю базовой модели Qwen-Image
Демо
#lora #image2lora
👍12❤2🔥2😱1
Нейронавт | Нейросети в творчестве
Disney инвестирует 1 миллиард долларов в OpenAI и заключает лицензионное соглашение, которое позволит юзерам Sora создавать клипы с персонажами из франшиз Marvel, Pixar и Star Wars Пацаны, фальстарт, оказывается нужно было ждать разрешения 🤩 Итак, пользователи…
😁8💯3