INFP: Audio-Driven Interactive Head Generation in Dyadic Conversations
Bytedance продолжают изобретать способы оживлять картинки
Интерактивная генерация головы на основе звука для диадических (парных) разговоров
Получив две дорожки диалога и одно портретное изображение произвольного агента, INFP динамически синтезирует вербальные, невербальные и интерактивные видео агента с реалистичной мимикой и ритмичными движениями позы головы.
Короче, заставит портрет говорить, петь, человечно слушать
Работает в реальном времени, 40 fps на Nvidia Tesla A10
Применимо например для видеоконференций
Код ждем
#audio2video #talkinghead #image2video #portraitanimation #realtime
Bytedance продолжают изобретать способы оживлять картинки
Интерактивная генерация головы на основе звука для диадических (парных) разговоров
Получив две дорожки диалога и одно портретное изображение произвольного агента, INFP динамически синтезирует вербальные, невербальные и интерактивные видео агента с реалистичной мимикой и ритмичными движениями позы головы.
Короче, заставит портрет говорить, петь, человечно слушать
Работает в реальном времени, 40 fps на Nvidia Tesla A10
Применимо например для видеоконференций
Код ждем
#audio2video #talkinghead #image2video #portraitanimation #realtime
🔥12👏2❤1👍1🤡1
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
Media is too big
VIEW IN TELEGRAM
Ну, за мультипликаторов.
Тут Гугль неожиданно выкатил вот такую интересную работу.
И мультик.
Для каждого персонажа свой файнтюн(?!, да, там LoadCheckPoint + Dreambooth SDXL). По 12-то картинкам.
Эти файнтюны генерят кривые руки и пропорции - их корректируют через Depth и Canny контролнеты.
В ComfyUI.
Там же сегментируют персонажей с помощью Dino и SAM.
Часть картинок анимируют с помощью AnimateDiff + DaVinci+Nuke.
А часть - просто ригают и анимируют в Adobe Character Animator.
(Тут мы перестаем пить за мультипликаторов и вопросительно поднимаем бровь). Гугль, это что вообще?
Гугль: это ассистент для аниматоров.
"В рамках этого пилотного проекта мы вместе с художниками разрабатывали новые рабочие процессы для 2D-анимации, одновременно создавая короткометражный образовательный мультфильм. Мы определили несколько рабочих процессов, которые позволят упростить процесс анимации и более эффективно воплотить замыслы художников на экране."
Кода или воркфлоу для Комфи я не нашел.
Но есть кожаные сценарии для эпизодов.
Странная работа.
https://genai-2d-character-animation.github.io/
Тут Гугль неожиданно выкатил вот такую интересную работу.
И мультик.
Для каждого персонажа свой файнтюн(?!, да, там LoadCheckPoint + Dreambooth SDXL). По 12-то картинкам.
Эти файнтюны генерят кривые руки и пропорции - их корректируют через Depth и Canny контролнеты.
В ComfyUI.
Там же сегментируют персонажей с помощью Dino и SAM.
Часть картинок анимируют с помощью AnimateDiff + DaVinci+Nuke.
А часть - просто ригают и анимируют в Adobe Character Animator.
(Тут мы перестаем пить за мультипликаторов и вопросительно поднимаем бровь). Гугль, это что вообще?
Гугль: это ассистент для аниматоров.
"В рамках этого пилотного проекта мы вместе с художниками разрабатывали новые рабочие процессы для 2D-анимации, одновременно создавая короткометражный образовательный мультфильм. Мы определили несколько рабочих процессов, которые позволят упростить процесс анимации и более эффективно воплотить замыслы художников на экране."
Кода или воркфлоу для Комфи я не нашел.
Но есть кожаные сценарии для эпизодов.
Странная работа.
https://genai-2d-character-animation.github.io/
👍4❤1🤡1
ComfyUI wrapper nodes for HunyuanVideo
Kijai уже прикрутил улучшайзер видеогенерации Enhance-A-Video в свой #ComfyUI пакет
Спасибо @Skubidoo
#text2video
Kijai уже прикрутил улучшайзер видеогенерации Enhance-A-Video в свой #ComfyUI пакет
Спасибо @Skubidoo
#text2video
❤13👍3🔥2🤡1
Deep Fourier-based Arbitrary-scale Super-resolution for Real-time Rendering
Свежий апскейлер, рилтайм.
Отличительная особенность - повышает разрешение изображения в любое количество раз.
Судя по всему, предназначен для повышения разрешения рендера игровых движков
Код
Видео от двухминутного доктора
#upscale #realtime
Свежий апскейлер, рилтайм.
Отличительная особенность - повышает разрешение изображения в любое количество раз.
Судя по всему, предназначен для повышения разрешения рендера игровых движков
Код
Видео от двухминутного доктора
#upscale #realtime
👍10🔥7❤1🤡1
Вы хотели мемов? Сначала опрос.
На сколько других каналов про ИИ и нейросети ты подписан
На сколько других каналов про ИИ и нейросети ты подписан
Anonymous Poll
4%
Подписан только на этот
21%
1-3
38%
4-7 каналов
37%
Много. Нейронавт лишь пылинка в космической бездне моих подписок
❤3🤡2👍1🎃1
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
This media is not supported in your browser
VIEW IN TELEGRAM
Японский метаверс. Now!
Полная копия Токио.
На сайте Пойнт клауды и CityJSON.
Выглядит как полный цифровой близнец, особенно с информацией про автобусы.
Качать и смотреть отсюда:
https://info.tokyo-digitaltwin.metro.tokyo.lg.jp/3dmodel/
Пошуруйте по сайту, интересный
@cgevent
Полная копия Токио.
На сайте Пойнт клауды и CityJSON.
Выглядит как полный цифровой близнец, особенно с информацией про автобусы.
Качать и смотреть отсюда:
https://info.tokyo-digitaltwin.metro.tokyo.lg.jp/3dmodel/
Пошуруйте по сайту, интересный
@cgevent
🔥10
Media is too big
VIEW IN TELEGRAM
3DHM: Synthesizing Moving People with 3D Control
Анимация персонажей в полный рост по одному изображению персонажа и образцу движения.
Новый оживлятор человеков в полный рост
Код ждем
#image2video #humananimation #pose2video
Анимация персонажей в полный рост по одному изображению персонажа и образцу движения.
Новый оживлятор человеков в полный рост
Код ждем
#image2video #humananimation #pose2video
🔥6
This media is not supported in your browser
VIEW IN TELEGRAM
ltx-video-0.9-vae-finetune
реддитор сделал файнтюн VAE видеогенератора LTX для борьбы с артефактами
Реддит
#finetune #text2video #video2video #image2video
реддитор сделал файнтюн VAE видеогенератора LTX для борьбы с артефактами
Реддит
#finetune #text2video #video2video #image2video
🔥15
This media is not supported in your browser
VIEW IN TELEGRAM
HSfM: Reconstructing People, Places, and Cameras
В Беркли придумали новый метод, который совместно реконструирует 3D людей, сцену и камеры из небольшого набора некалиброванных изображений
Посмотреть демо реконструкции
Кода нет
#image2scene #imageto3d #humanreconstruction #camera
В Беркли придумали новый метод, который совместно реконструирует 3D людей, сцену и камеры из небольшого набора некалиброванных изображений
Посмотреть демо реконструкции
Кода нет
#image2scene #imageto3d #humanreconstruction #camera
🔥5
УСПЕТЬ ДО НОВОГО ГОДА
Каждый год мы все воодушевленные ставим цели, но потом что-то идет не по плану…
🎁 А ЧТО ЕСЛИ?
Попасть в закрытую тусовку топовых экспертов, подготовиться и стартануть 2025 год с новыми знаниями
А ещё, прокачать свои навыки, окружение и результаты за последнюю неделю уходящего года — абсолютно БЕСПЛАТНО?
Мы с экспертами подумали над этим… и уверенно говорим ПОГНАЛИ!
НО! Просто собрать папку экспертов и сделать канал было бы слишком скучно!
🥁🥁🥁
я представляю тебе…
✨ Новогодний корпоратив экспертов
где каждый день ты будешь читать ценные тосты и узнавать что-то новое и полезное: идеи, бонусы, разборы и шаги для роста!
👥 5 топовых экспертов уже готовы делиться своим опытом и знаниями
🎄 Плюс к этому ты получаешь:
• комьюнити заряженных людей, готовых расти вместе с тобой
• возможность задать любой вопрос экспертам лично
• ежедневные сюрпризы и подарки, которые реально ценны.
✨ короче, это не просто движуха, а настоящий шанс сделать свой рывок и заработать в Новом году
Жми на ссылку, заходи на Корпоратив и забирай свои бонусы 👇🏻
@ExpertPartyBot
@ExpertPartyBot
@ExpertPartyBot
Не упусти свой шанс — впитать самые актуальные связки, идеи, знания и опыт, чтобы сделать заветную сумму💵
Каждый год мы все воодушевленные ставим цели, но потом что-то идет не по плану…
Попасть в закрытую тусовку топовых экспертов, подготовиться и стартануть 2025 год с новыми знаниями
А ещё, прокачать свои навыки, окружение и результаты за последнюю неделю уходящего года — абсолютно БЕСПЛАТНО?
Мы с экспертами подумали над этим… и уверенно говорим ПОГНАЛИ!
НО! Просто собрать папку экспертов и сделать канал было бы слишком скучно!
🥁🥁🥁
я представляю тебе…
где каждый день ты будешь читать ценные тосты и узнавать что-то новое и полезное: идеи, бонусы, разборы и шаги для роста!
👥 5 топовых экспертов уже готовы делиться своим опытом и знаниями
• комьюнити заряженных людей, готовых расти вместе с тобой
• возможность задать любой вопрос экспертам лично
• ежедневные сюрпризы и подарки, которые реально ценны.
✨ короче, это не просто движуха, а настоящий шанс сделать свой рывок и заработать в Новом году
Жми на ссылку, заходи на Корпоратив и забирай свои бонусы 👇🏻
@ExpertPartyBot
@ExpertPartyBot
@ExpertPartyBot
Не упусти свой шанс — впитать самые актуальные связки, идеи, знания и опыт, чтобы сделать заветную сумму
Please open Telegram to view this post
VIEW IN TELEGRAM
👎9👍4❤1🔥1💩1
SimpleTuner v1.2.2
Обновился инструмент для дообучения диффузных генераторов.
Добавлена поддержка Sana и исправлены баги с обучением SD3.5 (Large + Medium)
реддит
#finetuning
Обновился инструмент для дообучения диффузных генераторов.
Добавлена поддержка Sana и исправлены баги с обучением SD3.5 (Large + Medium)
реддит
#finetuning
🔥8
Stable Diffusion 3.5 Medium Turbo (SD3.5M Turbo)
Высокопроизводительная дистиллированная версия картинкогенератора #SD35 Medium от Tensorart
Поддерживает лоры
#optimization #text2image
Высокопроизводительная дистиллированная версия картинкогенератора #SD35 Medium от Tensorart
Поддерживает лоры
#optimization #text2image
👍9
Звезда фильмов для взрослых Хлоя Амур продала свой облик ИИ-компании чтобы получать отчисления с вебкам-бота не работая
#news #adult
#news #adult
😁14👍7👀4🔥2🤮1
OminiControl Training
Опубликован код обучения универсального управляемого генератора изображений OminiControl
Можете обучить свой собственный OminiControl на базе #flux с любым управлением - примерка, 3D, поза или что-либо еще что придумаете.
Только запаситесь двумя NVIDIA H100, 80GB VRAM. Непонятно почему двумя, ведь столько памяти у одной H100, но по ссылке написано именно так
#finetuning #training #conditioning #text2image
Опубликован код обучения универсального управляемого генератора изображений OminiControl
Можете обучить свой собственный OminiControl на базе #flux с любым управлением - примерка, 3D, поза или что-либо еще что придумаете.
Только запаситесь двумя NVIDIA H100, 80GB VRAM. Непонятно почему двумя, ведь столько памяти у одной H100, но по ссылке написано именно так
#finetuning #training #conditioning #text2image
👍5
DeepSeek V3
Крупнейшая модель в опенсорсе, конкурирует с Sonnet 3.5 и GPT-4o. Превосходит Llama 405B. Особенно хорош в кодинге и математике.
Архитектурно - совет экспертов, рассуждающие модели еще не превзошел
Уже на Чатбот арене
HF
Чат
#assistant #moe
Крупнейшая модель в опенсорсе, конкурирует с Sonnet 3.5 и GPT-4o. Превосходит Llama 405B. Особенно хорош в кодинге и математике.
Архитектурно - совет экспертов, рассуждающие модели еще не превзошел
Уже на Чатбот арене
HF
Чат
#assistant #moe
❤9