Animatable Gaussians: Learning Pose-dependent Gaussian Mapsfor High-fidelity Human Avatar Modeling
Анимируемые аватары человеков на гауссианах по исходному видео с нескольких ракурсов.
Из входного обучающего видео вытаскивает параметрические заготовки для вида спереди и со спины. Далее для динамического моделирования поз прикручен StyleGAN. Модель подстраивается под одежду, все дела.
И, конечно же,
Код
#humanavatar #gaussian #videoto3D #video2avatar #poseto3D
Анимируемые аватары человеков на гауссианах по исходному видео с нескольких ракурсов.
Из входного обучающего видео вытаскивает параметрические заготовки для вида спереди и со спины. Далее для динамического моделирования поз прикручен StyleGAN. Модель подстраивается под одежду, все дела.
И, конечно же,
Эксперименты показывают, что наш метод превосходит другие современные подходы
Код
#humanavatar #gaussian #videoto3D #video2avatar #poseto3D
🔥10🤯2
OneDiff v1.0.0
Обновка ускорителя SD и SVD OneDiff
Ускорение генерации одной строчкой кода
Гитхаб
#text2image #text2video #tools
Обновка ускорителя SD и SVD OneDiff
Ускорение генерации одной строчкой кода
Гитхаб
#text2image #text2video #tools
❤4
This media is not supported in your browser
VIEW IN TELEGRAM
Dough
Управление генерацией видео через Steerable Motion и Motion Director
Код
Дискорд
#video2video #video2motion #motion2video #conditioning
Управление генерацией видео через Steerable Motion и Motion Director
Код
Дискорд
#video2video #video2motion #motion2video #conditioning
🔥22❤3
This media is not supported in your browser
VIEW IN TELEGRAM
Llama 3
Meta AI выпустили мощную языковую модель. Кроме того что она крутая и бесплатная, она еще умеет шустро рисовать. Но пока только для США
Попробовать здесь (включаем VPN США)
Альтернативная ссылка для всех (только генератор текста)
#assistant #chatbot #text2image #llm #vlm
Meta AI выпустили мощную языковую модель. Кроме того что она крутая и бесплатная, она еще умеет шустро рисовать. Но пока только для США
Попробовать здесь (включаем VPN США)
Альтернативная ссылка для всех (только генератор текста)
#assistant #chatbot #text2image #llm #vlm
👍5
ControlNet++: Improving Conditional Controlswith Efficient Consistency Feedback
Новый улучшенный контролнет.
Новый подход, который улучшает контроль генерации на уровне пикселей.
Доступны модели:
- LineArt
- Depth
- Segmentation
- Hed (SoftEdge)
- Canny
Код
Демо
#conditioning #image2image #text2image
Новый улучшенный контролнет.
Новый подход, который улучшает контроль генерации на уровне пикселей.
Доступны модели:
- LineArt
- Depth
- Segmentation
- Hed (SoftEdge)
- Canny
Код
Демо
#conditioning #image2image #text2image
👍8❤2
Нейронавт | Нейросети в творчестве
Инструкция по запуску SD3 через API в ComfyUI #tutorial #text2image
Basic Stable Diffusion API GUI
А вот оболочка для запуска #SD3 и без ComfyUI
Скачать релиз
#text2image #tools
А вот оболочка для запуска #SD3 и без ComfyUI
Скачать релиз
#text2image #tools
Дисклеймер: я не поддерживаю ни фашизм, ни Гитлера, кейс считаю скандальным.
В Мичигане кто-то ухитрился всунуть изображение Гитлера на биллборд, да еще и написать ему зашифрованное поздравление. Биллборд находится на заправочной станции Marathon
Изображение, очевидно, сделано при помощи Controlnet.
Выглядит как поздравление некоего дяди Ади с 88 восхождением.
На реддите текст расшифровывают так:
88 - Hail Hitler (H - восьмая буква алфавита)
Adi - прозвище сами знаете кого
GDL - лига защиты язычников
GTV - “GoyimTV”, онлайн-видеоканал, управляемый GDL.
ХТ - Jon_Minadeo_II
WLM - White Lives Matter
реддит
#news
В Мичигане кто-то ухитрился всунуть изображение Гитлера на биллборд, да еще и написать ему зашифрованное поздравление. Биллборд находится на заправочной станции Marathon
Изображение, очевидно, сделано при помощи Controlnet.
Выглядит как поздравление некоего дяди Ади с 88 восхождением.
На реддите текст расшифровывают так:
88 - Hail Hitler (H - восьмая буква алфавита)
Adi - прозвище сами знаете кого
GDL - лига защиты язычников
GTV - “GoyimTV”, онлайн-видеоканал, управляемый GDL.
ХТ - Jon_Minadeo_II
WLM - White Lives Matter
реддит
#news
😁9🤡6😱5🍾1
Опубликован код конкурента InstanID, персонализатора FlashFace
Код
Колаб
#personalization #stylization #image2image
Код
Колаб
#personalization #stylization #image2image
😁8👍4❤1
Hyper-SD: Trajectory Segmented Consistency Model for Efficient Image Synthesis
Новый метод дистилляции (ускорения) SD от ByteDance.
Сохраняет качество практически без потерь при сокращении шагов. Что позволяет делать генерацию по эскизу практически в реальном времени
Код/веса
Демо t2i
Демо Scribble
#optimization #text2image #image2image #realtime
Новый метод дистилляции (ускорения) SD от ByteDance.
Сохраняет качество практически без потерь при сокращении шагов. Что позволяет делать генерацию по эскизу практически в реальном времени
Код/веса
Демо t2i
Демо Scribble
#optimization #text2image #image2image #realtime
❤10
AutoCrawler: A Progressive Understanding Web Agent for Web Crawler Generation
Агент для автоматического выполнения заданий в интернете. На основе языковой модели, естественно. Давно жду пригодную модель для этих целей.
Пока есть только экспериментальный код. Авторы планируют адаптировать свою модель к работе с реальными сайтами. Наверно, обучали на игрушечных, я не знаю.
Код
#assistant #agent
Агент для автоматического выполнения заданий в интернете. На основе языковой модели, естественно. Давно жду пригодную модель для этих целей.
Пока есть только экспериментальный код. Авторы планируют адаптировать свою модель к работе с реальными сайтами. Наверно, обучали на игрушечных, я не знаю.
Код
#assistant #agent
😁7❤1
MoMA: Multimodal LLM Adapter for Fast PersonalizedImage Generation
Мультимодальный LLM-адаптер (#MLLM), специализируется на создании персонализированных изображений с учетом тематики.
Умеет редактировать контекст (погода, локация), текстуры.
От кого? Правильно, от ByteDance
Код
Модель
#text2image #text2image
Мультимодальный LLM-адаптер (#MLLM), специализируется на создании персонализированных изображений с учетом тематики.
Умеет редактировать контекст (погода, локация), текстуры.
От кого? Правильно, от ByteDance
Код
Модель
#text2image #text2image
🔥5❤2
This media is not supported in your browser
VIEW IN TELEGRAM
LGM: Large Multi-View Gaussian Model for High-Resolution 3D Content Creation
Генератор 3D моделей по тексту и по одному изображению на гауссианах
Код
Демо
#gaussian #textto3D #imageto3D
Генератор 3D моделей по тексту и по одному изображению на гауссианах
Код
Демо
#gaussian #textto3D #imageto3D
👏6🔥3
Ладно, раскрою секрет. Меня несколько раз спрашивали где я беру новости. Так я вам и сказал, ага, вы же сразу пойдете сами там брать, и мне не останется. Поэтому секрет такой: читайте Сергея Цыпцына, и будете в курсе происходящего в цифровом мире.
С Сергеем я знаком еще с 2015 года когда он пришел знакомиться на студию Scandinava. Легендарный автор лучшей книги про Maya на русском языке, организатор CG Event'а, эксперт в области компьютерной графики. Если вы всё еще не знаете, он ведет один из самых популярных каналов про ИИ Метаверсище и ИИще. Уже из названия можно понять что там вас ожидает авторский стиль.
В духе Сергея строить сбывающиеся прогнозы и даже указывать цифровому миру куда ему катиться.
Он не устаёт "хоронить" профессионалов самых разных направлений — от художников до разработчиков. Но дед пошёл дальше и казнил... камеру-раздеватор. Почитайте, это любопытно.
Он проверяет и докапывается до сути там где остальные просто репостят не разбираясь. Он первый спалил что Kaedim нанял индусов имитировать ИИ. Почитайте, там целый сериал
А еще на его счету 625 употреблений слова «кожаный» в постах (это не шутка, проверено!).
В общем, рекомендую подписаться и читать его блог, чтобы действительно понимать и осмысливать, как развивается всё это ИИ-безобразие в нашем мире.
С Сергеем я знаком еще с 2015 года когда он пришел знакомиться на студию Scandinava. Легендарный автор лучшей книги про Maya на русском языке, организатор CG Event'а, эксперт в области компьютерной графики. Если вы всё еще не знаете, он ведет один из самых популярных каналов про ИИ Метаверсище и ИИще. Уже из названия можно понять что там вас ожидает авторский стиль.
В духе Сергея строить сбывающиеся прогнозы и даже указывать цифровому миру куда ему катиться.
Он не устаёт "хоронить" профессионалов самых разных направлений — от художников до разработчиков. Но дед пошёл дальше и казнил... камеру-раздеватор. Почитайте, это любопытно.
Он проверяет и докапывается до сути там где остальные просто репостят не разбираясь. Он первый спалил что Kaedim нанял индусов имитировать ИИ. Почитайте, там целый сериал
А еще на его счету 625 употреблений слова «кожаный» в постах (это не шутка, проверено!).
В общем, рекомендую подписаться и читать его блог, чтобы действительно понимать и осмысливать, как развивается всё это ИИ-безобразие в нашем мире.
❤16🤡10😁4🔥2
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
This media is not supported in your browser
VIEW IN TELEGRAM
Адобченко начинает жечь в преддверии Adobe Max.
Поглядите, как должен выглядеть интерфейс для работы с ИИ-картинками.
IP-Adapter и Style Reference, Firefly 3 и многое другое от Адобченко. Ждем к вечеру еще новостей.
Поглядите, как должен выглядеть интерфейс для работы с ИИ-картинками.
IP-Adapter и Style Reference, Firefly 3 и многое другое от Адобченко. Ждем к вечеру еще новостей.
🤔11🔥4💩3
Вы наверняка слышали про Chatbot Arena, где можно пользоваться топовыми LLM бесплатно.
Встречайте TEXT TO IMAGE ARENA - лидерборд генераторов картинок по тексту
#comparison #shootout #leaderboard
Встречайте TEXT TO IMAGE ARENA - лидерборд генераторов картинок по тексту
#comparison #shootout #leaderboard
👍18🤡4🔥3👎1
This media is not supported in your browser
VIEW IN TELEGRAM
StreamMultiDiffusion: Real-Time Interactive Generation withRegion-Based Semantic Control
Интерактивная генерация картинки по мульти промпту и заданным областям в реальном времени
Код
Демо SD1.5
Демо SDXL
#text2image #conditioning #realtime
Интерактивная генерация картинки по мульти промпту и заданным областям в реальном времени
Код
Демо SD1.5
Демо SDXL
#text2image #conditioning #realtime
🔥7👍2👎2🌚1