This media is not supported in your browser
VIEW IN TELEGRAM
Gemini 2.0
Гугл объявил эру агентов.
Мультимодальный ассистент
- в риалтайме понимает одновременно и аудио и видео
- можно стримить ему свой экран
- может общаться голосом
- выполняет сложные задачи
- ищет в интернете
И все это бесплатно. Россиян традиционно не любят. Добро пожаловать с неевропейского IP
Попробовать
#news #agent
Гугл объявил эру агентов.
Мультимодальный ассистент
- в риалтайме понимает одновременно и аудио и видео
- можно стримить ему свой экран
- может общаться голосом
- выполняет сложные задачи
- ищет в интернете
И все это бесплатно. Россиян традиционно не любят. Добро пожаловать с неевропейского IP
Попробовать
#news #agent
👍6💯3
DiffSensei: Bridging Multi-Modal LLMs and Diffusion Models for Customized Manga Generation
Генератор манги (японских комиксов) на основе текстового описания и изображений персонажей.
Под капотом дообученный SDXL
- Создает мангу с несколькими персонажами, которые адаптируются к текстовому описанию
- Есть контроль расположения персонажей и диалогов на странице
- Сохраняет стиль и консистентность персонажей
Код
#text2image #comics
Генератор манги (японских комиксов) на основе текстового описания и изображений персонажей.
Под капотом дообученный SDXL
- Создает мангу с несколькими персонажами, которые адаптируются к текстовому описанию
- Есть контроль расположения персонажей и диалогов на странице
- Сохраняет стиль и консистентность персонажей
Код
#text2image #comics
❤13
Media is too big
VIEW IN TELEGRAM
MMAudio: Taming Multimodal Joint Training for High-Quality Video-to-Audio Synthesis
Генератор звука по видео или текстовому описанию
Код
Демо
Колаб
#video2audio #video2sound #text2audio
Генератор звука по видео или текстовому описанию
Код
Демо
Колаб
#video2audio #video2sound #text2audio
👍10❤1🔥1
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Трумультимодальность.
До вечернего стрима от OpenAI у нас, похоже, идет день Google и Gemini.
OpenAI ТОЧНО пора показать обновленный DALL·E 3, ибо смотрите, что творит Gemini. Причем творит сама по себе, без вызова всяких Imagen-ов - это трумултимодальная модель.
Поглядите все видосики обязательно.
Путешествия по картинкам меня до сих пор восхищают, типа поверни вправо и, особенно, отъедь назад. Хотя такое мы видели в последний месяц регулярно, особенно у видеогенераторов. Но тут повторюсь монолитный чат и хорошее качество.
А вот пример с газовой горелкой - просто отличный: "нарисуй то, что случится, когда горелка повернется".
Визуальная цепочка мыслей.
"Включи телевизор" - тоже неплохо.
Источник тут.
В общем, я прям жду, что ответит OpenAI, прежде чем делать мучительные выборы.
И поднимите веки Midjourney кто-нибудь. Неприлично уже.
@cgevent
До вечернего стрима от OpenAI у нас, похоже, идет день Google и Gemini.
OpenAI ТОЧНО пора показать обновленный DALL·E 3, ибо смотрите, что творит Gemini. Причем творит сама по себе, без вызова всяких Imagen-ов - это трумултимодальная модель.
Поглядите все видосики обязательно.
Путешествия по картинкам меня до сих пор восхищают, типа поверни вправо и, особенно, отъедь назад. Хотя такое мы видели в последний месяц регулярно, особенно у видеогенераторов. Но тут повторюсь монолитный чат и хорошее качество.
А вот пример с газовой горелкой - просто отличный: "нарисуй то, что случится, когда горелка повернется".
Визуальная цепочка мыслей.
"Включи телевизор" - тоже неплохо.
Источник тут.
В общем, я прям жду, что ответит OpenAI, прежде чем делать мучительные выборы.
И поднимите веки Midjourney кто-нибудь. Неприлично уже.
@cgevent
🔥14👍6❤1
StableAnimator: High-Quality Identity-Preserving Human Image Animation
Очередной аниматор персонажа по фото и образцу движения, сохраняющий идентичность персонажа. Под капотом SVD
Код
#humananimation #characteranimation #image2video #pose2video
Очередной аниматор персонажа по фото и образцу движения, сохраняющий идентичность персонажа. Под капотом SVD
Код
#humananimation #characteranimation #image2video #pose2video
👍6🔥5❤1
This media is not supported in your browser
VIEW IN TELEGRAM
В трекере точек на видео TAPTR реализовали потоковый режим, позволяющий обрабатывать видео любой длины на RTX 3090
Демо TAPTRv3
#tracking
Демо TAPTRv3
#tracking
🔥9👍2❤1
This media is not supported in your browser
VIEW IN TELEGRAM
SynCamMaster: Synchronizing Multi-Camera Video Generation from Diverse Viewpoints
Метод заставить видеогенераторы делать одно и то же видео с двух и более ракурсов.
Ждем во всех видеогенрилках планеты
Код
#text2image #multiview
Метод заставить видеогенераторы делать одно и то же видео с двух и более ракурсов.
Ждем во всех видеогенрилках планеты
Код
#text2image #multiview
🔥15🤔2❤1
Leffa: Learning Flow Fields in Attention for Controllable Person Image Generation
Модель от запрещенной Meta умеет переодевать и менять позу на изображении по образцу.
На позировании развернул девушку спиной, лох))
Гитхаб
Демо
#tryon #image2image #pose2image
Модель от запрещенной Meta умеет переодевать и менять позу на изображении по образцу.
На позировании развернул девушку спиной, лох))
Гитхаб
Демо
#tryon #image2image #pose2image
👍6❤1🔥1
Media is too big
VIEW IN TELEGRAM
nlf: Neural Localizer Fields for Continuous 3D Human Pose and Shape Estimation
Реконструкция позы человека по видео с одного ракурса, с фигурой но без одежды
Код
#poseestimation #video2pose #videoto3d #video2mesh #humanreconstruction
Реконструкция позы человека по видео с одного ракурса, с фигурой но без одежды
Код
#poseestimation #video2pose #videoto3d #video2mesh #humanreconstruction
🔥13
This media is not supported in your browser
VIEW IN TELEGRAM
Krea.ai Edit
Редактор изображений Krea.ai теперь доступен всем.
Инпейнтинг, аутпейнтинг, выделение/замена/удаление объектов. Все это удобно как в фотошопе и бесплатно (ограниченно)
#imageediting #inpainting #outpainting
Редактор изображений Krea.ai теперь доступен всем.
Инпейнтинг, аутпейнтинг, выделение/замена/удаление объектов. Все это удобно как в фотошопе и бесплатно (ограниченно)
#imageediting #inpainting #outpainting
👍5❤1
StyleStudio: Text-Driven Style Transfer with Selective Control of Style Elements
Перенос стиля изображения. Насколько я понял, работает на базе SDXL, хотя можно прикрутить и к другим генераторам
Код
Демо
#styletransfer #text2image
Перенос стиля изображения. Насколько я понял, работает на базе SDXL, хотя можно прикрутить и к другим генераторам
Код
Демо
#styletransfer #text2image
❤7🤯2
This media is not supported in your browser
VIEW IN TELEGRAM
Короткометражка созданная при помощи опенсорсных нейросеток.
Твиттер
Youtube - там подробная инструкция, в описании ссылки на бесплатный воркфлоу и более продвинутый платный
#video2video #tutorial
Твиттер
Youtube - там подробная инструкция, в описании ссылки на бесплатный воркфлоу и более продвинутый платный
#video2video #tutorial
👍20❤2