Media is too big
VIEW IN TELEGRAM
MMAudio: Taming Multimodal Joint Training for High-Quality Video-to-Audio Synthesis
Генератор звука по видео или текстовому описанию
Код
Демо
Колаб
#video2audio #video2sound #text2audio
Генератор звука по видео или текстовому описанию
Код
Демо
Колаб
#video2audio #video2sound #text2audio
👍10❤1🔥1
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Трумультимодальность.
До вечернего стрима от OpenAI у нас, похоже, идет день Google и Gemini.
OpenAI ТОЧНО пора показать обновленный DALL·E 3, ибо смотрите, что творит Gemini. Причем творит сама по себе, без вызова всяких Imagen-ов - это трумултимодальная модель.
Поглядите все видосики обязательно.
Путешествия по картинкам меня до сих пор восхищают, типа поверни вправо и, особенно, отъедь назад. Хотя такое мы видели в последний месяц регулярно, особенно у видеогенераторов. Но тут повторюсь монолитный чат и хорошее качество.
А вот пример с газовой горелкой - просто отличный: "нарисуй то, что случится, когда горелка повернется".
Визуальная цепочка мыслей.
"Включи телевизор" - тоже неплохо.
Источник тут.
В общем, я прям жду, что ответит OpenAI, прежде чем делать мучительные выборы.
И поднимите веки Midjourney кто-нибудь. Неприлично уже.
@cgevent
До вечернего стрима от OpenAI у нас, похоже, идет день Google и Gemini.
OpenAI ТОЧНО пора показать обновленный DALL·E 3, ибо смотрите, что творит Gemini. Причем творит сама по себе, без вызова всяких Imagen-ов - это трумултимодальная модель.
Поглядите все видосики обязательно.
Путешествия по картинкам меня до сих пор восхищают, типа поверни вправо и, особенно, отъедь назад. Хотя такое мы видели в последний месяц регулярно, особенно у видеогенераторов. Но тут повторюсь монолитный чат и хорошее качество.
А вот пример с газовой горелкой - просто отличный: "нарисуй то, что случится, когда горелка повернется".
Визуальная цепочка мыслей.
"Включи телевизор" - тоже неплохо.
Источник тут.
В общем, я прям жду, что ответит OpenAI, прежде чем делать мучительные выборы.
И поднимите веки Midjourney кто-нибудь. Неприлично уже.
@cgevent
🔥14👍6❤1
StableAnimator: High-Quality Identity-Preserving Human Image Animation
Очередной аниматор персонажа по фото и образцу движения, сохраняющий идентичность персонажа. Под капотом SVD
Код
#humananimation #characteranimation #image2video #pose2video
Очередной аниматор персонажа по фото и образцу движения, сохраняющий идентичность персонажа. Под капотом SVD
Код
#humananimation #characteranimation #image2video #pose2video
👍6🔥5❤1
This media is not supported in your browser
VIEW IN TELEGRAM
В трекере точек на видео TAPTR реализовали потоковый режим, позволяющий обрабатывать видео любой длины на RTX 3090
Демо TAPTRv3
#tracking
Демо TAPTRv3
#tracking
🔥9👍2❤1
This media is not supported in your browser
VIEW IN TELEGRAM
SynCamMaster: Synchronizing Multi-Camera Video Generation from Diverse Viewpoints
Метод заставить видеогенераторы делать одно и то же видео с двух и более ракурсов.
Ждем во всех видеогенрилках планеты
Код
#text2image #multiview
Метод заставить видеогенераторы делать одно и то же видео с двух и более ракурсов.
Ждем во всех видеогенрилках планеты
Код
#text2image #multiview
🔥15🤔2❤1
Leffa: Learning Flow Fields in Attention for Controllable Person Image Generation
Модель от запрещенной Meta умеет переодевать и менять позу на изображении по образцу.
На позировании развернул девушку спиной, лох))
Гитхаб
Демо
#tryon #image2image #pose2image
Модель от запрещенной Meta умеет переодевать и менять позу на изображении по образцу.
На позировании развернул девушку спиной, лох))
Гитхаб
Демо
#tryon #image2image #pose2image
👍6❤1🔥1
Media is too big
VIEW IN TELEGRAM
nlf: Neural Localizer Fields for Continuous 3D Human Pose and Shape Estimation
Реконструкция позы человека по видео с одного ракурса, с фигурой но без одежды
Код
#poseestimation #video2pose #videoto3d #video2mesh #humanreconstruction
Реконструкция позы человека по видео с одного ракурса, с фигурой но без одежды
Код
#poseestimation #video2pose #videoto3d #video2mesh #humanreconstruction
🔥13
This media is not supported in your browser
VIEW IN TELEGRAM
Krea.ai Edit
Редактор изображений Krea.ai теперь доступен всем.
Инпейнтинг, аутпейнтинг, выделение/замена/удаление объектов. Все это удобно как в фотошопе и бесплатно (ограниченно)
#imageediting #inpainting #outpainting
Редактор изображений Krea.ai теперь доступен всем.
Инпейнтинг, аутпейнтинг, выделение/замена/удаление объектов. Все это удобно как в фотошопе и бесплатно (ограниченно)
#imageediting #inpainting #outpainting
👍5❤1
StyleStudio: Text-Driven Style Transfer with Selective Control of Style Elements
Перенос стиля изображения. Насколько я понял, работает на базе SDXL, хотя можно прикрутить и к другим генераторам
Код
Демо
#styletransfer #text2image
Перенос стиля изображения. Насколько я понял, работает на базе SDXL, хотя можно прикрутить и к другим генераторам
Код
Демо
#styletransfer #text2image
❤7🤯2
This media is not supported in your browser
VIEW IN TELEGRAM
Короткометражка созданная при помощи опенсорсных нейросеток.
Твиттер
Youtube - там подробная инструкция, в описании ссылки на бесплатный воркфлоу и более продвинутый платный
#video2video #tutorial
Твиттер
Youtube - там подробная инструкция, в описании ссылки на бесплатный воркфлоу и более продвинутый платный
#video2video #tutorial
👍20❤2
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
This media is not supported in your browser
VIEW IN TELEGRAM
Ну, за подкасты.
Не очень понятно зачем теперь нужны кожаные блогеры, влогеры, инфлюматьихенсеры.
Я тут смотрел, как народ упарывается в NotebokLM, создавая аудио-подкаст из текста, потом вырезает в аудасити звук для каждого голоса, потом огородит с хейгеном и звуком, и тд.
Все.
Одна кнопка.
Сделать красиво.
Тупо, но красиво.
А зачем еще это все?
Хейген, похоже, сами не понимают, как они троллят интернет.
@cgevent
Не очень понятно зачем теперь нужны кожаные блогеры, влогеры, инфлюматьихенсеры.
Я тут смотрел, как народ упарывается в NotebokLM, создавая аудио-подкаст из текста, потом вырезает в аудасити звук для каждого голоса, потом огородит с хейгеном и звуком, и тд.
Все.
Одна кнопка.
Сделать красиво.
Тупо, но красиво.
А зачем еще это все?
Хейген, похоже, сами не понимают, как они троллят интернет.
@cgevent
🔥10❤1👍1🤯1
This media is not supported in your browser
VIEW IN TELEGRAM
GigaChat песни
Вы не поверите, но GigaChat теперь умеет создавать песни подобно Suno/Udio.
Правда, пока только в ВК. в телеграм завезут позже
Качество как всегда отстает от мировых лидеров. Но это вопрос времени.
Длина трека - полторы минуты, а текст пишет на целую песню
#text2music
Вы не поверите, но GigaChat теперь умеет создавать песни подобно Suno/Udio.
Правда, пока только в ВК. в телеграм завезут позже
Качество как всегда отстает от мировых лидеров. Но это вопрос времени.
Длина трека - полторы минуты, а текст пишет на целую песню
#text2music
😁9👍5😈2👎1🥴1