History-Guided Video Diffusion
Метод генерации видео
За счет трюков с контекстом и трансформера форсированной диффуззи (DFoT) позволяет создавать консистентные ультрадлинные видео, видео бесконечной навигации, генерировать композиционное видео (сам не уверен о чем тут речь)
На видео с роботом объяснение работы модели, это непохоже на генерацию
Модельки небольшие, и разрешение у них 128x128 да 256x256, так что это пока не про контентмейкинг, а про фичи которые можно ожидать в видеогенераторах
Код
Демо
#image2video
Метод генерации видео
За счет трюков с контекстом и трансформера форсированной диффуззи (DFoT) позволяет создавать консистентные ультрадлинные видео, видео бесконечной навигации, генерировать композиционное видео (сам не уверен о чем тут речь)
На видео с роботом объяснение работы модели, это непохоже на генерацию
Модельки небольшие, и разрешение у них 128x128 да 256x256, так что это пока не про контентмейкинг, а про фичи которые можно ожидать в видеогенераторах
Код
Демо
#image2video
🔥7🤔1
CustomVideoX: 3D Reference Attention Driven Dynamic Adaptation for Zero-Shot Customized Video Diffusion Transformers
Видеогенератор с персонализацией, создает видео с объектом, заданным картинкой
За основу берут CogVideoX-5B и прикручивают лору
Код ждем
#personalization #text2video
Видеогенератор с персонализацией, создает видео с объектом, заданным картинкой
За основу берут CogVideoX-5B и прикручивают лору
Код ждем
#personalization #text2video
👍4
InspireMusic: A Unified Framework for Controlled Music, Song, Audio Generation with Collaborative Semantic and Acoustic Tokens
Опенсорсный генератор музыки от Tongyi Lab и Alibaba Group
Умеет создавать музыку по тексту, продолжать музыку, реконструировать (непонятно)
Качеством звука пока не впечатлил, но это опенсорс, тут есть перспектива
Код
Демо
#text2music #music2music #music
Опенсорсный генератор музыки от Tongyi Lab и Alibaba Group
Умеет создавать музыку по тексту, продолжать музыку, реконструировать (непонятно)
Качеством звука пока не впечатлил, но это опенсорс, тут есть перспектива
Код
Демо
#text2music #music2music #music
🔥8❤1👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Convergence
Лондонский стартап хвастается браузерным агентом, побивающим 200-долларовый Operator (или он уже бесплатный?)
На бесплатном тарифе 5 сессий в день и одна автоматизация
#assistant #agent
Лондонский стартап хвастается браузерным агентом, побивающим 200-долларовый Operator (или он уже бесплатный?)
На бесплатном тарифе 5 сессий в день и одна автоматизация
#assistant #agent
🤮5👍4💩3👎1
This media is not supported in your browser
VIEW IN TELEGRAM
Pippo : High-Resolution Multi-View Humans from a Single Image
Из одного портретного или в полный рост фото человека делает тёрнтейбл - фото облет студийного качества 512х512 (называют это 1K)
Код
#image2video #novelview
Из одного портретного или в полный рост фото человека делает тёрнтейбл - фото облет студийного качества 512х512 (называют это 1K)
Код
#image2video #novelview
🔥13🤔1
Этот ролик, сделанный в Veo 2 - редчайший случай из всего потока генеративного видео, когда я верю что это люди в кадре, а не бестолковая кучка пикселей, мимикрирующих под людей. Они делают что-то осмысленное, а не имтируют движение. По крайней мере, мне это так выглядит
Ну и тут посмотреть бы на промпты и количество отбракованных версий. Скорее всего автор режиссер с опытом и понимает как работает камера и действие в кадре
Ну и тут посмотреть бы на промпты и количество отбракованных версий. Скорее всего автор режиссер с опытом и понимает как работает камера и действие в кадре
👍9🔥3
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
Media is too big
VIEW IN TELEGRAM
Если честно, то даже я приподохренел.
Тут у нас была дискуссия (бессодержательная по большей части) за рекламу, ну штош, держите рекламы.
Давайте вы сначала посмотрите ролик со звуком(!), а потом почитаете тексты ниже...
Пришлось смотреть 3 раза.
Конечно, я испортил весь эффект, тем что сразу акцентировал внимание на ролике. Но таки да, это генератив от Veo2. И тут Гугл, похоже, пока непобиваем.
Я вначале подумал, что дядьки с камерами настоящие и щас нам расскажут про совмещение ИИ и видео.
Но из настоящего тут только говорящая голова со странным акцентом в части behind the scenes
Пруф тут: https://www.youtube.com/watch?v=VqLWWYfCEbI
Нормальный такой 𝘢𝘯 𝘪𝘯𝘥𝘦𝘱𝘦𝘯𝘥𝘦𝘯𝘵 𝘤𝘳𝘦𝘢𝘵𝘪𝘷𝘦 𝘦𝘹𝘦𝘳𝘤𝘪𝘴𝘦 - как пишет автор. Один. Без ансамбля.
От себя добавлю, что закадровый нарратив для ИИ-роликов - это прям палочка выручалочка, недавно об этом думал.
Встречал немного снобистское мнение в прошлой жизни, что закадровый нарратив появляется там, где режиссер не может справиться со сценой или сценарием. Для ИИ - это идеальные костыли. Поглядите ролик еще раз.
И спать.
P.S. Огромное спасибо Всеволоду Тарану за такой шикарный ИИ-подгон.
@cgevent
Тут у нас была дискуссия (бессодержательная по большей части) за рекламу, ну штош, держите рекламы.
Давайте вы сначала посмотрите ролик со звуком(!), а потом почитаете тексты ниже...
Пришлось смотреть 3 раза.
Конечно, я испортил весь эффект, тем что сразу акцентировал внимание на ролике. Но таки да, это генератив от Veo2. И тут Гугл, похоже, пока непобиваем.
Я вначале подумал, что дядьки с камерами настоящие и щас нам расскажут про совмещение ИИ и видео.
Но из настоящего тут только говорящая голова со странным акцентом в части behind the scenes
Пруф тут: https://www.youtube.com/watch?v=VqLWWYfCEbI
Нормальный такой 𝘢𝘯 𝘪𝘯𝘥𝘦𝘱𝘦𝘯𝘥𝘦𝘯𝘵 𝘤𝘳𝘦𝘢𝘵𝘪𝘷𝘦 𝘦𝘹𝘦𝘳𝘤𝘪𝘴𝘦 - как пишет автор. Один. Без ансамбля.
От себя добавлю, что закадровый нарратив для ИИ-роликов - это прям палочка выручалочка, недавно об этом думал.
Встречал немного снобистское мнение в прошлой жизни, что закадровый нарратив появляется там, где режиссер не может справиться со сценой или сценарием. Для ИИ - это идеальные костыли. Поглядите ролик еще раз.
И спать.
P.S. Огромное спасибо Всеволоду Тарану за такой шикарный ИИ-подгон.
@cgevent
🔥19👍4
Forwarded from Нейросети и Блендер
Валентинки через Glif
Теперь каждый глиф стоит по-разному, но на старте вам дают 30 кредитов бесплатно и так же они ежедневно пополняются. А я подготовил для вас Глифы для Валентинок!
💰 В среднем 1 генерация в моих глифах тратит ~8 кредитов
💰 Оригинальный Glif — ~5 кредитов
Готовые глифы для Валентинок:
► Оригинальный Glif — откуда я взял идею, генерирует картинку + милый текст через Sonnet. Из минусов — вотермарка.
► Мой вариант. 2:3 размерность (1200x1600px) — Идеален для печати!
НО! Есть особенность сделал его с разделением промпта для Clip L и T5XXL.
Мне помогает вот этот промпт для любой LLM:
Если не хочется заморачиваться с промптами для Clip L и T5XXL, просто вставьте одинаковый текст в оба поля.
► Вариант с возможностью референс картинки. Добавил Redux туда.
► HF Lora — для тех кто хочет локально погенерить
— Я распечатал эти открытки на акварельной бумаге, и они выглядят как настоящая пастель!
Теперь каждый глиф стоит по-разному, но на старте вам дают 30 кредитов бесплатно и так же они ежедневно пополняются. А я подготовил для вас Глифы для Валентинок!
Готовые глифы для Валентинок:
► Оригинальный Glif — откуда я взял идею, генерирует картинку + милый текст через Sonnet. Из минусов — вотермарка.
► Мой вариант. 2:3 размерность (1200x1600px) — Идеален для печати!
НО! Есть особенность сделал его с разделением промпта для Clip L и T5XXL.
Мне помогает вот этот промпт для любой LLM:
Create prompts based on text for Clip L and T5XXL. Text: [Ваше описание или картинка] Если не хочется заморачиваться с промптами для Clip L и T5XXL, просто вставьте одинаковый текст в оба поля.
► Вариант с возможностью референс картинки. Добавил Redux туда.
► HF Lora — для тех кто хочет локально погенерить
— Я распечатал эти открытки на акварельной бумаге, и они выглядят как настоящая пастель!
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤2
Animate Anyone 2: High-Fidelity Character Image Animation with Environment Affordance
Второе поколение нейронки от Tongyi Lab и Alibaba Group. Кода к первому так и нет.
Заменяет персонажа на видео по одному фото.
Кода нет и не стоит губу раскатывать
#image2video #humananimation #characteranimation #pose2video
Второе поколение нейронки от Tongyi Lab и Alibaba Group. Кода к первому так и нет.
Заменяет персонажа на видео по одному фото.
Кода нет и не стоит губу раскатывать
#image2video #humananimation #characteranimation #pose2video
🔥7🤷♂1