Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
В RunwayML GEN-3 завезли image2video.
Теперь можно полноценно сравнивать Луму, Клинг и Ген-3.
Если сравнивать по скорости - очень и очень быстро (сейчас).
Если по цене, очень и очень и очень дорого.
У меня пока ощущение, то ГЕН-3 хорошо делает VFX, то есть всякие , водичку, дымы, огоньки и прочую пиротехнику.
Если у вас еще осталась хоть капля кредитов, го тестировать.
https://app.runwayml.com/
@cgevent
Теперь можно полноценно сравнивать Луму, Клинг и Ген-3.
Если сравнивать по скорости - очень и очень быстро (сейчас).
Если по цене, очень и очень и очень дорого.
У меня пока ощущение, то ГЕН-3 хорошо делает VFX, то есть всякие , водичку, дымы, огоньки и прочую пиротехнику.
Если у вас еще осталась хоть капля кредитов, го тестировать.
https://app.runwayml.com/
@cgevent
👍2
AuraSR-v2
Обновка GAN-апскейлера для сгенерированных изображений. Да, он заточен на генерации.
Побеждены проблемы при апскейле jpg компрессии. Поработали над деталями и починили стыки тайлов.
Fal.ai работает над третьей версией
Репозиторий
Демо (на офсайте)
Какое-то Демо
#upscale
Обновка GAN-апскейлера для сгенерированных изображений. Да, он заточен на генерации.
Побеждены проблемы при апскейле jpg компрессии. Поработали над деталями и починили стыки тайлов.
Fal.ai работает над третьей версией
Репозиторий
Демо (на офсайте)
Какое-то Демо
#upscale
❤8👍2
Media is too big
VIEW IN TELEGRAM
VEnhancer: Generative Space-Time Enhancement for Video Generation
Сейчас когда есть тройка лидеров в генерации видео, постить другие новые видеогенераторы неинтересно. Но вот этот проект достоин внимания.
VEnhancer - генеративная платформа для расширения пространства-времени. Улучшает связность сгенерированного видео, повышает разрешение, убирает кипение. Под капотом специальный контролнет
Код
#enhance #video2video
Сейчас когда есть тройка лидеров в генерации видео, постить другие новые видеогенераторы неинтересно. Но вот этот проект достоин внимания.
VEnhancer - генеративная платформа для расширения пространства-времени. Улучшает связность сгенерированного видео, повышает разрешение, убирает кипение. Под капотом специальный контролнет
Код
#enhance #video2video
🔥11👍1
Нейронавт | Нейросети в творчестве
Segment Anything Model 2 (SAM 2) Следующее поколение популярного сегментатора от запрещенных. Работает на картинках и на видео. Ну и прицепом еще и датасет выпустили. Демо (вероятно понадобится VPN. Свое видео не загрузить) Код/веса #segmentation #image2mask…
Появились демоспейсы SAM2. Только для картинок.
А вот в колабе можно и видео обработать
Демо1 (со скачиванием маски)
Демо2
колаб
#segmentation #image2mask #video2mask
А вот в колабе можно и видео обработать
Демо1 (со скачиванием маски)
Демо2
колаб
#segmentation #image2mask #video2mask
❤4👍1
Media is too big
VIEW IN TELEGRAM
Friend necklace
Занятный гаджет в виде кулона с опенсорсным софтом.
Слушает и записывает ваши разговоры, коннектится к смартфону.
Заметки, выжимка, чат с заметками - все плюшки LLM.
Доступен по предзаказу или можете собрать самостоятельно по инструкции.
Инструкция по сборке
Appstore
Playmarket
#gadget #speech2text #stt #summary
Занятный гаджет в виде кулона с опенсорсным софтом.
Слушает и записывает ваши разговоры, коннектится к смартфону.
Заметки, выжимка, чат с заметками - все плюшки LLM.
Доступен по предзаказу или можете собрать самостоятельно по инструкции.
Инструкция по сборке
Appstore
Playmarket
#gadget #speech2text #stt #summary
❤5👍1😈1
Matting by Generation
Новый подход матированию - созданию маски для отделения объекта от фона, позволяющий лучше сохранять мелкие детали.
Код ждем
#image2mask #matting
Новый подход матированию - созданию маски для отделения объекта от фона, позволяющий лучше сохранять мелкие детали.
Код ждем
#image2mask #matting
🔥13❤1👍1😎1
Forwarded from Data Secrets
GPT-5 закончила обучение уже в апреле, а claude 3.5 opus выйдет в сентябре
Это информация из отчета доктора Алана Томпсона – ресерчера и автора The Memo. Он утверждает, что GPT-5 уже давно на стадии тестирования и выйдет где-то во время выборов в США, как и следующая модель Meta, Gemini 2 и Grok-3 (см.схему наверху).
Полностью репорт, откуда взята картинка, станет доступен в начале августа. В основном он будет посвящен данным, на которых якобы обучалась GPT5-5.
Сомнительно, но окээй...
Это информация из отчета доктора Алана Томпсона – ресерчера и автора The Memo. Он утверждает, что GPT-5 уже давно на стадии тестирования и выйдет где-то во время выборов в США, как и следующая модель Meta, Gemini 2 и Grok-3 (см.схему наверху).
Полностью репорт, откуда взята картинка, станет доступен в начале августа. В основном он будет посвящен данным, на которых якобы обучалась GPT5-5.
Сомнительно, но окээй...
😁1🤔1
👍3🔥1
Forwarded from эйай ньюз
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Вышел убийца Kling! Генерит за 30 секунд!
Ну почти...
Тут чуваки из Zhipu AI (это AI-стартап, китайский аналог Open AI со своим блэкджеком и ChatGPTGLM) выпустили свою Sora. Штука генерит 6-секундные видео за 30 секунд, что ну очень быстро, согласитесь (в Клинге я ждал больше часа, у Лумы 5 сек генерится 2 минуты). Так быстро работает, насколько я понял, из-за их хитрого 3D автоэнкодера, который сжимает представление видео в latent space до 2% от оригинального размера.
Вот промпты для видосиков из примера с голливудской адаптацией на английский язык от Google переводчика:
Остальные без инструкций, так, для примера.
Качество ну не синематик, видно, что тренили на стоках и каких-то странных китайских видео. Назвали Qingying или Ying. Пока кредиты безлимитные. Я хотел потестить, но похоже, мы снова столкнулись с новым феноменом: paywall по-китайски. Опять нужен китайский номер :( Может, у кого из вас выйдет вот ссылка.
Как же китайцы дрючат!
Источник
Пытаемся вломиться здесь
@ai_newz
Ну почти...
Тут чуваки из Zhipu AI (это AI-стартап, китайский аналог Open AI со своим блэкджеком и Chat
Вот промпты для видосиков из примера с голливудской адаптацией на английский язык от Google переводчика:
In a lush forest, some sunlight shines through the gaps between leaves, creating a Tyndall effect, giving the light shape.
When the tsunami roared in like a raging monster, the entire village was instantly swallowed up by the sea, just like a classic scene in a doomsday movie.
In the neon-lit city night scene, a little monkey full of cyber beauty holds high-tech tools and repairs equally flashing, futuristic electronic equipment.
Changing the style of painting, the kitten opened its mouth wide, showing a human-like confused expression, with question marks written all over its face.
Остальные без инструкций, так, для примера.
Качество ну не синематик, видно, что тренили на стоках и каких-то странных китайских видео. Назвали Qingying или Ying. Пока кредиты безлимитные. Я хотел потестить, но похоже, мы снова столкнулись с новым феноменом: paywall по-китайски. Опять нужен китайский номер :( Может, у кого из вас выйдет вот ссылка.
Источник
Пытаемся вломиться здесь
@ai_newz
👍3❤1🔥1🤔1