Forwarded from эйай ньюз
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Вышел убийца Kling! Генерит за 30 секунд!
Ну почти...
Тут чуваки из Zhipu AI (это AI-стартап, китайский аналог Open AI со своим блэкджеком и ChatGPTGLM) выпустили свою Sora. Штука генерит 6-секундные видео за 30 секунд, что ну очень быстро, согласитесь (в Клинге я ждал больше часа, у Лумы 5 сек генерится 2 минуты). Так быстро работает, насколько я понял, из-за их хитрого 3D автоэнкодера, который сжимает представление видео в latent space до 2% от оригинального размера.
Вот промпты для видосиков из примера с голливудской адаптацией на английский язык от Google переводчика:
Остальные без инструкций, так, для примера.
Качество ну не синематик, видно, что тренили на стоках и каких-то странных китайских видео. Назвали Qingying или Ying. Пока кредиты безлимитные. Я хотел потестить, но похоже, мы снова столкнулись с новым феноменом: paywall по-китайски. Опять нужен китайский номер :( Может, у кого из вас выйдет вот ссылка.
Как же китайцы дрючат!
Источник
Пытаемся вломиться здесь
@ai_newz
Ну почти...
Тут чуваки из Zhipu AI (это AI-стартап, китайский аналог Open AI со своим блэкджеком и Chat
Вот промпты для видосиков из примера с голливудской адаптацией на английский язык от Google переводчика:
In a lush forest, some sunlight shines through the gaps between leaves, creating a Tyndall effect, giving the light shape.
When the tsunami roared in like a raging monster, the entire village was instantly swallowed up by the sea, just like a classic scene in a doomsday movie.
In the neon-lit city night scene, a little monkey full of cyber beauty holds high-tech tools and repairs equally flashing, futuristic electronic equipment.
Changing the style of painting, the kitten opened its mouth wide, showing a human-like confused expression, with question marks written all over its face.
Остальные без инструкций, так, для примера.
Качество ну не синематик, видно, что тренили на стоках и каких-то странных китайских видео. Назвали Qingying или Ying. Пока кредиты безлимитные. Я хотел потестить, но похоже, мы снова столкнулись с новым феноменом: paywall по-китайски. Опять нужен китайский номер :( Может, у кого из вас выйдет вот ссылка.
Источник
Пытаемся вломиться здесь
@ai_newz
👍3❤1🔥1🤔1
#оффтоп
Похоже, ютуб блокнули мне. не смог ни одно видео открыть
Похоже, ютуб блокнули мне. не смог ни одно видео открыть
😱11😐2❤1👍1
This media is not supported in your browser
VIEW IN TELEGRAM
TAPTR: Tracking Any Point with TRansformers as Detection
Еще один трекер точек на видео. Построен на том что отслеживание точек имеет большое сходство с обнаружением и отслеживанием объектов.
Похоже, он, как и конкуренты, может отслеживать скрытые точки, но авторы не очень стремятся показать это на примерах
Код
Демо (трек области)
Демо (трек точек)
#tracking
Еще один трекер точек на видео. Построен на том что отслеживание точек имеет большое сходство с обнаружением и отслеживанием объектов.
Похоже, он, как и конкуренты, может отслеживать скрытые точки, но авторы не очень стремятся показать это на примерах
Код
Демо (трек области)
Демо (трек точек)
#tracking
👍7❤2
ExAvatar: Expressive Whole-Body 3D Gaussian Avatar
Полный 3D аватар на гауссианах
Код ждем
#gaussian #humanavatar #humananimation
Полный 3D аватар на гауссианах
Код ждем
#gaussian #humanavatar #humananimation
👍10🥴3😁1
Flux
Новый генератор картинок от Fal.ai и Black Forest Labs (то самое место куда ушли в марте разработчики Stable Diffusion)
В релизе напирают на качество, анатомию, реализм, понимание промпта и скорость
Flux досутпен в трех вариантах:
FLUX.1 [dev]: Базовая модель с открытым исходным кодом и некоммерческой лицензией, которую сообщество может использовать для разработки поверх нее. Попробовать
FLUX.1 [schnell]: усовершенствованная версия базовой модели, которая работает в 10 раз быстрее. Лицензия Apache 2. Попробовать
FLUX.1 [pro]: Версия с закрытым исходным кодом, доступная только через API. Попробовать
Веса dev и schnell - по 24Гб
Гитхаб
HF
#text2image #news
Новый генератор картинок от Fal.ai и Black Forest Labs (то самое место куда ушли в марте разработчики Stable Diffusion)
В релизе напирают на качество, анатомию, реализм, понимание промпта и скорость
Flux досутпен в трех вариантах:
FLUX.1 [dev]: Базовая модель с открытым исходным кодом и некоммерческой лицензией, которую сообщество может использовать для разработки поверх нее. Попробовать
FLUX.1 [schnell]: усовершенствованная версия базовой модели, которая работает в 10 раз быстрее. Лицензия Apache 2. Попробовать
FLUX.1 [pro]: Версия с закрытым исходным кодом, доступная только через API. Попробовать
Веса dev и schnell - по 24Гб
Гитхаб
HF
#text2image #news
🔥14👍4❤1
SF3D: Stable Fast 3D Mesh Reconstruction with UV-unwrapping and Illumination Disentanglement
Stability AI продолжает подавать признаки жизни.
Сегодня релизнули генератор 3D ассетов по картинке.
Сразу с текстурой, UV разверткой и материалом.
Генерация происходит меньше чем за секунду на H100
Тест Бендера - очень хорошо, меш в комментах
Блог
Код
Демо
API
#imageto3D
Stability AI продолжает подавать признаки жизни.
Сегодня релизнули генератор 3D ассетов по картинке.
Сразу с текстурой, UV разверткой и материалом.
Генерация происходит меньше чем за секунду на H100
Тест Бендера - очень хорошо, меш в комментах
Блог
Код
Демо
API
#imageto3D
👍13❤2👌1
ControlNet ProMax
Обновка ControlNet++ для SDXL.
Обновление ProMaх включает в себя весь существующий набор ControlNet Union, в который добавлены возможности комбинации нескольких типов ControlNet к одному исходному изображению и новые функции Tile Deblur, Tile Superresolution, Tile Variation, Inpaint и Outpaint
Гитхаб
Веса на HF
#controlnet #conditioning #text2image #image2image
Обновка ControlNet++ для SDXL.
Обновление ProMaх включает в себя весь существующий набор ControlNet Union, в который добавлены возможности комбинации нескольких типов ControlNet к одному исходному изображению и новые функции Tile Deblur, Tile Superresolution, Tile Variation, Inpaint и Outpaint
Гитхаб
Веса на HF
#controlnet #conditioning #text2image #image2image
🔥18👍1
This media is not supported in your browser
VIEW IN TELEGRAM
InstantSplat: Sparse-view SfM-free Gaussian Splatting in Seconds
Реконструкция больших сцен на гауссианах, быстрая и качественная
Код
Демо
#gaussian #imageto3d #image2scene
Реконструкция больших сцен на гауссианах, быстрая и качественная
Код
Демо
#gaussian #imageto3d #image2scene
🔥8👍1
This media is not supported in your browser
VIEW IN TELEGRAM
VideoLLaMA 2: Advancing Spatial-Temporal Modeling and Audio Understanding in Video-LLMs
Модель понимания видео/аудио. Недавно выложены веса VideoLLaMA2-8x7B-Base и VideoLLaMA2-8x7B
Код
Демо
Веса
#VLM #video2text #assistant
Модель понимания видео/аудио. Недавно выложены веса VideoLLaMA2-8x7B-Base и VideoLLaMA2-8x7B
Код
Демо
Веса
#VLM #video2text #assistant
🔥9👍3
Собрал для вас редкие и полезные каналы про нейронки:
Please open Telegram to view this post
VIEW IN TELEGRAM
Telegram
Tips AI | IT & AI
Авторский канал про сервисы и технологии IT и AI, которые могут упростить (или не совсем) жизнь.
Пишу только то, что сам считаю интересным. Автор: @igortru
Информация по рекламе: @tipsprbot
Пишу только то, что сам считаю интересным. Автор: @igortru
Информация по рекламе: @tipsprbot
🔥9❤6👍1😁1
Forwarded from эйай ньюз
Умельцы прикрутили новую Ламу 405B к Comfy UI.
Работает на хостинге Replicate. По сути, это кастомная нода, которая пишет полноценный промпт из простого описания (prompt rewrite), так же как ChatGPT для Dalle-3.
Вообще мне не очень понравился процесс генерации картинок в нашем любимом чатГПТ, потому что у тебя нет контроля над финальным промптом, который идёт в диффузионку. Даже если просишь использовать данный промпт слово в слово, гптишка нет-нет, да меняет там что-нибудь без твоего разрешения. А суть промпт-инжиниринга в том, чтобы итеративно менять промпт и смотреть, что улучшилось, но бот часто берет и всё переписывает. Хотя для новичков это, конечно, топчик. Ну и как отправная точка для профи, тоже хорошо.
Вижу такой пайплайн для генерации короткометражных фильмов:
1) Сценарист выдаёт краткое описание кадров и, может быть, скетч от руки.
2) Нодами генерим промпт для каждого кадра на вход, берём скетчи и раскадровку от сценариста.
3) Художник пишет промпт для стиля. Добавляем его после промпта каждого кадра отдельной нодой. Подбирает модельки, лоры и пр.
4) Запускаем весь батч раз 5-10, берём лучшие кадры.
5) Идем в Luma оживлять картинки.
Кстати, нужны гайды по Комфи? Ставьте 🦄
Гитхаб
@ai_newz
Работает на хостинге Replicate. По сути, это кастомная нода, которая пишет полноценный промпт из простого описания (prompt rewrite), так же как ChatGPT для Dalle-3.
Вообще мне не очень понравился процесс генерации картинок в нашем любимом чатГПТ, потому что у тебя нет контроля над финальным промптом, который идёт в диффузионку. Даже если просишь использовать данный промпт слово в слово, гптишка нет-нет, да меняет там что-нибудь без твоего разрешения. А суть промпт-инжиниринга в том, чтобы итеративно менять промпт и смотреть, что улучшилось, но бот часто берет и всё переписывает. Хотя для новичков это, конечно, топчик. Ну и как отправная точка для профи, тоже хорошо.
Вижу такой пайплайн для генерации короткометражных фильмов:
1) Сценарист выдаёт краткое описание кадров и, может быть, скетч от руки.
2) Нодами генерим промпт для каждого кадра на вход, берём скетчи и раскадровку от сценариста.
3) Художник пишет промпт для стиля. Добавляем его после промпта каждого кадра отдельной нодой. Подбирает модельки, лоры и пр.
4) Запускаем весь батч раз 5-10, берём лучшие кадры.
5) Идем в Luma оживлять картинки.
Кстати, нужны гайды по Комфи? Ставьте 🦄
Гитхаб
@ai_newz
👍16🥴3💯3👀2⚡1