Amuse 2.0 Beta
Среда для запуска моделей Stable Diffusion локально на железе #AMD.
Встроенный апскейлер AMD XDNA™ Super Resolution.
Рекомендованный минимум: AMD Ryzen™ AI 300 series + 24GB RAM
#text2image #upscale
Среда для запуска моделей Stable Diffusion локально на железе #AMD.
Встроенный апскейлер AMD XDNA™ Super Resolution.
Рекомендованный минимум: AMD Ryzen™ AI 300 series + 24GB RAM
#text2image #upscale
👍6
AccDiffusion: An Accurate Method for Higher-Resolution Image Generation
Метод точной поэтапной генерации изображений с более высоким разрешением без обучения. Решает проблему клонирующихся объектов при поэтапной генерации. Конкурент demofusion
Код
Демо
#text2image
Метод точной поэтапной генерации изображений с более высоким разрешением без обучения. Решает проблему клонирующихся объектов при поэтапной генерации. Конкурент demofusion
Код
Демо
#text2image
👍6
Cycle3D: High-quality and Consistent Image-to-3D Generation via Generation-Reconstruction Cycle
Генератор 3D по одной картинке. Демонстрация превосходства над не самыми сильными конкурентами
Код ждем
Демо ждем
#imageto3d
Генератор 3D по одной картинке. Демонстрация превосходства над не самыми сильными конкурентами
Код ждем
Демо ждем
#imageto3d
👀6
This media is not supported in your browser
VIEW IN TELEGRAM
Bridging the Gap: Studio-like Avatar Creation from a Monocular Phone Capture
Видео аватар студийного качества по одному видео со смартфона.
Под капотом StyleGAN2 карты лица и дифузия
Кода нет
#humanavatar #talkinghead #image2avatar #video2avatar
Видео аватар студийного качества по одному видео со смартфона.
Под капотом StyleGAN2 карты лица и дифузия
Кода нет
#humanavatar #talkinghead #image2avatar #video2avatar
🔥3👍1
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
В RunwayML GEN-3 завезли image2video.
Теперь можно полноценно сравнивать Луму, Клинг и Ген-3.
Если сравнивать по скорости - очень и очень быстро (сейчас).
Если по цене, очень и очень и очень дорого.
У меня пока ощущение, то ГЕН-3 хорошо делает VFX, то есть всякие , водичку, дымы, огоньки и прочую пиротехнику.
Если у вас еще осталась хоть капля кредитов, го тестировать.
https://app.runwayml.com/
@cgevent
Теперь можно полноценно сравнивать Луму, Клинг и Ген-3.
Если сравнивать по скорости - очень и очень быстро (сейчас).
Если по цене, очень и очень и очень дорого.
У меня пока ощущение, то ГЕН-3 хорошо делает VFX, то есть всякие , водичку, дымы, огоньки и прочую пиротехнику.
Если у вас еще осталась хоть капля кредитов, го тестировать.
https://app.runwayml.com/
@cgevent
👍2
AuraSR-v2
Обновка GAN-апскейлера для сгенерированных изображений. Да, он заточен на генерации.
Побеждены проблемы при апскейле jpg компрессии. Поработали над деталями и починили стыки тайлов.
Fal.ai работает над третьей версией
Репозиторий
Демо (на офсайте)
Какое-то Демо
#upscale
Обновка GAN-апскейлера для сгенерированных изображений. Да, он заточен на генерации.
Побеждены проблемы при апскейле jpg компрессии. Поработали над деталями и починили стыки тайлов.
Fal.ai работает над третьей версией
Репозиторий
Демо (на офсайте)
Какое-то Демо
#upscale
❤8👍2
Media is too big
VIEW IN TELEGRAM
VEnhancer: Generative Space-Time Enhancement for Video Generation
Сейчас когда есть тройка лидеров в генерации видео, постить другие новые видеогенераторы неинтересно. Но вот этот проект достоин внимания.
VEnhancer - генеративная платформа для расширения пространства-времени. Улучшает связность сгенерированного видео, повышает разрешение, убирает кипение. Под капотом специальный контролнет
Код
#enhance #video2video
Сейчас когда есть тройка лидеров в генерации видео, постить другие новые видеогенераторы неинтересно. Но вот этот проект достоин внимания.
VEnhancer - генеративная платформа для расширения пространства-времени. Улучшает связность сгенерированного видео, повышает разрешение, убирает кипение. Под капотом специальный контролнет
Код
#enhance #video2video
🔥11👍1
Нейронавт | Нейросети в творчестве
Segment Anything Model 2 (SAM 2) Следующее поколение популярного сегментатора от запрещенных. Работает на картинках и на видео. Ну и прицепом еще и датасет выпустили. Демо (вероятно понадобится VPN. Свое видео не загрузить) Код/веса #segmentation #image2mask…
Появились демоспейсы SAM2. Только для картинок.
А вот в колабе можно и видео обработать
Демо1 (со скачиванием маски)
Демо2
колаб
#segmentation #image2mask #video2mask
А вот в колабе можно и видео обработать
Демо1 (со скачиванием маски)
Демо2
колаб
#segmentation #image2mask #video2mask
❤4👍1
Media is too big
VIEW IN TELEGRAM
Friend necklace
Занятный гаджет в виде кулона с опенсорсным софтом.
Слушает и записывает ваши разговоры, коннектится к смартфону.
Заметки, выжимка, чат с заметками - все плюшки LLM.
Доступен по предзаказу или можете собрать самостоятельно по инструкции.
Инструкция по сборке
Appstore
Playmarket
#gadget #speech2text #stt #summary
Занятный гаджет в виде кулона с опенсорсным софтом.
Слушает и записывает ваши разговоры, коннектится к смартфону.
Заметки, выжимка, чат с заметками - все плюшки LLM.
Доступен по предзаказу или можете собрать самостоятельно по инструкции.
Инструкция по сборке
Appstore
Playmarket
#gadget #speech2text #stt #summary
❤5👍1😈1
Matting by Generation
Новый подход матированию - созданию маски для отделения объекта от фона, позволяющий лучше сохранять мелкие детали.
Код ждем
#image2mask #matting
Новый подход матированию - созданию маски для отделения объекта от фона, позволяющий лучше сохранять мелкие детали.
Код ждем
#image2mask #matting
🔥13❤1👍1😎1
Forwarded from Data Secrets
GPT-5 закончила обучение уже в апреле, а claude 3.5 opus выйдет в сентябре
Это информация из отчета доктора Алана Томпсона – ресерчера и автора The Memo. Он утверждает, что GPT-5 уже давно на стадии тестирования и выйдет где-то во время выборов в США, как и следующая модель Meta, Gemini 2 и Grok-3 (см.схему наверху).
Полностью репорт, откуда взята картинка, станет доступен в начале августа. В основном он будет посвящен данным, на которых якобы обучалась GPT5-5.
Сомнительно, но окээй...
Это информация из отчета доктора Алана Томпсона – ресерчера и автора The Memo. Он утверждает, что GPT-5 уже давно на стадии тестирования и выйдет где-то во время выборов в США, как и следующая модель Meta, Gemini 2 и Grok-3 (см.схему наверху).
Полностью репорт, откуда взята картинка, станет доступен в начале августа. В основном он будет посвящен данным, на которых якобы обучалась GPT5-5.
Сомнительно, но окээй...
😁1🤔1