Для TriplaneGaussian опубликован код/веса и появился сайт проекта.
Примеры с генерациями из MJ и фото объектов из реального мира
Сайт
Код
#gaussian #imageto3D
Примеры с генерациями из MJ и фото объектов из реального мира
Сайт
Код
#gaussian #imageto3D
🔥4👏1
This media is not supported in your browser
VIEW IN TELEGRAM
SHINOBIShape and Illumination using Neural Object Decomposition via BRDF Optimization In-the-wild
Реконструкция 3D объекта с материалами и освещением из набора изображений от Google
Код ждем
#imageto3D
Реконструкция 3D объекта с материалами и освещением из набора изображений от Google
Код ждем
#imageto3D
👍6
Forwarded from Data Secrets
Генеративная модель Сбера Kandinsky стала мировым лидером по темпу роста
А вот по популярности среди разработчиков заняла второе место — Stable Diffusion немного опередила отечественную нейронку. Рейтинг представил известный AI-ресурс с open source-решениями Hugging Face.
Еще разрабы Kandinsky впечатлили итогами 2023 года. В прошлом году нейросеть создала более 200 млн изображений для 12 млн юзеров.
А вот по популярности среди разработчиков заняла второе место — Stable Diffusion немного опередила отечественную нейронку. Рейтинг представил известный AI-ресурс с open source-решениями Hugging Face.
Еще разрабы Kandinsky впечатлили итогами 2023 года. В прошлом году нейросеть создала более 200 млн изображений для 12 млн юзеров.
🤮23👍13🤡5🔥1👏1
Depth Anything: Unleashing the Power of Large-Scale Unlabeled Data
Новый генератор глубины от Tiktok. Неплохо работает на видео. Да чего там неплохо, очень хорошо, но пока еще не идеально. Они еще дообучили на своей модели контролнет и генерят видео (см на сайте). На сравнении в середине Midas, справа Depth Anything
Код
Демо
Колаб
#image2depth #video2depth
Новый генератор глубины от Tiktok. Неплохо работает на видео. Да чего там неплохо, очень хорошо, но пока еще не идеально. Они еще дообучили на своей модели контролнет и генерят видео (см на сайте). На сравнении в середине Midas, справа Depth Anything
Код
Демо
Колаб
#image2depth #video2depth
🔥9
Metric3D: Towards Zero-shot Metric 3D Prediction from A Single Image
Посмотрим как справляется с этой же задачей чемпион прошлогоднего весеннего челленджа по предсказанию глубины на CVPR 2023.
Кажется, не хуже. Еще и карту нормалей выдает
Код
Демо
#image2depth
Посмотрим как справляется с этой же задачей чемпион прошлогоднего весеннего челленджа по предсказанию глубины на CVPR 2023.
Кажется, не хуже. Еще и карту нормалей выдает
Код
Демо
#image2depth
👍6
This media is not supported in your browser
VIEW IN TELEGRAM
ActAnywhere: Subject-Aware Video Background Generation
Adobe смастерили генератор видео, который понимает переднеплановый объект и генерит соответствующий задний план под него. Да так, что они еще могут и взаимодействовать! В качестве задания можно подать начальный кадр задника, по видимому текст. Можно заменять и переднеплановый объект.
Короче, это ближе к той кнопке
#text2video #video2video
Adobe смастерили генератор видео, который понимает переднеплановый объект и генерит соответствующий задний план под него. Да так, что они еще могут и взаимодействовать! В качестве задания можно подать начальный кадр задника, по видимому текст. Можно заменять и переднеплановый объект.
Короче, это ближе к той кнопке
Сделать Красиво, которую мы хотим в кинопроизводстве. Ждем новую фичу в ПО Adobe#text2video #video2video
🔥5❤1👍1
Forwarded from AI для Всех (Artemii)
This media is not supported in your browser
VIEW IN TELEGRAM
Скрейпинг веб страниц в эпоху GPT-Vision
Последние пару недель, я много эксперементировал с парсингом и скрейпингом веб страниц. В итоге я пришел к выводу, что сайты были сделаны для того что бы на них смотрели глазами, и соответственно парсить их эффкетивнее всего тоже будет глазами.
Собрал для вас старый добрый Colab, с помощью которого можно сделать summary любой страницы в интернете (в пределах того, на что не обидится OpenAI).
Как это работает:
- с помощью selenium я делаю скриншоты сайта
- объединяю их в одну картинку
- отправляю эту картинку в GPT-vision
- получаю summary
🚀 Google Colab
Приглашаю всех попробовать и присылать PR c новыми функциями, исправлением багов и прочими правками.
В качестве бонуса (для продвинутых пользователей), добавил в pipeline создание эмбедингов поверх полученных summary.
Если пойдет, может быть сделаем крутого open-source Web-scrapping Assistant или типа того
Последние пару недель, я много эксперементировал с парсингом и скрейпингом веб страниц. В итоге я пришел к выводу, что сайты были сделаны для того что бы на них смотрели глазами, и соответственно парсить их эффкетивнее всего тоже будет глазами.
Собрал для вас старый добрый Colab, с помощью которого можно сделать summary любой страницы в интернете (в пределах того, на что не обидится OpenAI).
Как это работает:
- с помощью selenium я делаю скриншоты сайта
- объединяю их в одну картинку
- отправляю эту картинку в GPT-vision
- получаю summary
🚀 Google Colab
Приглашаю всех попробовать и присылать PR c новыми функциями, исправлением багов и прочими правками.
В качестве бонуса (для продвинутых пользователей), добавил в pipeline создание эмбедингов поверх полученных summary.
Если пойдет, может быть сделаем крутого open-source Web-scrapping Assistant или типа того
❤14👍4🔥3
dewatermark.ai
Удаление вотермарков с изображений. Говорят что бесплатно. Сервис умный, сам находит вотермарки, но можно выделить и кистью
#tools #inpainting #restoration
Удаление вотермарков с изображений. Говорят что бесплатно. Сервис умный, сам находит вотермарки, но можно выделить и кистью
#tools #inpainting #restoration
❤5🔥3👍2
Наверстываю упущенное из-за поездки на премьеру
Для InstantID опубликован код, демоспейс. Да он даже уже в Pinokio есть
Он сохраняет узнаваемость лучше чем Photomaker. И уже придумали как его ускорить при помощи LCM-Lora
Код
Демо
Демо на некоммерческом GPU-кластере
#text2image #image2image #stylization #personalization
Для InstantID опубликован код, демоспейс. Да он даже уже в Pinokio есть
Он сохраняет узнаваемость лучше чем Photomaker. И уже придумали как его ускорить при помощи LCM-Lora
Код
Демо
Демо на некоммерческом GPU-кластере
#text2image #image2image #stylization #personalization
👍6
This media is not supported in your browser
VIEW IN TELEGRAM
Human-LRM: Single-View 3D Human Digitalization with Large Reconstruction Models
#Nerf-реконструкция человека в 3D по одному изображению за 5 секунд. Связность на видео.
Как думаете, куда Adobe прикрутит эту штуку?
#imageto3D #videoavatar #image2avatar #image2nerf #video2nerf #novelview #rendering
#Nerf-реконструкция человека в 3D по одному изображению за 5 секунд. Связность на видео.
Как думаете, куда Adobe прикрутит эту штуку?
#imageto3D #videoavatar #image2avatar #image2nerf #video2nerf #novelview #rendering
❤4
LUMIERE: A Space-Time Diffusion Model for Realistic Video Generation
Генератор видео от Google.
- по тексту
- по изображению
- inpainting
- стилизация
- синемаграфия - анимация отдельных объектов
Шикарно, что с доступом, Google?
#text2video #image2video #inpainting #stylization
Генератор видео от Google.
- по тексту
- по изображению
- inpainting
- стилизация
- синемаграфия - анимация отдельных объектов
Шикарно, что с доступом, Google?
#text2video #image2video #inpainting #stylization
❤3
FMA-Net: Flow-Guided Dynamic Filtering and Iterative Feature Refinement with Multi-Attention for Joint Video Super-Resolution and Deblurring
Улучшайзер-энхенсер-апскейлер видео. Из мыльного видео низкого разрешения делает четкое видео высокого разрешения.
Новый лидер в этом типе задач.
Код ждем
#video2video #enhance #upscale #superresolution
Улучшайзер-энхенсер-апскейлер видео. Из мыльного видео низкого разрешения делает четкое видео высокого разрешения.
Новый лидер в этом типе задач.
Код ждем
#video2video #enhance #upscale #superresolution
👏2