Forwarded from эйай ньюз
Media is too big
VIEW IN TELEGRAM
🚀Align your Latents: High-Resolution Video Synthesis with Latent Diffusion Models
[CVPR 2023]
Кажется, этот год будет годом генерации видео!
Тут авторы Stable Diffusion постажировались в NVIDIA и выкатили Latent Diffusion для синтеза видео.
Со слов автора статьи и моего одногруппника Робина, важной частью тут является временной fine-tuning декодера для видео — он исправляет мерцающие артефакты, возникающие при наивном декодировании.
Кода и весов не будет, потому что это NVIDIA🌚. Так что наслаждайтесь примерами и ждем реиплементации от китайцев.
Сайт проекта
@ai_newz
[CVPR 2023]
Кажется, этот год будет годом генерации видео!
Тут авторы Stable Diffusion постажировались в NVIDIA и выкатили Latent Diffusion для синтеза видео.
Со слов автора статьи и моего одногруппника Робина, важной частью тут является временной fine-tuning декодера для видео — он исправляет мерцающие артефакты, возникающие при наивном декодировании.
Кода и весов не будет, потому что это NVIDIA🌚. Так что наслаждайтесь примерами и ждем реиплементации от китайцев.
Сайт проекта
@ai_newz
👍2
Forwarded from Stable Diffusion | Text2img
This media is not supported in your browser
VIEW IN TELEGRAM
Это просто невероятно 😳
Реклама новой камеры поражает воображение,
Samsung Super Duper Space 5000 Mega Zoom.
Ладно, ладно, это StableDiffusion и Infinite zoom
Реклама новой камеры поражает воображение,
Samsung Super Duper Space 5000 Mega Zoom.
🤣8👏3
Сделал небольшой мод который (пусть немного криво) заменяет Макса Пэйна на всеми любимого мужчину честной судьбы. В коментах будет небольшая инструкция по установке и оригиналы скинов. Если вам понравится то дальше можно добавить других стримеров ну или ещё что придумать. Подскажите ещё игры с такими же развертками текстур персонажей.
😁27❤8👍1
Forwarded from Нейронавтика (AI research)
Model Deliberate
Lora ГАЗ-21
Если перед
Clip skip - 1
Prompt
Lora ГАЗ-21
Если перед
GAZ21 ставить свет red, yellow то будем меняться цвет автомобиля. Clip skip - 1
Prompt
GAZ21 <lora:21_gaz:0.9>, (photorealistic:1.3), best quality, ultra high res, detailed
Negative (deformed, distorted, disfigured:1.3), ugly, disgusting, blurry, amputation, painting, sketch, art, drawing, blur❤3👍2
Forwarded from Denis Sexy IT 🤖
Media is too big
VIEW IN TELEGRAM
Очень нравится зарождение «нейронного кинематографа» – когда из текста генерируют видео кусочки, сшивают в фильм и добавляют озвучку.
Получается, что уже сейчас каждый может пойти и снять кино мечты, вот тут в треде подборка разных работ.
До больших экранов этому подходу еще много лет, но как же круто
Получается, что уже сейчас каждый может пойти и снять кино мечты, вот тут в треде подборка разных работ.
До больших экранов этому подходу еще много лет, но как же круто
❤1👍1
Forwarded from Psy Eyes (Andrey Bezryadin)
Инпейтинг прямо в NeRF. Сцена рендерится с позиции камеры, а цвета берутся отталкиваясь от соседних видов.
Сайт — Бумага
Разработчик сделал рабочую копию операционной системы Саманты из фильма «Она». Преобразование голоса в текстовый промт через Whisper —> генерация текстового ответа через GPT 3.5 —> озвучка ответа в реальном-времени через Elevenlabs. То есть, от фильма до реальности мы добрались за 10 лет.
Автор
Другой чувак связал свой Quest Pro с повседневными вещами: прослушивание музыки, просмотр погоды, регулировка штор, и прочее в режиме MR. Уже не кино. Но котана тебе всё-равно надо будет в реале.
Автор
ECON: создание по одному фото 3D модели человека. Работает даже с группой людей в сложных позах.
Сайт — Colab — Гитхаб — Плагин для Blender — Гайд
Paint-by-Skech: делаешь набросок, что изменить на картинке и получаешь несколько вариантов одежды, фонов, итд.
Бумага — Гитхаб
FaceLit: тоже создание 3D по фото, но с возможностью играться с освещением.
Сайт — Бумага — Гитхаб
Сравнение 4 автономных генеративных AI агентов: “Westworld” simulation, Camel, BabyAGI, AutoGPT.
Пост + Бумага, как научить модель самостоятельно дебажить код
Сайт — Бумага
Разработчик сделал рабочую копию операционной системы Саманты из фильма «Она». Преобразование голоса в текстовый промт через Whisper —> генерация текстового ответа через GPT 3.5 —> озвучка ответа в реальном-времени через Elevenlabs. То есть, от фильма до реальности мы добрались за 10 лет.
Автор
Другой чувак связал свой Quest Pro с повседневными вещами: прослушивание музыки, просмотр погоды, регулировка штор, и прочее в режиме MR. Уже не кино. Но котана тебе всё-равно надо будет в реале.
Автор
ECON: создание по одному фото 3D модели человека. Работает даже с группой людей в сложных позах.
Сайт — Colab — Гитхаб — Плагин для Blender — Гайд
Paint-by-Skech: делаешь набросок, что изменить на картинке и получаешь несколько вариантов одежды, фонов, итд.
Бумага — Гитхаб
FaceLit: тоже создание 3D по фото, но с возможностью играться с освещением.
Сайт — Бумага — Гитхаб
Сравнение 4 автономных генеративных AI агентов: “Westworld” simulation, Camel, BabyAGI, AutoGPT.
Пост + Бумага, как научить модель самостоятельно дебажить код
👍5🔥2