Forwarded from Нейродвиж
Вы сейчас офигеете, но ChatGPT умеет генерировать картинки. Без подписок, плагинов и прочего.
Промт следующий:
«
Промт следующий:
«
PROMPT: INPUT = {focus} OUTPUT = {denoscription) \n! [IMGI(https://image.pollinations.ai/prompt/{denoscription}) {denoscription) = {focusDetailed},%20{adjective1), %20{adjective2), %20{visualStyle1},%20{visualStyle2}, %20{visualStyle3},%20{artist Reference)
OUTPUT = [a cat outside in the sun, orange cat, happy cat, Sunny, warm, lots of flowers INPUT =a cat]» — там где OUTPUT поменяйте запрос на свой промт и готово.😁8👍3
This media is not supported in your browser
VIEW IN TELEGRAM
Magic123: One Image to High-Quality 3D Object Generation Using Both 2D and 3D Diffusion Priors
генератор 3D объекта по одному фото. На фоне конкурентов выглядит хорошо (см на сайте). На первом этапе для грубой геометрии использует NeRF, но на выходе дает текстурированный меш. Ну может с таким уровнем активности в этой области уже в следующем году будем генерить ассеты для игр и кино нейросетями.
[UPDATE]
Код
#imageto3D
генератор 3D объекта по одному фото. На фоне конкурентов выглядит хорошо (см на сайте). На первом этапе для грубой геометрии использует NeRF, но на выходе дает текстурированный меш. Ну может с таким уровнем активности в этой области уже в следующем году будем генерить ассеты для игр и кино нейросетями.
[UPDATE]
Код
#imageto3D
👍6
Нейронавт | Нейросети в творчестве
Fabrie Design Roast Я нашел чем вас занять в это воскресенье. ИИ-прожаркой картинок, чем же еще. Прежде чем выложить свой сгенерированный шедевр на всеобщее обозрение, можете скормить его Fabrie Design Roast, и тогда будете готовы к худшей реакции интернета.…
Что, никому не понравилось?
🤔5👍2👎2
Forwarded from Machinelearning
🏌️ GlOttal-flow LPC Filter (GOLF)
A DDSP-based neural vocoder.
Новый метод синтеза поющего голоса (SVS), использующий физические характеристики человеческого голоса с помощью дифференцируемой цифровой обработки сигнала
🖥 Github: https://github.com/yoyololicon/golf
📕 Paper: https://arxiv.org/abs/2306.17252v1
🔗 Demo: https://yoyololicon.github.io/golf-demo/
ai_machinelearning_big_data
A DDSP-based neural vocoder.
Новый метод синтеза поющего голоса (SVS), использующий физические характеристики человеческого голоса с помощью дифференцируемой цифровой обработки сигнала
ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Webapp Factory
Генератор веб-приложений на NodeJS по текстовому запросу.
Под капотом языковая модель WizardCoder-15B.
Тупит, конечно. Простым запросом практически ничего невозможно добиться. Более подробным описанием удается добиться частично работающей аппки. Полагаю, очень подробным описанием можно получить рабочую аппку. Правда из демо ее никуда не сохранить.
Блог с описанием и кодом
Демо
#text2app #coding #text2code
Генератор веб-приложений на NodeJS по текстовому запросу.
Под капотом языковая модель WizardCoder-15B.
Тупит, конечно. Простым запросом практически ничего невозможно добиться. Более подробным описанием удается добиться частично работающей аппки. Полагаю, очень подробным описанием можно получить рабочую аппку. Правда из демо ее никуда не сохранить.
Блог с описанием и кодом
Демо
#text2app #coding #text2code
👍1
Forwarded from тоже моушн
This media is not supported in your browser
VIEW IN TELEGRAM
Михаил, автор канала NeuroAE пилит отличный плагин, который позволяет лихо управлять генерацией в Stable Diffusion прямо из афтера - даже при отсутствии мощного железа! маст хэв для уверенных пользователей афтера
а уроки и гайды о том как пользоватья своим детищем Михаил постит в ютубе
скачать плагин - в канале NeuroAE
гайды и уроки на ютуб
на днях еще кое что про связку AE и стейбла будет, не отключайтесь
@тоже_моушн
а уроки и гайды о том как пользоватья своим детищем Михаил постит в ютубе
скачать плагин - в канале NeuroAE
гайды и уроки на ютуб
❤1
Control-A-Video
Другое название Video-ControlNet. На вход подаем видео, но авторы пишут что это #text2video модель, генерирующая видео по тексту. А видео управляет генерацией, из него извекаются карта глубины, Canny и HED, уже знакомые нам по ControlNet.
Качество так себе, хуже чем ZeroScope. Но если вы готовы поковыряться в коде, авторы пишут что чекпойнт можно заменить на любой другой на основе SD v1.5
На втором видео мой эксперимент - Дарт Вейдер танцует с маракасами
Код
Демо выдает максимум 16 кадров, 8fps
#video2video
Другое название Video-ControlNet. На вход подаем видео, но авторы пишут что это #text2video модель, генерирующая видео по тексту. А видео управляет генерацией, из него извекаются карта глубины, Canny и HED, уже знакомые нам по ControlNet.
Качество так себе, хуже чем ZeroScope. Но если вы готовы поковыряться в коде, авторы пишут что чекпойнт можно заменить на любой другой на основе SD v1.5
На втором видео мой эксперимент - Дарт Вейдер танцует с маракасами
Код
Демо выдает максимум 16 кадров, 8fps
#video2video
This media is not supported in your browser
VIEW IN TELEGRAM
В Нью-Йорке аппарат с ИИ делает предсказания. Вводите дату рождения, выбираете вопрос и делаете снимок — устройство распечатает предсказание
❤2
Ну и в редактировании картинок тоже все еще продолжают что-то изобретать.
LEDITS: Real Image Editing with DDPM Inversion and Semantic Guidance
Авторы называют этот метод легковесным рилтаймовым. Правда, в их демке никакого рилтайма нет. Но все же работает довольно быстро. Демка позволяет удалить/добавить объекты, стили, лица или что-то кастомное (сам не знаю что). А я как раз давно никуда не добавлял Бендера
Код
Демо
#image2image #text2image
LEDITS: Real Image Editing with DDPM Inversion and Semantic Guidance
Авторы называют этот метод легковесным рилтаймовым. Правда, в их демке никакого рилтайма нет. Но все же работает довольно быстро. Демка позволяет удалить/добавить объекты, стили, лица или что-то кастомное (сам не знаю что). А я как раз давно никуда не добавлял Бендера
Код
Демо
#image2image #text2image
👍1
Vectorizer.ai
Делает из растровой картинки векторную. Да, трассировщики-векторизаторы у нас уже есть лет 20-30, так что это не то чтобы фича которую мы ждали. Но сюда завезли ИИ, и здесь есть подгонка целых геометрических фигур, очистка углов, сопоставление касательных, обтекание кривых и многое другое. А еще есть API, и у разработчиков все еще много планов на дальнейшее развитие. И количество настроек при скачивании радует.
Вектризовать фотки неинтресно, а вот посмотрите что он делает со старыми мультиками. Ну а Мунк как будто изначально был векторным 😱
Ах да, чуть не забыл. Если вы генерите логотипы в SD или MJ, то эта штука для вас
#image2vector
Делает из растровой картинки векторную. Да, трассировщики-векторизаторы у нас уже есть лет 20-30, так что это не то чтобы фича которую мы ждали. Но сюда завезли ИИ, и здесь есть подгонка целых геометрических фигур, очистка углов, сопоставление касательных, обтекание кривых и многое другое. А еще есть API, и у разработчиков все еще много планов на дальнейшее развитие. И количество настроек при скачивании радует.
Вектризовать фотки неинтресно, а вот посмотрите что он делает со старыми мультиками. Ну а Мунк как будто изначально был векторным 😱
Ах да, чуть не забыл. Если вы генерите логотипы в SD или MJ, то эта штука для вас
#image2vector
👍11
This media is not supported in your browser
VIEW IN TELEGRAM
Segment Anything Meets Point Tracking
Сегментация видео с управляющими точками на базе SAM
Авторы скрестили SAM с классической идеей трекинга точек.
Код
#segmentation #image2mask #video2mask
Сегментация видео с управляющими точками на базе SAM
Авторы скрестили SAM с классической идеей трекинга точек.
Код
#segmentation #image2mask #video2mask
🔥5
This media is not supported in your browser
VIEW IN TELEGRAM
MAGVIT:Masked Generative Video Transformer
генератор/редактор видео от Google. Первую публикацию я видел еще в декабре 2022, а сейчас они разродились кодом. С тех пор мы видели уже много интересного на эту тему. Может потому кодом и поделились что устарело. Тем не менее, MAGVIT умеет то чего не умеют ни Gen-2, ни Zeroscope. Список фич:
- предсказание кадров
- интерполяция кадров
- видео инпейнтинг
- видео аутпейнтинг
За счет этого может выполнять разные интересные задачи, см на сайте
Код
Колаб
#text2video #video2video
генератор/редактор видео от Google. Первую публикацию я видел еще в декабре 2022, а сейчас они разродились кодом. С тех пор мы видели уже много интересного на эту тему. Может потому кодом и поделились что устарело. Тем не менее, MAGVIT умеет то чего не умеют ни Gen-2, ни Zeroscope. Список фич:
- предсказание кадров
- интерполяция кадров
- видео инпейнтинг
- видео аутпейнтинг
За счет этого может выполнять разные интересные задачи, см на сайте
Код
Колаб
#text2video #video2video
❤3
Forwarded from CGIT_Vines (Marvin Heemeyer)
This media is not supported in your browser
VIEW IN TELEGRAM
Меня как раз недавно спрашивали, можно ли через depth мапу получить сносную геометрию, чтобы использовать в играх.
Вот тут показан процесс на 6 минут пайплайна через карту глубины. Заспойлерю, можно китбашить, прототипировать что-то быстрое, но это в продакшн не годится пока.
Лицо из метахьюманов.
Смотреть пайплайн
Вот тут показан процесс на 6 минут пайплайна через карту глубины. Заспойлерю, можно китбашить, прототипировать что-то быстрое, но это в продакшн не годится пока.
Лицо из метахьюманов.
Смотреть пайплайн
👍2👏1
This media is not supported in your browser
VIEW IN TELEGRAM
DragonDiffusion: Enabling Drag-style Manipulation on Diffusion Models
Диффузионный конкурент DragGAN. Надеюсь, этот сможет редактировать без превращения картинки в кашу. Но пока нет ни сайта, ни кода. Есть пейпер и страничка на гитхабе.
Гитхаб
Пейпер
[UPDATE]
Код здесь
#image2image
Диффузионный конкурент DragGAN. Надеюсь, этот сможет редактировать без превращения картинки в кашу. Но пока нет ни сайта, ни кода. Есть пейпер и страничка на гитхабе.
Гитхаб
Пейпер
[UPDATE]
Код здесь
#image2image