Composer: Creative and Controllable Image Synthesis with Composable Conditions
Управляемая диффузионная генерация изображений с композицией во главе угла. Управлять можно при помощи текста, палитры, сегментных масок, карты глубины, наброска, гистограммы и чего-то еще.
Короче, этакий конкурент #controlnet
Код обещают позже, репозиторий уже есть
#text2image #image2image
Управляемая диффузионная генерация изображений с композицией во главе угла. Управлять можно при помощи текста, палитры, сегментных масок, карты глубины, наброска, гистограммы и чего-то еще.
Короче, этакий конкурент #controlnet
Код обещают позже, репозиторий уже есть
#text2image #image2image
Media is too big
VIEW IN TELEGRAM
Image to Sound Effect
демо на huggingface, генерирует звуковые эффекты к изображению.
Под капотом свежий генератор звука из текста AudioLDM и старый image2text CoCa Image Captioning
#image2audio #text2audio
демо на huggingface, генерирует звуковые эффекты к изображению.
Под капотом свежий генератор звука из текста AudioLDM и старый image2text CoCa Image Captioning
#image2audio #text2audio
👍1
А анимации по карте глубины как в предыдущем посте - можно делать на Leiapix
Понадобится регистрация на сайте. Заливаете картинку, через 5 секунд получаете анимацию.
Сейчас для генерации карт глубины все (в том числе automatic1111) пользуются MiDaS. Но у Leiapix под капотом штука которая справляется в разы лучше (см картинки):
Boosting Monocular Depth Estimation Models to High-Resolution via Content-Adaptive Multi-Resolution Merging
Для меня загадка почему эту нейросетку не используют повсеместно вместо MiDaS
Код
#image2depth #image2video #monoculardepth
Понадобится регистрация на сайте. Заливаете картинку, через 5 секунд получаете анимацию.
Сейчас для генерации карт глубины все (в том числе automatic1111) пользуются MiDaS. Но у Leiapix под капотом штука которая справляется в разы лучше (см картинки):
Boosting Monocular Depth Estimation Models to High-Resolution via Content-Adaptive Multi-Resolution Merging
Для меня загадка почему эту нейросетку не используют повсеместно вместо MiDaS
Код
#image2depth #image2video #monoculardepth
❤1👍1
Следующая цель OpenAI - создание сильного ИИ (AGI)
Конечно же, он будет еще более зацензурированный со всех сторон чем ChatGPT, потому что опасность/ответственность/бла-бла-бла
Конечно же, он будет еще более зацензурированный со всех сторон чем ChatGPT, потому что опасность/ответственность/бла-бла-бла
Forwarded from Denis Sexy IT 🤖
Спорим, вы никогда не думали, что литературный жанр «Попаданцы» пострадает от появления GPT-нейронок?
Мне дали доступ к Bing, и хоть там и куча цензуры, использовать Bing как гаджет путешественника во времени уже можно💀
Мне дали доступ к Bing, и хоть там и куча цензуры, использовать Bing как гаджет путешественника во времени уже можно
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6
Видео в аниме от Corridor Digital.
Мастер-класс как сделать хорошо там где у всех получается кипящая каша.
Но забавно как инновационная часть пайплайна устарела еще две недели назад с появлением #Controlnet. Настала эпоха когда нет времени вынашивать трендовые идеи, инструменты устаревают быстрее чем успеваешь их использовать
https://www.youtube.com/watch?v=_9LX9HSQkWo
Мастер-класс как сделать хорошо там где у всех получается кипящая каша.
Но забавно как инновационная часть пайплайна устарела еще две недели назад с появлением #Controlnet. Настала эпоха когда нет времени вынашивать трендовые идеи, инструменты устаревают быстрее чем успеваешь их использовать
https://www.youtube.com/watch?v=_9LX9HSQkWo
YouTube
Did We Just Change Animation Forever?
ANYONE can make a cartoon with this groundbreaking technique. Want to learn how? We made a ONE-HOUR, CLICK-BY-CLICK TUTORIAL on http://www.corridordigital.com/
Watch the full ROCK PAPER SCISSORS anime on Corridor ► https://youtu.be/GVT3WUa-48Y
This project…
Watch the full ROCK PAPER SCISSORS anime on Corridor ► https://youtu.be/GVT3WUa-48Y
This project…
Бот Image | Video Painter теперь умеет писать стихи про портреты.
Закидываете фото, выбираете Image to poem, выбираете язык русский/английский, ждете 5 сек.
#image2text
Закидываете фото, выбираете Image to poem, выбираете язык русский/английский, ждете 5 сек.
#image2text
This media is not supported in your browser
VIEW IN TELEGRAM
FaceTTS. Imaginary Voice: Face-styled Diffusion Model for Text-to-Speech
Занятный #TTS генератор речи, генерит не просто по тексту, но еще с учетом предлагаемого портрета говорящего. На основе портрета модель генерит тембр и прочие акустические характеристики голоса.
Кода пока нет
Занятный #TTS генератор речи, генерит не просто по тексту, но еще с учетом предлагаемого портрета говорящего. На основе портрета модель генерит тембр и прочие акустические характеристики голоса.
Кода пока нет
Directed Diffusion:Direct Control of Object Placement through Attention Guidance
Метод диффуззионной генерации изображений, который лучше чем StableDiffusion позволяет управлять положением объекта через текстовые указания.
Кода нет
Метод диффуззионной генерации изображений, который лучше чем StableDiffusion позволяет управлять положением объекта через текстовые указания.
Кода нет
Raising the Cost of Malicious AI-Powered Image Editing
Тут люди придумали как защитить фотки от редактирования нейросетями типа Stablediffusion. После обработки этим защитным методом результаты редактирования image2image получаются нереалистичными
Код
Демо
#tools
Тут люди придумали как защитить фотки от редактирования нейросетями типа Stablediffusion. После обработки этим защитным методом результаты редактирования image2image получаются нереалистичными
Код
Демо
#tools
sketch_teddy.gif
15 MB
Latent-NeRF
генератор 3D объектов.
#nerf #textto3D #3Dto3D
генератор 3D объектов.
Мы исследуем различные способы введения управления формой для преобразования текста в 3D и представляем три модели: Latent-NeRF с чисто текстовым управлением, Latent-NeRF с мягким управлением формой для более точного контроля над сгенерированной формой и Latent-Paint для генерации текстур для явных формКод
#nerf #textto3D #3Dto3D
👍1
This media is not supported in your browser
VIEW IN TELEGRAM
А вот и конкурент Microsoft Designer'а
Записаться в вейтлист Uizard Autodesigner
Запишетесь - ищите в почте реферральную ссылку. За каждую регистрацию вас продвинут в очереди вейтлиста
#design
Записаться в вейтлист Uizard Autodesigner
Запишетесь - ищите в почте реферральную ссылку. За каждую регистрацию вас продвинут в очереди вейтлиста
#design
👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Fadr
Сервис разбирает музыкальный трек на отдельные инструменты. Генерирует midi-файл, делает ремиксы, показывает аккорды. Короче, занятно
Налетай
#audio2audio #audio2midi #music2music #music2track
Сервис разбирает музыкальный трек на отдельные инструменты. Генерирует midi-файл, делает ремиксы, показывает аккорды. Короче, занятно
Налетай
#audio2audio #audio2midi #music2music #music2track
This media is not supported in your browser
VIEW IN TELEGRAM
I hear your true colors: Image Guided Audio Generation
Еще один генератор звука по изображению.
Код
#image2audio
Еще один генератор звука по изображению.
Код
#image2audio
👍1