Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.44K photos
3.71K videos
41 files
4.75K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
DisCO: Portrait Distortion Correction with Perspective-Aware 3D GANs

Интересный проект. Коррекция перспективных искажений портрета. Если знаете чем портрет снятый на 70мм отличается от портрета снятого на 24мм, то объяснения не понадобятся.

Код обещают позже

#image2image #tools
🔥2👍1
Composer: Creative and Controllable Image Synthesis with Composable Conditions

Управляемая диффузионная генерация изображений с композицией во главе угла. Управлять можно при помощи текста, палитры, сегментных масок, карты глубины, наброска, гистограммы и чего-то еще.
Короче, этакий конкурент #controlnet

Код обещают позже, репозиторий уже есть

#text2image #image2image
Media is too big
VIEW IN TELEGRAM
Image to Sound Effect

демо на huggingface, генерирует звуковые эффекты к изображению.
Под капотом свежий генератор звука из текста AudioLDM и старый image2text CoCa Image Captioning

#image2audio #text2audio
👍1
А анимации по карте глубины как в предыдущем посте - можно делать на Leiapix
Понадобится регистрация на сайте. Заливаете картинку, через 5 секунд получаете анимацию.

Сейчас для генерации карт глубины все (в том числе automatic1111) пользуются MiDaS. Но у Leiapix под капотом штука которая справляется в разы лучше (см картинки):

Boosting Monocular Depth Estimation Models to High-Resolution via Content-Adaptive Multi-Resolution Merging

Для меня загадка почему эту нейросетку не используют повсеместно вместо MiDaS

Код

#image2depth #image2video #monoculardepth
1👍1
Следующая цель OpenAI - создание сильного ИИ (AGI)

Конечно же, он будет еще более зацензурированный со всех сторон чем ChatGPT, потому что опасность/ответственность/бла-бла-бла
Forwarded from Denis Sexy IT 🤖
Спорим, вы никогда не думали, что литературный жанр «Попаданцы» пострадает от появления GPT-нейронок?

Мне дали доступ к Bing, и хоть там и куча цензуры, использовать Bing как гаджет путешественника во времени уже можно 💀
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6
Видео в аниме от Corridor Digital.
Мастер-класс как сделать хорошо там где у всех получается кипящая каша.

Но забавно как инновационная часть пайплайна устарела еще две недели назад с появлением #Controlnet. Настала эпоха когда нет времени вынашивать трендовые идеи, инструменты устаревают быстрее чем успеваешь их использовать

https://www.youtube.com/watch?v=_9LX9HSQkWo
Бот Image | Video Painter теперь умеет писать стихи про портреты.
Закидываете фото, выбираете Image to poem, выбираете язык русский/английский, ждете 5 сек.

#image2text
А вы знали что в automatic1111 по правому клику на кнопке Generate есть опция бесконечного цикла генерации? Продолжает рожать картинки пока не скажешь ему «Горшочек, не вари»
🤯4👏2
This media is not supported in your browser
VIEW IN TELEGRAM
FaceTTS. Imaginary Voice: Face-styled Diffusion Model for Text-to-Speech

Занятный #TTS генератор речи, генерит не просто по тексту, но еще с учетом предлагаемого портрета говорящего. На основе портрета модель генерит тембр и прочие акустические характеристики голоса.

Кода пока нет
Directed Diffusion:Direct Control of Object Placement through Attention Guidance

Метод диффуззионной генерации изображений, который лучше чем StableDiffusion позволяет управлять положением объекта через текстовые указания.

Кода нет
Raising the Cost of Malicious AI-Powered Image Editing

Тут люди придумали как защитить фотки от редактирования нейросетями типа Stablediffusion. После обработки этим защитным методом результаты редактирования image2image получаются нереалистичными

Код
Демо

#tools
sketch_teddy.gif
15 MB
Latent-NeRF

генератор 3D объектов.
Мы исследуем различные способы введения управления формой для преобразования текста в 3D и представляем три модели: Latent-NeRF с чисто текстовым управлением, Latent-NeRF с мягким управлением формой для более точного контроля над сгенерированной формой и Latent-Paint для генерации текстур для явных форм

Код

#nerf #textto3D #3Dto3D
👍1
This media is not supported in your browser
VIEW IN TELEGRAM
А вот и конкурент Microsoft Designer

Записаться в вейтлист Uizard Autodesigner

Запишетесь - ищите в почте реферральную ссылку. За каждую регистрацию вас продвинут в очереди вейтлиста

#design
👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Fadr
Сервис разбирает музыкальный трек на отдельные инструменты. Генерирует midi-файл, делает ремиксы, показывает аккорды. Короче, занятно
Налетай

#audio2audio #audio2midi #music2music #music2track