Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.46K photos
3.73K videos
41 files
4.77K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
Stable Doodle

Опробовал новую игрушку StabilityAI/Clipdrop на своих старых комиксах. Если неграмотно написать промт, то Stable Doodle вашим дудлом подотрется. А если грамотно, то прям можно комиксы рисовать. Правда, без повторяющихся от панели к панели объектов.

Не хватает загрузки входных дудлов, приходится рисовать на месте в маленьком окошке.

#image2image #sketch2image
👍1
LLM arena

Текстовая игра против ИИ. Если вам понравилось играть в Гэндальфа, то и это должно зайти.

Вы выступаете в роли бойца. Вам говорят кто вы и кто ваш противник. Можете писать что угодно. LLM решает кто победил. Цель - победить минимальным количеством символов.

И не ведитесь на лимон, он не помогает

#game #gaming #chatbot #LLM
👍4😁1
Media is too big
VIEW IN TELEGRAM
A Generalized Ray Formulation For Wave-Optics Rendering

Оказывается, трассировка лучей - некорректный метод получения 3D рендера. В этом исследовании показано, что трассировка волн дает лучшие результаты. Более грамотные объяснения у двухминутного доктора
Авторам удалось еще и добиться скоростного рендера, десятые доли секунды для разрешения 1440p. Код и все материалы в наличии.

Код

#rendering
👍6🤔3
Forwarded from тоже моушн
This media is not supported in your browser
VIEW IN TELEGRAM
что ж, пришло время об этом рассказать: красиво стилизовать видео теперь можно не только в платном StableWarp но и бесплатном Deforum

и никакого фликера, даже напротив - еще более гладкая анимация. на видео сравнение двух техник при условно одинаковых настройках. магия работает в A1111 на ip2p контролнете и режиме hybrid video

узнал про этот трюк благодаря подписчику. спасибо, Михаил!

StableWarp по прежнему остается годным и очень крутым инструментом, но на мой личный взгляд - чрезмерно навороченным и чем дальше тем сложнее в нем разобраться, я уже не говорю про новых пользователей, у которых вскипает мозг при виде сотен настроек.

файл с настройками дефорума - в комментах

@тоже_моушн
👍2
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
Media is too big
VIEW IN TELEGRAM
SDFX: Новый UI для Stable Diffusion. Выглядит нарядно.

Как пишет автор (очень правильные слова, я ныл об этом тут):
У создания SDFX было два основных мотива. Первый возник из-за повторяющейся задачи в A111 прокрутки вниз, настройки параметров, прокрутки вверх, нажатия «Создать» и повторения этого цикла снова и снова. Выполнение этого 1500 раз сказалось на моем психическом здоровье. Второй проблемой была тяжеловесность и непоследовательность графического интерфейса, который полностью упускал из виду основной элемент: изображение. Stable Diffusion — это технология, которая генерирует изображения. Итак, где изображения на интерфейсе? Он должен быть в основе интерфейса. Все, что я вижу, это тысячи кнопок и ползунков, разбросанных вокруг. Пришло время положить этому конец. Внедрение новых технологий, таких как Stable Diffusion, неизбежно требует создания простых в использовании продуктов, а не сложных интерфейсов, предназначенные для инженеров, которые восхищаются миллиардами кнопок и бесконечными выпадающими меню.

Есть две засады.
Будет только в августе.
Человек пишет все это в одно кожаное лицо.

Соответственно, развитие и поддержка проекта будут однопоточными.
Подробности тут:
https://www.reddit.com/r/StableDiffusion/comments/1437b8o/sdfx_new_ui_for_stable_diffusion/
4🤔2👍1👎1🔥1
Forwarded from эйай ньюз
🔥CM3leon - Новая универсальная генеративная модель для Картинок и текста

Ребята из Meta AI (FAIR) представили новую генеративную модель. Это по сути мультимодальная decoder-only LLM на базе архитектуры OPT, которая умеет работать как с изображениями, так и с текстом.

Для картинок используется предобученный токенизатор VQ-VAE, который разбивает 256x256 изображеие на 1024 токена из словаря размером в 8192.

Натренили модельку на 7 млрд параметров — CM3Leon-7B, которая хорошо генерит в 256x256 и выдает state-of-the-art FID = 4.8 на MS-COCO.

Модель умеет:
1. text-to-image
2. image-to-text, то есть можно спрашивать любые вопросы по картинке
3. image-to-image с текстовой инструкцией

Одна генерация 256x256 занимает 9 сек в int8 (для сравнения авторегрессионная модель Parti-3В требует 6.4 сек, но дает хуже результаты).

Блог
Статья

@ai_newz
This media is not supported in your browser
VIEW IN TELEGRAM
Unloop

ИИ-лупер для музыкантов c VampNet под капотом. Придумывает на лету свои вариации сыгранных вами фрагментов.

Unloop представляет собой патч для MAX. Надеюсь, музыканты знают что это такое, потому что я не знаю. Инструкция по установке по ссылке:

Код

#music2music #audio2audio #AImusic
👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Air

"первый в мире" искусственный интеллект, который может принимать телефонные звонки продолжительностью 10-40 минут, звучащие как у настоящего человека, с бесконечной памятью, идеальным запоминанием и способный автономно выполнять действия в более чем 5000 приложениях. Он может выполнять всю работу агента, работающего полный рабочий день, без необходимости в обучении, управлении или мотивации.

Ну все, готовимся к новой волне телефонных разводов, теперь с ИИ

твиттер

#voicebot #LLM не знаю какие еще теги сюда придумать
🔥4
This media is not supported in your browser
VIEW IN TELEGRAM
fabrie

Дизайн-среда с ControlNet натасканным на визуализацию скечей.

100 бесплатных генераций в день. Платных тарифов пока нет. Но видимо планируются, потому что есть рефералка.

реддит
ProductHunt

#sketch2image #design #image2image
👍2
PSLD: Solving Linear Inverse Problems Provably via Posterior Sampling with Latent Diffusion Models

Новый метод использования диффузионных моделей для инпейнтинга без дообучения, апскейла, удаления шума, удаления моушенблюра, восстановления резкости. Выглядит впечатляюще

Код
Демо

#image2image #inpainting #deblur #denoise #upscale #superresulution
👍41
NIFTY: Neural Object Interaction Fieldsfor Guided Human Motion Synthesis

Модель взаимодействия 3D-человеков с 3D-объектами.
Собрались вместе Университет Мичигана, Стэнфорд, Google и NVIDIA. Это как Мстители, только в области 3D-технологий. Да и придумали назначить 3D-объектам так называемое поле взаимодействия. Это поле и управляет анимацией персонажа, взаимодействующего с объектом. А взаимодействия это отдельная попоболь в 3D. Видимо, там серьезные планы на AR гарнитуры, цифровые аватары и вот это все.

Код обещают выложить

#humananimation