Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.47K photos
3.73K videos
41 files
4.77K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
300
Краткий пересказ статей от YandexGPT

Опробовал на нестареющей классике

#LLM #chatbot
This media is not supported in your browser
VIEW IN TELEGRAM
instaVerse

Помните нейропанорамы blockadelabs?

На их движке появился новый более интерактивный проект, который сейчас на стадии альфа-тестирования. Сгенерированные 2D локации переводит в 3D, и там теперь можно даже походить. У меня жутко тормозит, а у вас как?

Попробовать InstaVerse

#imageto3D #image2scene
👍2
Нейронавт | Нейросети в творчестве
Zeroscope теперь можно потестить в браузере, появлился демоспейс на HF. Вроде работает но очередь переполнена Демо #text2video
This media is not supported in your browser
VIEW IN TELEGRAM
Еще один демоспейс Zeroscope, от другого автора. Да не обманет вас его "v2" в его названии, это тот же самый Zeroscope.
Здесь в отличие от демоспейса fffiloni в дополнение к окошку промта есть еще пара рулек настроек.

На видео: Дарт Вейдер катается на ките

Демо

#text2video
3
Обратная сторона

Можно было предположить что педофилам нечужды современные технологии. ИИ-изображения сексуального насилия над детьми уже стали предметом активной торговли. Интересно как на это отреагируют StabilityAI.

Мое мнение, пока это не привело к чему-то бОльшему чем торговля ненастоящими картинками, уж лучше ненастоящие чем настоящие. А торговля была и до Stable Diffusion. Если с этим не боролись до сих пор, то ИИ-генераторы тут ни при чем. Впрочем, тут может быть вред о котором я не догадываюсь. Что думаете?

Статья на BBC (из РФ включайте VPN)
This media is not supported in your browser
VIEW IN TELEGRAM
ChatGPT, плагины-шмагины! Да сделайте уже свой плагин на Gradio за 5 минут

Запилить плагин-шмагин

#chatbot #tools
👍4
This media is not supported in your browser
VIEW IN TELEGRAM
Rerender a video теперь можно запустить в колабе. Работает пока не очень, можно ожидать что в официальном релизе будет лучше.
Много красивых примеров на официальной страничке

colab

@тоже_моушн

#text2video #video2video
1
PoseDiffusion: Solving Pose Estimation via Diffusion-aided Bundle Adjustment

Трекинг камеры по пачке входных изображений с разных ракурсов. Бонусом - рендер новых ракурсов. Задача которая давно успешно решается без применения ИИ. Но в компьютерном зрении бывает нужно чтобы она решалась автоматически и быстро.

Код

#tracking #imageto3D #novelview #rendering
👍1
SDXL 0.9 Photographers Study

Фотографы, найденные в #SDXL, удобная галерея.
А значит, можно выбрать стиль, закинуть имя фотографа в промт и творить

#gallery
This media is not supported in your browser
VIEW IN TELEGRAM
MVDiffusion: Enabling Holistic Multi-view Image Generation with Correspondence-Aware Diffusion

По текстовому промту генерирует целостно согласованные изображения с нескольких ракурсов, что может пригодиться для создания панорамы или для многоракурсной генерации изображения по карте глубины. Может выдавать меш с текстурой

Код обещают в начале августа
Демо

#text2image #text2scene #novelview #textto3D #depthto3D #depth2image #text2scene #depth2scene
This media is not supported in your browser
VIEW IN TELEGRAM
Mixed Image Editing

Playground AI
выкатили редактор изображений с большинством последних достижений в этой области.

#image2image #imageediting
Forwarded from QWERTY
Чат-бот научили издеваться над телефонными мошенниками

В австралийском Университете Маккуори эксперты по кибербезопасности разработали чат-бот Apate. В основе — языковая модель с искусственным интеллектом и система клонирования голоса. Apate обучали на расшифровках телефонных разговоров с мошенниками. Цель проекта — удерживать собеседника на линии максимальное время, так как большое число таких разговоров способно пошатнуть «бизнес-модель» преступников. В ряде случаев ИИ удивил и своих создателей — он проявлял изрядную находчивость в нестандартных ситуациях, когда мошенники запрашивали информацию, отсутствовавшую в обучающих материалах.

Представители преступного мира и сами сейчас активно внедряют ИИ, подключая технологии клонирования голоса и дипфейки. Поэтому проект Apate — это своего рода симметричный ответ на передовые решения у мошенников. Учёные предполагают, что подобных чат-ботов могли бы внедрять операторы телефонной связи.
👍8
Нейронавт | Нейросети в творчестве
Emad твитнул про #SDXL Версия 1.0 будет будет легко дообучаться и в то же время качественная из коробки. Она уже самая качественная базовая модель. - Kohya уже подготовил свою дообучалку - Авторы выложат свою мощную дообучалку - Текстовая инверсия готова…
Вести с полей #SDXL

Оказывается, для обучения/дообучения требуется хренова гора VRAM. Вплоть до того что со всеми возможными оптимизациями обучение не запустится даже на 40GB VRAM. В коментах возражают что у Kohya обучение работает на 24GB, и он пилит алгоритм обучения на 12GB.

Не все радужно и гладко в датском королевстве. Возможно, мы вступаем в эру зависимости SD от онлайн сервисов. Можно даже конспирологически предположить что это сделано специально чтобы контролировать и цензурировать модели.

Пост на реддит
🤯2😱1
Forwarded from CGIT_Vines (Marvin Heemeyer)
This media is not supported in your browser
VIEW IN TELEGRAM
Replica Studios сделала войс плагин для движков, позволяющий озвучивать внутриигровых персонажей и передавать голоса непосредственно в проекты. Кроме игровых движков, совместим также с Iclone, Omniverse, Roblox, Metahuman.

Цитата компании: "NPC, управляемые искусственным интеллектом, будут динамически реагировать на голос игрока в реальном времени. Персонажи будут менять свой диалог, эмоциональный тон и жесты тела в ответ на то, как игрок обращается к ним."

Демку можно скачать тут
🔥6
Faster Segment Anything (MobileSAM)

FastSAM быстрый, но можно быть еще быстрее. MobileSAM всемеро легче и впятеро быстрее. И уже поддерживается в Grounded-SAM.

Код
Демо

#segmentation #image2mask #video2mask
👍1
This media is not supported in your browser
VIEW IN TELEGRAM
One-2-3-45: Any Single Image to 3D Mesh in 45 Seconds without Per-Shape Optimization

Свежий быстрый генератор 3D моделей по тексту или входной картинке.
Получив задание, первым делом генерит несколько ракурсов объекта через Zero123. А уже потом собирает объемную модель. На выходе меш с текстурами.

Код обещают выложить
Демо (сейчас не работает)
Демо2

#imageto3D #textto3D #novelview #rendering
👍4
Похоже. Но только слишком много чести кожаным самим промты придумывать, это и без них справятся
Real-time volumetric rendering of dynamic humans

В MetaAI придумали как быстро (3 часа против 72 часов у других существующих методов) воссоздать динамическую модель человека по одному видео чтобы рендерить ее в рилтайме. На мобилках рилтайм получается 40 кадров в секунду.

Скорость создания аватара достигается за счет параметрической болванки человека, которую, видимо, подстраивают индивидуально под персонажа с входного видео.

И похоже, что кодом делиться не хотят. Такая корова нужна самому

#videoto3D #video2avatar #humanavatar
👍3