Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.46K photos
3.73K videos
41 files
4.77K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
ChatGPT, плагины-шмагины! Да сделайте уже свой плагин на Gradio за 5 минут

Запилить плагин-шмагин

#chatbot #tools
👍4
This media is not supported in your browser
VIEW IN TELEGRAM
Rerender a video теперь можно запустить в колабе. Работает пока не очень, можно ожидать что в официальном релизе будет лучше.
Много красивых примеров на официальной страничке

colab

@тоже_моушн

#text2video #video2video
1
PoseDiffusion: Solving Pose Estimation via Diffusion-aided Bundle Adjustment

Трекинг камеры по пачке входных изображений с разных ракурсов. Бонусом - рендер новых ракурсов. Задача которая давно успешно решается без применения ИИ. Но в компьютерном зрении бывает нужно чтобы она решалась автоматически и быстро.

Код

#tracking #imageto3D #novelview #rendering
👍1
SDXL 0.9 Photographers Study

Фотографы, найденные в #SDXL, удобная галерея.
А значит, можно выбрать стиль, закинуть имя фотографа в промт и творить

#gallery
This media is not supported in your browser
VIEW IN TELEGRAM
MVDiffusion: Enabling Holistic Multi-view Image Generation with Correspondence-Aware Diffusion

По текстовому промту генерирует целостно согласованные изображения с нескольких ракурсов, что может пригодиться для создания панорамы или для многоракурсной генерации изображения по карте глубины. Может выдавать меш с текстурой

Код обещают в начале августа
Демо

#text2image #text2scene #novelview #textto3D #depthto3D #depth2image #text2scene #depth2scene
This media is not supported in your browser
VIEW IN TELEGRAM
Mixed Image Editing

Playground AI
выкатили редактор изображений с большинством последних достижений в этой области.

#image2image #imageediting
Forwarded from QWERTY
Чат-бот научили издеваться над телефонными мошенниками

В австралийском Университете Маккуори эксперты по кибербезопасности разработали чат-бот Apate. В основе — языковая модель с искусственным интеллектом и система клонирования голоса. Apate обучали на расшифровках телефонных разговоров с мошенниками. Цель проекта — удерживать собеседника на линии максимальное время, так как большое число таких разговоров способно пошатнуть «бизнес-модель» преступников. В ряде случаев ИИ удивил и своих создателей — он проявлял изрядную находчивость в нестандартных ситуациях, когда мошенники запрашивали информацию, отсутствовавшую в обучающих материалах.

Представители преступного мира и сами сейчас активно внедряют ИИ, подключая технологии клонирования голоса и дипфейки. Поэтому проект Apate — это своего рода симметричный ответ на передовые решения у мошенников. Учёные предполагают, что подобных чат-ботов могли бы внедрять операторы телефонной связи.
👍8
Нейронавт | Нейросети в творчестве
Emad твитнул про #SDXL Версия 1.0 будет будет легко дообучаться и в то же время качественная из коробки. Она уже самая качественная базовая модель. - Kohya уже подготовил свою дообучалку - Авторы выложат свою мощную дообучалку - Текстовая инверсия готова…
Вести с полей #SDXL

Оказывается, для обучения/дообучения требуется хренова гора VRAM. Вплоть до того что со всеми возможными оптимизациями обучение не запустится даже на 40GB VRAM. В коментах возражают что у Kohya обучение работает на 24GB, и он пилит алгоритм обучения на 12GB.

Не все радужно и гладко в датском королевстве. Возможно, мы вступаем в эру зависимости SD от онлайн сервисов. Можно даже конспирологически предположить что это сделано специально чтобы контролировать и цензурировать модели.

Пост на реддит
🤯2😱1
Forwarded from CGIT_Vines (Marvin Heemeyer)
This media is not supported in your browser
VIEW IN TELEGRAM
Replica Studios сделала войс плагин для движков, позволяющий озвучивать внутриигровых персонажей и передавать голоса непосредственно в проекты. Кроме игровых движков, совместим также с Iclone, Omniverse, Roblox, Metahuman.

Цитата компании: "NPC, управляемые искусственным интеллектом, будут динамически реагировать на голос игрока в реальном времени. Персонажи будут менять свой диалог, эмоциональный тон и жесты тела в ответ на то, как игрок обращается к ним."

Демку можно скачать тут
🔥6
Faster Segment Anything (MobileSAM)

FastSAM быстрый, но можно быть еще быстрее. MobileSAM всемеро легче и впятеро быстрее. И уже поддерживается в Grounded-SAM.

Код
Демо

#segmentation #image2mask #video2mask
👍1
This media is not supported in your browser
VIEW IN TELEGRAM
One-2-3-45: Any Single Image to 3D Mesh in 45 Seconds without Per-Shape Optimization

Свежий быстрый генератор 3D моделей по тексту или входной картинке.
Получив задание, первым делом генерит несколько ракурсов объекта через Zero123. А уже потом собирает объемную модель. На выходе меш с текстурами.

Код обещают выложить
Демо (сейчас не работает)
Демо2

#imageto3D #textto3D #novelview #rendering
👍4
Похоже. Но только слишком много чести кожаным самим промты придумывать, это и без них справятся
Real-time volumetric rendering of dynamic humans

В MetaAI придумали как быстро (3 часа против 72 часов у других существующих методов) воссоздать динамическую модель человека по одному видео чтобы рендерить ее в рилтайме. На мобилках рилтайм получается 40 кадров в секунду.

Скорость создания аватара достигается за счет параметрической болванки человека, которую, видимо, подстраивают индивидуально под персонажа с входного видео.

И похоже, что кодом делиться не хотят. Такая корова нужна самому

#videoto3D #video2avatar #humanavatar
👍3
This media is not supported in your browser
VIEW IN TELEGRAM
Any Image to 3D

Генерация 3D обектов по картинке. И вроде выглядит прилично.
Сейчас генерация происходит в дискорде, как в MidJourney. Кстати, есть интеграция с MJ для генерации входных картинок через ваш MJ аакунт.

Записаться в вейтлист (Вы можете зайти в дискорд, но генерировать сможете только после того как вам одобрят доступ по вейтлисту)
Дискорд
Галерея

#textto3D #imageto3D
👍5
This media is not supported in your browser
VIEW IN TELEGRAM
Text2Room: Extracting Textured 3D Meshes from 2D Text-to-Image Models

Генератор целых интерьеров по тексту. На выходе текстурированный меш. На сайте есть интерактивный меш вьюер.

Код

#textto3D #text2scene #rendering
👍41