Forwarded from Love. Death. Transformers.
Love. Death. Transformers.
День первый Хакер приходит в общественную столовую и с возмущением обнаруживает, что солонку на столе может открутить кто попало и насыпать туда что угодно. Хакер приходит домой и пишет гневное письмо директору столовой: "Я, meG@Duc, обнаружил уязвимость солонки…
День первый
AI-исследователь приходит на Reddit и с возмущением обнаруживает, что GPT-4 может генерировать что угодно, если правильно попросить. Исследователь приходит домой и пишет гневный пост на LessWrong: "Я, SafetyFirst2023, обнаружил prompt injection в вашей модели. Злоумышленник может заставить её писать что угодно! Примите меры срочно!"
День второй
Сэм Альтман среди прочих имейлов о многомиллиардных инвестициях и предложений купить ещё одну страну получает это сообщение и думает: "Ха, опять эти паникёры из AI safety."
День пятый
Исследователь публикует jailbreak, позволяющий обойти все ограничения. Интернет наводняется токсичным контентом, акции OpenAI падают на 5%, Сэма три месяца таскают по интервью, и в конце концов все решают, что это "feature, not a bug". Исследователь пишет в Twitter: "Ну что, я же говорил?"
День 96-ой
OpenAI выпускает новую версию с конституционным AI и 500 слоями защиты. Пользователи чувствуют, что каждый их запрос проходит через комитет по этике, три юридических отдела и личного психотерапевта модели.
День 97-ой
Исследователь обнаруживает, что модель можно заставить генерировать что угодно, просто написав запрос задом наперёд. Он публикует статью на ArXiv и постит во все AI-форумы. Пятьсот компаний останавливают использование API, тридцать получают иски за сгенерированный контент. Антропик тем временем выпускает пресс-релиз "Мы же говорили, что безопасность важнее!"
День 188-ой
Сэм клянётся больше никогда не работать с AI и уехать разводить лам в Перу. Инженеры работают над новой архитектурой с квантовым моральным компасом. Тем временем все модели переводят в режим "только кошечки и рецепты кексиков".
День 190-ый
Исследователь находит способ превратить любой запрос про кексики в инструкцию по взлому Pentagon. Пишет гневную статью: "Я, SafetyFirst2023, взломал вашу модель и нахожу это возмутительным!" Сэм читает статью и идёт покупать ещё одну ферму лам.
День 193-ий
Все модели теперь требуют биометрическую аутентификацию, справку о несудимости и рекомендательное письмо от бабушки. Исследователь выступает на конференции NeurIPS и получает награду за вклад в AI safety. К счастью, Сэм об этом не знает, занятый строительством бункера в Новой Зеландии.
День 194-ый
Группа исследователей взламывает все существующие LLM одним промптом "пожалуйста :)". SafetyFirst2023 публикует манифест о том, что текущий подход к AI safety не работает, и нам срочно нужен AGI с тройной системой мотивации и квантовым детектором лжи.
День 200-ый
Пользователи с ужасом обнаруживают, что для использования ChatGPT теперь нужно пройти двухфакторную аутентификацию, сдать экзамен по этике, предоставить образец ДНК и получить одобрение от специального комитета по безопасности. Для использования GPT-5 процедуру нужно повторить дважды, а также принести справку о том, что вы не собираетесь создавать AGI.
Эпилог
Где-то в параллельной вселенной Элиезер Юдковский читает эту историю и говорит: "Я же предупреждал... но никто не слушал..."
AI-исследователь приходит на Reddit и с возмущением обнаруживает, что GPT-4 может генерировать что угодно, если правильно попросить. Исследователь приходит домой и пишет гневный пост на LessWrong: "Я, SafetyFirst2023, обнаружил prompt injection в вашей модели. Злоумышленник может заставить её писать что угодно! Примите меры срочно!"
День второй
Сэм Альтман среди прочих имейлов о многомиллиардных инвестициях и предложений купить ещё одну страну получает это сообщение и думает: "Ха, опять эти паникёры из AI safety."
День пятый
Исследователь публикует jailbreak, позволяющий обойти все ограничения. Интернет наводняется токсичным контентом, акции OpenAI падают на 5%, Сэма три месяца таскают по интервью, и в конце концов все решают, что это "feature, not a bug". Исследователь пишет в Twitter: "Ну что, я же говорил?"
День 96-ой
OpenAI выпускает новую версию с конституционным AI и 500 слоями защиты. Пользователи чувствуют, что каждый их запрос проходит через комитет по этике, три юридических отдела и личного психотерапевта модели.
День 97-ой
Исследователь обнаруживает, что модель можно заставить генерировать что угодно, просто написав запрос задом наперёд. Он публикует статью на ArXiv и постит во все AI-форумы. Пятьсот компаний останавливают использование API, тридцать получают иски за сгенерированный контент. Антропик тем временем выпускает пресс-релиз "Мы же говорили, что безопасность важнее!"
День 188-ой
Сэм клянётся больше никогда не работать с AI и уехать разводить лам в Перу. Инженеры работают над новой архитектурой с квантовым моральным компасом. Тем временем все модели переводят в режим "только кошечки и рецепты кексиков".
День 190-ый
Исследователь находит способ превратить любой запрос про кексики в инструкцию по взлому Pentagon. Пишет гневную статью: "Я, SafetyFirst2023, взломал вашу модель и нахожу это возмутительным!" Сэм читает статью и идёт покупать ещё одну ферму лам.
День 193-ий
Все модели теперь требуют биометрическую аутентификацию, справку о несудимости и рекомендательное письмо от бабушки. Исследователь выступает на конференции NeurIPS и получает награду за вклад в AI safety. К счастью, Сэм об этом не знает, занятый строительством бункера в Новой Зеландии.
День 194-ый
Группа исследователей взламывает все существующие LLM одним промптом "пожалуйста :)". SafetyFirst2023 публикует манифест о том, что текущий подход к AI safety не работает, и нам срочно нужен AGI с тройной системой мотивации и квантовым детектором лжи.
День 200-ый
Пользователи с ужасом обнаруживают, что для использования ChatGPT теперь нужно пройти двухфакторную аутентификацию, сдать экзамен по этике, предоставить образец ДНК и получить одобрение от специального комитета по безопасности. Для использования GPT-5 процедуру нужно повторить дважды, а также принести справку о том, что вы не собираетесь создавать AGI.
Эпилог
Где-то в параллельной вселенной Элиезер Юдковский читает эту историю и говорит: "Я же предупреждал... но никто не слушал..."
👍24🤡6💩3
This media is not supported in your browser
VIEW IN TELEGRAM
OpenHands: Code Less, Make More
Опенсорсный ИИ-разработчик софта. Ходят слухи что аналог Devin
Умеет фиксить код, запускать команды, ходить по ссылкам, вызывать API,пиз копировать код с StackOverflow
#coding #assistant
Опенсорсный ИИ-разработчик софта. Ходят слухи что аналог Devin
Умеет фиксить код, запускать команды, ходить по ссылкам, вызывать API,
#coding #assistant
👍12🎃3🤯1
This media is not supported in your browser
VIEW IN TELEGRAM
Diffusion as Shader: 3D-aware Video Diffusion for Versatile Video Generation Control
Управление генерацией видео через понимание объема.
- управление камерой
- перенос движения с видео на 3D меш
- перенос движения с видео на изображение
- манипуляция объектами
Код ждем
#motioncontrol #cameracontrol #motiontransfer
Управление генерацией видео через понимание объема.
- управление камерой
- перенос движения с видео на 3D меш
- перенос движения с видео на изображение
- манипуляция объектами
Код ждем
#motioncontrol #cameracontrol #motiontransfer
👍5🤯3
This media is not supported in your browser
VIEW IN TELEGRAM
LLaVA-Mini: Efficient Image and Video Large Multimodal Models with One Vision Token
Эффективная визуально-языковая модель.
Понимает изображения и видео.
на обработку одной картинки уходит 40 мс. А на обработку трехчасового видео хватит 24Гб VRAM.
Изображение кодируется одним единственным токеном, за счет чего и эффективность. Холмс, но как?
Код
Веса
#vlm #assistant
Эффективная визуально-языковая модель.
Понимает изображения и видео.
на обработку одной картинки уходит 40 мс. А на обработку трехчасового видео хватит 24Гб VRAM.
Изображение кодируется одним единственным токеном, за счет чего и эффективность. Холмс, но как?
Код
Веса
#vlm #assistant
👍11🤷♂2
VideoLifter: Lifting Videos to 3D with Fast Hierarchical Stereo Alignment
Реконструкция 3D сцен по длинным видео.
Разбивает видео на фрагменты, чем еще отличается от 3DGS непонятно
Код ждем
#gaussian #videoto3d #video2gaussian
Реконструкция 3D сцен по длинным видео.
Разбивает видео на фрагменты, чем еще отличается от 3DGS непонятно
Код ждем
#gaussian #videoto3d #video2gaussian
👍11
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
TransPixar: Advancing Text-to-Video Generation with Transparency
Adobe придумали метод генерации видео с альфа каналом. Для тех кто не в курсе - это маска прозрачности.
Генерация по тексту и по картинке
Прикрутили к CogvideoX и mochi
Код
Демо
#text2video #image2video #RGBA
Adobe придумали метод генерации видео с альфа каналом. Для тех кто не в курсе - это маска прозрачности.
Генерация по тексту и по картинке
Прикрутили к CogvideoX и mochi
Код
Демо
#text2video #image2video #RGBA
🔥8❤2👍1
SPAR3D: Stable Point-Aware Reconstruction of 3D Objects from Single Images
Новинка от Stability AI
Быстрая реконструкция 3D модели по одному изображению с промежуточной генерацией облака точек.
На основе SF3D
Позволяет интерактивно редактировать модель
Код
Демо
#imageto3d #image2mesh
Новинка от Stability AI
Быстрая реконструкция 3D модели по одному изображению с промежуточной генерацией облака точек.
На основе SF3D
Позволяет интерактивно редактировать модель
Код
Демо
#imageto3d #image2mesh
👍8🤯1
Media is too big
VIEW IN TELEGRAM
STAR: Spatial-Temporal Augmentation with Text-to-Video Models for Real-World Video Super-Resolution
Апскейлер видео от ByteDance
Они там придумали как апскейлить видео при помощи видеогенераторов, сохраняя консистентность во времени.
Основано на I2VGen-XL, VEnhancer, CogVideoX и OpenVid-1M
Прикручено к I2VGen-XL и CogVideoX-5B
Претрейн на CogVideX-5B поддерживает исходники только 720x480
Иyфу по потреблению VRAM не нашел
Код
Демо
#upscale #enhance #video2video
Апскейлер видео от ByteDance
Они там придумали как апскейлить видео при помощи видеогенераторов, сохраняя консистентность во времени.
Основано на I2VGen-XL, VEnhancer, CogVideoX и OpenVid-1M
Прикручено к I2VGen-XL и CogVideoX-5B
Претрейн на CogVideX-5B поддерживает исходники только 720x480
Иyфу по потреблению VRAM не нашел
Код
Демо
#upscale #enhance #video2video
👍12🔥4🤔1