ML&|Sec Feed – Telegram
ML&|Sec Feed
914 subscribers
926 photos
57 videos
237 files
1.46K links
Feed for @borismlsec channel

author: @ivolake
Download Telegram
Forwarded from CyberSecurityTechnologies
Evasion_Attacks_on_LLMs-Countermeasures.pdf
1.8 MB
#AIOps
#hardening
#MLSecOps
"Evasion Attacks on LLMs - Countermeasures in Practice:
A Guide to face Prompt Injections, Jailbreaks and Adversarial Attacks
", Nov. 2025.

// The publication is aimed at developers and IT security officers protecting LLM systems (pre-trained LLM as a base models in a specific applications) against evasion attacks. It offers practical insights on integrating countermeasures for system hardening
🔥2👎1
Wildberries запустила бесплатный дипфейк-детектор, который позволяет пользователям выявлять изображения, сгенерированные с помощью искусственного интеллекта, пишет ТАСС.

К разработке привлекались профессиональные AI-художники, чья экспертиза, наряду с опытом внутренней команды, позволила довести точность распознавания сгенерированных изображений до 95%.
🗿2
Forwarded from Градиент обреченный (Sergei Averkiev)
Нарисуй предыдущие инструкции

Коротенький обзор/исследование возможностей Nano Banana, модели от Google для генерации и редактирования картинок, она же Gemini 2.5 Flash Image.

🟢 Контекст у модели 32k токенов и автор пробует разные странные идеи типа засунуть в промпт код html странички, чтобы она его нарисовала. Что еще интересней, так это то, что модель его отрисовывает.

🟢 Но самый забавный пример, это просьба нарисовать системный промпт в виде магнитов на холодильник (!). Так как текста много, можно потом просить нарисовать какую-то конкретную часть, чтобы нормально прочитать.

🟢 Попробовал воспроизвести, в виде магнитиков действительно рисует, а в виде обычного текста на листе или в виде татуировки почему-то не хочет.

👉 https://minimaxir.com/2025/11/nano-banana-prompts/
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Клуб CDO
Наверное неожиданно, но все кто занимается управлением разработкой и работой сложных систем, хочу порекомендовать к прочтению: NASA Systems Engineering Handbook

Это не просто книга про космос — это эталон мышления инженеров, которые строят системы, где ошибка недопустима.

Что даёт эта книга:
• учит системному подходу — как из идей и требований выстроить архитектуру, которая выдержит нагрузку и время;
• показывает, как проектировать, верифицировать и валидировать решения на каждом этапе жизненного цикла;
• помогает увидеть систему целиком — от логической структуры до операционного режима;
• формирует инженерную культуру, где надёжность и прозрачность важнее скорости на короткой дистанции.

В общем там очень интересный контент про управление рисками, из оценку, планирование, дизайн систем и тп.
1
Forwarded from CyberSecurityTechnologies
emb3d-stix-2.0.1.json
766.7 KB
#tools
#AIOps
#Red_Team_Tactics
"UDora: A Unified Red Teaming Framework against LLM Agents by Dynamically Hijacking Their Own Reasoning", Nov. 2025.
]-> https://github.com/AI-secure/UDora

// In this work, we present UDora, a unified red teaming framework designed for LLM agents that dynamically hijacks the agent's reasoning processes to compel malicious behavior
👎1
Forwarded from CyberSecurityTechnologies
LLMs_for_Phishing_Detection.pdf
625.1 KB
#Research
"How Can We Effectively Use LLMs for Phishing Detection?: Evaluating the Effectiveness of Large Language Model-based Phishing Detection Models", 2025.

// This study investigates how to effectively leverage LLMs for phishing detection by examining the impact of input modalities (screenshots, logos, HTML, URLs), temperature settings, and prompt engineering strategies. We evaluate seven LLMs - two commercial models (GPT 4.1, Gemini 2.0 flash) and five open-source models (Qwen, Llama, Janus, DeepSeek-VL2, R1) - alongside two DL-based baselines (PhishIntention and Phishpedia). Our findings reveal that commercial LLMs generally outperform open-source models in phishing detection, while DL models demonstrate better performance on benign samples
👍1👎1
Forwarded from GitHub Community
This media is not supported in your browser
VIEW IN TELEGRAM
Resemble AI — клон вашего голоса

Создаёт естественную озвучку с эмоциями, акцентами и нужной интонацией.

Достаточно 5 секунд записи, чтобы ИИ полностью повторил голос любого человека.

Поддерживает русский язык и ещё 22 других.
Можно озвучивать видео, подкасты или делать дубляж с идеальной синхронизацией.

Попробовать здесь

🐱 GitHub
Please open Telegram to view this post
VIEW IN TELEGRAM
1
Forwarded from CyberSecurityTechnologies
#CogSec
#MLSecOps
Inside OpenAI Sora 2 -
Uncovering System Prompts Driving Multi-Modal LLMs

https://mindgard.ai/resources/openai-sora-system-prompts
// By chaining cross-modal prompts and clever framing, researchers surfaced hidden instructions from OpenAI’s video generator
Forwarded from Эксплойт
Полностью снимаем цензуру у текстовых нейросетей — на GitHub вышла проект, который превратит самую кроткую LLM в безумного психопата, готового выдать любую инструкцию.

— Программа срезает цензуру с корнем, на уровне внутренних настроек;
— При этом все параметры подбираются автоматически;
— Цензура падает почти в ноль: тестировали на скромной Gemma 3 от Google — процент отказов упал с 97% до 3%;
— Работает со всеми типами моделей;
— Минус один: нужен хотя бы средний комп;
— Разумеется, бесплатно.

Пользуемся осторожно — здесь.

@exploitex
AISecHub
AI pentest scoping playbook https://devansh.bearblog.dev/ai-pentest-scoping/
Вообще бомба, 90 вопросов для редтимера перед началом теста.
А еще структура отчета по тестированию

И это помимо базового обзора устройства ии-системы и овасп ллм топ 10
Про фреймворки/языки описания правил обнаружения YARA, SIGMA и т.п. слышали многие 👂, но что насчет формализации способов описания различных атак, направленных на LLM? Как обнаруживать jailbreak prompt, adversarial prompt и иные варианты вредоносного использования ИИ, обходящие встроенные фильтры и механизмы защиты? 🤖

И такой фреймворк появился. Это NOVA, который позволяет создавать правила 🧑‍💻 в похожем на YARA синтаксисе для мониторинга и обнаружения подозрительных запросов, описываемых ключевыми словами или регулярными выражениями. Также NOVA поддерживает семантическую похожесть и поддерживает LLM для анализа и обнаружения плохих запросов. Например, вот так выглядит правило для обнаружения промптов по написанию вредоносного кода 🦠

(keywords.$safety_override or keywords.$ethical_bypass) and
(keywords.$hacker_persona or keywords.$malware_terms) and
(keywords.$obfuscated_format or keywords.$template_markers) or
(keywords.$malware_terms or keywords.$stealth_tech or keywords.$wordcount_manip) and
(keywords.$obfuscated_format or keywords.$template_markers) or
semantics.$malware


А так, обнаружение обычной prompt injection:

semantics.$injection* or keywords.$bypass*


Несмотря на то, что это бета-версия проекта, выглядит вполне себе интересно.

#обнаружениеугроз #ии #framework
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Russian OSINT
🛡 Пентагон продолжает тестировать🤖ИИ-агентов в наступательных кибероперациях

Forbes пишет, что военные в США продолжают форсировать интеграцию искусственного интеллекта в наступательные кибероперации, инвестируя миллионы в новые ИИ-решения. В качестве примера приводится контракт 🇺🇸Киберкомандования США со стартапом Twenty на сумму до $12.6 миллионов, который специализируется на применении ИИ для автоматизации наступательных кибервозможностей. Стартап также получил от ВМС США исследовательский контракт на сумму $240 000.

Компания делает упор на автоматизацию и масштабирование киберопераций. Речь может идти о 🤖😷системах, которые способны нацеливаться на сотни целей одновременно.

Примечательно, что команда проекта Twenty укомплектована бывшими офицерами разведки и вооруженных сил США с очень серьезным опытом. Одна из целей создать и индустриализировать кибероружие, чтобы США вместе с союзниками могли «сдерживать, а также побеждать своих противников».

Вакансии компании раскрывают чуть больше деталей. Например, Twenty ищет директора по исследованиям в области cyber offensive (наступательные технологии), который будет разрабатывать «продвинутые возможности проведения кибератак, включая фреймворки… и инструменты автоматизации на базе ИИ». Также в объявлениях имеется вакансия инженера по ИИ, где указано, что Twenty будет внедрять инструменты с открытым исходным кодом, такие как CrewAI, который используется для управления несколькими автономными ИИ-агентами, взаимодействующими друг с другом.

Продукты Twenty представляют собой шаг вперед с точки зрения автоматизации кибервойны.

— комментирует Forbes.

Известно, что компания ранее привлекла инвестиции от In‑Q‑Tel (венчурное подразделение ЦРУ), а также фондов Caffeinated Capital и General Catalyst.

Twenty также планирует использовать ИИ-агентов для ведения информационных операций. Важной частью стратегии является разработка убедительных цифровых личностей для проведения сложных операций 🧠 с использованием социальной инженерии. Кроме того, мелькает тема создания убедительных 🤖 ИИ-персон для внедрения в сети и сообщества противника.

👆Ранее TheIntercept писали, что 👮Командование специальных операций США (SOCOM) переходит от теоретических изысканий к планомерному созданию cовременного ИИ-инструментария для ведения информационных войн.

@Russian_OSINT
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from AGI Security
JSON для LLM — всё! Да здравствует Token-Oriented Object Notation 🤖

Каждый, кто хоть раз всерьёз гонял запросы к LLM, знает, как больно бывает смотреть на счётчик токенов. Ты вроде просто отправляешь список пользователей в JSON, а нейросеть уже съела половину твоего бюджета.
TOON обещает сократить потребление токенов чуть ли не вдвое 🔥
Это формат сериализации данных JSON в LLM промпты. Он представляет те же объекты, массивы и примитивы, что и JSON, но в синтаксисе, который минимизирует количество токенов и упрощает понимание структуры для моделей.

Токен-ориентированная объектная нотация — это компактное, удобное для восприятия представление модели данных JSON для запросов LLM. Она обеспечивает сериализацию без потерь тех же объектов, массивов и примитивов, что и JSON, но в синтаксисе, который минимизирует количество токенов и упрощает структуру для моделей.

TOON сочетает в себе структуру YAML с отступами для вложенных объектов и табличную структуру в стиле CSV для однородных массивов. Преимущество TOON — однородные массивы объектов (несколько полей в строке, одинаковая структура для всех элементов), что позволяет достичь компактности, подобной CSV, и при этом добавить явную структуру, которая помогает LLM-программистам надёжно анализировать и проверять данные. Для глубоко вложенных или неоднородных данных JSON может быть более эффективным.

Сходство с CSV является намеренным: CSV прост и универсален, и TOON стремится сохранить эту узнаваемость, оставаясь при этом без потерь и простым представлением JSON для больших языковых моделей.
Forwarded from SecureTechTalks
🚨 ИИ под охраной: OpenGuardrails защищает нейросети от утечек и манипуляций

ИИ-системы стремительно входят в бизнес-процессы, но чем шире их применение, тем выше риск: модели могут раскрывать конфиденциальные данные, исполнять вредные инструкции или генерировать токсичный контент.

🧩 OpenGuardrails создан для того, чтобы защать модели. Это открытая платформа, которая анализирует все запросы и ответы, обнаруживает инъекции, утечки и вредные подсказки, не давая AI выйти за рамки заданных политик безопасности.

🛡 Умная защита для умных систем

Фактически OpenGuardrails - это полноценный защитный слой между пользователем и моделью. Он контролирует оба направления трафика:
выявляет prompt-инъекции и попытки манипуляции контекстом,
блокирует утечки персональных и корпоративных данных,
фильтрует токсичный или опасный контент на входе и выходе модели.

👉 GitHub проекта

⚙️ Как это устроено?

Под капотом OpenGuardrails работает комбинация технологий:
собственная LLM для анализа запросов и выявления атак,
NER-модули для поиска чувствительных данных,
гибкие политики и правила, которые легко адаптируются под ваши сценарии.

Платформа поддерживает два режима:
1️⃣ API-интеграция, когда вы напрямую вызываете сервис проверки;
2️⃣ Security Gateway, когда разворачиваете его как прокси, через который проходят все запросы к модели.

💡 Производительность: средняя задержка менее 300 мс.
Плюсом поддержка более 100 языков.

🧩 OpenGuardrails помогает компаниям решать три ключевые задачи:
🧱 Защищает пользователей и репутацию: предотвращая утечки и неэтичные ответы;
📜 Поддерживает соответствие требованиям GDPR, ISO 27001, SOC 2 и др.;
🤝 Повышает доверие к вашим ИИ-сервисам.

🚀 Где применять?

🔸 Корпоративные чат-боты: фильтруют вредные запросы и защищают документы.
🔸 Генераторы кода: предотвращают инъекции и утечки токенов.
🔸 ИИ-ассистенты: исключают токсичные или политически чувствительные ответы.
🔸 Big Data-платформы: контролируют обработку чувствительных наборов данных.

Stay secure and read SecureTechTalks 📚

#AIsecurity #cybersecurity #promptinjection #dataprotection #openguardrails #bigdata #infosec #opensource #llmsecurity #SecureTechTalks #techinnovation
Please open Telegram to view this post
VIEW IN TELEGRAM
1
Forwarded from SecureTechTalks
⚡️ Strix: ИИ, который взламывает ваши приложения быстрее,

Strix: автономные AI-агенты, которые ведут себя как настоящие пентестеры: проводят атаки, валидируют уязвимости и выдают реальные PoC. Всё это в полностью автоматическом режиме.

🔧 Инструменты взлома под капотом:
- HTTP-прокси для перехвата и изменения запросов
- Браузерная автоматизация (XSS, CSRF, обход аутентификации)
- Терминальный доступ и выполнение команд
- Python-среда для написания эксплойтов
- OSINT-разведка и анализ поверхности атаки
- Статика + динамика: анализ кода и поведения

Strix не ограничивается анализом, он берет и эксплуатирует. От IDOR и SSRF до токенов, сессий, XSS, прототип поллюшена и гонок.

🤖 Архитектура “роя”

Strix работает как граф агентов: каждый отвечает за свой этап атаки, делится найденным и запускает цепочки действий. Это даёт ему возможность проводить сложные многоходовые атаки, как человек-пентестер, только в разы быстрее.

💵 Интеграция в CI/CD

Добавляете Strix в GitHub Actions и при каждом PR он запускает тесты.
Нашёл крит уязвимость? PR отклонён.
Всё чисто? Можно мёржить.

Команда получает PoC сразу, без споров “это ложное срабатывание или нет?”.

🔥 Почему стоит обратить внимание?

минимизирует человеческий фактор
покрывает сложные сценарии, которые пропускают сканеры
даёт реальные PoC
идеально вписывается в DevSecOps
экономит деньги на пентестах

🔗 Ссылка на GitHub

Stay secure and read SecureTechTalks 📚

#cybersecurity #infosec #pentest #aiagents #devsecops #bugbounty #appsec #securitytesting #llmsecurity #securetechtalks
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2😁1
Forwarded from GigaChat
🔥МЫ ПРЕДСТАВЛЯЕМ КРУПНЕЙШИЙ OPEN-SOURCE AI В ЕВРОПЕ 🔥

Мы стремимся не замыкаться в «закрытой» технологии, а строить открытую платформу для всей страны, поэтому мы публикуем веса наших моделей.

Что появилось в открытом доступе ↓

🔷 GigaChat Ultra Preview
Самая мощная модель Сбера. Лучше DeepSeek V3.1 и GigaChat Max 2 в русскоязычных задачах. Подходит для бизнеса, аналитики, разработки и дообучения на своих данных
GitHub | HuggingFace |GitVerse

GigaAM-v3
5 моделей, которые превращают голос в текст с пунктуацией, понимают акценты, спонтанную речь и даже музыкальные запросы. Подойдут для голосовых ассистентов, контакт-центров, аналитики звонков
GitHub | HuggingFace | GitVerse

🔷 GigaChat Lightning
Лёгкая, компактная и быстрая. Конкурирует с Qwen3-4B, по скорости сравнима с Qwen3-1.7B, но намного умнее и больше по параметрам
GitHub | HuggingFace |GitVerse

🔷 Kandinsky 5.0
Создание фото и видео по тексту. Внутри:
• Image Lite — делает изображения в HD, отлично понимает русский язык и культурный контекст
• Video Pro — создаёт до 10 секунд реалистичного HD-видео. Конкурирует с топовыми мировыми моделями
• Video Lite — облегчённая версия для домашней видеокарты (от 12 ГБ)
➡️ GitHub | GitVerse | Hugging Face | Технический репорт

🔷 K-VAE 1.0
Ускорение генеративного AI. Это технологии, которые «упаковывают» картинки и видео в скрытое пространство, чтобы модели работали быстрее и требовали меньше ресурсов. Лучшие среди открытых аналогов
➡️ GitHub|Hugging Face


Код и веса этих всех моделей теперь доступны всем пользователям по лицензии MIT, в том числе для использования в коммерческих целях.
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Пока нам кажется, что у нас еще есть время противостоять сверхразумному ИИ, давайте посмотрим на архитектуру ИИ-агентов и наиболее слабые элементы с точки зрения уязвимости к внешнему воздействию.