NEW BOT Телеграм, страница

ML&|Sec Feed

Forwarded from Похек AI (Сергей Зыбнев)

Nikita Barsukov — Look at my Pickle (2025).pdf

9.9 MB

Презентации с митапа LLAMATOR в Ереване

Evolution of AI Threats.pdf

4.9 MB

Jailbreaking LLMs via Semantic Abstraction.pptx.pdf

4.1 MB

🔥3❤1🥱1

154 viewsБорис_ь с ml, 09:37

ML&|Sec Feed

Forwarded from DevSecOps Talks

Building Secure AI Applications.pdf

2.7 MB

Building Secure AI Applications

Всем привет!

В приложении можно скачать небольшой методический материал (~ 40 страниц), посвященный тому, на что обращать внимание при обеспечении ИБ при разработке приложений, использующих AI.

Материал основан на OWASP Top 10 для LLM:
🍭 LLM01 Prompt Injection
🍭 LLM02 Sensitive Information Disclosure
🍭 LLM03 Supply Chain
🍭 LLM04 Data and Model Poisoning
🍭 LLM05 Improper Output Handling и не только

Для каждого раздела описаны общие рекомендации по повышению уровня защищенности и перечень инструментов, которые можно использовать для автоматизации.

Дополнительно в материале представлена концептуальная архитектура с соотношением рассматриваемых угроз.

135 viewsБорис_ь с ml, 04:54

ML&|Sec Feed

Forwarded from RoboFuture

У Anthropic вышло очень интересное видео на тему универсальных агентов (general-purpose agents), которое у меня максимально отзывается. Основной посыл - не нужно делать специализированных агентов, нужно делать одного качественного универсального, а его уже кастомизировать под свои задачи

Само видео (16 минут) и короткая статья по нему от businessinsider

Инженеры из Anthropic предлагают вместо набора агентов использовать скилы для агента, который изначально создан для написания кода (Claude Code). Дальше они говорят, что skills будут использовать не только инженеры, но и нетехнические специалисты - врачи, менеджеры, трейдеры и тд, которые будут кастомизировать этого агента под себя

По их логике, один general-purpose агент + библиотека skills становится “универсальной основой” для множества задач — без зоопарка спецагентов

Иными словами, такой агент - универсальный интерфейс к миру

А вот с тем, что CLI-агент подходит нетехническим специалистам, я не согласен… Все-таки инструмент достаточно специфичный. Мне кажется, что будущее действительно за универсальными агентами, но не совсем такими.
Для работы будут использоваться агенты, которые выглядят как чатовый интерфейс (как ChatGPT)

Примерно год назад наша команда загорелась идеей универсального агента GigaAgent, которого недавно представили на AIJ. Уже довольно много коллег разработчиков мне отписалось о тестировании, на AIJ и Conversations заинтересовались компании. Здесь могу только порадоваться, напомнить ставить звездочки нашему опенсорс-агенту и присылать PR :) Круто, что большие игроки тоже увидели будущее в этом подходе!

P.S. У нас большое обновление в dev ветке - MCP, RAG, долговременная память

👍3

137 viewsБорис_ь с ml, 15:07

ML&|Sec Feed

Forwarded from MLTimes

Gartner предупредила о киберрисках при использовании ИИ-браузеров

Gartner выпустила рекомендацию для организаций по блокировке агентских ИИ-браузеров. Речь о продуктах вроде Comet от Perplexity и ChatGPT Atlas от OpenAI. Причина - высокие киберриски для корпоративных данных.

Документ называется "Кибербезопасность должна пока блокировать браузеры с ИИ". Его подготовили вице-президент по исследованиям Деннис Сюй, старший директор-аналитик Евгений Миролюбов и вице-президент-аналитик Джон Уоттс. Главная претензия - настройки по умолчанию ставят удобство выше безопасности.

https://mltimes.ai/gartner-predupredila-o-kiberriskah-pri-ispolzovanii-ii-brauzerov/

141 viewsБорис_ь с ml, 08:00

ML&|Sec Feed

https://hexstrike.com/

HexStrike AI

HexStrike AI - Revolutionary AI-Powered Offensive Security Framework

Advanced AI-driven penetration testing and security assessment tools.

👎1

132 viewsБорис_ь с ml, 06:16

ML&|Sec Feed

https://www.inferasecurity.ru/

www.inferasecurity.ru

INFERA SECURITY

Denoscription

👀1

125 viewsБорис_ь с ml, 08:36

ML&|Sec Feed

Forwarded from Градиент обреченный (Sergei Averkiev)

Все про кодовые модели

Хороший обзор Code LLMs, от фундаментальных моделей до агентов.

🟢 Какие задачи есть в кодогенерации. Неплохая таксономия (code completion, FIM, оптимизация кода, ревью, генерация тестов и т.д.)

🟢 Как обучают, про претрейн для кода, SFT и RL. Какие есть метрики и бенчи под них.

Добавляем в закладки, когда-нибудь почитаем.

https://arxiv.org/pdf/2511.18538

Please open Telegram to view this post

VIEW IN TELEGRAM

👍2

128 viewsБорис_ь с ml, 09:57

ML&|Sec Feed

Forwarded from SecPost

🧠Рынок кибербезопасности для ИИ готовится к взрывному росту, прогнозируя объём в миллиарды рублей уже к 2026 году. Его подстёгивают первые громкие инциденты с утечками данных через AI-модели, которые создают спрос на защиту.

⏩При этом интеграция ИИ в бизнес опережает внедрение систем контроля, открывая новое поле для кибератак и формируя стремительно растущий сегмент рынка, подробнее в материале SecPost😍

Please open Telegram to view this post

VIEW IN TELEGRAM

secpost.ru

Российский рынок защиты ИИ-систем обещает перевалить за 1 млрд руб. в 2026 году

Рынок кибербезопасности для ИИ готовится к взрывному росту, прогнозируя объём в миллиарды рублей уже к 2026 году. Его подстёгивают первые громкие инциденты с утечками данных через AI-модели, которые создают спрос на защиту. При этом интеграция ИИ в бизнес…

135 viewsБорис_ь с ml, 10:32

ML&|Sec Feed

Forwarded from Похек AI (Сергей Зыбнев)

Про работу памяти ChatGPT и Claude

https://manthanguptaa.in/posts/chatgpt_memory/
https://manthanguptaa.in/posts/claude_memory/

manthanguptaa.in

I Reverse Engineered ChatGPT's Memory System, and Here's What I Found!

When I asked ChatGPT what it remembered about me, it listed 33 facts from my name and career goals to my current fitness routine. But how does it actually store and retrieve this information? And why does it feel so seamless?
After extensive experimentation…

👍2

122 viewsБорис_ь с ml, 13:12

ML&|Sec Feed

Vibranium Dome - LLM WAF for Agents

GitHub

GitHub - genia-dev/vibraniumdome: LLM Security Platform.

LLM Security Platform. Contribute to genia-dev/vibraniumdome development by creating an account on GitHub.

🔥2

185 viewsБорис_ь с ml, 14:07

ML&|Sec Feed

Forwarded from AISecure

Начал проходить AI Red Teamer от Hack The Box (делают вместе с Google).

Это путь про red team-подходы к AI-системам: LLM, prompt injection, атаки на данные, evasion-атаки, безопасность AI-приложений и всё вокруг этого. Формат классический для HTB — теория + практика.

Что показалось интересным — курс довольно быстро расширяется.
Когда начинал, в пути было 5 модулей, сейчас уже 12, и часть из них добавили совсем недавно.

Текущий состав модулей:

- Fundamentals of AI
- Applications of AI in InfoSec
- Introduction to Red Teaming AI
- Prompt Injection Attacks
- LLM Output Attacks
- AI Data Attacks
- Attacking AI — Application and System
- AI Evasion — Foundations
- AI Evasion — First-Order Attacks
- AI Evasion — Sparsity Attacks
- AI Privacy (NEW)
- AI Defense (NEW)

Причём все уроки уровня — Medium / Hard, так что это не «ознакомительный курс», а достаточно плотный материал.
И с пометкой NEW - совсем свежие модули,

Сам ещё в процессе, поэтому финальные выводы делать рано. Но как структурированная обучалка по AI red teaming и безопасности ИИ в целом — выглядит интересно, плюс видно, что путь активно допиливают и расширяют.

Если тема AI security откликается — стоит глянуть.

#security #HTB #AI #RedTeam

👍2

93 viewsБорис_ь с ml, 04:25

ML&|Sec Feed

Forwarded from Innovation & Research

AI-агенты летят в космос

Космические аппараты становятся слишком сложными, слишком автономными и слишком удаленными от Земли, чтобы полагаться на статические правила и наземные исследования. Мультиагентный подход к AI-разработке дает практичный, поэтапный, оперативно совместимый метод обнаружения, понимания и реагирования на аномалии — особенно на те, которые ранее не наблюдались.

Этот подход повышает надежность миссии, улучшает безопасность и готовит космические системы к реалиям работы в условиях отсутствия связи с Землей.

Такой подход, основанный на совместном мышлении, обеспечивает ряд оперативных преимуществ:

- Чувствительность к тонким закономерностям: Благодаря специализации агентов, они могут обнаруживать отклонения на ранних стадиях, которые упускаются из виду в рамках широких монолитных моделей.
- Снижение количества ложных срабатываний: Согласованность действий агентов повышает уверенность и снижает уровень шума в ходе выполнения миссии.
- Охват неизвестных неизвестных: Агенты могут отслеживать отклонения без необходимости использования предопределенных меток или исторических примеров.
- Бортовое, независимое от Земли распознавание: При развертывании на орбите агенты могут диагностировать проблемы даже при длительных перебоях в связи.

По мере расширения лунных, марсианских и космических миссий это становится структурным требованием. Миссии должны обеспечивать безопасную работу, не полагаясь исключительно на наземный контроль.

Небольшая заметка об этом от основателя стартапа, работающего над мультиагентной архитектурой для космических миссий.
https://spacenews.com/how-multi-agent-ai-can-strengthen-space-missions-against-the-unknown/

SpaceNews

How multi-agent AI can strengthen space missions against the unknown

117 viewsБорис_ь с ml, 04:36

ML&|Sec Feed

Forwarded from GitHub Community

Eigent — это первое в мире настольное приложение Multi-agent Workforce, которое позволяет создавать, управлять и внедрять собственную рабочую силу на основе ИИ, способную превратить самые сложные рабочие процессы в автоматизированные задачи.

🐱

GitHub

Please open Telegram to view this post

VIEW IN TELEGRAM

122 viewsБорис_ь с ml, 05:50

ML&|Sec Feed

Forwarded from GitHub Community

QueryWeaver — инструмент Text2SQL с открытым исходным кодом, который преобразует естественный язык в SQL с помощью анализа схемы на основе графов.

Задавайте вопросы базе данных на простом английском языке, а QueryWeaver сделает всё остальное.

🐱

GitHub

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥1

129 viewsБорис_ь с ml, 05:50

ML&|Sec Feed

https://ai.meta.com/blog/practical-ai-agent-security/

Meta AI

Agents Rule of Two: A Practical Approach to AI Agent Security

We've developed the Agents Rule of Two. When this framework is followed, the severity of security risks is deterministically reduced.

134 viewsБорис_ь с ml, 11:07