NEW BOT Телеграм, страница - 747487401

ML&|Sec Feed

914 subscribers

924 photos

57 videos

237 files

1.46K links

Feed for @borismlsec channel

author: @ivolake

Download Telegram

About

Blog

Apps

Platform

914 subscribers

Forwarded from Андрей

Решения в области ИИ-безопасности на 2025 год

Рынок систем безопасности на основе ИИ вступает в новую фазу

После нескольких лет ажиотажа и исследований мы наблюдаем явную консолидацию рынка решений для обеспечения безопасности с помощью ИИ. Сектор безопасности с помощью ИИ вступает в фазу зрелости, о чём свидетельствует эволюция нашего «Радара решений для обеспечения безопасности с помощью ИИ».

https://www.riskinsight-wavestone.com/en/2025/09/2025-ai-security-solutions-radar/

2025 AI security solutions Radar - RiskInsight

The AI security market is entering a new phase After several years of excitement and exploration, we are now witnessing a clear consolidation of the AI security solutions market. The AI security sector is entering a phase of...

198 viewsБорис_ь с ml, 12:13

Forwarded from Андрей

2025 AI security solutions Radar - RiskInsight.PDF

198 viewsБорис_ь с ml, 12:13

Forwarded from AISec [x\x feed]🍓🍌🍆 (Artyom Semenov)

https://www.neuronpedia.org/

137 viewsБорис_ь с ml, 16:41

Forwarded from CyberSecurityTechnologies

VLM_Multi-Faceted_Attack.pdf

#MLSecOps
#Offensive_security
"Multi-Faceted Attack: Exposing Cross-Model Vulnerabilities in Defense-Equipped Vision-Language Models", Nov. 2025.

// Multi-Faceted Attack (MFA) - framework that systematically uncovers general safety vulnerabilities in leading defense-equipped VLMs, including GPT-4o, Gemini-Pro, and LlaMA 4, etc. Central to MFA is the Attention-Transfer Attack, which conceals harmful instructions inside a meta task with competing objectives. We offer a theoretical perspective grounded in reward-hacking to explain why such an attack can succeed

👍1

162 viewsБорис_ь с ml, 03:50

фазы атак на ии

OWASP + Microsoft - https://atlas.mitre.org/matrices/ATLAS
Zenity - https://ttps.ai
Nvidia - https://developer.nvidia.com/blog/modeling-attacks-on-ai-powered-apps-with-the-ai-kill-chain-framework
Hiddenlayer - https://hiddenlayer.com/innovation-hub/introducing-a-taxonomy-of-adversarial-prompt-engineering

Attacks Matrix - AI Agents Attack Matrix

Documentation for the AI Agents Attack Matrix

174 viewsБорис_ь с ml, edited 05:57

Forwarded from CodeCamp

Российские ученые взяли трофей на NeurIPS 2025 — команда In2AI заняла первое место в международном турнире по стратегическому мышлению для ИИ-агентов.

В состав сборной вошли представители научного партнера Сбера — Институт AIRI. Одна из их моделей с 8B параметров обошла участников на GPT-5, Gemini 2.5 Pro и Grok 4. В итоге она выиграла сразу в двух треках: Efficient и Open.

Секрет успеха — в системном инженерном подходе к обучению с подкреплением. Всего в соревновании участвовали 76 команд и 944 модели.

Наши слоны 💪

Please open Telegram to view this post

VIEW IN TELEGRAM

⚡1

152 viewsБорис_ь с ml, 19:12

Forwarded from GitHub Community

Baby Dragon Hatchling (BDH) — это архитектура большой языковой модели, вдохновлённая биологией, которая объединяет принципы глубокого обучения с основами нейробиологии.

Разработанная исследователями из Pathway, BDH представляет собой теоретическую и практическую основу для понимания того, как в искусственных системах возникают рассуждения и обобщения.

🐱

Please open Telegram to view this post

VIEW IN TELEGRAM

⚡1🔥1🥱1

156 viewsБорис_ь с ml, 19:41

Forwarded from CyberSecurityTechnologies

Lifecycle_Supervision_Framework_for_Robustly_Aligned_AI_Agents.pdf

#AIOps
#CogSec
#MLSecOps
"Cognitive Control Architecture (CCA): A Lifecycle Supervision Framework for Robustly Aligned AI Agents", Dec.2025.

// Method is predicated on a core insight: no matter how subtle an IPI attack, its pursuit of a malicious objective will ultimately manifest as a detectable deviation in the action trajectory, distinct from the expected legitimate plan

See also:
]-> Dynamic Environment to Evaluate Prompt Injection Attacks and Defenses for LLM Agents
]-> https://agentdojo.spylab.ai

141 viewsБорис_ь с ml, 09:04

Forwarded from Евгений Кокуйкин - Raft

Большой релиз OWASP Top 10 for Agentic AI Applications 🔥.

Последние месяцы мы в команде Agentic Security Initiative собирали первый отраслевой фреймворк по безопасности агентных ИИ-систем. Над документом работали более 100 человек: ресерчеры, вендоры, представители регуляторов и институтов вроде NIST и Linux Foundation.

Мы приоритизировали риски и собрали практические меры защиты для автономных агентов, которые уже заходят в корпоративную инфраструктуру. Если вы строите AI Security-стратегию на 2026 год, из OWASP в первую очередь стоит взять именно этот документ за основу.

Ссылка на релиз.
Сегодня в 17:00 по Москве официальный запуск гайда. Ссылка на трансляцию.

OWASP Gen AI Security Project

OWASP Top 10 for Agentic Applications for 2026

The OWASP Top 10 for Agentic Applications 2026 is a globally peer-reviewed framework that identifies the most critical security risks facing autonomous and agentic AI systems. Developed through extensive collaboration with more than 100 industry experts,…

134 viewsБорис_ь с ml, 09:15

Forwarded from Похек AI (Сергей Зыбнев)

Nikita Barsukov — Look at my Pickle (2025).pdf

Презентации с митапа LLAMATOR в Ереване

Evolution of AI Threats.pdf

Jailbreaking LLMs via Semantic Abstraction.pptx.pdf

🔥3❤1🥱1

154 viewsБорис_ь с ml, 09:37

Forwarded from DevSecOps Talks

Building Secure AI Applications.pdf

Building Secure AI Applications

Всем привет!

В приложении можно скачать небольшой методический материал (~ 40 страниц), посвященный тому, на что обращать внимание при обеспечении ИБ при разработке приложений, использующих AI.

Материал основан на OWASP Top 10 для LLM:
🍭 LLM01 Prompt Injection
🍭 LLM02 Sensitive Information Disclosure
🍭 LLM03 Supply Chain
🍭 LLM04 Data and Model Poisoning
🍭 LLM05 Improper Output Handling и не только

Для каждого раздела описаны общие рекомендации по повышению уровня защищенности и перечень инструментов, которые можно использовать для автоматизации.

Дополнительно в материале представлена концептуальная архитектура с соотношением рассматриваемых угроз.

135 viewsБорис_ь с ml, 04:54

Forwarded from RoboFuture

У Anthropic вышло очень интересное видео на тему универсальных агентов (general-purpose agents), которое у меня максимально отзывается. Основной посыл - не нужно делать специализированных агентов, нужно делать одного качественного универсального, а его уже кастомизировать под свои задачи

Само видео (16 минут) и короткая статья по нему от businessinsider

Инженеры из Anthropic предлагают вместо набора агентов использовать скилы для агента, который изначально создан для написания кода (Claude Code). Дальше они говорят, что skills будут использовать не только инженеры, но и нетехнические специалисты - врачи, менеджеры, трейдеры и тд, которые будут кастомизировать этого агента под себя

По их логике, один general-purpose агент + библиотека skills становится “универсальной основой” для множества задач — без зоопарка спецагентов

Иными словами, такой агент - универсальный интерфейс к миру

А вот с тем, что CLI-агент подходит нетехническим специалистам, я не согласен… Все-таки инструмент достаточно специфичный. Мне кажется, что будущее действительно за универсальными агентами, но не совсем такими.
Для работы будут использоваться агенты, которые выглядят как чатовый интерфейс (как ChatGPT)

Примерно год назад наша команда загорелась идеей универсального агента GigaAgent, которого недавно представили на AIJ. Уже довольно много коллег разработчиков мне отписалось о тестировании, на AIJ и Conversations заинтересовались компании. Здесь могу только порадоваться, напомнить ставить звездочки нашему опенсорс-агенту и присылать PR :) Круто, что большие игроки тоже увидели будущее в этом подходе!

P.S. У нас большое обновление в dev ветке - MCP, RAG, долговременная память

👍3

137 viewsБорис_ь с ml, 15:07

Forwarded from MLTimes

Gartner предупредила о киберрисках при использовании ИИ-браузеров

Gartner выпустила рекомендацию для организаций по блокировке агентских ИИ-браузеров. Речь о продуктах вроде Comet от Perplexity и ChatGPT Atlas от OpenAI. Причина - высокие киберриски для корпоративных данных.

Документ называется "Кибербезопасность должна пока блокировать браузеры с ИИ". Его подготовили вице-президент по исследованиям Деннис Сюй, старший директор-аналитик Евгений Миролюбов и вице-президент-аналитик Джон Уоттс. Главная претензия - настройки по умолчанию ставят удобство выше безопасности.

https://mltimes.ai/gartner-predupredila-o-kiberriskah-pri-ispolzovanii-ii-brauzerov/

141 viewsБорис_ь с ml, 08:00

https://hexstrike.com/

HexStrike AI - Revolutionary AI-Powered Offensive Security Framework

Advanced AI-driven penetration testing and security assessment tools.

👎1

132 viewsБорис_ь с ml, 06:16

https://www.inferasecurity.ru/

www.inferasecurity.ru

INFERA SECURITY

👀1

125 viewsБорис_ь с ml, 08:36

Forwarded from Градиент обреченный (Sergei Averkiev)

Все про кодовые модели

Хороший обзор Code LLMs, от фундаментальных моделей до агентов.

🟢 Какие задачи есть в кодогенерации. Неплохая таксономия (code completion, FIM, оптимизация кода, ревью, генерация тестов и т.д.)

🟢 Как обучают, про претрейн для кода, SFT и RL. Какие есть метрики и бенчи под них.

Добавляем в закладки, когда-нибудь почитаем.

https://arxiv.org/pdf/2511.18538

Please open Telegram to view this post

VIEW IN TELEGRAM

👍2

128 viewsБорис_ь с ml, 09:57

Forwarded from SecPost

🧠Рынок кибербезопасности для ИИ готовится к взрывному росту, прогнозируя объём в миллиарды рублей уже к 2026 году. Его подстёгивают первые громкие инциденты с утечками данных через AI-модели, которые создают спрос на защиту.

⏩При этом интеграция ИИ в бизнес опережает внедрение систем контроля, открывая новое поле для кибератак и формируя стремительно растущий сегмент рынка, подробнее в материале SecPost😍

Please open Telegram to view this post

VIEW IN TELEGRAM

Российский рынок защиты ИИ-систем обещает перевалить за 1 млрд руб. в 2026 году

Рынок кибербезопасности для ИИ готовится к взрывному росту, прогнозируя объём в миллиарды рублей уже к 2026 году. Его подстёгивают первые громкие инциденты с утечками данных через AI-модели, которые создают спрос на защиту. При этом интеграция ИИ в бизнес…

135 viewsБорис_ь с ml, 10:32

Forwarded from Похек AI (Сергей Зыбнев)

Про работу памяти ChatGPT и Claude

https://manthanguptaa.in/posts/chatgpt_memory/
https://manthanguptaa.in/posts/claude_memory/

manthanguptaa.in

I Reverse Engineered ChatGPT's Memory System, and Here's What I Found!

When I asked ChatGPT what it remembered about me, it listed 33 facts from my name and career goals to my current fitness routine. But how does it actually store and retrieve this information? And why does it feel so seamless?
After extensive experimentation…

👍2

122 viewsБорис_ь с ml, 13:12

Vibranium Dome - LLM WAF for Agents

GitHub - genia-dev/vibraniumdome: LLM Security Platform.

LLM Security Platform. Contribute to genia-dev/vibraniumdome development by creating an account on GitHub.

🔥2

185 viewsБорис_ь с ml, 14:07