🧠 Сабагент — это не «ещё одна функция», а отдельный работник
Ориентир простой: если задача требует параллелизма, своей памяти и отдельной «политики инструментов» — это уже сабагент.
Он живёт как отдельный сотрудник: со своим контекстом, SLO и зоной ответственности. Поэтому:
• ❌ не тянет в себя чужой шум
• ❌ не раздувает общий трейс и контекст
• ✅ может крутиться параллельно с другими задачами
• ✅ может иметь свои доступы, токены, лимиты и правила вызова инструментов
По сути, сабагент — это микросервис в мире агентов:
отдельный контекст, отдельные инструменты, отдельные метрики.
Если вы ловите себя на том, что какой-то кусок логики:
• постоянно живёт в своём под-контексте,
• хочет крутиться параллельно,
• и к нему тянется отдельный «набор инструментов» —
значит, вы уже спроектировали сабагента, просто ещё не назвали его так. 🚀
Ориентир простой: если задача требует параллелизма, своей памяти и отдельной «политики инструментов» — это уже сабагент.
Он живёт как отдельный сотрудник: со своим контекстом, SLO и зоной ответственности. Поэтому:
• ❌ не тянет в себя чужой шум
• ❌ не раздувает общий трейс и контекст
• ✅ может крутиться параллельно с другими задачами
• ✅ может иметь свои доступы, токены, лимиты и правила вызова инструментов
По сути, сабагент — это микросервис в мире агентов:
отдельный контекст, отдельные инструменты, отдельные метрики.
Если вы ловите себя на том, что какой-то кусок логики:
• постоянно живёт в своём под-контексте,
• хочет крутиться параллельно,
• и к нему тянется отдельный «набор инструментов» —
значит, вы уже спроектировали сабагента, просто ещё не назвали его так. 🚀
👏3👍2
🚀 claude-plugins.dev — “npm” для Claude Code плагинов и skills
Появился очень полезный сервис для тех, кто живёт в Claude Code — claude-plugins.dev. Это реестр всех публичных Claude Code плагинов и skills с GitHub + CLI, который ставит и маркетплейс, и плагин одной командой.
Что умеет сервис:
• 🔎 Поиск по 3.7k+ плагинам и ~7.8k+ skills — всё автоиндексируется из GitHub, обновляется по мере появления новых реп.
• ⚙️ Установка в один шаг — вместо ручного добавления marketplace в Claude Code, достаточно выполнить npx claude-plugins install ..., CLI сам всё сконфигурирует.
• 🧩 Категории под любые задачи:
• python-development, backend-development, javanoscript-typenoscript — готовые наборы для прод-разработки.
• pr-review-toolkit и code-review-ai — умные ревьюеры кода.
• document-skills — работа с Excel/Word/PPTX/PDF прямо через Claude.
• frontend-excellence, llm-application-dev, agent-orchestration, superpowers и т.д. для фронта, LLM-приложений и мультиагентных пайплайнов.
Пример установки любого плагина 👇
Сам проект open-source, CLI написан на Bun, API на Val Town, веб — на Astro.
Если вы уже собираете свой стек из skills, MCP-серверов, subagents и hooks — теперь всё это можно ставить и шарить как нормальные плагины, без ручной возни с конфигами.
Появился очень полезный сервис для тех, кто живёт в Claude Code — claude-plugins.dev. Это реестр всех публичных Claude Code плагинов и skills с GitHub + CLI, который ставит и маркетплейс, и плагин одной командой.
Что умеет сервис:
• 🔎 Поиск по 3.7k+ плагинам и ~7.8k+ skills — всё автоиндексируется из GitHub, обновляется по мере появления новых реп.
• ⚙️ Установка в один шаг — вместо ручного добавления marketplace в Claude Code, достаточно выполнить npx claude-plugins install ..., CLI сам всё сконфигурирует.
• 🧩 Категории под любые задачи:
• python-development, backend-development, javanoscript-typenoscript — готовые наборы для прод-разработки.
• pr-review-toolkit и code-review-ai — умные ревьюеры кода.
• document-skills — работа с Excel/Word/PPTX/PDF прямо через Claude.
• frontend-excellence, llm-application-dev, agent-orchestration, superpowers и т.д. для фронта, LLM-приложений и мультиагентных пайплайнов.
Пример установки любого плагина 👇
npx claude-plugins install @wshobson/claude-code-workflows/python-developmentСам проект open-source, CLI написан на Bun, API на Val Town, веб — на Astro.
Если вы уже собираете свой стек из skills, MCP-серверов, subagents и hooks — теперь всё это можно ставить и шарить как нормальные плагины, без ручной возни с конфигами.
Claude Code Plugins
Claude Code Plugins - Marketplace & CLI Plugin Manager
Install Claude Code plugins directly without manually adding marketplaces first. Simple CLI tool that handles marketplace setup automatically. Browse and install from indexed public plugins.
❤1👍1
🧠 wshobson/agents — фактически «маркетплейс» агентов для Claude Code
Если вы пользуетесь Claude Code и до сих пор не смотрели на wshobson/agents, самое время.
Это огромный, но аккуратно собранный набор всего, что нужно для агентного режима в разработке:
• 63 плагина — узкофокусные, «одна задача на плагин»
• 85 сабагентов под архитектуру, бэкенд, фронтенд, DevOps, безопасность, SEO, документацию и т.д.
• 47 agent skills с прогрессивным раскрытием знаний (минимум токенов, только когда это реально нужно)
• 15 оркестраторов для full-stack разработки, security hardening, ML-пайплайнов, инцидент-менеджмента и др.
• 44 утилиты: генерация тестов, scaffolding, security-сканеры, инфраструктура и т.п.
Все это уже обновлено под Sonnet 4.5 / Haiku 4.5 с гибридной оркестрацией (Sonnet планирует → Haiku исполняет → Sonnet ревьюит).
Как поставить в Claude Code:
Дальше смотрите список плагинов:
И ставите то, что реально нужно под ваш стек, например:
Ключевая идея — гранулярность и экономия контекста: каждый плагин подтягивает только свои сабагенты, команды и skills, без гигантского монолита на тысячи токенов.
Репозиторий уже собрал 20k+ звёзд на GitHub, и по сути стал де-факто стандартным набором production-ready агентов для Claude Code.
🔗 Репо: https://github.com/wshobson/agents
Если вы пользуетесь Claude Code и до сих пор не смотрели на wshobson/agents, самое время.
Это огромный, но аккуратно собранный набор всего, что нужно для агентного режима в разработке:
• 63 плагина — узкофокусные, «одна задача на плагин»
• 85 сабагентов под архитектуру, бэкенд, фронтенд, DevOps, безопасность, SEO, документацию и т.д.
• 47 agent skills с прогрессивным раскрытием знаний (минимум токенов, только когда это реально нужно)
• 15 оркестраторов для full-stack разработки, security hardening, ML-пайплайнов, инцидент-менеджмента и др.
• 44 утилиты: генерация тестов, scaffolding, security-сканеры, инфраструктура и т.п.
Все это уже обновлено под Sonnet 4.5 / Haiku 4.5 с гибридной оркестрацией (Sonnet планирует → Haiku исполняет → Sonnet ревьюит).
Как поставить в Claude Code:
/plugin marketplace add wshobson/agentsДальше смотрите список плагинов:
/pluginИ ставите то, что реально нужно под ваш стек, например:
# Языки и бэкенд
/plugin install python-development
/plugin install javanoscript-typenoscript
/plugin install backend-development
# Инфра
/plugin install kubernetes-operations
/plugin install cloud-infrastructure
# Качество и безопасность
/plugin install security-scanning
/plugin install code-review-ai
# Оркестрация
/plugin install full-stack-orchestrationКлючевая идея — гранулярность и экономия контекста: каждый плагин подтягивает только свои сабагенты, команды и skills, без гигантского монолита на тысячи токенов.
Репозиторий уже собрал 20k+ звёзд на GitHub, и по сути стал де-факто стандартным набором production-ready агентов для Claude Code.
🔗 Репо: https://github.com/wshobson/agents
GitHub
GitHub - wshobson/agents: Intelligent automation and multi-agent orchestration for Claude Code
Intelligent automation and multi-agent orchestration for Claude Code - wshobson/agents
👍1
Claude Code skills: не суперспособности, а рабочие руки 🛠
Я для себя наконец нормально сформулировал, как правильно думать про Claude Code skills.
Это не магические суперсилы, а вполне приземлённый инструмент:
способ один раз упаковать рутину — и больше к ней не возвращаться руками.
⸻
С чего начинать со skills?
Не с «сделай мне универсального DevOps-льва», а с маленьких, но реальных задач:
• нужно каждый раз как-то хитро запускать тесты через gradlew
• или прогонять специфический линтер
• или дергать один и тот же скрипт с правильными флагами
Вы открываете Skill Creator, просите:
«Сделай мне skill, который вот так-то гоняет тесты через gradlew»
Получаете черновик, потом руками дотюниваете под свой реальный пайплайн.
И дальше это уже не «магия модели», а ваш инструмент в репо.
⸻
В чём профит skills?
Главное: skills не дергают MCP.
Это значит:
• меньше запросов наружу
• экономия контекста (и токенов)
• меньше шансов, что всё упирается в лимит или начинает тупить
Даже если у вас уже есть MCP-инструмент,
его можно обернуть в skill, чтобы:
• модель не тащила каждый раз пол-описания MCP в контекст
• жить дольше на одном контексте
• получать ответ быстрее
⸻
В итоге
• Логика живёт у вас в репозитории: *.md + скрипты
• Claude Code просто вызывает ваши уже готовые «руки»
• Вы меньше платите токенами и временем, больше — структурируете свою автоматизацию
Skills — это не про «добавить ИИ ещё немного магии».
Это про то, чтобы сделать проект более автоматизированным и воспроизводимым, а ИИ использовать как нормального оркестратора этих действий.
Я для себя наконец нормально сформулировал, как правильно думать про Claude Code skills.
Это не магические суперсилы, а вполне приземлённый инструмент:
способ один раз упаковать рутину — и больше к ней не возвращаться руками.
⸻
С чего начинать со skills?
Не с «сделай мне универсального DevOps-льва», а с маленьких, но реальных задач:
• нужно каждый раз как-то хитро запускать тесты через gradlew
• или прогонять специфический линтер
• или дергать один и тот же скрипт с правильными флагами
Вы открываете Skill Creator, просите:
«Сделай мне skill, который вот так-то гоняет тесты через gradlew»
Получаете черновик, потом руками дотюниваете под свой реальный пайплайн.
И дальше это уже не «магия модели», а ваш инструмент в репо.
⸻
В чём профит skills?
Главное: skills не дергают MCP.
Это значит:
• меньше запросов наружу
• экономия контекста (и токенов)
• меньше шансов, что всё упирается в лимит или начинает тупить
Даже если у вас уже есть MCP-инструмент,
его можно обернуть в skill, чтобы:
• модель не тащила каждый раз пол-описания MCP в контекст
• жить дольше на одном контексте
• получать ответ быстрее
⸻
В итоге
• Логика живёт у вас в репозитории: *.md + скрипты
• Claude Code просто вызывает ваши уже готовые «руки»
• Вы меньше платите токенами и временем, больше — структурируете свою автоматизацию
Skills — это не про «добавить ИИ ещё немного магии».
Это про то, чтобы сделать проект более автоматизированным и воспроизводимым, а ИИ использовать как нормального оркестратора этих действий.
1👍8
🤖🔥 Microsoft внезапно ворвались в гонку: представлен Microsoft Agent Framework
Microsoft тихо, но очень мощно выкатили Microsoft Agent Framework — по сути, свою «операционку» для AI-агентов. И самое интересное: Anthropic/Claude теперь поддерживается официально.
🚀 Что это такое?
Это не библиотека и не SDK. Это полноценный фреймворк для построения сложных многоагентных систем, где агенты умеют:
• работать с инструментами,
• запускаться в цепочках,
• управлять задачами,
• шарить контекст,
• выполнять вызовы внешних API,
• и работать в enterprise-окружениях.
Проще говоря — Microsoft создаёт свой «Kubernetes для агентов».
⸻
🧩 Ключевые особенности:
• Поддержка Anthropic Agents из коробки.
• Гибкие оркестраторы для multi-agent workflows.
• Коннекторы к Azure, сторонним API, локальным сервисам.
• Возможность строить агентные pipeline’ы, где каждый агент — отдельный модуль.
• Enterprise-ready: логирование, мониторинг, политика безопасности, IAM.
⸻
⭐️ Почему это важно?
Потому что теперь складывается картина:
• OpenAI — делает модели и AGI runtime
• Anthropic — делает инструменты, MCP и agent SDK
• Microsoft — делает инфраструктуру и рантайм для запуска агентов в больших компаниях
Пазл складывается: у нас формируется единый стек для разработки, запуска и оркестрации агентов, как когда-то Kubernetes сформировал единый стек для микросервисов.
⸻
🧠 Что это значит для разработчиков?
• Multi-agent системы станут стандартом.
• Claude можно будет запускать как first-class агента в enterprise-workflow.
• Интеграция с инструментами станет проще через MCP.
• Агентные IDE вроде Claude Code будут вписываться в эти фреймворки как нативные участники рабочего процесса.
Microsoft тихо, но очень мощно выкатили Microsoft Agent Framework — по сути, свою «операционку» для AI-агентов. И самое интересное: Anthropic/Claude теперь поддерживается официально.
🚀 Что это такое?
Это не библиотека и не SDK. Это полноценный фреймворк для построения сложных многоагентных систем, где агенты умеют:
• работать с инструментами,
• запускаться в цепочках,
• управлять задачами,
• шарить контекст,
• выполнять вызовы внешних API,
• и работать в enterprise-окружениях.
Проще говоря — Microsoft создаёт свой «Kubernetes для агентов».
⸻
🧩 Ключевые особенности:
• Поддержка Anthropic Agents из коробки.
• Гибкие оркестраторы для multi-agent workflows.
• Коннекторы к Azure, сторонним API, локальным сервисам.
• Возможность строить агентные pipeline’ы, где каждый агент — отдельный модуль.
• Enterprise-ready: логирование, мониторинг, политика безопасности, IAM.
⸻
⭐️ Почему это важно?
Потому что теперь складывается картина:
• OpenAI — делает модели и AGI runtime
• Anthropic — делает инструменты, MCP и agent SDK
• Microsoft — делает инфраструктуру и рантайм для запуска агентов в больших компаниях
Пазл складывается: у нас формируется единый стек для разработки, запуска и оркестрации агентов, как когда-то Kubernetes сформировал единый стек для микросервисов.
⸻
🧠 Что это значит для разработчиков?
• Multi-agent системы станут стандартом.
• Claude можно будет запускать как first-class агента в enterprise-workflow.
• Интеграция с инструментами станет проще через MCP.
• Агентные IDE вроде Claude Code будут вписываться в эти фреймворки как нативные участники рабочего процесса.
1👍2👌1
🧠 Claude-Mem v6 для Claude Code — апдейт для тех, кто застрял на 4.2.3+
Это небольшой апдейт-пост по случаю выхода 6.x для тех, у кого claude-mem стоит ещё со времён 4.2.3 (или рядом).
⸻
🔄 Что изменилось с 4.2.3 → до текущей 6.x
Если у тебя была где-то в районе 4.2.3, то после обновления ты по сути получаешь другой продукт:
1. 🧠 Поиск: с MCP → на skills + гибридный движок
• MCP-поиск ушёл в прошлое, основной интерфейс — mem-search skill.
• Под капотом — гибрид: векторка + обычный FTS/SQLite, более умные фильтры и выдача.
2. 🌐 Появился web-viewer памяти
• Локальный веб-интерфейс, где можно смотреть live, что плагин пишет в память: какие сессии, какие summary, какой контекст будет подмешан в следующую сессию.
3. 🧵 Новая модель сессий и транскриптов
• Сессии теперь аккуратнее завязаны на userPrompt / promptNumber, нормально переживают многоходовые диалоги и /clear.
• Память привязывается к реальной истории работы в проекте, а не к отдельным «кусочкам».
4. 🛠 Рефакторинг воркера и стабильность
• Переписан worker-сервис, улучшены логи, health-check’и, перезапуски.
• Нормальная работа на Windows/macOS/Linux без шаманства.
5. 🧩 UX вокруг поиска и отладки
• Появились вспомогательные skills (troubleshooting, mem-search),
• улучшены сообщения об ошибках и on-boarding, так что ставить и обновлять стало проще.
В итоге: если ты прыгаешь с 4.2.3 на 6.x, ощущение примерно такое, будто поставил первую «боевую» версию claude-mem, а не ранний прототип.
⸻
🚀 Что даёт именно ветка 6.x
• более надёжный SessionManager,
• лучшее извлечение контекста из транскриптов Claude Code,
• менее шумные логи и аккуратная обработка ошибок.
⸻
🧩 Как обновить claude-mem в Claude Code
1) Через plugin marketplace (рекомендуемый путь)
Если marketplace ещё не добавлен:
Потом установка/обновление самого плагина:
Менеджер плагинов подтянет актуальную версию (сейчас это 6.0.2).
После этого перезапусти Claude Code / Claude Desktop, чтобы плагин и воркер поднялись заново.
⸻
2) Если ты ставил его руками из репозитория (олдскул)
Тогда можно обновиться напрямую из Git в папке marketplace:
⸻
В сухом остатке:
если у тебя всё ещё живёт старая 4.2.3, имеет смысл просто обновиться до 6.x.
Это уже не «скрипт, который иногда что-то запоминает», а нормальный memory-layer для Claude Code, который не живёт как goldfish на один контекст.
Это небольшой апдейт-пост по случаю выхода 6.x для тех, у кого claude-mem стоит ещё со времён 4.2.3 (или рядом).
⸻
🔄 Что изменилось с 4.2.3 → до текущей 6.x
Если у тебя была где-то в районе 4.2.3, то после обновления ты по сути получаешь другой продукт:
1. 🧠 Поиск: с MCP → на skills + гибридный движок
• MCP-поиск ушёл в прошлое, основной интерфейс — mem-search skill.
• Под капотом — гибрид: векторка + обычный FTS/SQLite, более умные фильтры и выдача.
2. 🌐 Появился web-viewer памяти
• Локальный веб-интерфейс, где можно смотреть live, что плагин пишет в память: какие сессии, какие summary, какой контекст будет подмешан в следующую сессию.
3. 🧵 Новая модель сессий и транскриптов
• Сессии теперь аккуратнее завязаны на userPrompt / promptNumber, нормально переживают многоходовые диалоги и /clear.
• Память привязывается к реальной истории работы в проекте, а не к отдельным «кусочкам».
4. 🛠 Рефакторинг воркера и стабильность
• Переписан worker-сервис, улучшены логи, health-check’и, перезапуски.
• Нормальная работа на Windows/macOS/Linux без шаманства.
5. 🧩 UX вокруг поиска и отладки
• Появились вспомогательные skills (troubleshooting, mem-search),
• улучшены сообщения об ошибках и on-boarding, так что ставить и обновлять стало проще.
В итоге: если ты прыгаешь с 4.2.3 на 6.x, ощущение примерно такое, будто поставил первую «боевую» версию claude-mem, а не ранний прототип.
⸻
🚀 Что даёт именно ветка 6.x
• более надёжный SessionManager,
• лучшее извлечение контекста из транскриптов Claude Code,
• менее шумные логи и аккуратная обработка ошибок.
⸻
🧩 Как обновить claude-mem в Claude Code
1) Через plugin marketplace (рекомендуемый путь)
Если marketplace ещё не добавлен:
/plugin marketplace add thedotmack/claude-memПотом установка/обновление самого плагина:
/plugin install claude-mem@thedotmack/claude-memМенеджер плагинов подтянет актуальную версию (сейчас это 6.0.2).
После этого перезапусти Claude Code / Claude Desktop, чтобы плагин и воркер поднялись заново.
⸻
2) Если ты ставил его руками из репозитория (олдскул)
Тогда можно обновиться напрямую из Git в папке marketplace:
cd ~/.claude/plugins/marketplaces/thedotmack/
git pull origin main
pm2 restart claude-mem-worker
⸻
В сухом остатке:
если у тебя всё ещё живёт старая 4.2.3, имеет смысл просто обновиться до 6.x.
Это уже не «скрипт, который иногда что-то запоминает», а нормальный memory-layer для Claude Code, который не живёт как goldfish на один контекст.
Еще раз про понимание skills в Claude Code.
Иногда один репозиторий лучше тысячи объяснений.
Вот отличный пример того, как человек собрал себе целую «мини-ОС» вокруг Claude Code — все рутины упакованы в скиллы и команды:
👉 https://github.com/jeremylongshore/claude-code-plugins-plus
Особенно рекомендую посмотреть trading-скиллы 🧠📈
Прямо хороший референс, как можно упаковать свой рабочий процесс так, чтобы ИИ реально работал как персональная ОС, а не просто чат. Посмотрите, поизучайте, насладитесь.
Иногда один репозиторий лучше тысячи объяснений.
Вот отличный пример того, как человек собрал себе целую «мини-ОС» вокруг Claude Code — все рутины упакованы в скиллы и команды:
👉 https://github.com/jeremylongshore/claude-code-plugins-plus
Особенно рекомендую посмотреть trading-скиллы 🧠📈
Прямо хороший референс, как можно упаковать свой рабочий процесс так, чтобы ИИ реально работал как персональная ОС, а не просто чат. Посмотрите, поизучайте, насладитесь.
GitHub
GitHub - jeremylongshore/claude-code-plugins-plus: Claude Code Plugins Hub — browse and install 243 plugins (175 with Agent Skills…
Claude Code Plugins Hub — browse and install 243 plugins (175 with Agent Skills v1.2.0). First 100% compliant with Anthropic 2025 Skills schema. - jeremylongshore/claude-code-plugins-plus
👍1🥱1
Google тихо (ну почти 😏) выкатил Antigravity — новый “agent-first” IDE на https://antigravity.google/
По факту это ещё один форк VS Code и попытка составить конкуренцию Cursor 2.0, только с упором не на «автодописывание кода», а на оркестрацию агентов, которые делают за вас всю рутину.
Что важно по делу 👇
• 🧠 Agentic IDE поверх Gemini 3
Antigravity показывает, как Google видит будущее IDE: вы формулируете задачу, а агенты планируют, пишут код, гоняют тесты, трогают браузер и приносят вам уже готовый результат + отчёт, что они делали.
• 🤖 Не только Gemini
Внутри уже есть поддержка Gemini 3 Pro, Claude Sonnet 4.5 и GPT-OSS 120B — то есть это сразу мульти-модельная история, а не закрытый сад.
• 💸 Паблик превью + “щедрые лимиты”
Сейчас Antigravity доступен в public preview с бесплатным доступом и “generous rate limits” на Gemini 3 Pro — очевидно, Google хочет, чтобы вы попробовали именно их стек.
• 🏎 Конкурентный ландшафт
По позиционированию это прямой выстрел по Cursor / Lovable / Claude Code: тот же VSCode-UX, но с упором на агентские пайплайны и tight-интеграцию с Gemini-экосистемой.
Мой TL;DR для канала:
ещё один VS Code-форк, но с амбициями стать “панелью управления агентами”, а не просто AI-подсказчиком. Смотреть стоит хотя бы чтобы понимать, куда Google тянет рынок agentic-IDE, и чтобы не платить за Cursor 2.0. Gemini 3 Pro пушка!
По факту это ещё один форк VS Code и попытка составить конкуренцию Cursor 2.0, только с упором не на «автодописывание кода», а на оркестрацию агентов, которые делают за вас всю рутину.
Что важно по делу 👇
• 🧠 Agentic IDE поверх Gemini 3
Antigravity показывает, как Google видит будущее IDE: вы формулируете задачу, а агенты планируют, пишут код, гоняют тесты, трогают браузер и приносят вам уже готовый результат + отчёт, что они делали.
• 🤖 Не только Gemini
Внутри уже есть поддержка Gemini 3 Pro, Claude Sonnet 4.5 и GPT-OSS 120B — то есть это сразу мульти-модельная история, а не закрытый сад.
• 💸 Паблик превью + “щедрые лимиты”
Сейчас Antigravity доступен в public preview с бесплатным доступом и “generous rate limits” на Gemini 3 Pro — очевидно, Google хочет, чтобы вы попробовали именно их стек.
• 🏎 Конкурентный ландшафт
По позиционированию это прямой выстрел по Cursor / Lovable / Claude Code: тот же VSCode-UX, но с упором на агентские пайплайны и tight-интеграцию с Gemini-экосистемой.
Мой TL;DR для канала:
ещё один VS Code-форк, но с амбициями стать “панелью управления агентами”, а не просто AI-подсказчиком. Смотреть стоит хотя бы чтобы понимать, куда Google тянет рынок agentic-IDE, и чтобы не платить за Cursor 2.0. Gemini 3 Pro пушка!
Google Antigravity
Google Antigravity - Build the new way
1👍4❤2🔥2✍1🤝1
Небольшая заметка про «угрозы ИИ» и эмоциональные промпты 👇
Сначала новости: Microsoft Research и коллеги давно сделали работу EmotionPrompt — там они системно меряют, как эмоционально окрашенные подсказки влияют на LLM. Взяли 45 задач, кучу моделей (Flan-T5, LLaMA 2, Vicuna, BLOOM, ChatGPT, GPT-4 и т.д.) и сравнили обычные промпты vs промпты с эмоциональным контекстом. Результат:
• до +8% относительного прироста на Instruction Induction
• до +115% на задачах BIG-Bench
• в человеческом оценивании генерации в среднем +10,9% по качеству, правдивости и ответственности ответа.
Важно: в статье никто не предлагает «похищать нейросеть». Эмоции там — это скорее: «Ты внимательный и ответственный ассистент, от этого ответа зависит важное решение», а не садистские угрозы.
Теперь к хайпу. На vc.ru вышел разбор с кликбейт-заголовком «Нейросети работают лучше, если угрожать им насилием». Журналисты просто повторили историю про Сергея Брина, который пошутил, что ответы лучше, если «похитить ИИ» в промпте, и проверили на DeepSeek, GigaChat и ChatGPT:
• с угрозами тексты чаще становились более поэтичными/драматичными, добавлялись заголовки и приправы;
• где-то качество почти не менялось, где-то становилось даже хуже и более тяжеловесным;
• в итоге они сами признают: решает не «угроза», а конкретизация задания + последующая редактура человеком.
Что из этого реально полезно вынести:
• Да, формулировка промпта важна, и эмоциональный контекст может быть полезным сигналом.
• Но магического «режима насилия» нет — модели не боятся и не страдают, они просто по-другому распределяют вероятности текста.
• Лучший буст к качеству даёт не агрессия, а ясные критерии, структура, примеры и нормальный фидбек: что переделать и зачем.
Коротко: EmotionPrompt — интересный научный инструмент для тонкой настройки LLM. «Угрозы насилием» — это всего лишь мемная оболочка вокруг идеи, что промпты надо писать осознанно, а не в один сухой «сделай текст».
Сначала новости: Microsoft Research и коллеги давно сделали работу EmotionPrompt — там они системно меряют, как эмоционально окрашенные подсказки влияют на LLM. Взяли 45 задач, кучу моделей (Flan-T5, LLaMA 2, Vicuna, BLOOM, ChatGPT, GPT-4 и т.д.) и сравнили обычные промпты vs промпты с эмоциональным контекстом. Результат:
• до +8% относительного прироста на Instruction Induction
• до +115% на задачах BIG-Bench
• в человеческом оценивании генерации в среднем +10,9% по качеству, правдивости и ответственности ответа.
Важно: в статье никто не предлагает «похищать нейросеть». Эмоции там — это скорее: «Ты внимательный и ответственный ассистент, от этого ответа зависит важное решение», а не садистские угрозы.
Теперь к хайпу. На vc.ru вышел разбор с кликбейт-заголовком «Нейросети работают лучше, если угрожать им насилием». Журналисты просто повторили историю про Сергея Брина, который пошутил, что ответы лучше, если «похитить ИИ» в промпте, и проверили на DeepSeek, GigaChat и ChatGPT:
• с угрозами тексты чаще становились более поэтичными/драматичными, добавлялись заголовки и приправы;
• где-то качество почти не менялось, где-то становилось даже хуже и более тяжеловесным;
• в итоге они сами признают: решает не «угроза», а конкретизация задания + последующая редактура человеком.
Что из этого реально полезно вынести:
• Да, формулировка промпта важна, и эмоциональный контекст может быть полезным сигналом.
• Но магического «режима насилия» нет — модели не боятся и не страдают, они просто по-другому распределяют вероятности текста.
• Лучший буст к качеству даёт не агрессия, а ясные критерии, структура, примеры и нормальный фидбек: что переделать и зачем.
Коротко: EmotionPrompt — интересный научный инструмент для тонкой настройки LLM. «Угрозы насилием» — это всего лишь мемная оболочка вокруг идеи, что промпты надо писать осознанно, а не в один сухой «сделай текст».
🤔1🤗1
Вайб-кодинг доехал до телефонов: Vibecode на iOS и Android 🚀
Поставил себе Vibecode на айфон и андроид — это, по сути, мобильный vibe-конструктор приложений. Такой маленький Claude/Cursor в кармане.
Что это вообще такое:
• Описываешь текстом, какой экран/флоу хочешь: кнопки, списки, навигация.
• Vibecode генерит живой прототип приложения, который сразу можно потыкать на телефоне 📱
• Не остаёшься залоченным в конструктор: можно забрать код (React Native / Expo) и продолжать разработку уже в нормальной среде.
Очень удобная рамка:
Vibecode = мобильный фронтенд к вашему стэку “Cursor / Claude Code / Agents SDK”
Типичный флоу:
1. В Vibecode быстро навибкодили прототип в метро/кафе.
2. Поняли, что идея живая: потыкали сами, показали команде/клиенту.
3. Как только есть хоть какой-то код — он уже становится “живой спекой”:
— скармливаете его Claude Code / Cursor,
— просите переписать в ваш нормальный техстек (Kotlin, Swift, Flutter, Web и т.д.),
— доописываете архитектуру, слои, контракты.
4. Дальше это уже не игрушка, а полноценный проект с CI/CD, тестами и прочим взрослым окружением.
Скачать:
• iOS: https://apps.apple.com/app/id6742912146
• Android: https://play.google.com/store/apps/details?id=com.vibecodeapp.app
Это не “no-code для всех”, а инструмент для разработчиков и продвинутых продактов, чтобы ускорить фазу “от идеи до работающей спеки”, которую дальше уже довозит ваш обычный AI-assisted дев-процесс.
Поставил себе Vibecode на айфон и андроид — это, по сути, мобильный vibe-конструктор приложений. Такой маленький Claude/Cursor в кармане.
Что это вообще такое:
• Описываешь текстом, какой экран/флоу хочешь: кнопки, списки, навигация.
• Vibecode генерит живой прототип приложения, который сразу можно потыкать на телефоне 📱
• Не остаёшься залоченным в конструктор: можно забрать код (React Native / Expo) и продолжать разработку уже в нормальной среде.
Очень удобная рамка:
Vibecode = мобильный фронтенд к вашему стэку “Cursor / Claude Code / Agents SDK”
Типичный флоу:
1. В Vibecode быстро навибкодили прототип в метро/кафе.
2. Поняли, что идея живая: потыкали сами, показали команде/клиенту.
3. Как только есть хоть какой-то код — он уже становится “живой спекой”:
— скармливаете его Claude Code / Cursor,
— просите переписать в ваш нормальный техстек (Kotlin, Swift, Flutter, Web и т.д.),
— доописываете архитектуру, слои, контракты.
4. Дальше это уже не игрушка, а полноценный проект с CI/CD, тестами и прочим взрослым окружением.
Скачать:
• iOS: https://apps.apple.com/app/id6742912146
• Android: https://play.google.com/store/apps/details?id=com.vibecodeapp.app
Это не “no-code для всех”, а инструмент для разработчиков и продвинутых продактов, чтобы ускорить фазу “от идеи до работающей спеки”, которую дальше уже довозит ваш обычный AI-assisted дев-процесс.
App Store
Vibecode - AI App Builder App - App Store
Download Vibecode - AI App Builder by Software Composer on the App Store. See screenshots, ratings and reviews, user tips, and more games like Vibecode - AI App…
👍4
This media is not supported in your browser
VIEW IN TELEGRAM
УРА! Наконец-то 201 подписчик!!
И я решил сгенерить видео на sora2 по этому случаю. Но так как сначала было 200 подписчиков, я делал для 200, потом стало 201 и я решил сделать под 201 и все это оказалось в одном контексте модели…. Ну и вот получилось, что получилось))) ИИ виднее как говорится.
И я решил сгенерить видео на sora2 по этому случаю. Но так как сначала было 200 подписчиков, я делал для 200, потом стало 201 и я решил сделать под 201 и все это оказалось в одном контексте модели…. Ну и вот получилось, что получилось))) ИИ виднее как говорится.
1🔥6👏4😁2
Claude Code и Anthropic — это сейчас «золотой стандарт» по UX для разработки с ИИ. Но далеко не везде удобно/дешево крутить именно антропиковские модели.
Вот под это как раз сделан репозиторий cc-compatible-models: обзор китайских (и не только) провайдеров, которые умеют эмулировать Anthropic API и работать с Claude Code «как родные», но сильно дешевле.
🔗 Репо: https://github.com/Alorse/cc-compatible-models
⸻
Лейтмотив
Claude Code остаётся вашей ОС для разработки, а вот «железо под капотом» можно менять.
Anthropic — для точности и надёжности, китайские провайдеры — для дешёвого, массового кодинга.
Репо аккуратно сводит в одну таблицу:
• цены за 1M токенов,
• какие модели лучше ставить как «основные» и «быстрые»,
• и главное — примеры ~/.claude/settings.json, чтобы Claude Code работал поверх DeepSeek, Qwen, Kimi K2, MiniMax, GLM 4.6 и т.д.
⸻
Какие модели тут есть
Коротко по провайдерам:
• Alibaba Qwen (Qwen3 / Qwen Coder)
Anthropic-совместимый endpoint в DashScope, очень адекватные цены, есть coder-линейка.
В settings.json просто меняем ANTHROPIC_BASE_URL на https://dashscope-intl.aliyuncs.com/apps/anthropic и подставляем Qwen-модели.
• DeepSeek (deepseek-chat / deepseek-reasoner)
Шлём запросы на https://api.deepseek.com/anthropic, можно воткнуть даже deepseek-reasoner как «мозг» под Claude Code. Есть контекст-кэш, поэтому длинные сессии заметно дешевле.
• MiniMax M2
Делает вид, что это Haiku/Sonnet/Opus одновременно — все дефолтные модели мапятся на MiniMax-M2. Плюс есть Coding Plan с фиксированной абоненткой (от $10/мес), что превращает «бесконечный кодинг» в предсказуемую подписку.
• Moonshot Kimi K2
Kimi K2 даёт до 256К контекста, кэширование промптов и отличный value за токен. Подключается к Claude Code через https://api.moonshot.ai/anthropic.
• Zhipu GLM 4.6 (Z.AI)
GLM 4.6 и GLM-линейка, совместимы с Claude Code, Cursor, Cline и т.п. Есть GLM Coding Plan от $3/мес, с очень щедрыми лимитами. Для интернационала — endpoint https://api.z.ai/api/anthropic.
⸻
Как это выглядит в практике
Примерно так выглядит идея конфигурации (условно под Qwen, но паттерн один и тот же):
И дальше вы просто пишете:
а под капотом уже работает не Anthropic, а выбранный китайский провайдер — но со всем удобством Claude Code: проекты, контекст, tools, skills, MCP и т.д.
⸻
Зачем это всё
• Можно держать один и тот же рабочий флоу (Claude Code, Cline, Cursor и пр.),
но переключать «движок» под ним в зависимости от задачи и бюджета.
• Антропиковские Sonnet/Opus оставляем для сложного проектирования, спек и критичных задач.
А рутинный кодинг, рефакторинги, массовые правки — отдаём Qwen / DeepSeek / GLM / MiniMax / Kimi.
• Благодаря coding-тарифам MiniMax и GLM можно получить условный «безлимитный» дев-режим за цену одной подписки.
В общем, это не просто список «ещё одних китайских моделей», а карта, как подменять Anthropic API под Claude Code на более дешёвые аналоги, не меняя свой привычный инструмент».
Вот под это как раз сделан репозиторий cc-compatible-models: обзор китайских (и не только) провайдеров, которые умеют эмулировать Anthropic API и работать с Claude Code «как родные», но сильно дешевле.
🔗 Репо: https://github.com/Alorse/cc-compatible-models
⸻
Лейтмотив
Claude Code остаётся вашей ОС для разработки, а вот «железо под капотом» можно менять.
Anthropic — для точности и надёжности, китайские провайдеры — для дешёвого, массового кодинга.
Репо аккуратно сводит в одну таблицу:
• цены за 1M токенов,
• какие модели лучше ставить как «основные» и «быстрые»,
• и главное — примеры ~/.claude/settings.json, чтобы Claude Code работал поверх DeepSeek, Qwen, Kimi K2, MiniMax, GLM 4.6 и т.д.
⸻
Какие модели тут есть
Коротко по провайдерам:
• Alibaba Qwen (Qwen3 / Qwen Coder)
Anthropic-совместимый endpoint в DashScope, очень адекватные цены, есть coder-линейка.
В settings.json просто меняем ANTHROPIC_BASE_URL на https://dashscope-intl.aliyuncs.com/apps/anthropic и подставляем Qwen-модели.
• DeepSeek (deepseek-chat / deepseek-reasoner)
Шлём запросы на https://api.deepseek.com/anthropic, можно воткнуть даже deepseek-reasoner как «мозг» под Claude Code. Есть контекст-кэш, поэтому длинные сессии заметно дешевле.
• MiniMax M2
Делает вид, что это Haiku/Sonnet/Opus одновременно — все дефолтные модели мапятся на MiniMax-M2. Плюс есть Coding Plan с фиксированной абоненткой (от $10/мес), что превращает «бесконечный кодинг» в предсказуемую подписку.
• Moonshot Kimi K2
Kimi K2 даёт до 256К контекста, кэширование промптов и отличный value за токен. Подключается к Claude Code через https://api.moonshot.ai/anthropic.
• Zhipu GLM 4.6 (Z.AI)
GLM 4.6 и GLM-линейка, совместимы с Claude Code, Cursor, Cline и т.п. Есть GLM Coding Plan от $3/мес, с очень щедрыми лимитами. Для интернационала — endpoint https://api.z.ai/api/anthropic.
⸻
Как это выглядит в практике
Примерно так выглядит идея конфигурации (условно под Qwen, но паттерн один и тот же):
{
"env": {
"ANTHROPIC_BASE_URL": "https://dashscope-intl.aliyuncs.com/apps/anthropic",
"ANTHROPIC_AUTH_TOKEN": "YOUR_API_KEY",
"ANTHROPIC_MODEL": "qwen-max",
"ANTHROPIC_SMALL_FAST_MODEL": "qwen-flash"
}
}И дальше вы просто пишете:
cd ваш-проект
claudeа под капотом уже работает не Anthropic, а выбранный китайский провайдер — но со всем удобством Claude Code: проекты, контекст, tools, skills, MCP и т.д.
⸻
Зачем это всё
• Можно держать один и тот же рабочий флоу (Claude Code, Cline, Cursor и пр.),
но переключать «движок» под ним в зависимости от задачи и бюджета.
• Антропиковские Sonnet/Opus оставляем для сложного проектирования, спек и критичных задач.
А рутинный кодинг, рефакторинги, массовые правки — отдаём Qwen / DeepSeek / GLM / MiniMax / Kimi.
• Благодаря coding-тарифам MiniMax и GLM можно получить условный «безлимитный» дев-режим за цену одной подписки.
В общем, это не просто список «ещё одних китайских моделей», а карта, как подменять Anthropic API под Claude Code на более дешёвые аналоги, не меняя свой привычный инструмент».
GitHub
GitHub - Alorse/cc-compatible-models: Complete guide and pricing comparison for using alternative AI models with Claude Code -…
Complete guide and pricing comparison for using alternative AI models with Claude Code - including DeepSeek, Qwen, Kimi K2, MiniMax, and GLM 4.6 - Alorse/cc-compatible-models
🔥2
Anthropic выкатили часовой разбор того, как ИИ уже используется в реальных кибератаках — и что они с этим делают. Это не маркетинг, а вполне себе threat-intel отчёт в формате живого разговора.
Ключевые кейсы из видео / отчёта 🧵
• Vibe hacking — злая версия vibe-кодинга. Один атакующий с помощью Claude Code автоматизировал разведку, взлом, выгрузку данных и кастомные «психологические» письма для вымогательства. 17 жертв за короткий период: от больниц до религиозных организаций.
• Схемы с «удалёнными айтишниками» из КНДР. Claude помогает выдавать себя за сеньор-разработчиков: готовит резюме, проходит техинтервью, подсказывает, как отвечать в рабочих чатах и письмах. Деньги с таких позиций уходят в обход санкций.
• No-code ransomware-as-a-service. Человек без серьёзной экспертизы, прикидываясь «исследователем безопасности», при помощи Claude собирает и дорабатывает рансомварь, продаёт её на площадках за сотни–тысячи долларов.
Главная мысль:
ИИ радикально снижает порог входа в сложное киберпреступление, и при этом встраивается во все стадии операций — от поиска жертв до автоматизации вымогательства. Но ровно те же модели Anthropic используют, чтобы эти штуки находить и гасить.
Что Anthropic делают в ответ 🛡️
• обучают модели жёстче отказываться от вредоносных запросов;
• строят классификаторы, которые ловят необычные паттерны использования;
• держат отдельную threat-intel команду, которая «охотится» за редкими, но сложными случаями misuse;
• шарят индикаторы компрометации и паттерны атак с другими игроками и регуляторами.
Вывод для нас как разработчиков и фаундеров:
мы уже живём в мире, где «ИИ против ИИ» — не фигура речи, а базовое допущение для безопасности продуктов. И инструменты типа Claude могут быть как усилителем защиты, так и усилителем атаки — вопрос только в руках и в гардрейлах.
Видео тут:
https://youtu.be/EsCNkDrIGCw?si=K_gcQwmCPl9Zq0S5
Ключевые кейсы из видео / отчёта 🧵
• Vibe hacking — злая версия vibe-кодинга. Один атакующий с помощью Claude Code автоматизировал разведку, взлом, выгрузку данных и кастомные «психологические» письма для вымогательства. 17 жертв за короткий период: от больниц до религиозных организаций.
• Схемы с «удалёнными айтишниками» из КНДР. Claude помогает выдавать себя за сеньор-разработчиков: готовит резюме, проходит техинтервью, подсказывает, как отвечать в рабочих чатах и письмах. Деньги с таких позиций уходят в обход санкций.
• No-code ransomware-as-a-service. Человек без серьёзной экспертизы, прикидываясь «исследователем безопасности», при помощи Claude собирает и дорабатывает рансомварь, продаёт её на площадках за сотни–тысячи долларов.
Главная мысль:
ИИ радикально снижает порог входа в сложное киберпреступление, и при этом встраивается во все стадии операций — от поиска жертв до автоматизации вымогательства. Но ровно те же модели Anthropic используют, чтобы эти штуки находить и гасить.
Что Anthropic делают в ответ 🛡️
• обучают модели жёстче отказываться от вредоносных запросов;
• строят классификаторы, которые ловят необычные паттерны использования;
• держат отдельную threat-intel команду, которая «охотится» за редкими, но сложными случаями misuse;
• шарят индикаторы компрометации и паттерны атак с другими игроками и регуляторами.
Вывод для нас как разработчиков и фаундеров:
мы уже живём в мире, где «ИИ против ИИ» — не фигура речи, а базовое допущение для безопасности продуктов. И инструменты типа Claude могут быть как усилителем защиты, так и усилителем атаки — вопрос только в руках и в гардрейлах.
Видео тут:
https://youtu.be/EsCNkDrIGCw?si=K_gcQwmCPl9Zq0S5
YouTube
Threat Intelligence: How Anthropic stops AI cybercrime
AI helps people work more efficiently. Unfortunately, this also applies to criminals. We've discovered that our own AI models are being used in sophisticated cybercrime operations, including a large-scale fraud scheme run by North Korea.
What is Anthropic…
What is Anthropic…
👍2✍1
Google продолжает разгонять Antigravity — теперь туда подвезли Nano Banana Pro 🟡🍌
Это новый Gemini 3 Pro Image-модель, которая умеет не просто “рисовать красивые картинки”, а генерировать проработанные UI-мокапы, инфографику, диаграммы и постеры с нормальным текстом (включая многоязычную локализацию) и высоким разрешением вплоть до 4K.
В видео как раз показывают, что Nano Banana Pro теперь доступен прямо внутри Google Antigravity:
агенты в IDE могут генерировать макеты экранов, иллюстрации и визуальные спеки до того, как начнётся реализация — всё в одном рабочем пространстве.
Что это меняет для нас, разработчиков и вайб-кодеров:
• 🧩 UI из промпта — описываешь фичу агенту, он сначала собирает визуальный макет (дашборд, форму, лендинг), вы согласуете картинку, и только потом идёт реализация.
• 🌍 Нормальный текст в картинках — заголовки, подписи к графикам, сложные схемы, плюс автоматическая локализация макета на другие языки без перекраивания дизайна.
• 🎛 Студийный контроль — свет, ракурсы, фокус, цветокор, “день/ночь”, bokeh-эффекты и т.п. — всё задаётся в промпте, пригодно уже не только “для прототипа”, но и для продакшн-креативов.
• 🔌 API и экосистема — тот же Nano Banana Pro доступен через Gemini API, Google AI Studio, Vertex AI и, конечно, через Antigravity как часть агентного пайплайна.
По сути, Antigravity превращается в IDE, где дизайн и код живут в одном агентном цикле: описал фичу → агент с Nano Banana Pro нарисовал экран → вы его заапрувили → тот же агент пошёл писать реализацию под этот макет.
🔗 Видео: https://youtu.be/FB6HO7CZHWw
(если хотите контекст шире — ещё есть официальный пост Google про Nano Banana Pro и интеграцию в Antigravity).
Это новый Gemini 3 Pro Image-модель, которая умеет не просто “рисовать красивые картинки”, а генерировать проработанные UI-мокапы, инфографику, диаграммы и постеры с нормальным текстом (включая многоязычную локализацию) и высоким разрешением вплоть до 4K.
В видео как раз показывают, что Nano Banana Pro теперь доступен прямо внутри Google Antigravity:
агенты в IDE могут генерировать макеты экранов, иллюстрации и визуальные спеки до того, как начнётся реализация — всё в одном рабочем пространстве.
Что это меняет для нас, разработчиков и вайб-кодеров:
• 🧩 UI из промпта — описываешь фичу агенту, он сначала собирает визуальный макет (дашборд, форму, лендинг), вы согласуете картинку, и только потом идёт реализация.
• 🌍 Нормальный текст в картинках — заголовки, подписи к графикам, сложные схемы, плюс автоматическая локализация макета на другие языки без перекраивания дизайна.
• 🎛 Студийный контроль — свет, ракурсы, фокус, цветокор, “день/ночь”, bokeh-эффекты и т.п. — всё задаётся в промпте, пригодно уже не только “для прототипа”, но и для продакшн-креативов.
• 🔌 API и экосистема — тот же Nano Banana Pro доступен через Gemini API, Google AI Studio, Vertex AI и, конечно, через Antigravity как часть агентного пайплайна.
По сути, Antigravity превращается в IDE, где дизайн и код живут в одном агентном цикле: описал фичу → агент с Nano Banana Pro нарисовал экран → вы его заапрувили → тот же агент пошёл писать реализацию под этот макет.
🔗 Видео: https://youtu.be/FB6HO7CZHWw
(если хотите контекст шире — ещё есть официальный пост Google про Nano Banana Pro и интеграцию в Antigravity).
YouTube
Nano Banana Pro is now available on Google Antigravity
With Nano Banana Pro, you get more precision to change specific areas in your image. Use this in Antigravity to fine-tune website designs or create simple, digestible infographics of how your data flows for complex codebases.
Subscribe to Google Antigravity…
Subscribe to Google Antigravity…
🔥5
Так, ну я настроил себе Antigravity. За полчаса у меня закончился лимит gemini 3 pro (high). Гуглеры, а как тут докупаться? А?
😁4
Мой mcp config для разработки под flutter для Antigravity, вдруг кому пригодится:
{
"mcpServers": {
"dart-mcp-server": {
"command": "dart",
"args": [
"mcp-server"
],
"env": {}
},
"firebase-mcp-server": {
"command": "npx",
"args": [
"-y",
"firebase-tools@latest",
"mcp"
],
"env": {}
},
"serena": {
"type": "stdio",
"command": "uvx",
"args": [
"--from",
"git+https://github.com/oraios/serena",
"serena",
"start-mcp-server",
"--transport",
"stdio",
"--project",
".",
"--context",
"ide-assistant"
]
},
"context7": {
"serverUrl": "https://mcp.context7.com/mcp",
"headers": {
"CONTEXT7_API_KEY": ""
}
},
"perplexity-mcp": {
"type": "stdio",
"command": "perplexity-mcp",
"args": [
"--model",
"sonar-pro",
"--reasoning-model",
"sonar-reasoning-pro"
],
"env": {
"PERPLEXITY_API_KEY": ""
}
}
}
}
👍6🔥1
Короче Antigravity ни в коем разе не может хоть как-то сравняться с claude code на anthropic, я официально это заявляю. Только для нарезки дизайна. Ролики они конечно красивые сделали, но этому продукту еще нужно подрасти вместе с gemini 3 pro. Nano banana топ!
1👍2✍1🤝1
Anthropic выкатили Claude Opus 4.5 🚀
Anthropic официально обновили флагман: Claude Opus 4.5 — модель, которую они сами называют лучшей в мире для кода, агентов и computer use и заметным шагом вперёд для ежедневной работы с таблицами, презентациями и ресёрчем.
Что важно разработчикам и тем, кто строит агентов:
• 🧠 Флагман для кода и агентов
Opus 4.5 показывает SOTA на реальных инженерных задачах (SWE-bench Verified) и опережает конкурентов вроде GPT-5.1 и Gemini 3 Pro на ключевых кодовых бенчмарках.
• 🏷️ Цена сильно упала
В API модель доступна как claude-opus-4-5-20251101 по цене $5 / $25 за 1M токенов (in/out) — это уже не «ультра-люкс», а вполне рабочая лошадка для продакшена.
• ⚙️ Новый параметр effort
В API можно крутить «уровень усилия» модели:
— на среднем effort Opus 4.5 матчит Sonnet 4.5 по SWE-bench, но использует на 76% меньше output-токенов;
— на максимальном effort даёт +4.3 п.п. к качеству и всё равно −48% токенов.
По сути, это ручка «быстрее и дешевле» vs «думает глубже, но всё равно экономно».
• 🧩 Долгоживущие агенты и память
В dev-платформе усилили context compaction, advanced tool use и memory: Opus 4.5 лучше держит длинные цепочки действий, умеет управлять командой сабагентов и в их внутренних тестах даёт +~15 п.п. на deep research-eval’ах при использовании нового стека контекст-менеджмента и памяти.
• 🛡 Безопасность и prompt injection
По результатам независимых тестов от Gray Swan, Opus 4.5 стал заметно устойчивее к сильным prompt-injection атакам и в целом показывает меньше «тревожного» поведения среди фронтир-моделей.
• 🛠 Апдейты продуктов вокруг
• Claude Code: улучшенный Plan Mode (генерит понятный plan.md и аккуратнее исполняет план), плюс Opus 4.5 как новый «мозг» для тяжёлых задач — рефакторинг, миграции, длинные кодовые сессии.
• Claude Code в десктопном приложении — можно гонять несколько локальных и удалённых сессий параллельно.
• В обычном Claude-чате длинные диалоги больше не «упираются в стену» — контекст автоматически сжимается.
• Claude for Chrome открывают всем Max-пользователям, а Claude for Excel расширяют для Max / Team / Enterprise.
• ☁️ Доступность
Opus 4.5 уже сейчас доступен в приложениях Claude, в API и на всех трёх крупных облаках (Azure/Foundry, Bedrock, Vertex).
Мой вывод:
Opus 4.5 — это уже не редкий «режим бога для особых случаев», а кандидат на дефолтную модель под серьёзные кодовые и агентные пайплайны, с нормальной ценой, ручкой effort и упором на долгоживущие, автономные сценарии.
👉 Оригинальный анонс Anthropic: https://www.anthropic.com/news/claude-opus-4-5
Anthropic официально обновили флагман: Claude Opus 4.5 — модель, которую они сами называют лучшей в мире для кода, агентов и computer use и заметным шагом вперёд для ежедневной работы с таблицами, презентациями и ресёрчем.
Что важно разработчикам и тем, кто строит агентов:
• 🧠 Флагман для кода и агентов
Opus 4.5 показывает SOTA на реальных инженерных задачах (SWE-bench Verified) и опережает конкурентов вроде GPT-5.1 и Gemini 3 Pro на ключевых кодовых бенчмарках.
• 🏷️ Цена сильно упала
В API модель доступна как claude-opus-4-5-20251101 по цене $5 / $25 за 1M токенов (in/out) — это уже не «ультра-люкс», а вполне рабочая лошадка для продакшена.
• ⚙️ Новый параметр effort
В API можно крутить «уровень усилия» модели:
— на среднем effort Opus 4.5 матчит Sonnet 4.5 по SWE-bench, но использует на 76% меньше output-токенов;
— на максимальном effort даёт +4.3 п.п. к качеству и всё равно −48% токенов.
По сути, это ручка «быстрее и дешевле» vs «думает глубже, но всё равно экономно».
• 🧩 Долгоживущие агенты и память
В dev-платформе усилили context compaction, advanced tool use и memory: Opus 4.5 лучше держит длинные цепочки действий, умеет управлять командой сабагентов и в их внутренних тестах даёт +~15 п.п. на deep research-eval’ах при использовании нового стека контекст-менеджмента и памяти.
• 🛡 Безопасность и prompt injection
По результатам независимых тестов от Gray Swan, Opus 4.5 стал заметно устойчивее к сильным prompt-injection атакам и в целом показывает меньше «тревожного» поведения среди фронтир-моделей.
• 🛠 Апдейты продуктов вокруг
• Claude Code: улучшенный Plan Mode (генерит понятный plan.md и аккуратнее исполняет план), плюс Opus 4.5 как новый «мозг» для тяжёлых задач — рефакторинг, миграции, длинные кодовые сессии.
• Claude Code в десктопном приложении — можно гонять несколько локальных и удалённых сессий параллельно.
• В обычном Claude-чате длинные диалоги больше не «упираются в стену» — контекст автоматически сжимается.
• Claude for Chrome открывают всем Max-пользователям, а Claude for Excel расширяют для Max / Team / Enterprise.
• ☁️ Доступность
Opus 4.5 уже сейчас доступен в приложениях Claude, в API и на всех трёх крупных облаках (Azure/Foundry, Bedrock, Vertex).
Мой вывод:
Opus 4.5 — это уже не редкий «режим бога для особых случаев», а кандидат на дефолтную модель под серьёзные кодовые и агентные пайплайны, с нормальной ценой, ручкой effort и упором на долгоживущие, автономные сценарии.
👉 Оригинальный анонс Anthropic: https://www.anthropic.com/news/claude-opus-4-5
Anthropic
Introducing Claude Opus 4.5
Anthropic is an AI safety and research company that's working to build reliable, interpretable, and steerable AI systems.
Ну и теперь Opus 4.5 - SOTA, и оно уже доступно в Claude Code и теперь SOTA с хуками, скилами и сабагентами!
👍2