Forwarded from Банкста
Компания Anthropic, разработчик Claude — самого продвинутого ИИ для программирования — выяснила, что хакеры эффективно использовали ее агента Claude Code для кибератак.
По ее данным, в одном случае хакеры за месяц украли данные у 17 учреждений, причем ИИ выступил и техническим оператором (включая начальный поиск уязвимостей), и консультантом. А в дальнейшем — специалистом по психологическим операциям, писавшим «профилированные под конкретный профиль вымогательские письма» тем, чьи данные были украдены. Заодно подгоняя сумму выкупа под конкретного человека.
Исследователи обнаружили компьютерный вирус на базе ИИ — PromptLock. Он использует открытую модель от OpenAI, чтобы писать вредоносные скрипты в реальном времени. После этого программа может «украсть» или зашифровать данные. @banksta
По ее данным, в одном случае хакеры за месяц украли данные у 17 учреждений, причем ИИ выступил и техническим оператором (включая начальный поиск уязвимостей), и консультантом. А в дальнейшем — специалистом по психологическим операциям, писавшим «профилированные под конкретный профиль вымогательские письма» тем, чьи данные были украдены. Заодно подгоняя сумму выкупа под конкретного человека.
Исследователи обнаружили компьютерный вирус на базе ИИ — PromptLock. Он использует открытую модель от OpenAI, чтобы писать вредоносные скрипты в реальном времени. После этого программа может «украсть» или зашифровать данные. @banksta
Кому токенов не хватает можно бесплатно покодить) Я посмотрю отпишусь тоже как оно работает
Forwarded from XOR
Произошел ночной подгон от Маска: xAI тихонько выпустили Grok Code
Это гибридная модель с 37B активными параметрами, заточенная под программирование. Контекстное окно — 262K токенов. Модель раньше скрывалась под именем «sonic», и первые пользователи от в восторге от ее скорости и точности. Бенчей пока нет.
Зато модель уже доступна в Cursor и Opencode бесплатно до 2 сентября🤩
@xor_journal
Это гибридная модель с 37B активными параметрами, заточенная под программирование. Контекстное окно — 262K токенов. Модель раньше скрывалась под именем «sonic», и первые пользователи от в восторге от ее скорости и точности. Бенчей пока нет.
Зато модель уже доступна в Cursor и Opencode бесплатно до 2 сентября
@xor_journal
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4🔥1
Forwarded from Machinelearning
400 страниц про всё, что нужно знать об агентных системах. Автор — senior engineer в Google, выложил драфт для открытого ревью.
📖 В книге:
- продвинутые техники промптинга
- паттерны для мульти-агентов
- использование инструментов и MCP
- практические примеры с кодом
⚡ По сути, это полный справочник по построению умных агентов. Must-read для разработчиков AI.
@ai_machinelearning_big_data
#AI #Agents #Google #OpenSource #freebook
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
2👍6🔥4✍2
https://github.com/charmbracelet/crush
Новый терминальный агент, много кто из наших контрибутит. Реальный конкурент Claude code, но не поддерживает подписки
Новый терминальный агент, много кто из наших контрибутит. Реальный конкурент Claude code, но не поддерживает подписки
GitHub
GitHub - charmbracelet/crush: The glamourous AI coding agent for your favourite terminal 💘
The glamourous AI coding agent for your favourite terminal 💘 - charmbracelet/crush
https://www.youtube.com/watch?v=Yf_1w00qIKc
Вышло видео с создателем Claude Code Борисом Черным.
0:00 — Вступление и контекст
• Разговор Алекса Альберта (Anthropic) с Борисом Черным (создатель Claude Code) о том, что такое Claude Code, зачем он появился и как им пользоваться. Основной фокус — «агентное кодирование» в терминале как универсальной среде.
4:49 — Для кого и за что платим
• Кому особенно полезен инструмент: проф. разработчикам и командам с разными IDE/стеками.
• Стоимость и модель использования (в т.ч. в составе подписок Max) — ориентир для «серьёзной работы».
7:15 — Почему именно терминал
• Терминал выбран как «наименьший общий знаменатель» между Vim/VS Code/Zed и т.д.; так проще интегрироваться в любые пайплайны и быстрее эволюционировать продукт.
9:35 — Что умеет прямо сейчас
• Агент читает файлы, строит план, вносит набор согласованных правок, пишет тесты и т.д. Это не «автодополнение», а самостоятельная работа под присмотром.
• Переход от «пишем код» к «оркестрируем агента и ревьюим результаты».
12:23 — Claude 4 и сдвиг в качестве
• По сравнению с 3.7 Sonnet, линейка Claude 4 лучше «держит» инструкции и чаще попадает «с первого выстрела» (в т.ч. по тестам). Это расширяет набор задач, которые можно отдавать агенту.
12:23–15:16 — Интеграции: GitHub Actions и «фоновый программист»
• Установка GitHub Action из самого Claude Code; можно упоминать бота в issue/PR, чтобы он чинил, дописывал тесты и подготавливал PR «в фоне». Это меняет модель работы команды.
15:16 — Практические советы (best practices)
• Сначала «попросить составить план», затем — реализация.
• Давать фазу «прочитай файлы → подумай → кодируй» (extended thinking).
• Параллелить простые задачи (auto-accept), а сложные вести вручную в IDE-терминале.
17:33 — Claude.md и память
• Многоуровневые Claude.md: проектный/командный/личный/глобальный/вложенный — для стиля, правил, частых команд; есть «memory mode» для запоминания полезных паттернов.
Дальше — взгляд вперёд
• Глубже интегрироваться с инструментами (IDE, CI) и упростить «вызов агента» вне терминала (например, из чатов/таск-трекеров) — цель сделать доступ к «лёгким задачам» ещё проще.
Вышло видео с создателем Claude Code Борисом Черным.
0:00 — Вступление и контекст
• Разговор Алекса Альберта (Anthropic) с Борисом Черным (создатель Claude Code) о том, что такое Claude Code, зачем он появился и как им пользоваться. Основной фокус — «агентное кодирование» в терминале как универсальной среде.
4:49 — Для кого и за что платим
• Кому особенно полезен инструмент: проф. разработчикам и командам с разными IDE/стеками.
• Стоимость и модель использования (в т.ч. в составе подписок Max) — ориентир для «серьёзной работы».
7:15 — Почему именно терминал
• Терминал выбран как «наименьший общий знаменатель» между Vim/VS Code/Zed и т.д.; так проще интегрироваться в любые пайплайны и быстрее эволюционировать продукт.
9:35 — Что умеет прямо сейчас
• Агент читает файлы, строит план, вносит набор согласованных правок, пишет тесты и т.д. Это не «автодополнение», а самостоятельная работа под присмотром.
• Переход от «пишем код» к «оркестрируем агента и ревьюим результаты».
12:23 — Claude 4 и сдвиг в качестве
• По сравнению с 3.7 Sonnet, линейка Claude 4 лучше «держит» инструкции и чаще попадает «с первого выстрела» (в т.ч. по тестам). Это расширяет набор задач, которые можно отдавать агенту.
12:23–15:16 — Интеграции: GitHub Actions и «фоновый программист»
• Установка GitHub Action из самого Claude Code; можно упоминать бота в issue/PR, чтобы он чинил, дописывал тесты и подготавливал PR «в фоне». Это меняет модель работы команды.
15:16 — Практические советы (best practices)
• Сначала «попросить составить план», затем — реализация.
• Давать фазу «прочитай файлы → подумай → кодируй» (extended thinking).
• Параллелить простые задачи (auto-accept), а сложные вести вручную в IDE-терминале.
17:33 — Claude.md и память
• Многоуровневые Claude.md: проектный/командный/личный/глобальный/вложенный — для стиля, правил, частых команд; есть «memory mode» для запоминания полезных паттернов.
Дальше — взгляд вперёд
• Глубже интегрироваться с инструментами (IDE, CI) и упростить «вызов агента» вне терминала (например, из чатов/таск-трекеров) — цель сделать доступ к «лёгким задачам» ещё проще.
YouTube
A conversation on Claude Code
Anthropic’s Boris Cherny (Claude Code) and Alex Albert (Claude Relations) talk about Claude Code—how it started as Anthropic's own internal agentic coding tool, and practical tips for getting the most out of your experience.
Find out more: https://www.…
Find out more: https://www.…
👍4
🧑💻 Вопрос про лимиты и токены Anthropic
Меня тут спрашивали — как обойти лимиты у Anthropic? А я спрошу в ответ: зачем вообще?
Сейчас есть куча бесплатных топовых моделей от китайцев, доступных прямо в OpenRouter. Один минус — они будут обучаться на вашем коде (если это критично, просто не используйте).
✨ Примеры свежих State-of-the-Art моделей:
• DeepSeek 3.1
• Qwen Coder 480B (самая большая кодер-модель)
• Kimi K2 (последняя версия)
И все они доступны бесплатно через OpenRouter.
⚙️ Как подключить:
1. Регистрируетесь в OpenRouter.
2. Делаете API-ключ.
3. Подключаете его к Crush — терминальному агенту, про который я недавно рассказывал.
После этого можно использовать бесплатные модели прямо в терминале.
🚀 Скоро еще покажу несколько интересных китайских терминальных агентов.
Меня тут спрашивали — как обойти лимиты у Anthropic? А я спрошу в ответ: зачем вообще?
Сейчас есть куча бесплатных топовых моделей от китайцев, доступных прямо в OpenRouter. Один минус — они будут обучаться на вашем коде (если это критично, просто не используйте).
✨ Примеры свежих State-of-the-Art моделей:
• DeepSeek 3.1
• Qwen Coder 480B (самая большая кодер-модель)
• Kimi K2 (последняя версия)
И все они доступны бесплатно через OpenRouter.
⚙️ Как подключить:
1. Регистрируетесь в OpenRouter.
2. Делаете API-ключ.
3. Подключаете его к Crush — терминальному агенту, про который я недавно рассказывал.
После этого можно использовать бесплатные модели прямо в терминале.
🚀 Скоро еще покажу несколько интересных китайских терминальных агентов.
GitHub
GitHub - charmbracelet/crush: The glamourous AI coding agent for your favourite terminal 💘
The glamourous AI coding agent for your favourite terminal 💘 - charmbracelet/crush
1👍6❤2🔥2
Forwarded from эйай ньюз
Китайцы из Zhipu запустили подписку для Claude Code
В основе — собственная модель Zhipu, GLM 4.5. Работает исключительно с Claude Code, подписчикам выдаётся API ключ для эндпоинта совместимого с API Anthropic, который можно засунуть в агента от Антропик. Основной селлинг поинт — повышенные лимиты по сравнению с подпиской от Anthropic и меньше цена ($3 в месяц за Lite подписку и $15 за Pro). Вообще интересно наблюдать как, несмотря на закрытость Claude Code, всё больше провайдеров прилагают кучу усилий чтобы поддерживать именно его, а не что-то более открытое.
z.ai/subscribe
@ai_newz
В основе — собственная модель Zhipu, GLM 4.5. Работает исключительно с Claude Code, подписчикам выдаётся API ключ для эндпоинта совместимого с API Anthropic, который можно засунуть в агента от Антропик. Основной селлинг поинт — повышенные лимиты по сравнению с подпиской от Anthropic и меньше цена ($3 в месяц за Lite подписку и $15 за Pro). Вообще интересно наблюдать как, несмотря на закрытость Claude Code, всё больше провайдеров прилагают кучу усилий чтобы поддерживать именно его, а не что-то более открытое.
z.ai/subscribe
@ai_newz
❤4
Чуть не пропустил
https://developer.apple.com/documentation/xcode-release-notes/xcode-26-release-notes
Apple вслед за JetBrains активно докатывает большие coding LLM себе в интерфейс, что очень радует конечно. Но тут самое главное чтоб там был агент который умеет работать непосредственно с тулингом среды разработки, а не просто код писать. Код писать уже любая модель умеет…
https://developer.apple.com/documentation/xcode-release-notes/xcode-26-release-notes
Apple вслед за JetBrains активно докатывает большие coding LLM себе в интерфейс, что очень радует конечно. Но тут самое главное чтоб там был агент который умеет работать непосредственно с тулингом среды разработки, а не просто код писать. Код писать уже любая модель умеет…
👍2
💡 Vibe Coding: сначала план, потом код (или в сотый раз о самом важном)
Многие садятся вайб кодить — и тонут в хаосе. В Vibe Coding у нас всегда два этапа: Планируем → Кодируем. Это не бюрократия — это ускоритель.
⸻
1️⃣ План (обязательный артефакт)
• Сформулируй цель и границы.
• Собери доп. инфо: API/схемы/примеры/риски/ограничения.
• Определи DoD (критерии приёмки) и тест-кейс-скелет.
• Спланируй ветки и параллельные треки.
• Загрузите план в контекст ИИ (чтобы модель не «уходила в лес»).
Мини-шаблон (кидай в контекст перед кодом):
# План
Цель:
Объем/границы:
Входы/выходы:
API/контракты/схемы:
Ограничения/риски:
Артефакты на выходе:
DoD (критерии приёмки):
Тесты/метрики:
Ветки/параллельные треки:
План обзора (review):
⸻
2️⃣ Кодирование (строго по плану)
• Работаем в отдельных ветках: feature/..., fix/..., spike/....
• Для параллели используем git worktrees + Claude Code (удобно держать несколько сессий):
https://docs.claude.com/en/docs/claude-code/common-workflows#run-parallel-claude-code-sessions-with-git-worktrees
• Регулярный синк: фиксируем расхождения → обновляем план → только потом продолжаем код.
⸻
3️⃣ Обзор (review)
Сверяем результат с DoD и тестами. Не совпало? Сначала корректируем план, затем код. Так гасим галлюцинации ИИ, отвлечения и «забывание».
⸻
Почему это важно
✅ Меньше хаоса и бесконечных доработок.
✅ Быстрее поставка за счёт фокуса.
✅ Легче масштабировать команду и параллельные треки.
Анти-паттерн
«Сейчас накидаю, а там разберёмся» → путаница, хотфиксы, долгий хвост.
Чек-лист запуска
☑️ 15–30 мин на план → ☑️ загрузить в контекст → ☑️ ветки + worktrees → ☑️ регулярный синк → ☑️ review по DoD.
Многие садятся вайб кодить — и тонут в хаосе. В Vibe Coding у нас всегда два этапа: Планируем → Кодируем. Это не бюрократия — это ускоритель.
⸻
1️⃣ План (обязательный артефакт)
• Сформулируй цель и границы.
• Собери доп. инфо: API/схемы/примеры/риски/ограничения.
• Определи DoD (критерии приёмки) и тест-кейс-скелет.
• Спланируй ветки и параллельные треки.
• Загрузите план в контекст ИИ (чтобы модель не «уходила в лес»).
Мини-шаблон (кидай в контекст перед кодом):
# План
Цель:
Объем/границы:
Входы/выходы:
API/контракты/схемы:
Ограничения/риски:
Артефакты на выходе:
DoD (критерии приёмки):
Тесты/метрики:
Ветки/параллельные треки:
План обзора (review):
⸻
2️⃣ Кодирование (строго по плану)
• Работаем в отдельных ветках: feature/..., fix/..., spike/....
• Для параллели используем git worktrees + Claude Code (удобно держать несколько сессий):
https://docs.claude.com/en/docs/claude-code/common-workflows#run-parallel-claude-code-sessions-with-git-worktrees
• Регулярный синк: фиксируем расхождения → обновляем план → только потом продолжаем код.
⸻
3️⃣ Обзор (review)
Сверяем результат с DoD и тестами. Не совпало? Сначала корректируем план, затем код. Так гасим галлюцинации ИИ, отвлечения и «забывание».
⸻
Почему это важно
✅ Меньше хаоса и бесконечных доработок.
✅ Быстрее поставка за счёт фокуса.
✅ Легче масштабировать команду и параллельные треки.
Анти-паттерн
«Сейчас накидаю, а там разберёмся» → путаница, хотфиксы, долгий хвост.
Чек-лист запуска
☑️ 15–30 мин на план → ☑️ загрузить в контекст → ☑️ ветки + worktrees → ☑️ регулярный синк → ☑️ review по DoD.
Claude Code Docs
Common workflows - Claude Code Docs
Learn about common workflows with Claude Code.
1✍4👍3💯1
🚀 Anthropic выпустила Claude Sonnet 4.5 — новая SOTA в кодировании и автономных агентах
Сегодня Anthropic анонсировала Claude Sonnet 4.5 — крупный шаг вперёд в линейке Claude.
⚙️ Что заявлено нового и впечатляющего:
• Модель способна работать автономно до 30 часов подряд, выполняя сложные задачи — по сравнению с ~7 часами у предшественника Opus 4.
• Внутренние тесты включали полную разработку веб-приложения “с нуля” — включая логику, базы данных и весь стек.
• Значительный рост “умения использовать компьютер / инструменты” (operating system benchmark): ~60 % против ~40 % у предыдущих версий.
• Улучшенные навыки в финанcах, научных задачах, безопасности, многошаговых рассуждениях.
• Sonnet 4.5 уже доступна в публичной превью для GitHub Copilot — пользователи Pro, Business и Enterprise смогут её выбрать.
• Стоимость API остаётся прежней: $3 за миллион входных токенов и $15 за миллион выходных токенов.
• Anthropic утверждает, что Sonnet 4.5 — их наиболее “aligned” (согласованная) модель по сей день — с меньшей склонностью к отклонениям, манипуляциям и “внедрению” побочных намерений.
🧭 Почему это важный релиз (и чем интересен для сообщества):
• Это шаг к ИИ-агентам нового поколения, способным автономно работать над длительными проектами без постоянного вмешательства.
• Значительное повышение надёжности: не просто “быстро отвечает”, а “утрясает логику, связывает инструменты, завершает продукт”.
• Конкуренция на рынке LLM усиливается: Anthropic показывает, что может не просто догонять, но и задавать темп.
• Переход из “демо-фич” к реальным системам, которые можно внедрить в производство и закрыть требования к надёжности.
⸻
📌 Критически важно: пока что мы видим заявленные показатели и внутренние тесты; реальные кейсы внедрения и стабильность в продакшене покажут, насколько они соответствуют амбициям.
Го тестить!
Ну и скоро мой обзор glm-4.5 от z.ai
Сегодня Anthropic анонсировала Claude Sonnet 4.5 — крупный шаг вперёд в линейке Claude.
⚙️ Что заявлено нового и впечатляющего:
• Модель способна работать автономно до 30 часов подряд, выполняя сложные задачи — по сравнению с ~7 часами у предшественника Opus 4.
• Внутренние тесты включали полную разработку веб-приложения “с нуля” — включая логику, базы данных и весь стек.
• Значительный рост “умения использовать компьютер / инструменты” (operating system benchmark): ~60 % против ~40 % у предыдущих версий.
• Улучшенные навыки в финанcах, научных задачах, безопасности, многошаговых рассуждениях.
• Sonnet 4.5 уже доступна в публичной превью для GitHub Copilot — пользователи Pro, Business и Enterprise смогут её выбрать.
• Стоимость API остаётся прежней: $3 за миллион входных токенов и $15 за миллион выходных токенов.
• Anthropic утверждает, что Sonnet 4.5 — их наиболее “aligned” (согласованная) модель по сей день — с меньшей склонностью к отклонениям, манипуляциям и “внедрению” побочных намерений.
🧭 Почему это важный релиз (и чем интересен для сообщества):
• Это шаг к ИИ-агентам нового поколения, способным автономно работать над длительными проектами без постоянного вмешательства.
• Значительное повышение надёжности: не просто “быстро отвечает”, а “утрясает логику, связывает инструменты, завершает продукт”.
• Конкуренция на рынке LLM усиливается: Anthropic показывает, что может не просто догонять, но и задавать темп.
• Переход из “демо-фич” к реальным системам, которые можно внедрить в производство и закрыть требования к надёжности.
⸻
📌 Критически важно: пока что мы видим заявленные показатели и внутренние тесты; реальные кейсы внедрения и стабильность в продакшене покажут, насколько они соответствуют амбициям.
Го тестить!
Ну и скоро мой обзор glm-4.5 от z.ai
🔥3❤1👍1
Forwarded from Data, Stories and Languages
Claude Code 2.0
Но что ещё интереснее, anthropic опубликовали claude code 2.0!
https://www.npmjs.com/package/@anthropic-ai/claude-code
Из интересных изменений:
• Нативное приложение для VS Code
• команда /rewind для отката изменений
• команда /usage для просмотра лимитов твоего плана
• Ctrl + R для поиска по истории
• Tab для включения думающего режима
Остальные изменения тут: https://github.com/anthropics/claude-code/blob/main/CHANGELOG.md#200
Но что ещё интереснее, anthropic опубликовали claude code 2.0!
https://www.npmjs.com/package/@anthropic-ai/claude-code
Из интересных изменений:
• Нативное приложение для VS Code
• команда /rewind для отката изменений
• команда /usage для просмотра лимитов твоего плана
• Ctrl + R для поиска по истории
• Tab для включения думающего режима
Остальные изменения тут: https://github.com/anthropics/claude-code/blob/main/CHANGELOG.md#200
GitHub
claude-code/CHANGELOG.md at main · anthropics/claude-code
Claude Code is an agentic coding tool that lives in your terminal, understands your codebase, and helps you code faster by executing routine tasks, explaining complex code, and handling git workflo...
❤4👍1
https://youtu.be/dGiqrsv530Y?si=Od3w7JWk1IgFqiwU
Посмотрите этот демо ролик обязательно. Genie это были цветочки
Посмотрите этот демо ролик обязательно. Genie это были цветочки
YouTube
An experimental new way to design software
We’ve been experimenting with a new way to generate software. In this research preview, Claude builds whatever you can imagine, on the fly, without writing any code first. What you see is Claude creating software in real time, responding and adapting to your…
🚀 Новая эра агент-приложений: Claude Agent SDK от Anthropic
Anthropic недавно переименовали Claude Code SDK в Claude Agent SDK и расширили его возможности — теперь это не просто инструмент для помощи в коде, а полноценная платформа для построения автономных агентов.
🔍 Что это даёт
• Агент получает «компьютер» — доступ к файловой системе, запуск bash-команд, чтение/запись файлов и прочее. Это позволяет выполнять задачи вне рамок чистого текста.
• Используя этот подход, агент можно натренировать на:
• Финансовые агенты (анализ портфелей, прогнозы)
• Персональных ассистентов (календарь, travel, планирование)
• Службы поддержки (обработка запросов, эскалации)
• Глубокие агенты-исследователи (поиск по документам, сводка, анализ)
🔁 Архитектура: цикл агента
Типичный цикл работы агента в Claude Agent SDK:
1. Gather context — сбор контекста (файлы, логи, предыдущие сообщения)
2. Take action — применение инструментов, запуск кода, обращения к API
3. Verify work — проверка результатов, исправление ошибок, итерации
Ключевые детали:
• Инструменты (Tools): надо явно выделять основные действия, которые агент может предпринимать (например, fetchInbox, searchEmails)
• Subagents: агент может запускать субагентов, чтобы параллельно решать подзадачи и потом свернуть результаты назад
• Суммаризация контекста (compaction): при росте объёма контекста автоматически сводятся или резюмируются старые данные, чтобы не выйти за пределы контекстного окна
• Верификация: через правила (линтинг кода, валидацию), визуальные проверки (скриншоты), либо «судейство» другим LLM
🧪 Как начать
• Claude Agent SDK уже доступен — можно начать экспериментировать прямо сейчас.
• Для тех, кто уже работает с SDK, Anthropic публикуют гайд по миграции на новую версию.
• Важно: проектируйте агента вокруг цикла и методов верификации, потому что надёжность и возможность самоисправления — ключ к стабильной работе.
Anthropic недавно переименовали Claude Code SDK в Claude Agent SDK и расширили его возможности — теперь это не просто инструмент для помощи в коде, а полноценная платформа для построения автономных агентов.
🔍 Что это даёт
• Агент получает «компьютер» — доступ к файловой системе, запуск bash-команд, чтение/запись файлов и прочее. Это позволяет выполнять задачи вне рамок чистого текста.
• Используя этот подход, агент можно натренировать на:
• Финансовые агенты (анализ портфелей, прогнозы)
• Персональных ассистентов (календарь, travel, планирование)
• Службы поддержки (обработка запросов, эскалации)
• Глубокие агенты-исследователи (поиск по документам, сводка, анализ)
🔁 Архитектура: цикл агента
Типичный цикл работы агента в Claude Agent SDK:
1. Gather context — сбор контекста (файлы, логи, предыдущие сообщения)
2. Take action — применение инструментов, запуск кода, обращения к API
3. Verify work — проверка результатов, исправление ошибок, итерации
Ключевые детали:
• Инструменты (Tools): надо явно выделять основные действия, которые агент может предпринимать (например, fetchInbox, searchEmails)
• Subagents: агент может запускать субагентов, чтобы параллельно решать подзадачи и потом свернуть результаты назад
• Суммаризация контекста (compaction): при росте объёма контекста автоматически сводятся или резюмируются старые данные, чтобы не выйти за пределы контекстного окна
• Верификация: через правила (линтинг кода, валидацию), визуальные проверки (скриншоты), либо «судейство» другим LLM
🧪 Как начать
• Claude Agent SDK уже доступен — можно начать экспериментировать прямо сейчас.
• Для тех, кто уже работает с SDK, Anthropic публикуют гайд по миграции на новую версию.
• Важно: проектируйте агента вокруг цикла и методов верификации, потому что надёжность и возможность самоисправления — ключ к стабильной работе.