Кому токенов не хватает можно бесплатно покодить) Я посмотрю отпишусь тоже как оно работает
Forwarded from XOR
Произошел ночной подгон от Маска: xAI тихонько выпустили Grok Code
Это гибридная модель с 37B активными параметрами, заточенная под программирование. Контекстное окно — 262K токенов. Модель раньше скрывалась под именем «sonic», и первые пользователи от в восторге от ее скорости и точности. Бенчей пока нет.
Зато модель уже доступна в Cursor и Opencode бесплатно до 2 сентября🤩
@xor_journal
Это гибридная модель с 37B активными параметрами, заточенная под программирование. Контекстное окно — 262K токенов. Модель раньше скрывалась под именем «sonic», и первые пользователи от в восторге от ее скорости и точности. Бенчей пока нет.
Зато модель уже доступна в Cursor и Opencode бесплатно до 2 сентября
@xor_journal
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4🔥1
Forwarded from Machinelearning
400 страниц про всё, что нужно знать об агентных системах. Автор — senior engineer в Google, выложил драфт для открытого ревью.
📖 В книге:
- продвинутые техники промптинга
- паттерны для мульти-агентов
- использование инструментов и MCP
- практические примеры с кодом
⚡ По сути, это полный справочник по построению умных агентов. Must-read для разработчиков AI.
@ai_machinelearning_big_data
#AI #Agents #Google #OpenSource #freebook
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
2👍6🔥4✍2
https://github.com/charmbracelet/crush
Новый терминальный агент, много кто из наших контрибутит. Реальный конкурент Claude code, но не поддерживает подписки
Новый терминальный агент, много кто из наших контрибутит. Реальный конкурент Claude code, но не поддерживает подписки
GitHub
GitHub - charmbracelet/crush: The glamourous AI coding agent for your favourite terminal 💘
The glamourous AI coding agent for your favourite terminal 💘 - charmbracelet/crush
https://www.youtube.com/watch?v=Yf_1w00qIKc
Вышло видео с создателем Claude Code Борисом Черным.
0:00 — Вступление и контекст
• Разговор Алекса Альберта (Anthropic) с Борисом Черным (создатель Claude Code) о том, что такое Claude Code, зачем он появился и как им пользоваться. Основной фокус — «агентное кодирование» в терминале как универсальной среде.
4:49 — Для кого и за что платим
• Кому особенно полезен инструмент: проф. разработчикам и командам с разными IDE/стеками.
• Стоимость и модель использования (в т.ч. в составе подписок Max) — ориентир для «серьёзной работы».
7:15 — Почему именно терминал
• Терминал выбран как «наименьший общий знаменатель» между Vim/VS Code/Zed и т.д.; так проще интегрироваться в любые пайплайны и быстрее эволюционировать продукт.
9:35 — Что умеет прямо сейчас
• Агент читает файлы, строит план, вносит набор согласованных правок, пишет тесты и т.д. Это не «автодополнение», а самостоятельная работа под присмотром.
• Переход от «пишем код» к «оркестрируем агента и ревьюим результаты».
12:23 — Claude 4 и сдвиг в качестве
• По сравнению с 3.7 Sonnet, линейка Claude 4 лучше «держит» инструкции и чаще попадает «с первого выстрела» (в т.ч. по тестам). Это расширяет набор задач, которые можно отдавать агенту.
12:23–15:16 — Интеграции: GitHub Actions и «фоновый программист»
• Установка GitHub Action из самого Claude Code; можно упоминать бота в issue/PR, чтобы он чинил, дописывал тесты и подготавливал PR «в фоне». Это меняет модель работы команды.
15:16 — Практические советы (best practices)
• Сначала «попросить составить план», затем — реализация.
• Давать фазу «прочитай файлы → подумай → кодируй» (extended thinking).
• Параллелить простые задачи (auto-accept), а сложные вести вручную в IDE-терминале.
17:33 — Claude.md и память
• Многоуровневые Claude.md: проектный/командный/личный/глобальный/вложенный — для стиля, правил, частых команд; есть «memory mode» для запоминания полезных паттернов.
Дальше — взгляд вперёд
• Глубже интегрироваться с инструментами (IDE, CI) и упростить «вызов агента» вне терминала (например, из чатов/таск-трекеров) — цель сделать доступ к «лёгким задачам» ещё проще.
Вышло видео с создателем Claude Code Борисом Черным.
0:00 — Вступление и контекст
• Разговор Алекса Альберта (Anthropic) с Борисом Черным (создатель Claude Code) о том, что такое Claude Code, зачем он появился и как им пользоваться. Основной фокус — «агентное кодирование» в терминале как универсальной среде.
4:49 — Для кого и за что платим
• Кому особенно полезен инструмент: проф. разработчикам и командам с разными IDE/стеками.
• Стоимость и модель использования (в т.ч. в составе подписок Max) — ориентир для «серьёзной работы».
7:15 — Почему именно терминал
• Терминал выбран как «наименьший общий знаменатель» между Vim/VS Code/Zed и т.д.; так проще интегрироваться в любые пайплайны и быстрее эволюционировать продукт.
9:35 — Что умеет прямо сейчас
• Агент читает файлы, строит план, вносит набор согласованных правок, пишет тесты и т.д. Это не «автодополнение», а самостоятельная работа под присмотром.
• Переход от «пишем код» к «оркестрируем агента и ревьюим результаты».
12:23 — Claude 4 и сдвиг в качестве
• По сравнению с 3.7 Sonnet, линейка Claude 4 лучше «держит» инструкции и чаще попадает «с первого выстрела» (в т.ч. по тестам). Это расширяет набор задач, которые можно отдавать агенту.
12:23–15:16 — Интеграции: GitHub Actions и «фоновый программист»
• Установка GitHub Action из самого Claude Code; можно упоминать бота в issue/PR, чтобы он чинил, дописывал тесты и подготавливал PR «в фоне». Это меняет модель работы команды.
15:16 — Практические советы (best practices)
• Сначала «попросить составить план», затем — реализация.
• Давать фазу «прочитай файлы → подумай → кодируй» (extended thinking).
• Параллелить простые задачи (auto-accept), а сложные вести вручную в IDE-терминале.
17:33 — Claude.md и память
• Многоуровневые Claude.md: проектный/командный/личный/глобальный/вложенный — для стиля, правил, частых команд; есть «memory mode» для запоминания полезных паттернов.
Дальше — взгляд вперёд
• Глубже интегрироваться с инструментами (IDE, CI) и упростить «вызов агента» вне терминала (например, из чатов/таск-трекеров) — цель сделать доступ к «лёгким задачам» ещё проще.
YouTube
A conversation on Claude Code
Anthropic’s Boris Cherny (Claude Code) and Alex Albert (Claude Relations) talk about Claude Code—how it started as Anthropic's own internal agentic coding tool, and practical tips for getting the most out of your experience.
Find out more: https://www.…
Find out more: https://www.…
👍4
🧑💻 Вопрос про лимиты и токены Anthropic
Меня тут спрашивали — как обойти лимиты у Anthropic? А я спрошу в ответ: зачем вообще?
Сейчас есть куча бесплатных топовых моделей от китайцев, доступных прямо в OpenRouter. Один минус — они будут обучаться на вашем коде (если это критично, просто не используйте).
✨ Примеры свежих State-of-the-Art моделей:
• DeepSeek 3.1
• Qwen Coder 480B (самая большая кодер-модель)
• Kimi K2 (последняя версия)
И все они доступны бесплатно через OpenRouter.
⚙️ Как подключить:
1. Регистрируетесь в OpenRouter.
2. Делаете API-ключ.
3. Подключаете его к Crush — терминальному агенту, про который я недавно рассказывал.
После этого можно использовать бесплатные модели прямо в терминале.
🚀 Скоро еще покажу несколько интересных китайских терминальных агентов.
Меня тут спрашивали — как обойти лимиты у Anthropic? А я спрошу в ответ: зачем вообще?
Сейчас есть куча бесплатных топовых моделей от китайцев, доступных прямо в OpenRouter. Один минус — они будут обучаться на вашем коде (если это критично, просто не используйте).
✨ Примеры свежих State-of-the-Art моделей:
• DeepSeek 3.1
• Qwen Coder 480B (самая большая кодер-модель)
• Kimi K2 (последняя версия)
И все они доступны бесплатно через OpenRouter.
⚙️ Как подключить:
1. Регистрируетесь в OpenRouter.
2. Делаете API-ключ.
3. Подключаете его к Crush — терминальному агенту, про который я недавно рассказывал.
После этого можно использовать бесплатные модели прямо в терминале.
🚀 Скоро еще покажу несколько интересных китайских терминальных агентов.
GitHub
GitHub - charmbracelet/crush: The glamourous AI coding agent for your favourite terminal 💘
The glamourous AI coding agent for your favourite terminal 💘 - charmbracelet/crush
1👍6❤2🔥2
Forwarded from эйай ньюз
Китайцы из Zhipu запустили подписку для Claude Code
В основе — собственная модель Zhipu, GLM 4.5. Работает исключительно с Claude Code, подписчикам выдаётся API ключ для эндпоинта совместимого с API Anthropic, который можно засунуть в агента от Антропик. Основной селлинг поинт — повышенные лимиты по сравнению с подпиской от Anthropic и меньше цена ($3 в месяц за Lite подписку и $15 за Pro). Вообще интересно наблюдать как, несмотря на закрытость Claude Code, всё больше провайдеров прилагают кучу усилий чтобы поддерживать именно его, а не что-то более открытое.
z.ai/subscribe
@ai_newz
В основе — собственная модель Zhipu, GLM 4.5. Работает исключительно с Claude Code, подписчикам выдаётся API ключ для эндпоинта совместимого с API Anthropic, который можно засунуть в агента от Антропик. Основной селлинг поинт — повышенные лимиты по сравнению с подпиской от Anthropic и меньше цена ($3 в месяц за Lite подписку и $15 за Pro). Вообще интересно наблюдать как, несмотря на закрытость Claude Code, всё больше провайдеров прилагают кучу усилий чтобы поддерживать именно его, а не что-то более открытое.
z.ai/subscribe
@ai_newz
❤4
Чуть не пропустил
https://developer.apple.com/documentation/xcode-release-notes/xcode-26-release-notes
Apple вслед за JetBrains активно докатывает большие coding LLM себе в интерфейс, что очень радует конечно. Но тут самое главное чтоб там был агент который умеет работать непосредственно с тулингом среды разработки, а не просто код писать. Код писать уже любая модель умеет…
https://developer.apple.com/documentation/xcode-release-notes/xcode-26-release-notes
Apple вслед за JetBrains активно докатывает большие coding LLM себе в интерфейс, что очень радует конечно. Но тут самое главное чтоб там был агент который умеет работать непосредственно с тулингом среды разработки, а не просто код писать. Код писать уже любая модель умеет…
👍2
💡 Vibe Coding: сначала план, потом код (или в сотый раз о самом важном)
Многие садятся вайб кодить — и тонут в хаосе. В Vibe Coding у нас всегда два этапа: Планируем → Кодируем. Это не бюрократия — это ускоритель.
⸻
1️⃣ План (обязательный артефакт)
• Сформулируй цель и границы.
• Собери доп. инфо: API/схемы/примеры/риски/ограничения.
• Определи DoD (критерии приёмки) и тест-кейс-скелет.
• Спланируй ветки и параллельные треки.
• Загрузите план в контекст ИИ (чтобы модель не «уходила в лес»).
Мини-шаблон (кидай в контекст перед кодом):
# План
Цель:
Объем/границы:
Входы/выходы:
API/контракты/схемы:
Ограничения/риски:
Артефакты на выходе:
DoD (критерии приёмки):
Тесты/метрики:
Ветки/параллельные треки:
План обзора (review):
⸻
2️⃣ Кодирование (строго по плану)
• Работаем в отдельных ветках: feature/..., fix/..., spike/....
• Для параллели используем git worktrees + Claude Code (удобно держать несколько сессий):
https://docs.claude.com/en/docs/claude-code/common-workflows#run-parallel-claude-code-sessions-with-git-worktrees
• Регулярный синк: фиксируем расхождения → обновляем план → только потом продолжаем код.
⸻
3️⃣ Обзор (review)
Сверяем результат с DoD и тестами. Не совпало? Сначала корректируем план, затем код. Так гасим галлюцинации ИИ, отвлечения и «забывание».
⸻
Почему это важно
✅ Меньше хаоса и бесконечных доработок.
✅ Быстрее поставка за счёт фокуса.
✅ Легче масштабировать команду и параллельные треки.
Анти-паттерн
«Сейчас накидаю, а там разберёмся» → путаница, хотфиксы, долгий хвост.
Чек-лист запуска
☑️ 15–30 мин на план → ☑️ загрузить в контекст → ☑️ ветки + worktrees → ☑️ регулярный синк → ☑️ review по DoD.
Многие садятся вайб кодить — и тонут в хаосе. В Vibe Coding у нас всегда два этапа: Планируем → Кодируем. Это не бюрократия — это ускоритель.
⸻
1️⃣ План (обязательный артефакт)
• Сформулируй цель и границы.
• Собери доп. инфо: API/схемы/примеры/риски/ограничения.
• Определи DoD (критерии приёмки) и тест-кейс-скелет.
• Спланируй ветки и параллельные треки.
• Загрузите план в контекст ИИ (чтобы модель не «уходила в лес»).
Мини-шаблон (кидай в контекст перед кодом):
# План
Цель:
Объем/границы:
Входы/выходы:
API/контракты/схемы:
Ограничения/риски:
Артефакты на выходе:
DoD (критерии приёмки):
Тесты/метрики:
Ветки/параллельные треки:
План обзора (review):
⸻
2️⃣ Кодирование (строго по плану)
• Работаем в отдельных ветках: feature/..., fix/..., spike/....
• Для параллели используем git worktrees + Claude Code (удобно держать несколько сессий):
https://docs.claude.com/en/docs/claude-code/common-workflows#run-parallel-claude-code-sessions-with-git-worktrees
• Регулярный синк: фиксируем расхождения → обновляем план → только потом продолжаем код.
⸻
3️⃣ Обзор (review)
Сверяем результат с DoD и тестами. Не совпало? Сначала корректируем план, затем код. Так гасим галлюцинации ИИ, отвлечения и «забывание».
⸻
Почему это важно
✅ Меньше хаоса и бесконечных доработок.
✅ Быстрее поставка за счёт фокуса.
✅ Легче масштабировать команду и параллельные треки.
Анти-паттерн
«Сейчас накидаю, а там разберёмся» → путаница, хотфиксы, долгий хвост.
Чек-лист запуска
☑️ 15–30 мин на план → ☑️ загрузить в контекст → ☑️ ветки + worktrees → ☑️ регулярный синк → ☑️ review по DoD.
Claude Code Docs
Common workflows - Claude Code Docs
Learn about common workflows with Claude Code.
1✍4👍3💯1
🚀 Anthropic выпустила Claude Sonnet 4.5 — новая SOTA в кодировании и автономных агентах
Сегодня Anthropic анонсировала Claude Sonnet 4.5 — крупный шаг вперёд в линейке Claude.
⚙️ Что заявлено нового и впечатляющего:
• Модель способна работать автономно до 30 часов подряд, выполняя сложные задачи — по сравнению с ~7 часами у предшественника Opus 4.
• Внутренние тесты включали полную разработку веб-приложения “с нуля” — включая логику, базы данных и весь стек.
• Значительный рост “умения использовать компьютер / инструменты” (operating system benchmark): ~60 % против ~40 % у предыдущих версий.
• Улучшенные навыки в финанcах, научных задачах, безопасности, многошаговых рассуждениях.
• Sonnet 4.5 уже доступна в публичной превью для GitHub Copilot — пользователи Pro, Business и Enterprise смогут её выбрать.
• Стоимость API остаётся прежней: $3 за миллион входных токенов и $15 за миллион выходных токенов.
• Anthropic утверждает, что Sonnet 4.5 — их наиболее “aligned” (согласованная) модель по сей день — с меньшей склонностью к отклонениям, манипуляциям и “внедрению” побочных намерений.
🧭 Почему это важный релиз (и чем интересен для сообщества):
• Это шаг к ИИ-агентам нового поколения, способным автономно работать над длительными проектами без постоянного вмешательства.
• Значительное повышение надёжности: не просто “быстро отвечает”, а “утрясает логику, связывает инструменты, завершает продукт”.
• Конкуренция на рынке LLM усиливается: Anthropic показывает, что может не просто догонять, но и задавать темп.
• Переход из “демо-фич” к реальным системам, которые можно внедрить в производство и закрыть требования к надёжности.
⸻
📌 Критически важно: пока что мы видим заявленные показатели и внутренние тесты; реальные кейсы внедрения и стабильность в продакшене покажут, насколько они соответствуют амбициям.
Го тестить!
Ну и скоро мой обзор glm-4.5 от z.ai
Сегодня Anthropic анонсировала Claude Sonnet 4.5 — крупный шаг вперёд в линейке Claude.
⚙️ Что заявлено нового и впечатляющего:
• Модель способна работать автономно до 30 часов подряд, выполняя сложные задачи — по сравнению с ~7 часами у предшественника Opus 4.
• Внутренние тесты включали полную разработку веб-приложения “с нуля” — включая логику, базы данных и весь стек.
• Значительный рост “умения использовать компьютер / инструменты” (operating system benchmark): ~60 % против ~40 % у предыдущих версий.
• Улучшенные навыки в финанcах, научных задачах, безопасности, многошаговых рассуждениях.
• Sonnet 4.5 уже доступна в публичной превью для GitHub Copilot — пользователи Pro, Business и Enterprise смогут её выбрать.
• Стоимость API остаётся прежней: $3 за миллион входных токенов и $15 за миллион выходных токенов.
• Anthropic утверждает, что Sonnet 4.5 — их наиболее “aligned” (согласованная) модель по сей день — с меньшей склонностью к отклонениям, манипуляциям и “внедрению” побочных намерений.
🧭 Почему это важный релиз (и чем интересен для сообщества):
• Это шаг к ИИ-агентам нового поколения, способным автономно работать над длительными проектами без постоянного вмешательства.
• Значительное повышение надёжности: не просто “быстро отвечает”, а “утрясает логику, связывает инструменты, завершает продукт”.
• Конкуренция на рынке LLM усиливается: Anthropic показывает, что может не просто догонять, но и задавать темп.
• Переход из “демо-фич” к реальным системам, которые можно внедрить в производство и закрыть требования к надёжности.
⸻
📌 Критически важно: пока что мы видим заявленные показатели и внутренние тесты; реальные кейсы внедрения и стабильность в продакшене покажут, насколько они соответствуют амбициям.
Го тестить!
Ну и скоро мой обзор glm-4.5 от z.ai
🔥3❤1👍1
Forwarded from Data, Stories and Languages
Claude Code 2.0
Но что ещё интереснее, anthropic опубликовали claude code 2.0!
https://www.npmjs.com/package/@anthropic-ai/claude-code
Из интересных изменений:
• Нативное приложение для VS Code
• команда /rewind для отката изменений
• команда /usage для просмотра лимитов твоего плана
• Ctrl + R для поиска по истории
• Tab для включения думающего режима
Остальные изменения тут: https://github.com/anthropics/claude-code/blob/main/CHANGELOG.md#200
Но что ещё интереснее, anthropic опубликовали claude code 2.0!
https://www.npmjs.com/package/@anthropic-ai/claude-code
Из интересных изменений:
• Нативное приложение для VS Code
• команда /rewind для отката изменений
• команда /usage для просмотра лимитов твоего плана
• Ctrl + R для поиска по истории
• Tab для включения думающего режима
Остальные изменения тут: https://github.com/anthropics/claude-code/blob/main/CHANGELOG.md#200
GitHub
claude-code/CHANGELOG.md at main · anthropics/claude-code
Claude Code is an agentic coding tool that lives in your terminal, understands your codebase, and helps you code faster by executing routine tasks, explaining complex code, and handling git workflo...
❤4👍1
https://youtu.be/dGiqrsv530Y?si=Od3w7JWk1IgFqiwU
Посмотрите этот демо ролик обязательно. Genie это были цветочки
Посмотрите этот демо ролик обязательно. Genie это были цветочки
YouTube
An experimental new way to design software
We’ve been experimenting with a new way to generate software. In this research preview, Claude builds whatever you can imagine, on the fly, without writing any code first. What you see is Claude creating software in real time, responding and adapting to your…
🚀 Новая эра агент-приложений: Claude Agent SDK от Anthropic
Anthropic недавно переименовали Claude Code SDK в Claude Agent SDK и расширили его возможности — теперь это не просто инструмент для помощи в коде, а полноценная платформа для построения автономных агентов.
🔍 Что это даёт
• Агент получает «компьютер» — доступ к файловой системе, запуск bash-команд, чтение/запись файлов и прочее. Это позволяет выполнять задачи вне рамок чистого текста.
• Используя этот подход, агент можно натренировать на:
• Финансовые агенты (анализ портфелей, прогнозы)
• Персональных ассистентов (календарь, travel, планирование)
• Службы поддержки (обработка запросов, эскалации)
• Глубокие агенты-исследователи (поиск по документам, сводка, анализ)
🔁 Архитектура: цикл агента
Типичный цикл работы агента в Claude Agent SDK:
1. Gather context — сбор контекста (файлы, логи, предыдущие сообщения)
2. Take action — применение инструментов, запуск кода, обращения к API
3. Verify work — проверка результатов, исправление ошибок, итерации
Ключевые детали:
• Инструменты (Tools): надо явно выделять основные действия, которые агент может предпринимать (например, fetchInbox, searchEmails)
• Subagents: агент может запускать субагентов, чтобы параллельно решать подзадачи и потом свернуть результаты назад
• Суммаризация контекста (compaction): при росте объёма контекста автоматически сводятся или резюмируются старые данные, чтобы не выйти за пределы контекстного окна
• Верификация: через правила (линтинг кода, валидацию), визуальные проверки (скриншоты), либо «судейство» другим LLM
🧪 Как начать
• Claude Agent SDK уже доступен — можно начать экспериментировать прямо сейчас.
• Для тех, кто уже работает с SDK, Anthropic публикуют гайд по миграции на новую версию.
• Важно: проектируйте агента вокруг цикла и методов верификации, потому что надёжность и возможность самоисправления — ключ к стабильной работе.
Anthropic недавно переименовали Claude Code SDK в Claude Agent SDK и расширили его возможности — теперь это не просто инструмент для помощи в коде, а полноценная платформа для построения автономных агентов.
🔍 Что это даёт
• Агент получает «компьютер» — доступ к файловой системе, запуск bash-команд, чтение/запись файлов и прочее. Это позволяет выполнять задачи вне рамок чистого текста.
• Используя этот подход, агент можно натренировать на:
• Финансовые агенты (анализ портфелей, прогнозы)
• Персональных ассистентов (календарь, travel, планирование)
• Службы поддержки (обработка запросов, эскалации)
• Глубокие агенты-исследователи (поиск по документам, сводка, анализ)
🔁 Архитектура: цикл агента
Типичный цикл работы агента в Claude Agent SDK:
1. Gather context — сбор контекста (файлы, логи, предыдущие сообщения)
2. Take action — применение инструментов, запуск кода, обращения к API
3. Verify work — проверка результатов, исправление ошибок, итерации
Ключевые детали:
• Инструменты (Tools): надо явно выделять основные действия, которые агент может предпринимать (например, fetchInbox, searchEmails)
• Subagents: агент может запускать субагентов, чтобы параллельно решать подзадачи и потом свернуть результаты назад
• Суммаризация контекста (compaction): при росте объёма контекста автоматически сводятся или резюмируются старые данные, чтобы не выйти за пределы контекстного окна
• Верификация: через правила (линтинг кода, валидацию), визуальные проверки (скриншоты), либо «судейство» другим LLM
🧪 Как начать
• Claude Agent SDK уже доступен — можно начать экспериментировать прямо сейчас.
• Для тех, кто уже работает с SDK, Anthropic публикуют гайд по миграции на новую версию.
• Важно: проектируйте агента вокруг цикла и методов верификации, потому что надёжность и возможность самоисправления — ключ к стабильной работе.
Forwarded from Dealer.AI
Мода на файловую память, теперь и код-агенты anthropic.
Вышло agentic SDK от антропика и там нашлось несколько интересных вещей про контекст и память.
Это уже практичное и модное решение, которое в разной форме мы наблюдали у manus и memagent.
Основные позиции – не засоряем контекст и кладем все в файловую систему ОС. Также для поиска НЕ используем без нужды семантику или даже bm25, оставаясь на grep/tail и прочих способах поиска встроенными инструментами вашей ОС. Да это не исключает проблемы больших файлов, где grep может быть не эффективен, но скорее всего, подобно идее с чанкованием, для памяти создается иерархическая память на "малых" файлах.
В итоге, центре всего стоит тезис: зачем нам семантика, когда можно взять поиск в ОС и агента для чтения и записи? Но, думаю, без семантики не обойтись, особенно, когда у нас много зависит от контекста, да еще и синонимов до кучи. Однако, быстренько найти нужный нейм файла, пойдет, а если не вышло (пустой поиск), уже можно полнотекстом и семантикой искать имя, тем самым балансировать между скоростью и надежностью/сложностью поиска.Особенно для файлов сотни мб или гб. Тут кстати и может помочь аналог чанкования, в виде иерархии файлов, на которые заранее бьём большие. Далее, берем файлик и читаем агентом, переносим из файла релевантное в контекст.
В любом случае, такое решение в итоге завязывает вас на эффективный контекст и конечно свойство роутинга, ризонинга и поиска по контексту. Крч хорошая llm вам нужна, которая у антропика есть. Но есть ли она у вас?)
Вышло agentic SDK от антропика и там нашлось несколько интересных вещей про контекст и память.
Это уже практичное и модное решение, которое в разной форме мы наблюдали у manus и memagent.
Основные позиции – не засоряем контекст и кладем все в файловую систему ОС. Также для поиска НЕ используем без нужды семантику или даже bm25, оставаясь на grep/tail и прочих способах поиска встроенными инструментами вашей ОС. Да это не исключает проблемы больших файлов, где grep может быть не эффективен, но скорее всего, подобно идее с чанкованием, для памяти создается иерархическая память на "малых" файлах.
В итоге, центре всего стоит тезис: зачем нам семантика, когда можно взять поиск в ОС и агента для чтения и записи? Но, думаю, без семантики не обойтись, особенно, когда у нас много зависит от контекста, да еще и синонимов до кучи. Однако, быстренько найти нужный нейм файла, пойдет, а если не вышло (пустой поиск), уже можно полнотекстом и семантикой искать имя, тем самым балансировать между скоростью и надежностью/сложностью поиска.
В любом случае, такое решение в итоге завязывает вас на эффективный контекст и конечно свойство роутинга, ризонинга и поиска по контексту. Крч хорошая llm вам нужна, которая у антропика есть. Но есть ли она у вас?)
Не успел я написать обзор glm-4.5 как вдруг:
⸻
🚀 Z.ai (Zhipu AI) выпустили GLM-4.6
Что нового:
• 📏 Контекст до 200K, вывод до 128K — влезают длинные ТЗ, логи и треки агентов.
• 💻 Кодинг: ощутимый рост в реальных задачах; по их CC-Bench — рядом с Claude Sonnet 4 и ~15% меньше токенов, чем у 4.5.
• 🧠 Рассуждения, tool-use, поиск и агенты — стабильнее и «умнее» в фреймворках.
• 🪪 Открытые веса (MIT) на Hugging Face → можно катать локально (vLLM/SGLang).
• 🔌 Где пощупать: Z.ai (чат/API) и OpenRouter ($0.60/M in, $2/M out); для IDE — GLM Coding Plan от $3/мес.
Кому зайдёт: разработчикам и тимлидам, кто строит агентные пайплайны и держит большие контексты в проде.
⸻
🚀 Z.ai (Zhipu AI) выпустили GLM-4.6
Что нового:
• 📏 Контекст до 200K, вывод до 128K — влезают длинные ТЗ, логи и треки агентов.
• 💻 Кодинг: ощутимый рост в реальных задачах; по их CC-Bench — рядом с Claude Sonnet 4 и ~15% меньше токенов, чем у 4.5.
• 🧠 Рассуждения, tool-use, поиск и агенты — стабильнее и «умнее» в фреймворках.
• 🪪 Открытые веса (MIT) на Hugging Face → можно катать локально (vLLM/SGLang).
• 🔌 Где пощупать: Z.ai (чат/API) и OpenRouter ($0.60/M in, $2/M out); для IDE — GLM Coding Plan от $3/мес.
Кому зайдёт: разработчикам и тимлидам, кто строит агентные пайплайны и держит большие контексты в проде.
1🔥3👍2✍1
По многочисленным просьбам!
🔑 Z.AI (GLM) — как зарегистрироваться по моей рефке, оплатить и получить API-ключ
Моя реф-ссылка:
https://z.ai/subscribe?ic=HRSUIKMMVP
Зачем это нужно?
API-ключ позволит использовать GLM (например, через zclaude для Claude Code) и другие интеграции.
Шаги:
1. Перейди по ссылке и создай аккаунт
Открой реф-страницу и зарегистрируйся/войдИ. После логина попадёшь в зону подписок.
2. Выбери тариф и оформи подписку
На странице подписки выбери план (напр. GLM Coding Lite или GLM Coding Pro) и следуй шагам оплаты. Эти планы заточены под кодинг-агентов и Claude Code.
3. Привяжи способ оплаты
В аккаунте открой раздел API Management → Payment Method и добавь карту (если не предложили в мастере подписки).
4. Создай API-ключ
Перейди в API Management → API Keys и нажми Create Key. Скопируй ключ и сохрани его в безопасном месте.
5. (Опционально) Подключение к Claude Code / zclaude
Для работы через Anthropic-совместимый эндпоинт Z.AI укажи базовый URL и ключ (см. мой ланчер zclaude). Базовый эндпоинт для Claude Code:
https://api.z.ai/api/anthropic
🔑 Z.AI (GLM) — как зарегистрироваться по моей рефке, оплатить и получить API-ключ
Моя реф-ссылка:
https://z.ai/subscribe?ic=HRSUIKMMVP
Зачем это нужно?
API-ключ позволит использовать GLM (например, через zclaude для Claude Code) и другие интеграции.
Шаги:
1. Перейди по ссылке и создай аккаунт
Открой реф-страницу и зарегистрируйся/войдИ. После логина попадёшь в зону подписок.
2. Выбери тариф и оформи подписку
На странице подписки выбери план (напр. GLM Coding Lite или GLM Coding Pro) и следуй шагам оплаты. Эти планы заточены под кодинг-агентов и Claude Code.
3. Привяжи способ оплаты
В аккаунте открой раздел API Management → Payment Method и добавь карту (если не предложили в мастере подписки).
4. Создай API-ключ
Перейди в API Management → API Keys и нажми Create Key. Скопируй ключ и сохрани его в безопасном месте.
5. (Опционально) Подключение к Claude Code / zclaude
Для работы через Anthropic-совместимый эндпоинт Z.AI укажи базовый URL и ключ (см. мой ланчер zclaude). Базовый эндпоинт для Claude Code:
https://api.z.ai/api/anthropic
z.ai
GLM Coding Plan powered by GLM-4.6
AI-powered coding with GLM-4.6 in Claude Code, Cline, OpenCode, and more. Plans start at $3/month to help you code faster, smarter, and more reliably.