Tool Building Ape × Gleb Kalinin – Telegram
Tool Building Ape × Gleb Kalinin
1.98K subscribers
231 photos
18 videos
3 files
142 links
@glebkalinin пишет о технологиях, ИИ и жизни в будущем. @Experimentally @mentalhealthtech

Without philosophical examination, builders inherit their answers from the defaults of their environment.
Download Telegram
Claude Skills — для меня один из самых важных апдейтов Антропиков после Claude Code.

MCP — популярный протокол. Но работает не очень хорошо. Самый важный и моментально заметный минус MCP — он может вернуть сколько угодно контента, который по умолчанию попадёт в контекстное окно LLM.

Один только список инструментов и их описание, возвращаемое MCP, может занимать несколько тысяч токенов.

А значит вы быстро столкнётесь либо с его переполнением контекстного окна, либо просто с деградацией перфоманса LLM (context rot).

К примеру, я запускаю всего один поиск по своему Обсидиану через MCP, MCP ищет не самым эффективным способом, вываливает в ответ полный контент десятка транскриптов, и всё, контекстное окно заполнено, десктопный Клод предлагает заводить новый чат.

Agent Skills предоставляет важное расширение и дополнение MCP.

Каждый Skill — это набор инструкций, готового кода и артефактов (например, шаблонов, графики).

Собрал и опубликовал свой первый навык для Claude Code — Deep Research через API OpenAI.

https://github.com/glebis/claude-skills/tree/main/deep-research

Этот навык делает запрос к модели o4-mini-deep-research. Нужен ключ и, увы, OpenAI требует верификацию организации — то есть нужно показать им документ, чтобы пользоваться этой моделью через АПИ.

Чтобы навык заработал с декстопным Клодом, нужно в настройках Capabilities добавить домен api.openai.com

Пример использования навыка на картинке:

запустил навык deep research, в качестве входных данных дал со своими фокусами из Obsidian, на выходе получил markdown файл с рекомендациями.

В одной команде можно использовать сразу несколько навыков, результаты одного навыка можно передать другому — например, сконвертировать в пдф, или превратить в презентацию, или опубликовать в вебе, или закинуть в Notion.
🔥6👌1🙈1
Cursor выпустили апдейт, который показывали на OpenAI Dev Day.

Новый агентский интерфейс сфокусирован не на коде, а на управлении множеством агентов — агент-ориентированный рабочий процесс.

Главная часть обновления — выпустили свою быструю модель Composer. Composer, позиционируемый как передовая модель, работает в четыре раза быстрее аналогичных по эффективности моделей и оптимизирован для низкой задержки и внесения правок во множество файлов.

Курсор теперь поддерживает рабочие деревья Git — можно запускать до восьми агентов или моделей параллельно в изолированных средах, так, чтобы агенты не мешали друг другу. Можно запросить несколько вариантов реализации задачи и выбрать лучшее решения.

В Cursor теперь встроен браузер (Chrome), позволяющий агентам самостоятельно тестировать, просматривать и исправлять ошибки в коде. По результатам моего небольшого тестирования, для разных задач на фронтэнде Cursor использует и Playwright.

Покодить с новой моделью можно и бесплатно — мне хватило токенов на час размеренного улучшения сложного фронта с управлением браузером.

Свою быструю модель выпустили и Windsurf — они запартнёрились с Cerebras и обещают до 950 токенов в секунду. SWE-1.5 — не просто кодинг-модель, а часть интегрированной системы (модель—инференс—агент).

Утверждают, что инженеры Cognition (компания-разработик Devin, купившая Windsurf) используют SWE-1.5 ежедневно: чтобы разбираться с большими кодовыми базами, редактирования конфигураций и разработки full stack приложений.
👍2🔥2
Agent Skills (агентские навыки) появились всего 3 недели назад, но уже меняют, как мы взаимодействуем с агентами. Саймон Виллисон в своём посте написал, что Skills — возможно, более важное обновление, чем MCP.

Навыки — это просто набор из промтов, исполняемого кода и других файлов (например, шаблонов, графики, шрифтов). Работает как в Claude Code, так и с десктопным Клодом (но с существенными ограничениями по доступу к сети).

Поскольку в навыках нет почти ничего специфичного для Клода, умельцы уже нашли способы запускать их в Codex-cli, кодинг-агенте OpenAI, входящим в любую платную подписку. Для этого нужно просто добавить небольшой скрипт, который перечисляет доступные скрипты и делает и доступными Кодексу.

Про skills можно думать, как про реальные человеческие навыки. Навык — «умение выполнять целенаправленные действия, доведённые до автоматизма в результате сознательного многократного повторения одних и тех же действий или решения типовых задач» (gramota). Чтобы что-либо автоматизировать при помощи skills, нужно описание процесса в духе standard operating procedure.

Как начать пользоваться Skills?

Для меня самым эффективным способом было установить несколько готовых навыков из официального репозитория Anthropic. Можно скачать их c гитхаба и установить все вместе, а можно попросить claude code добавлять их поштучно — достаточно скинуть ссылку на репозиторий навыков и перечислить только нужные.

Поэкспериментировав с готовыми навыками, можно создать свой собственный, запустив навык skill-creator — он поможет и написать промты, и создать нужный для работы навыка код.

Что я уже завернул в навыки:

→ часть операций по работе со своей базой в Obsidian: перелинковка заметок, выгрузка событий из календаря, копирование и перелинковка транскриптов из Fathom

→ работу с контентом: загрузку видео на Ютуб, генерацию транскриптов через whisper на groq, создание описаний и категорий и генерацию обложек

→ обернул в навык llm-cli, позволяющую через единый интерфейс пользоваться любыми llm (взять можно у меня на гитхабе) — теперь Claude code может для обработки текстов и мультимедийного контента использовать Groq или любую модель через OpenRouter.

Теперь в одном предложении внутри Клод кода я могу выполнять сложные операции, например: «Загрузи последнее видео в папке downloads, переведи описание на английский с помощью навыка llm groq и добавь в отдельную заметку в Obsidian. Добавь ссылку на неё в daily note в Obsidian.»

Pro tip: запускать навыки можно из командной строки в неинтерактивном режиме. Например, чтобы запустить синхронизацию календаря, я выполняю команду claude -p "Sync calendar"

———

В ноябре провожу лабораторию по Claude code для неразработчиков, конечно же, будем много экспериментировать со skills.

#agentskills@toolusing #claude@toolusing #claudecode@toolusing
👍138🔥2
В это воскресенье в 13:00 CET зову на первое онлайн-событие своего обновленного коммьюнити AGENCY.

Аудиовизуальный семинар проведёт Егор Крафт, междисциплинарный художник и исследователь, работающий в области искусства, теории, философии и исследований современного технологического проекта.

Насыщенный аудиовизуальными материалами кейноут-семинар об исследуемых автором темах искусственной памяти, эстетики автоматизации, синтетического производства и потребления знаний, новой сетевой когнитивной инфраструктуры, дихотомии между синтетическим или «естественным», реальным или виртуальным, институциональным или облачным и других стремительно размывающихся понятий в условиях технологической обусловленности.

Егор крут, редко публично выступает по-русски, приходите. И с нейросетями Егор начал работать гораздо раньше, чем это стало мейнстримом.

Зарегистрироваться (free)
https://luma.com/4rfyfyjh
🔥53👏1
This media is not supported in your browser
VIEW IN TELEGRAM
Из моих лабораторий по Obsidian и Claude Code (следующая — в январе) у меня рождаются проекты, большие и малые.

В начале последней лаборатории я решил, что сделаю себе наконец ассистента, который будет мощный, как Claude Code, и сможет хорошо работать с моим немалым контектом. Оказалось, что Claude Code — отличный RAG, Claude Code SDK позволяет строить приложения вокруг топовых агентных возможностей Claude Code.

В результате я строю полу-локальную агентную архитектуру для работы продукта, одно из взаимодействий с которым (по-английски) вы можете посмотреть на видео.

Я просто болтаю с быстрой и лёгкой моделью, а она иногда вызывает инструменты, внутри которых может быть простой поиск по файлам или базе данных, а может быть запуск дип-рисёрча, деплой или запуск рассылки.

Я постепенно подключаю в свою системы основные свои персональные данные — уже собираю базу из данных Apple Health, истори базы в Хроме, все фотографии из iCloud. У агента есть бот в телеграме, который умеет слать сообщения и сохранять контент, я могу созваниваться и на естественном языке запускать Agent Skills и выполнять любые операции с файлами, включая работу над исходным кодом интерфейса, через который я работаю с системой.

Читать научную фантастику в детстве было полезно — легче заметить, что я в ней уже живу.

И, к счастью, не только в антиутопичной части, а в той, где ты можешь построить под себя свой полезный и человечный ИИ, который станет настоящим партнером, даже кофаундером, а через пару-тройку лет всё это вполне сможет даже локально.
🔥19👍10😱4