По сегодняшнему воркшопу.
Отлично посидели, спасибо подключившимся за вопросы и Родиону за приглашение! :)
Однако 😰
🤚 Alexand, отзовитесь! :)
Слайды - в картинках этого поста и отдельно в виде Excalidraw файла - в комменте к этому посту.
Ответы на некоторые вопросы, на которые не успели ответить на звонке, тоже в комменте к этому посту.
Ссылки, которые были упомянуты на звонке:
● CodeAlive - тот самый context-(engine)-as-a-service, о котором говорили в рамках темы предоставления контекста агентам
● Augment Code, Qoder - пара IDE с неплохим встроенным context engine
● Context Arena - бенчмарки качества удержания контекста моделями, там и OpenAI MRCR с иголками, и ссылка на Fiction.LiveBench
● VibeKanban - удобный визуальный дэшборд для запуска разных CLI агентов локально
● имплементации Spec Driven Development (это прям отдельная большая тема):
* Spec Kit от GitHub
* BMAD-METHOD
Файлы агентов, как мы и говорили, действительно в отрыве от проекта имеет мало смысла шарить - давайте я лучше на днях отдельный пост напишу, который объясняет workflow именно в этом проекте, и к нему файлы агентов и команд приаттачу, чтобы контекст был понятен (см, кстати, слайд Sample Workflow - вот про него и будет речь).
#stream #workshop #agents
Отлично посидели, спасибо подключившимся за вопросы и Родиону за приглашение! :)
Однако 😰
С записью случился конфуз. Оказалось, что она была запущена только для Ноуттейкера (Fireflies.ai) некоего Alexand (guest). Поэтому объявляем его в розыск. Если вы знаете кто это или это вы - напишите мне плиз.
Оказалось, что мы вайбкодеры уже совсем Зумом разучились пользоваться.
Если не найдем Alexand, то повторим встречу, уж очень она хорошая получилась.
🤚 Alexand, отзовитесь! :)
Слайды - в картинках этого поста и отдельно в виде Excalidraw файла - в комменте к этому посту.
Ответы на некоторые вопросы, на которые не успели ответить на звонке, тоже в комменте к этому посту.
Ссылки, которые были упомянуты на звонке:
● CodeAlive - тот самый context-(engine)-as-a-service, о котором говорили в рамках темы предоставления контекста агентам
● Augment Code, Qoder - пара IDE с неплохим встроенным context engine
● Context Arena - бенчмарки качества удержания контекста моделями, там и OpenAI MRCR с иголками, и ссылка на Fiction.LiveBench
● VibeKanban - удобный визуальный дэшборд для запуска разных CLI агентов локально
● имплементации Spec Driven Development (это прям отдельная большая тема):
* Spec Kit от GitHub
* BMAD-METHOD
Файлы агентов, как мы и говорили, действительно в отрыве от проекта имеет мало смысла шарить - давайте я лучше на днях отдельный пост напишу, который объясняет workflow именно в этом проекте, и к нему файлы агентов и команд приаттачу, чтобы контекст был понятен (см, кстати, слайд Sample Workflow - вот про него и будет речь).
#stream #workshop #agents
7🔥37❤9👍6👏2
Так, дубль два - будет!
В следующую субботу, 27го сентября, в 17:00 по МСК повторим воркшоп по Claude Code с учётом фидбека, и теперь точно с записью (записями, чтобы уж надёжно :))
В программе:
● Анатомия кодингового агента
● Контекст и внимание
● Цикл работы агента
● Возможности Claude Code (команды, субагенты, модели, режимы работы, контекст)
● Codex и его сравнение с Claude Code
Ссылка на встречу: https://calendar.app.google/gtcTeQAeUxiVmtF5A
Хостом будет Родион с канала AI-Driven Development, спасибо ему за мотивацию :)
#workshop #agents #второй_блин
В следующую субботу, 27го сентября, в 17:00 по МСК повторим воркшоп по Claude Code с учётом фидбека, и теперь точно с записью (записями, чтобы уж надёжно :))
В программе:
● Анатомия кодингового агента
● Контекст и внимание
● Цикл работы агента
● Возможности Claude Code (команды, субагенты, модели, режимы работы, контекст)
● Codex и его сравнение с Claude Code
Ссылка на встречу: https://calendar.app.google/gtcTeQAeUxiVmtF5A
Хостом будет Родион с канала AI-Driven Development, спасибо ему за мотивацию :)
#workshop #agents #второй_блин
1👍28🔥16🎉6❤4
Смотрю, некоторые путаются в том, что такое Codex.
Но тут всё на самом деле очень просто:
● Codex CLI - это консольный агент для кодинга
● Codex cloud (но иногда - Codex web) - это то, что доступно на сайте ChatGPT. Является веб-приложением вокруг облачного фонового агента
● Codex IDE extension - ну тут понятно, расширение VSCode (которое, кстати, построено вокруг Codex CLI)
● GPT‑5‑Codex - модель для... Codex, тюн GPT-5 под задачи кодинга
—
● codex‑1 - модель, которая работала где вы думаете? В Codex! В сloud - в том, который ещё web.
Это был тюн o3 для кодинга, недавно её заменили на GPT-5-Codex (но это не точно)
● codex-mini-latest - модель, тюн o4-mini, которая была создана для самого первого Codex CLI в далёком апреле 2025го
● OpenAI Codex - модель, использовавшаяся для GitHub Copilot в 2021-2023гг
● А, ну и по мелочи - существовали "старые" Codex CLI и Codex IDE extension, которые к выходу GPT-5 были заменены новыми реализациями с потерей обратной совместимости и переводом на Rust вместо TypeScript, и некоторое время сосуществовали с "новыми"
Видите, всё максимально понятно.
Ждём больше Codex'ов!
(фото из секретных архивов OpenAI с тем самым человеком, который каждый следующий продукт предлагает назвать Codex)
#sarcastaball
Но тут всё на самом деле очень просто:
● Codex CLI - это консольный агент для кодинга
● Codex cloud (но иногда - Codex web) - это то, что доступно на сайте ChatGPT. Является веб-приложением вокруг облачного фонового агента
● Codex IDE extension - ну тут понятно, расширение VSCode (которое, кстати, построено вокруг Codex CLI)
● GPT‑5‑Codex - модель для... Codex, тюн GPT-5 под задачи кодинга
—
● codex‑1 - модель, которая работала где вы думаете? В Codex! В сloud - в том, который ещё web.
Это был тюн o3 для кодинга, недавно её заменили на GPT-5-Codex (но это не точно)
● codex-mini-latest - модель, тюн o4-mini, которая была создана для самого первого Codex CLI в далёком апреле 2025го
● OpenAI Codex - модель, использовавшаяся для GitHub Copilot в 2021-2023гг
● А, ну и по мелочи - существовали "старые" Codex CLI и Codex IDE extension, которые к выходу GPT-5 были заменены новыми реализациями с потерей обратной совместимости и переводом на Rust вместо TypeScript, и некоторое время сосуществовали с "новыми"
Видите, всё максимально понятно.
Ждём больше Codex'ов!
(фото из секретных архивов OpenAI с тем самым человеком, который каждый следующий продукт предлагает назвать Codex)
#sarcastaball
😁29🔥14👍7❤1🥴1
Forwarded from Уставший техдир
Как ИИ меняет требования к навыкам разработчика
Большие языковые модели и кодовые агенты автоматизируют рутину, меняя то, как мы разрабатываем. Традиционные навыки становятся базовым ожиданием, а не тем, за что нанимают инженеров
Взамен, фокус смещается на высокоуровневые задачи, где нужен человеческий интеллект:
- Выработка стратегического видения и понимание бизнес-целей
- Проектирование и планирование поступательного развития системы
- Следование избранному дизайну и архитектуре и ее своевременная адаптация
- Управление сложностью и качеством системы
Другими словами, все разработчики теперь должны быть немножко (а в скоре и множко) техлидами
Только что посмотрел подкаст с Кент Беком (старый дед, который программирует 52 года, отец Agile-манифеста, Экстремального Программирование и Test Driven Development)
Спасибо Максу, автору канала Этихлид, за кайфовый подгон в комментариях)
П.С. С удовольствием посмотрел, чего и вам советую. Очень полезно послушать любому уровня миддл+ и выше
Большие языковые модели и кодовые агенты автоматизируют рутину, меняя то, как мы разрабатываем. Традиционные навыки становятся базовым ожиданием, а не тем, за что нанимают инженеров
Взамен, фокус смещается на высокоуровневые задачи, где нужен человеческий интеллект:
- Выработка стратегического видения и понимание бизнес-целей
- Проектирование и планирование поступательного развития системы
- Следование избранному дизайну и архитектуре и ее своевременная адаптация
- Управление сложностью и качеством системы
Другими словами, все разработчики теперь должны быть немножко (а в скоре и множко) техлидами
Только что посмотрел подкаст с Кент Беком (старый дед, который программирует 52 года, отец Agile-манифеста, Экстремального Программирование и Test Driven Development)
Спасибо Максу, автору канала Этихлид, за кайфовый подгон в комментариях)
П.С. С удовольствием посмотрел, чего и вам советую. Очень полезно послушать любому уровня миддл+ и выше
YouTube
TDD, AI agents and coding with Kent Beck
• Kent Beck is one of the most influential figures in modern software development. Creator of Extreme Programming (XP), co-author of The Agile Manifesto, and a pioneer of Test-Driven Development (TDD), he’s shaped how teams write, test, and think about code.…
3👍11🫡10❤6🔥3
Этихлид
Так, дубль два - будет! В следующую субботу, 27го сентября, в 17:00 по МСК повторим воркшоп по Claude Code с учётом фидбека, и теперь точно с записью (записями, чтобы уж надёжно :)) В программе: ● Анатомия кодингового агента ● Контекст и внимание ● Цикл…
50-минутная готовность ⏰
Ссылка на встречу тут: https://calendar.app.google/gtcTeQAeUxiVmtF5A
Запись будет :)
#workshop #agents
Ссылка на встречу тут: https://calendar.app.google/gtcTeQAeUxiVmtF5A
Запись будет :)
#workshop #agents
21🔥14👍8⚡7👌3
Media is too big
VIEW IN TELEGRAM
Общие принципы работы кодовых агентов и Claude Code / Codex
Ура, воркшоп состоялся, и в этот раз у нас есть-таки запись :)
Спасибо Родиону за приглашение и всем тем, кто пришёл и задавал вопросы!
Затронутые темы:
00:01:08 - Что такое кодовый агент?
00:05:02 - Почему популярны консольные (CLI) агенты?
00:12:01 - Анатомия кодового агента
00:18:46 - Context Engines
00:20:59 - CodeAlive: context-as-a-service
00:35:44 - Цикл работы агента (Agent Loop)
00:38:53 - Погружение в работу контекста
00:48:16 - Техники управления контекстом
01:06:54 - Субагенты: ключевая особенность Claude Code
01:29:17 - Кастомные субагенты
01:37:45 - Сравнение Claude Code и Codex
01:56:07 - Codex Cloud и фоновые агенты
02:01:31 - Будущее AI-разработки и решение проблемы сложности
Ссылки, которые были упомянуты на звонке:
● Канал Родиона, AI-Driven Development
● CodeAlive - тот самый context-(engine)-as-a-service, о котором говорили в рамках темы предоставления контекста агентам
● Context Arena - бенчмарки качества удержания контекста моделями, там и OpenAI MRCR с иголками, и ссылка на Fiction.LiveBench
На некоторые неотвеченные вопросы ответил в комменте к этому посту (чтобы не пропускать такие штуки, можно вступить в чат канала).
Небольшой тизер: предварительно в октябре планируется онлайн-конференция, где буду читать доклад о роли архитектуры и классического процесса разработки в мире вайбкодинга и как это можно совмещать.
Полезного контента на конфе будет море, так что следите за новостями :)
#stream #workshop #agents
Ура, воркшоп состоялся, и в этот раз у нас есть-таки запись :)
Спасибо Родиону за приглашение и всем тем, кто пришёл и задавал вопросы!
Затронутые темы:
00:01:08 - Что такое кодовый агент?
00:05:02 - Почему популярны консольные (CLI) агенты?
00:12:01 - Анатомия кодового агента
00:18:46 - Context Engines
00:20:59 - CodeAlive: context-as-a-service
00:35:44 - Цикл работы агента (Agent Loop)
00:38:53 - Погружение в работу контекста
00:48:16 - Техники управления контекстом
01:06:54 - Субагенты: ключевая особенность Claude Code
01:29:17 - Кастомные субагенты
01:37:45 - Сравнение Claude Code и Codex
01:56:07 - Codex Cloud и фоновые агенты
02:01:31 - Будущее AI-разработки и решение проблемы сложности
Ссылки, которые были упомянуты на звонке:
● Канал Родиона, AI-Driven Development
● CodeAlive - тот самый context-(engine)-as-a-service, о котором говорили в рамках темы предоставления контекста агентам
● Context Arena - бенчмарки качества удержания контекста моделями, там и OpenAI MRCR с иголками, и ссылка на Fiction.LiveBench
На некоторые неотвеченные вопросы ответил в комменте к этому посту (чтобы не пропускать такие штуки, можно вступить в чат канала).
Небольшой тизер: предварительно в октябре планируется онлайн-конференция, где буду читать доклад о роли архитектуры и классического процесса разработки в мире вайбкодинга и как это можно совмещать.
Полезного контента на конфе будет море, так что следите за новостями :)
#stream #workshop #agents
16🔥55❤21👍13🥰3
Sonnet 4.5, Claude Code 2.0 и Claude Agent SDK
Целый пучок релизов от Anthropic :)
Самые интересные, на мой взгляд, вещи из анонсов:
Sonnet 4.5
● "лучшая модель для кодинга в мире" - ну это мы ещё проверим в течение пары дней :)
● очень хорошие приросты по агентским задачам, приросты по кодингу не такие впечатляющие, но тоже неплохие
● контекст всё ещё 200к в базе, и 1м для небольшого количества избранных
Claude Code 2.0
Внешние изменения:
● поддержка чекпойнтов (наконец-то!) -
● просмотр оставшихся лимитов (ещё раз наконец-то!) -
● сделали нативное расширение для VS Code
● Ctrl-R теперь отвечает за поиск по прошлым промптам
● Tab переключает thinking / non-thinking режимы (правда, непонятно, какого уровня thinking)
● ну и небольшой редизайн :)
Внутренние изменения:
● возможность редактирования контекста "на ходу" (выдана самому Claude Code и доступна по API, чтобы можно было активно из контекста выкусывать ставшие ненужными куски, такие как вызовы тулов, к примеру)
● Claude Code теперь сам знает, сколько у него осталось контекста и использует эту информацию, чтобы активно его редактировать, даже без компактизации
● новый инструмент Memory - для того, чтобы агент мог некоторые сведения хранить в папке /memories проекта - по сути, это небольшие записки, которые агент посчитал важными для того, чтобы сохранить и использовать позже. Возможности по работе с этой памятью так же доступны в API
Claude Agent SDK
● переименовали из Claude Code SDK
● по сути, это всё тот же движок Claude Code, но который теперь позволяет строить агентов не только для кодинга, но и агентов общего назначения
● теперь системный промпт не завязан чисто на код и агент не вычитывает CLAUDE.md, slash-команды и прочее на старте - это всё можно переопределить
● поддерживает добавление кастомных тулов с использованием встроенных MCP-серверов (которые прям внутри процесса Claude Code запускаются)
● словом, если вы хотите сделать что-то типа Claude Code, но для финансов, персонального ассистента, саппорта - это теперь можно сделать, используя Claude Agent SDK
Не выглядит революцией, но апдейты годные, будем пробовать :)
#news #model
Целый пучок релизов от Anthropic :)
Самые интересные, на мой взгляд, вещи из анонсов:
Sonnet 4.5
● "лучшая модель для кодинга в мире" - ну это мы ещё проверим в течение пары дней :)
● очень хорошие приросты по агентским задачам, приросты по кодингу не такие впечатляющие, но тоже неплохие
● контекст всё ещё 200к в базе, и 1м для небольшого количества избранных
Claude Code 2.0
Внешние изменения:
● поддержка чекпойнтов (наконец-то!) -
/rewind● просмотр оставшихся лимитов (ещё раз наконец-то!) -
/usage● сделали нативное расширение для VS Code
● Ctrl-R теперь отвечает за поиск по прошлым промптам
● Tab переключает thinking / non-thinking режимы (правда, непонятно, какого уровня thinking)
● ну и небольшой редизайн :)
Внутренние изменения:
● возможность редактирования контекста "на ходу" (выдана самому Claude Code и доступна по API, чтобы можно было активно из контекста выкусывать ставшие ненужными куски, такие как вызовы тулов, к примеру)
● Claude Code теперь сам знает, сколько у него осталось контекста и использует эту информацию, чтобы активно его редактировать, даже без компактизации
● новый инструмент Memory - для того, чтобы агент мог некоторые сведения хранить в папке /memories проекта - по сути, это небольшие записки, которые агент посчитал важными для того, чтобы сохранить и использовать позже. Возможности по работе с этой памятью так же доступны в API
Claude Agent SDK
● переименовали из Claude Code SDK
● по сути, это всё тот же движок Claude Code, но который теперь позволяет строить агентов не только для кодинга, но и агентов общего назначения
● теперь системный промпт не завязан чисто на код и агент не вычитывает CLAUDE.md, slash-команды и прочее на старте - это всё можно переопределить
● поддерживает добавление кастомных тулов с использованием встроенных MCP-серверов (которые прям внутри процесса Claude Code запускаются)
● словом, если вы хотите сделать что-то типа Claude Code, но для финансов, персонального ассистента, саппорта - это теперь можно сделать, используя Claude Agent SDK
Не выглядит революцией, но апдейты годные, будем пробовать :)
#news #model
4🔥34👍17❤9👎1
AI Dev 2025
Ну что ж, к осени 2025го уже всем стало понятно, что тренд на автоматизацию разработки наметился довольно чётко.
А вот динамика очень сильно разнится.
Сейчас в индустрии одновременно присутствуют как инструменты, на добрый порядок различающиеся по своему качеству и степени автоматизации, так и те, кто использует эти инструменты так же на порядок (не)эффективнее.
И тут ничего удивительного - сейчас почти каждый день появляется что-то новое, улучшается старое, и стало очень сложно выбрать между тем, что реально приносит пользу, а что на самом деле просто маркетинговый мусор.
Соответственно, наибольшую ценность представляет мнение и опыт тех, кто является реальными практиками, сами успешно строят продукты с помощью ИИ, и понимают, что является ценным, а что нет.
Именно такие люди собрались и решили провести конференцию, где расскажут о современных, рабочих подходах и инструментах для автоматизации и ускорения процесса разработки.
В программе: создатели собственных продуктов для ИИ-разработки, фаундеры компаний, эксперты по внедрению ИИ в enterprise, прожжённые технари, талантливые организаторы, умеющие пасти котов, дизайнеры модной одежды для разрабов, веломаньяки и даже перспективный ютубер!
Ожидается легкий флёр упоротости людей, увлечённых своим делом, куча полезной инфы и горячая дискуссия о будущем рынка разработки.
Итак, 14 октября, онлайн, 14:00-19:30 МСК.
(есть возможность участвовать бесплатно)
Все подробности и регистрация тут:
🔜 ai-dev.live 🔙
P.S. я и самв некотором роде спикер - расскажу, как вижу роль архитектуры и накопленного за 20 лет опыта в этом новом мире вайба :)
#aidev2025 #анонс #нереклама
Ну что ж, к осени 2025го уже всем стало понятно, что тренд на автоматизацию разработки наметился довольно чётко.
А вот динамика очень сильно разнится.
Сейчас в индустрии одновременно присутствуют как инструменты, на добрый порядок различающиеся по своему качеству и степени автоматизации, так и те, кто использует эти инструменты так же на порядок (не)эффективнее.
И тут ничего удивительного - сейчас почти каждый день появляется что-то новое, улучшается старое, и стало очень сложно выбрать между тем, что реально приносит пользу, а что на самом деле просто маркетинговый мусор.
Соответственно, наибольшую ценность представляет мнение и опыт тех, кто является реальными практиками, сами успешно строят продукты с помощью ИИ, и понимают, что является ценным, а что нет.
Именно такие люди собрались и решили провести конференцию, где расскажут о современных, рабочих подходах и инструментах для автоматизации и ускорения процесса разработки.
В программе: создатели собственных продуктов для ИИ-разработки, фаундеры компаний, эксперты по внедрению ИИ в enterprise, прожжённые технари, талантливые организаторы, умеющие пасти котов, дизайнеры модной одежды для разрабов, веломаньяки и даже перспективный ютубер!
Ожидается легкий флёр упоротости людей, увлечённых своим делом, куча полезной инфы и горячая дискуссия о будущем рынка разработки.
Итак, 14 октября, онлайн, 14:00-19:30 МСК.
(есть возможность участвовать бесплатно)
Все подробности и регистрация тут:
P.S. я и сам
#aidev2025 #анонс #нереклама
Please open Telegram to view this post
VIEW IN TELEGRAM
2🔥23👍13❤8🎉3🤡2
Уровни внедрения ИИ в разработку v2
Так, ну что, настало время обновить классификацию, уже 7 месяцев прошло с первой версии.
Disclaimer: уровни довольно условные и скорее нужно их воспринимать как то, насколько далеко мы от ручной работы с кодом.
0. Изоляция
Ну, кажется, не осталось программистов, которые ничего не слышали про использование ИИ в разработке.
Но если встретите таких - не спугните, это же как йети, с ними крайне интересно познакомиться :)
1. Сниппетинг
Использование сайтов ChatGPT/DeepSeek для написания мелких скриптов/функций от случая к случаю
2. Копипастинг
Систематическая разработка при помощи ИИ через копипастинг кода между каким-то UI к LLM и своей IDE.
Ускоряется в несколько раз износ Ctrl/C/V (ну или Ctrl/Shift/Insert, у членов древнего секретного ордена).
Кстати, сюда же попадает использование Repomix / Prompt Tower для склейки файлов проекта в один и отправки в AI Studio, к примеру, где у Gemini есть хороший 1м контекст.
3. Автодополнение
Использование одного лишь ИИ-автодополнения в процессе написания кода руками в своей IDE - собственно с этого всё и началось, когда вышел GitHub Copilot аж 300 лет тому назад (ну, ~3.5 года, если быть точнее,я был там, Гендальф).
4. AI IDE
Когда в IDE используется чат с LLM и/или агент: Cursor / Windsurf / RooCode / Cline.
В них можно интерактивно общаться с LLM и давать ей небольшие задачи для автономного выполнения, а LLM как часть агента уже сама найдёт нужный код в проекте, сама его поправит, сама выловит ошибки, и потом покажет diff, который можно поревьюить.
А ещё с этого уровня у нас появляются MCP, правила для агентов, простенькая память и проблематика контекста (если что, см. воркшоп, там про контекст много).
5. CLI-агенты
Отказываемся от GUI, переходим в консоль и кастомизируем агента под свои нужды и процессы: Claude Code, Codex CLI, Gemini CLI, etc, со своими плюсами и минусами в сравнении с IDE.
Здесь же появляются кастомные команды, субагенты и разнообразные workflows, в которых агент, пишущий код - лишь часть общего процесса.
6. Фоновые агенты и агенты полного цикла
Тут у нас Codex Cloud, Google Jules, GitHub Copilot coding agent и даже Cursor Background Agent как фоновые агенты в облаках, и работающие в основном с GitHub.
А также Devin / OpenHands - они способны в условном Slack принять от вас задачу, зададут вопросы, сходят в Git, залезут в базу знаний проекта, напишут код, потестят его, запушат и передадут на ревью,получат зарплату.
Между этими изначально двумя разными видами систем идёт конвергенция и, думаю, какой-то их гибрид сильно повлияет на будущее разработки.
7. (Secret Level)
Встречаются специальные маньяки, которые пишут свои мультиагентные системы под задачи разработки целых проектов.
Задачи у них тоже довольно специальные, но, как правило, интересные и весьма нетривиальные.
Здесь постепенно зарождается свой набор инструментария для высокоуровневой работы, который в перспективе может заменить привычные нам интерфейсы и позволит оркестрировать множество разнородных агентов.
У меня сейчас такое распределение получается в задачах разработки:
● 80% - №5, CLI-агенты с кастомными workflows
● 10% - №6, фоновые агенты для задач, которые случается делать не за рабочим местом
● 10% - №7, исследования по оркестрации мультиагентных систем
А как у вас обстоят дела (см. голосование дальше)?
—
Напоминаю про нашу конфу по AI-разработке во вторник, 14го!
🔜 ai-dev.live 🔙
#ai #development
Так, ну что, настало время обновить классификацию, уже 7 месяцев прошло с первой версии.
Disclaimer: уровни довольно условные и скорее нужно их воспринимать как то, насколько далеко мы от ручной работы с кодом.
0. Изоляция
Ну, кажется, не осталось программистов, которые ничего не слышали про использование ИИ в разработке.
Но если встретите таких - не спугните, это же как йети, с ними крайне интересно познакомиться :)
1. Сниппетинг
Использование сайтов ChatGPT/DeepSeek для написания мелких скриптов/функций от случая к случаю
2. Копипастинг
Систематическая разработка при помощи ИИ через копипастинг кода между каким-то UI к LLM и своей IDE.
Ускоряется в несколько раз износ Ctrl/C/V (ну или Ctrl/Shift/Insert, у членов древнего секретного ордена).
Кстати, сюда же попадает использование Repomix / Prompt Tower для склейки файлов проекта в один и отправки в AI Studio, к примеру, где у Gemini есть хороший 1м контекст.
3. Автодополнение
Использование одного лишь ИИ-автодополнения в процессе написания кода руками в своей IDE - собственно с этого всё и началось, когда вышел GitHub Copilot аж 300 лет тому назад (ну, ~3.5 года, если быть точнее,
4. AI IDE
Когда в IDE используется чат с LLM и/или агент: Cursor / Windsurf / RooCode / Cline.
В них можно интерактивно общаться с LLM и давать ей небольшие задачи для автономного выполнения, а LLM как часть агента уже сама найдёт нужный код в проекте, сама его поправит, сама выловит ошибки, и потом покажет diff, который можно поревьюить.
А ещё с этого уровня у нас появляются MCP, правила для агентов, простенькая память и проблематика контекста (если что, см. воркшоп, там про контекст много).
5. CLI-агенты
Отказываемся от GUI, переходим в консоль и кастомизируем агента под свои нужды и процессы: Claude Code, Codex CLI, Gemini CLI, etc, со своими плюсами и минусами в сравнении с IDE.
Здесь же появляются кастомные команды, субагенты и разнообразные workflows, в которых агент, пишущий код - лишь часть общего процесса.
6. Фоновые агенты и агенты полного цикла
Тут у нас Codex Cloud, Google Jules, GitHub Copilot coding agent и даже Cursor Background Agent как фоновые агенты в облаках, и работающие в основном с GitHub.
А также Devin / OpenHands - они способны в условном Slack принять от вас задачу, зададут вопросы, сходят в Git, залезут в базу знаний проекта, напишут код, потестят его, запушат и передадут на ревью,
Между этими изначально двумя разными видами систем идёт конвергенция и, думаю, какой-то их гибрид сильно повлияет на будущее разработки.
7. (Secret Level)
Встречаются специальные маньяки, которые пишут свои мультиагентные системы под задачи разработки целых проектов.
Задачи у них тоже довольно специальные, но, как правило, интересные и весьма нетривиальные.
Здесь постепенно зарождается свой набор инструментария для высокоуровневой работы, который в перспективе может заменить привычные нам интерфейсы и позволит оркестрировать множество разнородных агентов.
У меня сейчас такое распределение получается в задачах разработки:
● 80% - №5, CLI-агенты с кастомными workflows
● 10% - №6, фоновые агенты для задач, которые случается делать не за рабочим местом
● 10% - №7, исследования по оркестрации мультиагентных систем
А как у вас обстоят дела (см. голосование дальше)?
—
Напоминаю про нашу конфу по AI-разработке во вторник, 14го!
#ai #development
Please open Telegram to view this post
VIEW IN TELEGRAM
4👍25❤24🔥10👏2💩1
А как у вас по части внедрения AI в разработку?
Отметьте 2-3 наиболее частых в вашей работе пункта
Отметьте 2-3 наиболее частых в вашей работе пункта
Anonymous Poll
2%
0. Изоляция
13%
1. Сниппетинг
27%
2. Копипастинг
24%
3. Автодополнение
53%
4. AI IDE
37%
5. CLI-агенты
9%
6. Фоновые агенты и агенты полного цикла
5%
7. (Secret Level) - а расскажите, что делаете!
4%
Ничего из этого / рассскажу в комментах
YouTube
Building more effective AI agents
Anthropic’s Alex Albert (Claude Relations) sits down with Erik Schluntz (Multi-Agent Research and co-author of our blog post, Building Effective Agents) for a discussion on the evolution of agents over the past six months, including tips for building multi…
Эрик Шлунц (которого нужно слушать) недавно дал небольшое интервью о разном вокруг Claude Code и агентов.
А слушать его стоит хотя бы потому, что он занимается исследованиями мультиагентных систем в Anthropic и влияет на их разработку, ну и за правильные взгляды - вспомнить те же стволы, ветки и листья :)
Claude Code как агент общего назначения
Благодаря появлению Agent SDK Claude Code теперь можно использовать не только для программирования.
Если раньше для построения агента нам приходилось самим создавать agent loop, запросы к API, инструменты, реализовывать их выполнение, работу с файлами и MCP, то сейчас для этой задачи можно использовать SDK, который даёт готовый каркас для создания агентов.
Claude Skills ложатся в ту же канву - это возможность расширения навыков Claude как агента общего назначения.
Эволюция архитектуры агентов
● workflows - по-прежнему хороши там, где нужна низкая задержка, но вытесняются агентами там, где важнее абсолютное качество
● agent loops - модель самостоятельно выбирает нужные инструменты в цикле и исправляет ошибки, что в итоге значительно повышает качество в сравнении с workflows
● workflows of agents - каждый шаг в workflow представляет собой отдельного агента
● мультиагентные системы - несколько (суб)агентов работают одновременно над одной задачей или её подзадачами
🔴 Проблемы мультиагентных систем
Cообщество, кстати, про них прекрасно знает, и хорошо, что про них знают и в Anthropic.
Плохо то, что они о них заранее не рассказывают, когда выпускают инструменты
● Наблюдаемость (observability) - несмотря на то, что модели стали гораздо более способными, простота всё ещё остаётся важной.
И хотя можно построить большой workflow из агентов, лучше всё-таки начинать с самого простого и двигаться к более сложному решению, добавляя слои сложности только по необходимости, потому что это сильно затрудняет наблюдаемость.
Кто бы мог подумать, а некоторые люди мучаются, между прочим!
● Как и люди, мультиагентные системы могут страдать от излишней бюрократии и коммуникационных издержек, когда агенты тратят больше времени на общение друг с другом, чем на выполнение задачи.
Тут я почти сорвался и чуть не написал портянку с базой из теории информации в её приложении к коммуникациям в организациях, но об этом как-нить потом :)
● Claude совершает те же ошибки, что и неопытные менеджеры: он дает неполные или нечеткие инструкции субагенту и иногда ожидает, что у субагента будет правильный контекст, хотя на самом деле это не так.
Часть исследований Эрика - это обучение Claude быть лучшим менеджером и знать, как давать четкие инструкции субагентам и убеждаться, что он получает от них то, что нужно.
Забавно наблюдать, как антропоморфизм постепенно становится всё более и более явным и даже полезным в работе с моделями
🟢 Советы разработчикам при работе с агентами
● начинайте с простого и добавляйте сложность только по мере необходимости
● думайте с позиции ваших агентов
Поставьте себя на место модели и убедитесь, что вы дали достаточно информации, чтобы вы сами могли решить проблему. Стоит помнить, что модель видит только то, что мы ей показали.
Также имеет смысл смотреть в сырые запросы и логи, чтобы понимать, что пересылается на самом деле
● не делайте MCP один к одному с вашими API
Инструменты для модели или MCP должны быть 1:1 с вашим UI, а не с вашим API.
Модель не работает как традиционная программа - она скорее ведёт себя как пользователь всех этих инструментов
Про эту ошибку в создании MCP-серверов я тоже постоянно рассказываю, но аналогия с UI довольно полезная
Будущее агентов
Это, наряду с мультиагентностью, стоит читать как направления развития самих Anthropic
● Самостоятельная верификация: нужно научить агентов самостоятельно проверять свою работу. Например, агент, который написал веб-приложение, должен уметь открыть его в браузере, протестировать и исправить найденные баги
● Computer Use: возможность агентов взаимодействовать с GUI откроет огромные возможности для автоматизации задач в любых приложениях, с которыми работают люди
#video #reaction #interview
А слушать его стоит хотя бы потому, что он занимается исследованиями мультиагентных систем в Anthropic и влияет на их разработку, ну и за правильные взгляды - вспомнить те же стволы, ветки и листья :)
Claude Code как агент общего назначения
Благодаря появлению Agent SDK Claude Code теперь можно использовать не только для программирования.
Если раньше для построения агента нам приходилось самим создавать agent loop, запросы к API, инструменты, реализовывать их выполнение, работу с файлами и MCP, то сейчас для этой задачи можно использовать SDK, который даёт готовый каркас для создания агентов.
Claude Skills ложатся в ту же канву - это возможность расширения навыков Claude как агента общего назначения.
Эволюция архитектуры агентов
● workflows - по-прежнему хороши там, где нужна низкая задержка, но вытесняются агентами там, где важнее абсолютное качество
● agent loops - модель самостоятельно выбирает нужные инструменты в цикле и исправляет ошибки, что в итоге значительно повышает качество в сравнении с workflows
● workflows of agents - каждый шаг в workflow представляет собой отдельного агента
● мультиагентные системы - несколько (суб)агентов работают одновременно над одной задачей или её подзадачами
🔴 Проблемы мультиагентных систем
Cообщество, кстати, про них прекрасно знает, и хорошо, что про них знают и в Anthropic.
Плохо то, что они о них заранее не рассказывают, когда выпускают инструменты
● Наблюдаемость (observability) - несмотря на то, что модели стали гораздо более способными, простота всё ещё остаётся важной.
И хотя можно построить большой workflow из агентов, лучше всё-таки начинать с самого простого и двигаться к более сложному решению, добавляя слои сложности только по необходимости, потому что это сильно затрудняет наблюдаемость.
Кто бы мог подумать, а некоторые люди мучаются, между прочим!
● Как и люди, мультиагентные системы могут страдать от излишней бюрократии и коммуникационных издержек, когда агенты тратят больше времени на общение друг с другом, чем на выполнение задачи.
Тут я почти сорвался и чуть не написал портянку с базой из теории информации в её приложении к коммуникациям в организациях, но об этом как-нить потом :)
● Claude совершает те же ошибки, что и неопытные менеджеры: он дает неполные или нечеткие инструкции субагенту и иногда ожидает, что у субагента будет правильный контекст, хотя на самом деле это не так.
Часть исследований Эрика - это обучение Claude быть лучшим менеджером и знать, как давать четкие инструкции субагентам и убеждаться, что он получает от них то, что нужно.
Забавно наблюдать, как антропоморфизм постепенно становится всё более и более явным и даже полезным в работе с моделями
🟢 Советы разработчикам при работе с агентами
● начинайте с простого и добавляйте сложность только по мере необходимости
● думайте с позиции ваших агентов
Поставьте себя на место модели и убедитесь, что вы дали достаточно информации, чтобы вы сами могли решить проблему. Стоит помнить, что модель видит только то, что мы ей показали.
Также имеет смысл смотреть в сырые запросы и логи, чтобы понимать, что пересылается на самом деле
● не делайте MCP один к одному с вашими API
Инструменты для модели или MCP должны быть 1:1 с вашим UI, а не с вашим API.
Модель не работает как традиционная программа - она скорее ведёт себя как пользователь всех этих инструментов
Про эту ошибку в создании MCP-серверов я тоже постоянно рассказываю, но аналогия с UI довольно полезная
Будущее агентов
Это, наряду с мультиагентностью, стоит читать как направления развития самих Anthropic
● Самостоятельная верификация: нужно научить агентов самостоятельно проверять свою работу. Например, агент, который написал веб-приложение, должен уметь открыть его в браузере, протестировать и исправить найденные баги
● Computer Use: возможность агентов взаимодействовать с GUI откроет огромные возможности для автоматизации задач в любых приложениях, с которыми работают люди
#video #reaction #interview
1❤24👍21🔥12👏2
Хорошая новость для тех, кто пользуется Codex CLI/Cloud - для него теперь можно докупать кредиты, чтобы продолжить работу после того, как уперлись в лимиты плана (Plus или Pro).
$40 за 1000 кредитов
Сообщество давно просило у OpenAI сделать план между $20 и $200 в месяц, и кто-то покупал несколько аккаунтов для переключения между ними, но вот теперь есть официальный способ.
И сегодня всем скинули лимиты в честь этого события :)
Экономику еще нужно будет проверить на практике, но это уже намного лучше, чем блокировка после 2 дней работы на плане за $20 или платить $200 в месяц за заведомо недостижимые лимиты и ненужный набор фич в подписке.
Кстати, свои лимиты и баланс кредитов можно смотреть тут: https://chatgpt.com/codex/settings/usage
Страница в хелпе с подробностями: https://help.openai.com/en/articles/12642688-using-credits-for-flexible-usage-in-chatgpt-pluspro
#codex
$40 за 1000 кредитов
Сообщество давно просило у OpenAI сделать план между $20 и $200 в месяц, и кто-то покупал несколько аккаунтов для переключения между ними, но вот теперь есть официальный способ.
И сегодня всем скинули лимиты в честь этого события :)
Экономику еще нужно будет проверить на практике, но это уже намного лучше, чем блокировка после 2 дней работы на плане за $20 или платить $200 в месяц за заведомо недостижимые лимиты и ненужный набор фич в подписке.
Кстати, свои лимиты и баланс кредитов можно смотреть тут: https://chatgpt.com/codex/settings/usage
Страница в хелпе с подробностями: https://help.openai.com/en/articles/12642688-using-credits-for-flexible-usage-in-chatgpt-pluspro
#codex
2👍30🔥17❤7
Вайб-обзор на GPT 5.1 / Gemini 3 Pro / Opus 4.5 (1/2)
Даа, ноябрь выдался весьма урожайным на новые модели.
Перебивая один другого, ведущие вендоры выпустили по флагманской модели (некоторые даже по нескольку).
Провел с каждой из них достаточно времени, чтобы теперь поделиться мнением :)
Будем считать это вайб-обзором, т.к. формальных метрик у меня нету, и по сути это набор личных впечатлений, полученных в процессе решения реальных задач.
Если не указано иного, то я рассматриваю модели чисто с точки зрения использования их для разработки и исключительно в "родных", вендорских инструментах и на платных подписках.
Оценки по каждой характеристике относительны и выставлены в сравнении с лучшей моделью из трёх (т.е. 10 ≠ абсолют).
GPT 5.1 High (+Codex, +Max)
Весьма педантичное семейство моделей, которым можно доверить сложные и глубокие задачи, а так же те, которые требуют внимания к деталям.
Ни Gemini 3 Pro, ни Opus 4.5, даже несмотря на результаты на бенчмарках, не смогли стать заменой GPT 5 там, где нужен мощный ризонинг.
Через неё у меня проходят финальные версии планов, архитектурных решений, ревью - и всё обязательно с граундингом на существующую кодовую базу и документацию.
Собственно именно работа в существующих больших проектах ей удаётся лучше всего - модель сама способна качественно собрать контекст, понять corner cases, адаптироваться к стилю кода и архитектурным паттернам, и в целом ведёт себя не как ковбой-кодер, который после прочтения пары файлов кидается писать код (да, Gemini?).
И пусть иногда сбор этого самого контекста и раздумья происходят мучительно долго, по мне так лучше подождать ради качественного результата вместо того, чтобы потом переделывать несколько раз и бороться с галлюцинациями или излишней самоуверенностью, как это бывает у других моделей.
Увы, насколько хороша модель, настолько же и плох тулинг вокруг неё.
Несмотря на быстрый старт, команда Codex CLI спустя короткое время то ли увязла в выбранных технологиях, то ли готовит какой-то другой продукт - иначе сложно объяснить игнор нужных и очевидных фич, которые просит сообщество.
Claude Code почти во всём лучше Codex CLI, но, видимо, нам нельзя иметь удобную оболочку (harness / упряжку) и хорошую модель в составе одного агента.
Ну и агентность у GPT 5.1 похуже, если сравнивать с Claude, даже в случае Codex-вариантов.
Хотя связка обычной GPT 5.1 как планировщика, а Codex-варианта как исполнителя вполне рабочая на большинстве задач.
#ai #model #review
Даа, ноябрь выдался весьма урожайным на новые модели.
Перебивая один другого, ведущие вендоры выпустили по флагманской модели (некоторые даже по нескольку).
Провел с каждой из них достаточно времени, чтобы теперь поделиться мнением :)
Будем считать это вайб-обзором, т.к. формальных метрик у меня нету, и по сути это набор личных впечатлений, полученных в процессе решения реальных задач.
Если не указано иного, то я рассматриваю модели чисто с точки зрения использования их для разработки и исключительно в "родных", вендорских инструментах и на платных подписках.
Оценки по каждой характеристике относительны и выставлены в сравнении с лучшей моделью из трёх (т.е. 10 ≠ абсолют).
Критерии
● Интеллект
В данном случае - способность к решению сложных проблем.
● Работа с контекстом
Удержание, экономность использования, галлюцинации.
● Следование инструкциям
... плюс способность их помнить и принимать во внимание все разом, внимание к деталям.
● Планирование
Анализ требований и их осуществимости с граундингом на существующий проект, разбивка по этапам и задачам.
● Архитектура
Способность понимать, оперировать и следовать архитектурным концепциям, предлагать неконфликтующие изменения.
● Агентность
Автономное выполнение задач с эффективным использованием выданных инструментов.
● Рефакторинг
Понимание типовых рефакторингов, code smells и способность делать широкие изменения в существующей кодовой базе.
● UI/UX
Визуальная красота и удобство UI (в отрыве от красоты/сложности кода).
● Инструментарий
Набор IDE, CLI, Web и прочих инструментов, где работает модель.
● Стабильность
Как бесперебойность доступа к модели со стороны вендора, так и стабильность выдаваемого результата с т.з. качества.
GPT 5.1 High (+Codex, +Max)
Весьма педантичное семейство моделей, которым можно доверить сложные и глубокие задачи, а так же те, которые требуют внимания к деталям.
Ни Gemini 3 Pro, ни Opus 4.5, даже несмотря на результаты на бенчмарках, не смогли стать заменой GPT 5 там, где нужен мощный ризонинг.
Через неё у меня проходят финальные версии планов, архитектурных решений, ревью - и всё обязательно с граундингом на существующую кодовую базу и документацию.
Собственно именно работа в существующих больших проектах ей удаётся лучше всего - модель сама способна качественно собрать контекст, понять corner cases, адаптироваться к стилю кода и архитектурным паттернам, и в целом ведёт себя не как ковбой-кодер, который после прочтения пары файлов кидается писать код (да, Gemini?).
И пусть иногда сбор этого самого контекста и раздумья происходят мучительно долго, по мне так лучше подождать ради качественного результата вместо того, чтобы потом переделывать несколько раз и бороться с галлюцинациями или излишней самоуверенностью, как это бывает у других моделей.
Увы, насколько хороша модель, настолько же и плох тулинг вокруг неё.
Несмотря на быстрый старт, команда Codex CLI спустя короткое время то ли увязла в выбранных технологиях, то ли готовит какой-то другой продукт - иначе сложно объяснить игнор нужных и очевидных фич, которые просит сообщество.
Claude Code почти во всём лучше Codex CLI, но, видимо, нам нельзя иметь удобную оболочку (harness / упряжку) и хорошую модель в составе одного агента.
Ну и агентность у GPT 5.1 похуже, если сравнивать с Claude, даже в случае Codex-вариантов.
Хотя связка обычной GPT 5.1 как планировщика, а Codex-варианта как исполнителя вполне рабочая на большинстве задач.
#ai #model #review
9🔥31👍11❤9💯3
Вайб-обзор на GPT 5.1 / Gemini 3 Pro / Opus 4.5 (2/2)
Gemini 3 Pro
Модель перед выпуском хайпили так, что казалось, будто у всех сотрудников Google есть KPI на то, чтобы твитнуть нечто загадочное про выход то Gemini, то про что-то с цифрой 3, то про будущие фантастические возможности.
Конкретно у меня было много надежд на то, что у нас-таки будет модель уровня GPT 5, но c 1м контекста, с большей эрудицией (у GPT 5 с этим явно хуже) и агентностью.
Но чуда не случилось. Для разработки так уж точно.
Впечатление от релиза смазалось ещё и тем, что в составе продуктов, где модель стала доступной на старте, она работала довольно нестабильно (и это местами продолжается).
Ну а после того, как в реальной работе она не показала заявленного в бенчмарках, стало совсем грустно.
Нет, это безусловно отличная модель, очень начитанная, с мультимодальностью из коробки, но, кажется, её не создавали быть лучшей в разработке.
Для всего остального, впрочем, она очень хороша, а такие штуки как Nano Banana Pro и NotebookLM теперь у меня входят в набор повседневных инструментов.
Опять-таки, это Preview версия, и, возможно, тут, как и на старте GPT 5, проблема больше в тулинге, чем в самой модели, и нужно подождать месяц-другой, пока и тулинг оптимизируется, и появится новый чекпойнт модели.
А ещё стоит посматривать за прогрессом Antigravity, там есть несколько интересных задумок:
● спеки/планы как first-class citizens;
● поддержка работы с браузером через кастомное расширение для Chrome, что делает возможным модели "смотреть" на результат свой работы для замыкания feedback loop;
● отдельный интерфейс для работы с агентами;
● генерация схем проекта, дизайнов и картинок с помощью Nano Banana Pro.
Opus 4.5
Честно говоря, не думал, что Anthropic что-то сможет представить достойное на фоне прошлых двух моделей, но однако ж получилось.
Вкупе со снижением цен это делает новый Opus приемлемым как по лимитам, так и по качеству работы.
А если добавить к этому Claude Code, который, как я уже упомянул, в принципе является лучшим CLI-агентом на текущий момент, то вообще хорошо.
Виден рост по всем метрикам, связанным с разработкой, модель стала более аккуратной в суждениях, реже считает ваши решения гениальными и тратит меньше токенов.
Однако это всё ещё типичная Claude - стремительно улетающий контекст, недостаток внимания к мелочам, объявление нетронутых задач выполненными и т.п.
Да, всего этого стало меньше, но на это всё равно намного чаще натыкаешься, чем в той же GPT 5.1, и для эффективной работы всё ещё нужно построение более сложногонабора костылей поддерживающего workflow.
Зато Claude Code + Opus -- отличная связка для:
● greenfield-проектов и не очень сложных и больших проектов в целом, как для планирования, так и написания кода;
● всего, что связано с красивостями в UI;
● для агентных в целом и devops-задач в частности, когда нужно много всяких разных тулов подёргать, и через много шагов прийти к конечному результату (пока контекст не кончился, хехе).
Вердикт
Ультимативного инструмента нет, и нельзя его выбрать по какой-то одной характеристике, но если брать самые их яркие особенности, то я бы распределил их так:
● Сложный проект, много существующего кода, нужно внесение аккуратных правок, продумывая архитектуру и обсуждая варианты решения в деталях - GPT 5.1.
● Более-менее универсальная рабочая лошадка, которую вполне можно использовать как единственный инструмент, но с условием того, что вам придётся её объездить - Opus 4.5.
(прошу винить в обилии "лошадиных" аналогий модный сейчас термин harness).
● Если вам не так важна собственно разработка, а нужна вторая модель с хорошей эрудицией и интуицией не только в технических доменах, большим контекстом, хорошей мультимодальностью, а также для прототипов и ваншотов - Gemini 3 Pro.
Но в целом это, конечно, отличные обновления, прогресс весьма заметен.
И посмотрим, изменится ли что-то ещё до конца года :)
#ai #model #review
Gemini 3 Pro
Модель перед выпуском хайпили так, что казалось, будто у всех сотрудников Google есть KPI на то, чтобы твитнуть нечто загадочное про выход то Gemini, то про что-то с цифрой 3, то про будущие фантастические возможности.
Конкретно у меня было много надежд на то, что у нас-таки будет модель уровня GPT 5, но c 1м контекста, с большей эрудицией (у GPT 5 с этим явно хуже) и агентностью.
Но чуда не случилось. Для разработки так уж точно.
Впечатление от релиза смазалось ещё и тем, что в составе продуктов, где модель стала доступной на старте, она работала довольно нестабильно (и это местами продолжается).
Ну а после того, как в реальной работе она не показала заявленного в бенчмарках, стало совсем грустно.
Нет, это безусловно отличная модель, очень начитанная, с мультимодальностью из коробки, но, кажется, её не создавали быть лучшей в разработке.
Для всего остального, впрочем, она очень хороша, а такие штуки как Nano Banana Pro и NotebookLM теперь у меня входят в набор повседневных инструментов.
Опять-таки, это Preview версия, и, возможно, тут, как и на старте GPT 5, проблема больше в тулинге, чем в самой модели, и нужно подождать месяц-другой, пока и тулинг оптимизируется, и появится новый чекпойнт модели.
А ещё стоит посматривать за прогрессом Antigravity, там есть несколько интересных задумок:
● спеки/планы как first-class citizens;
● поддержка работы с браузером через кастомное расширение для Chrome, что делает возможным модели "смотреть" на результат свой работы для замыкания feedback loop;
● отдельный интерфейс для работы с агентами;
● генерация схем проекта, дизайнов и картинок с помощью Nano Banana Pro.
Opus 4.5
Честно говоря, не думал, что Anthropic что-то сможет представить достойное на фоне прошлых двух моделей, но однако ж получилось.
Вкупе со снижением цен это делает новый Opus приемлемым как по лимитам, так и по качеству работы.
А если добавить к этому Claude Code, который, как я уже упомянул, в принципе является лучшим CLI-агентом на текущий момент, то вообще хорошо.
Виден рост по всем метрикам, связанным с разработкой, модель стала более аккуратной в суждениях, реже считает ваши решения гениальными и тратит меньше токенов.
Однако это всё ещё типичная Claude - стремительно улетающий контекст, недостаток внимания к мелочам, объявление нетронутых задач выполненными и т.п.
Да, всего этого стало меньше, но на это всё равно намного чаще натыкаешься, чем в той же GPT 5.1, и для эффективной работы всё ещё нужно построение более сложного
Зато Claude Code + Opus -- отличная связка для:
● greenfield-проектов и не очень сложных и больших проектов в целом, как для планирования, так и написания кода;
● всего, что связано с красивостями в UI;
● для агентных в целом и devops-задач в частности, когда нужно много всяких разных тулов подёргать, и через много шагов прийти к конечному результату (пока контекст не кончился, хехе).
Вердикт
Ультимативного инструмента нет, и нельзя его выбрать по какой-то одной характеристике, но если брать самые их яркие особенности, то я бы распределил их так:
● Сложный проект, много существующего кода, нужно внесение аккуратных правок, продумывая архитектуру и обсуждая варианты решения в деталях - GPT 5.1.
● Более-менее универсальная рабочая лошадка, которую вполне можно использовать как единственный инструмент, но с условием того, что вам придётся её объездить - Opus 4.5.
(прошу винить в обилии "лошадиных" аналогий модный сейчас термин harness).
● Если вам не так важна собственно разработка, а нужна вторая модель с хорошей эрудицией и интуицией не только в технических доменах, большим контекстом, хорошей мультимодальностью, а также для прототипов и ваншотов - Gemini 3 Pro.
Но в целом это, конечно, отличные обновления, прогресс весьма заметен.
И посмотрим, изменится ли что-то ещё до конца года :)
#ai #model #review
9🔥50👍16❤12👏2
AI в SDLC - люди, процессы и организации [анонс]
Так, народ, я обычно тут пишу про технические штуки, но ведь все мы понимаем, что в профессии разработчика (и айтишников в целом) на самом деле очень много того самого человеческого фактора, про который всегда нужно помнить.
По мере того, как за прошедший год рос канал, я всё больше общался с коллегами из других компаний, консультировал, выступал с докладами, читал исследования и сам получал опыт того, как проходит внедрение AI в процессы разработки.
(шутка ли, довелось даже побыть участником круглого стола Frontend Conf 2025 по этой теме :))
Получается, что чисто технические навыки работы с моделями - это, может, процентов 30 успеха, а остальное - это люди, процессы, организации и куча неочевидных вещей, о которых нечасто пишут в статьях про то, "как я стал 10x-разработчиком с ИИ".
Так что попробую поделиться своими наблюдениями в этом плане, и в ближайшие недели на канале будет мини-серия про внедрение AI в разработку за пределами только лишь написания кода.
Если вы привыкли к моим техническим постам про модели и инструменты - некоторое время это будет чутка другой формат.
Но, как мне кажется, не менее важный.
Примерный список тем сейчас выглядит так (рандом):
⚪️ Психология разработчика: страхи, эйфория и нетипичная нагрузка
"Меня заменят", "я тупею, пока агент всё пишет за меня" и прочие бабайки.
Переход от роли исполнителя к роли человека, который ставит задачи и проверяет их выполнение - это другая ментальность и другой уровень ответственности.
Почему работа с ИИ превращается в вечный context switch, выгорание, и причём тут вообще сон и дофамин.
⚪️ AI как усилитель, а не серебряная пуля
Текущая реальность такова, что модели усиливают те процессы, которые у вас уже есть, и если внутри всё устроено плохо, AI ответственно масштабирует этот бардак.
Разберём, почему так получается и что с этим делать.
⚪️ SDLC-пайплайн и теория ограничений
ИИ очень быстро пишет код, но ревью, QA, релизы и поддержка почему-то быстрее не становятся.
Обсудим на пальцах, почему ускорение одной лишь разработки почти всегда приводит к росту техдолга и инцидентов, и как помогают CI/CD, тесты, платформенная инженерия и адекватные метрики.
⚪️ Организационные паттерны: пилоты и микростартапы внутри компании
Как запускать маленькие команды-пилоты, где AI присутствует на всех этапах SDLC - от постановки задачи до деплоя.
Какие задачи и куски продукта подходят для экспериментов, а какие лучше не трогать, пока вы не готовы к приключениям.
Почему иногда лучше заняться распилом монолита и процессами, а не прикручиванием агента к Jira.
⚪️ Диффузия ролей: PM пишет код, QA обучает агента
Границы ролей размываются: продакт, который сам собирает прототипы на агентах; разработчик, который больше думает про архитектуру и верификацию, чем про ручной кодинг; QA, который пишет автотесты вместе с LLM.
Как может выглядеть команда, где каждый аугментирован ИИ, и какие навыки в таком мире становятся базовыми.
⚪️ Shadow AI и внедрение снизу
"Теневой ИИ" уже есть почти в каждой компании: люди втихую пользуются моделями, даже если это не одобряется.
Как с этим жить руководителям, как не убить инициативу энтузиастов, и почему попытки внедрить AI "сверху" нередко проваливаются.
⚪️ Новые метрики: от идеи до продакшена, а не от промпта до коммита
Важнее не то, как быстро агент написал код, а то, за сколько идея доехала до пользователя и насколько часто это всё падает.
Где AI действительно помогает, а где только создаёт иллюзию прогресса.
—
Если вам это всё созвучно - оставайтесь на связи, и можно просто ждать постов :)
Если по дороге хочется поделиться своими болями и кейсами про внедрение AI в разработку - скидывайте в комменты и личку, подходящие постараюсь вплести в серию.
И если хочется, чтобы что-то было раскрыто более полно или какие-то темы я пропустил - тоже дайте знать.
—
А, и one more thing - на следующей неделе будет живой доклад, затрагивающий часть из этих тем, подробности чуть позже :)
#ai #sdlc #management
Так, народ, я обычно тут пишу про технические штуки, но ведь все мы понимаем, что в профессии разработчика (и айтишников в целом) на самом деле очень много того самого человеческого фактора, про который всегда нужно помнить.
По мере того, как за прошедший год рос канал, я всё больше общался с коллегами из других компаний, консультировал, выступал с докладами, читал исследования и сам получал опыт того, как проходит внедрение AI в процессы разработки.
(шутка ли, довелось даже побыть участником круглого стола Frontend Conf 2025 по этой теме :))
Получается, что чисто технические навыки работы с моделями - это, может, процентов 30 успеха, а остальное - это люди, процессы, организации и куча неочевидных вещей, о которых нечасто пишут в статьях про то, "как я стал 10x-разработчиком с ИИ".
Так что попробую поделиться своими наблюдениями в этом плане, и в ближайшие недели на канале будет мини-серия про внедрение AI в разработку за пределами только лишь написания кода.
Если вы привыкли к моим техническим постам про модели и инструменты - некоторое время это будет чутка другой формат.
Но, как мне кажется, не менее важный.
Примерный список тем сейчас выглядит так (рандом):
⚪️ Психология разработчика: страхи, эйфория и нетипичная нагрузка
"Меня заменят", "я тупею, пока агент всё пишет за меня" и прочие бабайки.
Переход от роли исполнителя к роли человека, который ставит задачи и проверяет их выполнение - это другая ментальность и другой уровень ответственности.
Почему работа с ИИ превращается в вечный context switch, выгорание, и причём тут вообще сон и дофамин.
⚪️ AI как усилитель, а не серебряная пуля
Текущая реальность такова, что модели усиливают те процессы, которые у вас уже есть, и если внутри всё устроено плохо, AI ответственно масштабирует этот бардак.
Разберём, почему так получается и что с этим делать.
⚪️ SDLC-пайплайн и теория ограничений
ИИ очень быстро пишет код, но ревью, QA, релизы и поддержка почему-то быстрее не становятся.
Обсудим на пальцах, почему ускорение одной лишь разработки почти всегда приводит к росту техдолга и инцидентов, и как помогают CI/CD, тесты, платформенная инженерия и адекватные метрики.
⚪️ Организационные паттерны: пилоты и микростартапы внутри компании
Как запускать маленькие команды-пилоты, где AI присутствует на всех этапах SDLC - от постановки задачи до деплоя.
Какие задачи и куски продукта подходят для экспериментов, а какие лучше не трогать, пока вы не готовы к приключениям.
Почему иногда лучше заняться распилом монолита и процессами, а не прикручиванием агента к Jira.
⚪️ Диффузия ролей: PM пишет код, QA обучает агента
Границы ролей размываются: продакт, который сам собирает прототипы на агентах; разработчик, который больше думает про архитектуру и верификацию, чем про ручной кодинг; QA, который пишет автотесты вместе с LLM.
Как может выглядеть команда, где каждый аугментирован ИИ, и какие навыки в таком мире становятся базовыми.
⚪️ Shadow AI и внедрение снизу
"Теневой ИИ" уже есть почти в каждой компании: люди втихую пользуются моделями, даже если это не одобряется.
Как с этим жить руководителям, как не убить инициативу энтузиастов, и почему попытки внедрить AI "сверху" нередко проваливаются.
⚪️ Новые метрики: от идеи до продакшена, а не от промпта до коммита
Важнее не то, как быстро агент написал код, а то, за сколько идея доехала до пользователя и насколько часто это всё падает.
Где AI действительно помогает, а где только создаёт иллюзию прогресса.
—
Если вам это всё созвучно - оставайтесь на связи, и можно просто ждать постов :)
Если по дороге хочется поделиться своими болями и кейсами про внедрение AI в разработку - скидывайте в комменты и личку, подходящие постараюсь вплести в серию.
И если хочется, чтобы что-то было раскрыто более полно или какие-то темы я пропустил - тоже дайте знать.
—
А, и one more thing - на следующей неделе будет живой доклад, затрагивающий часть из этих тем, подробности чуть позже :)
#ai #sdlc #management
3👍51🔥34❤10🎉2👏1
А вот и анонс живого доклада в следующий четверг, 11 декабря:
Неделя про AI-инструменты для руководителей и бизнеса от Стратоплана & со
2025-й стал, пожалуй, первым годом, когда AI массово начали внедрять в организации и процессы и все вы наверняка можете вспомнить пару громких новостей про результаты таких внедрений.
И это норма - сфера принципиально новая, очень горячая, но однако тут уже есть первые успешные практики, наработанные сообществом.
—
Потому Стратоплан и спикеры AI Dev объединились вместе, чтобы:
– показать AI инструменты для руководителей на практике, а также разобрать модель – GenAI Orchestrated Augmented Leader
– показать, как организовывать работу сотрудников с нейросетями, чтобы это было эффективно
– разобрать несколько кейсов внедрения в бизнес: что сработало, что провалилось и почему;
– рассмотрят форматы внедрения и дадут чек-лист самых популярных проблем на пути (конечно, с решениями)
Когда: с 8 по 12 декабря, с 16:00 до 17:00 GMT+3
Формат — каждый день, по одному часу и инструменту для решения ваших текущих задач
Бесплатно и без всяких скрытых оплат по ссылке здесь: https://stratoplan-school.com/marathon/etih/
—
11 декабря, 16:00 MSK - буду рассказывать про особенности внедрения AI в организации "сверху" и "снизу", и о том, какие сложности возникают в каждом из случаев.
Попробуем найти варианты того, как свести вместе инициативу и возможности.
Приходите!
#live #conference #announcement
Неделя про AI-инструменты для руководителей и бизнеса от Стратоплана & со
2025-й стал, пожалуй, первым годом, когда AI массово начали внедрять в организации и процессы и все вы наверняка можете вспомнить пару громких новостей про результаты таких внедрений.
И это норма - сфера принципиально новая, очень горячая, но однако тут уже есть первые успешные практики, наработанные сообществом.
—
Потому Стратоплан и спикеры AI Dev объединились вместе, чтобы:
– показать AI инструменты для руководителей на практике, а также разобрать модель – GenAI Orchestrated Augmented Leader
– показать, как организовывать работу сотрудников с нейросетями, чтобы это было эффективно
– разобрать несколько кейсов внедрения в бизнес: что сработало, что провалилось и почему;
– рассмотрят форматы внедрения и дадут чек-лист самых популярных проблем на пути (конечно, с решениями)
Когда: с 8 по 12 декабря, с 16:00 до 17:00 GMT+3
Формат — каждый день, по одному часу и инструменту для решения ваших текущих задач
Бесплатно и без всяких скрытых оплат по ссылке здесь: https://stratoplan-school.com/marathon/etih/
—
11 декабря, 16:00 MSK - буду рассказывать про особенности внедрения AI в организации "сверху" и "снизу", и о том, какие сложности возникают в каждом из случаев.
Попробуем найти варианты того, как свести вместе инициативу и возможности.
Приходите!
#live #conference #announcement
👍31🔥22❤13👏1👌1