Глеб Кудрявцев про AI кодинг – Telegram
Глеб Кудрявцев про AI кодинг
6.7K subscribers
95 photos
14 videos
2 files
79 links
Пишу тулы для кодинга и упарываюсь по агентам.

Основной канал t.me/glebkudr
Личка t.me/glebkudr1
Download Telegram
Напомню, что сота в кодинге до сего дня были никакие не антропики, а o3 (просто под нее тулинг херовый и контекста маловато). По заявленным бенчам пятерка не хуже. Если правда, то это очень хорошая модель. А вот если хуже трешки, то катастрофа.
😁3👍1
Погонял. Модель реально крутая.

Первая моделька которая по описанию задачи и предложенному диффу кода смогла предсказать как этот дифф будет работать и какие там (уже) есть ошибки. Гемини у меня в таком сценарии стабильно давал ложноположительные ответы ("все хорошо", когда оно не хорошо)

Жду не дождусь начать юзать ее через апи, без курсоровских ограничений по контексту.
2💯1185👍2
Самая лучшая аналогия про ЛЛМ была у Карпатого.

Он говорит, что это духи людей. Представьте вы занимаетесь спиритизмом и вызываете духа. И вы можете ему сказать ровно одну фразу, и он вам выдаст ответ.

Это ЛЛМ.

Вызываете еще раз — и дух не помнит общения с вами, так как он дух, нечем ему помнить. Но вы можете сказать ему, что вы общались, и он ответит вам как будто вы с ним общались.

Ровно таким образом работают 100% современных ЛЛМ. Очень наглядная аналогия.
2😁28👍5🙈4
Из меня охеренный продакт-менеджер, так что даже не было документации как работать с моим самым популярным продуктом 😂 Ридмишка была сделана один раз и практически не отъебись.

Благодарные читатели выручили объяснением пайплайна, за что им огромное спасибо 🙂 Я работаю именно так.
1
Forwarded from Sergey Ros
Привет 👋 В Шотгане есть три (на самом деле четыре) промпта на выбор: Dev, Architect, Find Bug.

Сперва я описываю верхнеуровнево задачу, выбираю режим архитектора. Итоговый промпт кидаю в Gemini Pro с температурой 0.1.

Читаю результат, проверяю на адекватность. Если вижу, что нейронку увело не туда, то переписываю изначальную задачу и заново кидаю обновленный промпт в новый чат.

В конце результата архитектора часто есть 7 пункт Open Questions. Там идут вопросы для уточнения с предположениями от нейронки. На них я отвечаю прямо в чате AI Studio Гугла. В ответ получаю снова ответ по форме с учётом ответов.

Итоговый ответ архитектора закидываю уже как промпт в Шотган и меняю режим на Dev. Вставляю получившийся промпт в новый чат Ai studio, тоже с температурой 0.1.

Дальше уже получаю итоговый код, его сперва проверяю по диагонали, чтобы убедиться, что все задачи учтены. А потом уже при переносе в редактор проверяю тщательно
Please open Telegram to view this post
VIEW IN TELEGRAM
👍19
Короче, идейка.

Ставим на комп софтинку, которая цепляется к Chrome, открывает Google AI Studio (или любую другую бесплатную браузерную песочницу) и начинает доить её запросами.
Агент подсовывает промпты на фоне пока ты листаешь мемасы. Я поресерчил, реально сделать.

Утилизируем эти промпты и ответы в новом Шотгане который представляет собой автономного прогера, что-то типа claude code 😎 Благодаря чему он работает как full-capable агент без всяких ключиков.

Профит: вместо того чтобы жечь деньги на токены, мы фармим щедрые офферы гугла и других браузерных тулов.

Думаю по-серьезке такое сделать, чтобы индусы поставили мне звездочек на гитхабе.

Че как идея, лайк?
1👍37👎64😁2
Что по шотгану? Ну вот буквально сегодня научил его наконец кодить. За кадром сканирование реп, менеджмент тасок и так далее, там чего-то дофига всего выходит.

Но просто хочу поделиться тем что есть.

https://www.loom.com/share/7a0fa8ec773d4ee39b50384d4e963bab?sid=f41becc2-2c5a-4f42-925b-7b02b530bd95
2👍22🔥5
Не понимаю тех, кто не любит хороший срач. Споры с незнакомцами в интернете отлично будоражат кровь и продлевают молодость 😁
🥰14😁11
Forwarded from Gleb Kudryavtcev
Я пробовал большинство известных и популярных языков, и скажу что тулинг хуже чем у джавы только в js/ts
😁12😢3❤‍🔥1
Посмотрел как у OpenAI Codex происходит формирование промптов. Что могу сказать — процесс сделан максимально через жопу.

Правильный процесс (например, Шотган 😎)
Системный промпт представляет собой шаблон, куда вкладываются другие промпты и куски контекста. Получается такая композиция top-down. Примерно так формируются веб-странички в современных фреймворках, так должны делаться и промпты для ЛЛМ. Удобно, наглядно, сразу видно, что получится в итоге.

Codex.
Финальный промпт собирается в коде без какой-либо шаблонизации. В итоге результат максимально неясен, ибо зарыт где-то в недрах растовского кода.

Итого: максимальный незачет, не делайте промпты без шаблонизатора. Если вам нужно забить гвоздь, то нужно найти молоток, а не пытаться делать это бревном.
🔥17😁4🤡21
Почему я пишу все свои проекты на Mongo

1) Я не хочу отдавать бабки дяде из облаков, поэтому вариант облачной БД отпадает. Supabase пока пока.
2) Важный и единственный выбор это на самом деле SQL vs NoSQL. Ну и внутри них допустим, еще свои разновидности.

И вот тут какая-нибудь постгря выглядит мощнее. Казалось бы, бери да пользуйся.

Но на деле SQL базы удобны только когда ты хорошо заранее спроектировал модель данных и хорошо понимаешь что куда и зачем.

Это полностью противоречит концепции индихакерства, когда обычно ты нихера не знаешь что куда и зачем, а так же на что будет похож твой проект через десяток итераций 🙂

Монга же идеальный вариант наговнякать чтобы протестить. А если оно будет загибаться от нагрузок, значит у тебя уже редкий успех и ты идешь просто все переписывать с командой разрабов хоть на чем. Хоть на той же постгре.

Очень удобно в монго, например, сохранять состояния агентов. Вообще не нужно думать заранее что и как — все модели сделаешь и засунешь туда по ходу разработки приложения.

Наговнякать же на SQL не выйдет — тебя тупо похоронит поток миграций в которых кое-как но нужно разбираться, если ты не хочешь каждые 5 минут терять все свои данные.

PS Для эмбеда и всяких однопользовательских плагинов же нет ничего лучше SQLite. Ее можно юзать как свалку документов, и тулинг гораздо проще постгри. Очень благодатная штука, если у вас проект на одного пользователя.

PSS Если вам файлики хранить, то берите комплектном к монге S3-совместимое хранилище, например Minio, его вам за глаза хватит, совместимо с любыми серьезными облачными провайдерами, если понадобится переехать.
👍3315👎2😨1
Код, отвечающий за обработку статуса applying_changes, находится внутри основного цикла агента (_run_agent_loop), но точка входа (метод run) запускает этот цикл только если статус сессии — RUNNING. Это создаёт ситуацию «Уловка-22», при которой код обработки недостижим именно тогда, когда он нужен больше всего.


У агента веселое настроение, и он сослался при анализе кода на фильм Уловка-22. Классический пример такой уловки хорошо знают европейские понаехи — тебя могут прописать, но для этого нужен банковский аккаунт, но банковский аккаунт не дают без прописки.
Считаю, прекрасно. Ну и зачем нужны эти кожаные, а?
😁11🔥4
Незначительная деталь для вас, историческая веха для Шотгана

Первый полностью автоматизированный коммит 😎
10🔥36👍13🤩41🤡1
Слушайте, вопрос—вброс. А чего все псят на gpt-5 кроме чисто продуктового факапа с переключением моделей?

Их топовая thinking модель бескомпромиссный лидер в кодинге. На всех моих задачах она рвет как тузик что соннет что прошку от гугла.

Контекста в 272к с индексацией очень даже хватает. Стоит разумных денег.

Ну медленная чуток, но зато за ней нужно очень мало переделывать.

Чем вы недовольны-то? 🙂
🔥17👍10
Идейка. Вы кидаете донат 5к/месяц, а я стримлю свою работу, как я пишу код — 2 часа в неделю по вечерам после 21 мск. Прям по-честному максимально, мои реальные проекты и все как я делаю. По ходу буду в войсе и на ваши вопросы отвечать.

Пишите в каментах плюсики, наберется с десяток — открою платежную формочку 😎
1😁34👎4😎32🔥1💩1🤝1
Короче у меня сегодня агенты срались между собой, ревьюер буллил кодера, было очень смешно читать лог.

Вообще, рекомендую всегда подключать ревьюера. Много ошибок вытаскивает, ванильные кодгены ленятся писать весь код и забивают на часть реализации, ревьюер этого не позволяет.

Gpt-5 в этой роли очень хорош, первая модель на моем опыте, которая хорошо понимает диффы и не просто с ними соглашается, а реально вникает в логику
18👍15🔥2
Глеб Кудрявцев про AI кодинг
Идейка. Вы кидаете донат 5к/месяц, а я стримлю свою работу, как я пишу код — 2 часа в неделю по вечерам после 21 мск. Прям по-честному максимально, мои реальные проекты и все как я делаю. По ходу буду в войсе и на ваши вопросы отвечать. Пишите в каментах…
Ну что, десять плюсиков набрали, открываю формочку 👍

За 5 т.р. в месяц показываю свой реальный рабочий процесс по кодингу, как я делаю фичи в шотгане и не только, обсуждаю это с вами в процессе.

https://careerfactory.ru/gleb-ai

После оплаты не закрывайте страницу, будет ссылка в закрытую группу. Туда я буду кидать ссылки на зум, постараюсь делать это максимально часто когда работаю (прям с сегодняшнего дня) + со следующей недели заведем постоянное расписание.
4
Будем медленно печально спускаться с горы. сегодня в 22 начнем.
Ща вот линтеры в шотгане мучаю и стратегию применения git diff (а то долго чего-то) — велкам на эти зажигательные темы 😁
18
Я внезапно понял, что пока писал новый шотган у меня уже почти получился lovable 😂

Показывал сегодня на стриме — у меня в облаке крутится сервак с движком. Засасывает туда гит репу, делает таски с помощью ллм-ок, а далее коммитит изменения обратно.

Добавить туда виртуалку чтобы могла рендерить какие-нибудь веб проекты и привет, вот тебе и современный вайбкод билдер сайтов.

Понять только не могу, кому и зачем это могло бы понадобиться. Не перевариваю такие конструкторы, но может просто не ЦА.
14👍7🔥6
Интересный юзкейс для скана репозитория — помощник в написании требований

Смотрите как самый обычный GPT отвечает на вопрос "как мне на основе приложения сделать конструктор телеграмм-ботов?", если ему просто подкинуть в контекст результат сканирования приложения, даже не обвязывая специальным промптом на крутую архитектуру.

https://chatgpt.com/share/689ddb8e-60a4-8004-8c24-6465e7ee9fff

Ориентируется в онтологии и уже реализованных фичах, предлагает полноценный план охватывающий не только технику, но и бизнес.

Для сравнения — тот же ответ в курсоре. Очень технический и производит впечатление полного, но на самом деле куча деталей некорректна и "обобщена", т.е. не относится к моему приложению.

https://gist.github.com/glebkudr/3156feda883b5f66d113b746ddeb5a12

Секрет в глубине и технике сканирования — подготовки данных, на основе которой мы конструируем ответы.

С помощью этой техники можно писать
— Продуктовые требования
— Тест-планы
— Архитектурные спеки
— Проводить ревью предложений на полноту/краевые случаи

Если вам/вашей компании интересно начать писать бизнес-требования или приведенные выше документы через мой сервис — пишите, подпишем NDA, сделаем вам скан кода, и попробуем в работе.
🔥15