Погонял. Модель реально крутая.
Первая моделька которая по описанию задачи и предложенному диффу кода смогла предсказать как этот дифф будет работать и какие там (уже) есть ошибки. Гемини у меня в таком сценарии стабильно давал ложноположительные ответы ("все хорошо", когда оно не хорошо)
Жду не дождусь начать юзать ее через апи, без курсоровских ограничений по контексту.
Первая моделька которая по описанию задачи и предложенному диффу кода смогла предсказать как этот дифф будет работать и какие там (уже) есть ошибки. Гемини у меня в таком сценарии стабильно давал ложноположительные ответы ("все хорошо", когда оно не хорошо)
Жду не дождусь начать юзать ее через апи, без курсоровских ограничений по контексту.
2💯11⚡8❤5👍2
Самая лучшая аналогия про ЛЛМ была у Карпатого.
Он говорит, что это духи людей. Представьте вы занимаетесь спиритизмом и вызываете духа. И вы можете ему сказать ровно одну фразу, и он вам выдаст ответ.
Это ЛЛМ.
Вызываете еще раз — и дух не помнит общения с вами, так как он дух, нечем ему помнить. Но вы можете сказать ему, что вы общались, и он ответит вам как будто вы с ним общались.
Ровно таким образом работают 100% современных ЛЛМ. Очень наглядная аналогия.
Он говорит, что это духи людей. Представьте вы занимаетесь спиритизмом и вызываете духа. И вы можете ему сказать ровно одну фразу, и он вам выдаст ответ.
Это ЛЛМ.
Вызываете еще раз — и дух не помнит общения с вами, так как он дух, нечем ему помнить. Но вы можете сказать ему, что вы общались, и он ответит вам как будто вы с ним общались.
Ровно таким образом работают 100% современных ЛЛМ. Очень наглядная аналогия.
2😁28👍5🙈4
Из меня охеренный продакт-менеджер, так что даже не было документации как работать с моим самым популярным продуктом 😂 Ридмишка была сделана один раз и практически не отъебись.
Благодарные читатели выручили объяснением пайплайна, за что им огромное спасибо 🙂 Я работаю именно так.
Благодарные читатели выручили объяснением пайплайна, за что им огромное спасибо 🙂 Я работаю именно так.
❤1
Forwarded from Sergey Ros
Привет 👋 В Шотгане есть три (на самом деле четыре) промпта на выбор: Dev, Architect, Find Bug.
Сперва я описываю верхнеуровнево задачу, выбираю режим архитектора. Итоговый промпт кидаю в Gemini Pro с температурой 0.1.
Читаю результат, проверяю на адекватность. Если вижу, что нейронку увело не туда, то переписываю изначальную задачу и заново кидаю обновленный промпт в новый чат.
В конце результата архитектора часто есть 7 пункт Open Questions. Там идут вопросы для уточнения с предположениями от нейронки. На них я отвечаю прямо в чате AI Studio Гугла. В ответ получаю снова ответ по форме с учётом ответов.
Итоговый ответ архитектора закидываю уже как промпт в Шотган и меняю режим на Dev. Вставляю получившийся промпт в новый чат Ai studio, тоже с температурой 0.1.
Дальше уже получаю итоговый код, его сперва проверяю по диагонали, чтобы убедиться, что все задачи учтены. А потом уже при переносе в редактор проверяю тщательно
Сперва я описываю верхнеуровнево задачу, выбираю режим архитектора. Итоговый промпт кидаю в Gemini Pro с температурой 0.1.
Читаю результат, проверяю на адекватность. Если вижу, что нейронку увело не туда, то переписываю изначальную задачу и заново кидаю обновленный промпт в новый чат.
В конце результата архитектора часто есть 7 пункт Open Questions. Там идут вопросы для уточнения с предположениями от нейронки. На них я отвечаю прямо в чате AI Studio Гугла. В ответ получаю снова ответ по форме с учётом ответов.
Итоговый ответ архитектора закидываю уже как промпт в Шотган и меняю режим на Dev. Вставляю получившийся промпт в новый чат Ai studio, тоже с температурой 0.1.
Дальше уже получаю итоговый код, его сперва проверяю по диагонали, чтобы убедиться, что все задачи учтены. А потом уже при переносе в редактор проверяю тщательно
Please open Telegram to view this post
VIEW IN TELEGRAM
👍19
Короче, идейка.
Ставим на комп софтинку, которая цепляется к Chrome, открывает Google AI Studio (или любую другую бесплатную браузерную песочницу) и начинает доить её запросами.
Агент подсовывает промпты на фоне пока ты листаешь мемасы. Я поресерчил, реально сделать.
Утилизируем эти промпты и ответы в новом Шотгане который представляет собой автономного прогера, что-то типа claude code 😎 Благодаря чему он работает как full-capable агент без всяких ключиков.
Профит: вместо того чтобы жечь деньги на токены, мы фармим щедрые офферы гугла и других браузерных тулов.
Думаю по-серьезке такое сделать, чтобы индусы поставили мне звездочек на гитхабе.
Че как идея, лайк?
Ставим на комп софтинку, которая цепляется к Chrome, открывает Google AI Studio (или любую другую бесплатную браузерную песочницу) и начинает доить её запросами.
Агент подсовывает промпты на фоне пока ты листаешь мемасы. Я поресерчил, реально сделать.
Утилизируем эти промпты и ответы в новом Шотгане который представляет собой автономного прогера, что-то типа claude code 😎 Благодаря чему он работает как full-capable агент без всяких ключиков.
Профит: вместо того чтобы жечь деньги на токены, мы фармим щедрые офферы гугла и других браузерных тулов.
Думаю по-серьезке такое сделать, чтобы индусы поставили мне звездочек на гитхабе.
Че как идея, лайк?
1👍37👎6✍4😁2
Что по шотгану? Ну вот буквально сегодня научил его наконец кодить. За кадром сканирование реп, менеджмент тасок и так далее, там чего-то дофига всего выходит.
Но просто хочу поделиться тем что есть.
https://www.loom.com/share/7a0fa8ec773d4ee39b50384d4e963bab?sid=f41becc2-2c5a-4f42-925b-7b02b530bd95
Но просто хочу поделиться тем что есть.
https://www.loom.com/share/7a0fa8ec773d4ee39b50384d4e963bab?sid=f41becc2-2c5a-4f42-925b-7b02b530bd95
Loom
RepoArchitect - 8 August 2025
2👍22🔥5
Не понимаю тех, кто не любит хороший срач. Споры с незнакомцами в интернете отлично будоражат кровь и продлевают молодость 😁
🥰14😁11
Forwarded from Gleb Kudryavtcev
Я пробовал большинство известных и популярных языков, и скажу что тулинг хуже чем у джавы только в js/ts
😁12😢3❤🔥1
Посмотрел как у OpenAI Codex происходит формирование промптов. Что могу сказать — процесс сделан максимально через жопу.
Правильный процесс (например, Шотган 😎)
Системный промпт представляет собой шаблон, куда вкладываются другие промпты и куски контекста. Получается такая композиция top-down. Примерно так формируются веб-странички в современных фреймворках, так должны делаться и промпты для ЛЛМ. Удобно, наглядно, сразу видно, что получится в итоге.
Codex.
Финальный промпт собирается в коде без какой-либо шаблонизации. В итоге результат максимально неясен, ибо зарыт где-то в недрах растовского кода.
Итого: максимальный незачет, не делайте промпты без шаблонизатора. Если вам нужно забить гвоздь, то нужно найти молоток, а не пытаться делать это бревном.
Правильный процесс (например, Шотган 😎)
Системный промпт представляет собой шаблон, куда вкладываются другие промпты и куски контекста. Получается такая композиция top-down. Примерно так формируются веб-странички в современных фреймворках, так должны делаться и промпты для ЛЛМ. Удобно, наглядно, сразу видно, что получится в итоге.
Codex.
Финальный промпт собирается в коде без какой-либо шаблонизации. В итоге результат максимально неясен, ибо зарыт где-то в недрах растовского кода.
Итого: максимальный незачет, не делайте промпты без шаблонизатора. Если вам нужно забить гвоздь, то нужно найти молоток, а не пытаться делать это бревном.
🔥17😁4🤡2❤1
Почему я пишу все свои проекты на Mongo
1) Я не хочу отдавать бабки дяде из облаков, поэтому вариант облачной БД отпадает. Supabase пока пока.
2) Важный и единственный выбор это на самом деле SQL vs NoSQL. Ну и внутри них допустим, еще свои разновидности.
И вот тут какая-нибудь постгря выглядит мощнее. Казалось бы, бери да пользуйся.
Но на деле SQL базы удобны только когда ты хорошо заранее спроектировал модель данных и хорошо понимаешь что куда и зачем.
Это полностью противоречит концепции индихакерства, когда обычно ты нихера не знаешь что куда и зачем, а так же на что будет похож твой проект через десяток итераций 🙂
Монга же идеальный вариант наговнякать чтобы протестить. А если оно будет загибаться от нагрузок, значит у тебя уже редкий успех и ты идешь просто все переписывать с командой разрабов хоть на чем. Хоть на той же постгре.
Очень удобно в монго, например, сохранять состояния агентов. Вообще не нужно думать заранее что и как — все модели сделаешь и засунешь туда по ходу разработки приложения.
Наговнякать же на SQL не выйдет — тебя тупо похоронит поток миграций в которых кое-как но нужно разбираться, если ты не хочешь каждые 5 минут терять все свои данные.
PS Для эмбеда и всяких однопользовательских плагинов же нет ничего лучше SQLite. Ее можно юзать как свалку документов, и тулинг гораздо проще постгри. Очень благодатная штука, если у вас проект на одного пользователя.
PSS Если вам файлики хранить, то берите комплектном к монге S3-совместимое хранилище, например Minio, его вам за глаза хватит, совместимо с любыми серьезными облачными провайдерами, если понадобится переехать.
1) Я не хочу отдавать бабки дяде из облаков, поэтому вариант облачной БД отпадает. Supabase пока пока.
2) Важный и единственный выбор это на самом деле SQL vs NoSQL. Ну и внутри них допустим, еще свои разновидности.
И вот тут какая-нибудь постгря выглядит мощнее. Казалось бы, бери да пользуйся.
Но на деле SQL базы удобны только когда ты хорошо заранее спроектировал модель данных и хорошо понимаешь что куда и зачем.
Это полностью противоречит концепции индихакерства, когда обычно ты нихера не знаешь что куда и зачем, а так же на что будет похож твой проект через десяток итераций 🙂
Монга же идеальный вариант наговнякать чтобы протестить. А если оно будет загибаться от нагрузок, значит у тебя уже редкий успех и ты идешь просто все переписывать с командой разрабов хоть на чем. Хоть на той же постгре.
Очень удобно в монго, например, сохранять состояния агентов. Вообще не нужно думать заранее что и как — все модели сделаешь и засунешь туда по ходу разработки приложения.
Наговнякать же на SQL не выйдет — тебя тупо похоронит поток миграций в которых кое-как но нужно разбираться, если ты не хочешь каждые 5 минут терять все свои данные.
PS Для эмбеда и всяких однопользовательских плагинов же нет ничего лучше SQLite. Ее можно юзать как свалку документов, и тулинг гораздо проще постгри. Очень благодатная штука, если у вас проект на одного пользователя.
PSS Если вам файлики хранить, то берите комплектном к монге S3-совместимое хранилище, например Minio, его вам за глаза хватит, совместимо с любыми серьезными облачными провайдерами, если понадобится переехать.
👍33❤15👎2😨1
Код, отвечающий за обработку статуса applying_changes, находится внутри основного цикла агента (_run_agent_loop), но точка входа (метод run) запускает этот цикл только если статус сессии — RUNNING. Это создаёт ситуацию «Уловка-22», при которой код обработки недостижим именно тогда, когда он нужен больше всего.
У агента веселое настроение, и он сослался при анализе кода на фильм Уловка-22. Классический пример такой уловки хорошо знают европейские понаехи — тебя могут прописать, но для этого нужен банковский аккаунт, но банковский аккаунт не дают без прописки.
Считаю, прекрасно. Ну и зачем нужны эти кожаные, а?
😁11🔥4
Слушайте, вопрос—вброс. А чего все псят на gpt-5 кроме чисто продуктового факапа с переключением моделей?
Их топовая thinking модель бескомпромиссный лидер в кодинге. На всех моих задачах она рвет как тузик что соннет что прошку от гугла.
Контекста в 272к с индексацией очень даже хватает. Стоит разумных денег.
Ну медленная чуток, но зато за ней нужно очень мало переделывать.
Чем вы недовольны-то? 🙂
Их топовая thinking модель бескомпромиссный лидер в кодинге. На всех моих задачах она рвет как тузик что соннет что прошку от гугла.
Контекста в 272к с индексацией очень даже хватает. Стоит разумных денег.
Ну медленная чуток, но зато за ней нужно очень мало переделывать.
Чем вы недовольны-то? 🙂
🔥17👍10
Идейка. Вы кидаете донат 5к/месяц, а я стримлю свою работу, как я пишу код — 2 часа в неделю по вечерам после 21 мск. Прям по-честному максимально, мои реальные проекты и все как я делаю. По ходу буду в войсе и на ваши вопросы отвечать.
Пишите в каментах плюсики, наберется с десяток — открою платежную формочку 😎
Пишите в каментах плюсики, наберется с десяток — открою платежную формочку 😎
1😁34👎4😎3❤2🔥1💩1🤝1
Короче у меня сегодня агенты срались между собой, ревьюер буллил кодера, было очень смешно читать лог.
Вообще, рекомендую всегда подключать ревьюера. Много ошибок вытаскивает, ванильные кодгены ленятся писать весь код и забивают на часть реализации, ревьюер этого не позволяет.
Gpt-5 в этой роли очень хорош, первая модель на моем опыте, которая хорошо понимает диффы и не просто с ними соглашается, а реально вникает в логику
Вообще, рекомендую всегда подключать ревьюера. Много ошибок вытаскивает, ванильные кодгены ленятся писать весь код и забивают на часть реализации, ревьюер этого не позволяет.
Gpt-5 в этой роли очень хорош, первая модель на моем опыте, которая хорошо понимает диффы и не просто с ними соглашается, а реально вникает в логику
❤18👍15🔥2
Глеб Кудрявцев про AI кодинг
Идейка. Вы кидаете донат 5к/месяц, а я стримлю свою работу, как я пишу код — 2 часа в неделю по вечерам после 21 мск. Прям по-честному максимально, мои реальные проекты и все как я делаю. По ходу буду в войсе и на ваши вопросы отвечать. Пишите в каментах…
Ну что, десять плюсиков набрали, открываю формочку 👍
За 5 т.р. в месяц показываю свой реальный рабочий процесс по кодингу, как я делаю фичи в шотгане и не только, обсуждаю это с вами в процессе.
https://careerfactory.ru/gleb-ai
После оплаты не закрывайте страницу, будет ссылка в закрытую группу. Туда я буду кидать ссылки на зум, постараюсь делать это максимально часто когда работаю (прям с сегодняшнего дня) + со следующей недели заведем постоянное расписание.
За 5 т.р. в месяц показываю свой реальный рабочий процесс по кодингу, как я делаю фичи в шотгане и не только, обсуждаю это с вами в процессе.
https://careerfactory.ru/gleb-ai
После оплаты не закрывайте страницу, будет ссылка в закрытую группу. Туда я буду кидать ссылки на зум, постараюсь делать это максимально часто когда работаю (прям с сегодняшнего дня) + со следующей недели заведем постоянное расписание.
❤4
Я внезапно понял, что пока писал новый шотган у меня уже почти получился lovable 😂
Показывал сегодня на стриме — у меня в облаке крутится сервак с движком. Засасывает туда гит репу, делает таски с помощью ллм-ок, а далее коммитит изменения обратно.
Добавить туда виртуалку чтобы могла рендерить какие-нибудь веб проекты и привет, вот тебе и современный вайбкод билдер сайтов.
Понять только не могу, кому и зачем это могло бы понадобиться. Не перевариваю такие конструкторы, но может просто не ЦА.
Показывал сегодня на стриме — у меня в облаке крутится сервак с движком. Засасывает туда гит репу, делает таски с помощью ллм-ок, а далее коммитит изменения обратно.
Добавить туда виртуалку чтобы могла рендерить какие-нибудь веб проекты и привет, вот тебе и современный вайбкод билдер сайтов.
Понять только не могу, кому и зачем это могло бы понадобиться. Не перевариваю такие конструкторы, но может просто не ЦА.
❤14👍7🔥6
Интересный юзкейс для скана репозитория — помощник в написании требований
Смотрите как самый обычный GPT отвечает на вопрос "
https://chatgpt.com/share/689ddb8e-60a4-8004-8c24-6465e7ee9fff
Ориентируется в онтологии и уже реализованных фичах, предлагает полноценный план охватывающий не только технику, но и бизнес.
Для сравнения — тот же ответ в курсоре. Очень технический и производит впечатление полного, но на самом деле куча деталей некорректна и "обобщена", т.е. не относится к моему приложению.
https://gist.github.com/glebkudr/3156feda883b5f66d113b746ddeb5a12
Секрет в глубине и технике сканирования — подготовки данных, на основе которой мы конструируем ответы.
С помощью этой техники можно писать
— Продуктовые требования
— Тест-планы
— Архитектурные спеки
— Проводить ревью предложений на полноту/краевые случаи
Если вам/вашей компании интересно начать писать бизнес-требования или приведенные выше документы через мой сервис — пишите, подпишем NDA, сделаем вам скан кода, и попробуем в работе.
Смотрите как самый обычный GPT отвечает на вопрос "
как мне на основе приложения сделать конструктор телеграмм-ботов?", если ему просто подкинуть в контекст результат сканирования приложения, даже не обвязывая специальным промптом на крутую архитектуру.https://chatgpt.com/share/689ddb8e-60a4-8004-8c24-6465e7ee9fff
Ориентируется в онтологии и уже реализованных фичах, предлагает полноценный план охватывающий не только технику, но и бизнес.
Для сравнения — тот же ответ в курсоре. Очень технический и производит впечатление полного, но на самом деле куча деталей некорректна и "обобщена", т.е. не относится к моему приложению.
https://gist.github.com/glebkudr/3156feda883b5f66d113b746ddeb5a12
Секрет в глубине и технике сканирования — подготовки данных, на основе которой мы конструируем ответы.
С помощью этой техники можно писать
— Продуктовые требования
— Тест-планы
— Архитектурные спеки
— Проводить ревью предложений на полноту/краевые случаи
Если вам/вашей компании интересно начать писать бизнес-требования или приведенные выше документы через мой сервис — пишите, подпишем NDA, сделаем вам скан кода, и попробуем в работе.
🔥15
Попробовал Jules. Ну что могу сказать, мой шотган лучше 😂 Реально блин уже подписку нужно прикручивать и продавать, а не страдать фигней.
🔥21👍5💯2
Самое сложное в курсоре и подобных агентах вовсе не "придумать" код, а применить полученные диффы к файлам. Капец какая дурацкая и плохо формализуемая процедура. Я догадывался что такое может быть, но блин, там просто кроличья нора.
Почему диффы? Потому что генерить файлы целиком с нуля тяжело + чревато ошибками. Все кодинговые тулы внутри себя работают с диффами. Но там где-то 5-6 слоев обработки сверху и страховок через дополнительные LLM вызовы, если что-то пошло не так.
Не так идет почти всегда 😂
Не даром в курсоре натренировали собственную сетку чисто под эту задачу. Прекрасно их понимаю.
Почему диффы? Потому что генерить файлы целиком с нуля тяжело + чревато ошибками. Все кодинговые тулы внутри себя работают с диффами. Но там где-то 5-6 слоев обработки сверху и страховок через дополнительные LLM вызовы, если что-то пошло не так.
Не так идет почти всегда 😂
Не даром в курсоре натренировали собственную сетку чисто под эту задачу. Прекрасно их понимаю.
👍12