Записки C3PO – Telegram
Записки C3PO
5.08K subscribers
70 photos
5 videos
225 links
Product Director @ T-Bank AI, ex. YouDo

Пишу о Product & People Management, AI, своих наблюдениях и прочих бесполезных вещах.
Download Telegram
Forwarded from nonamevc
почему «Cursor для x» это тупая идея

даже если питч разбавлен штампами вроде «AI-first», «AI это усиление, а не замена» и «UX for context engineering is our moat», все понимают, что примитив «Cursor для x» нужен, чтобы в голове собеседника сразу возник график «вырастим до $200m ARR за три года».

но переносить модель Cursor в другие вертикали бессмысленно, потому что ни в одной вертикали нет полного набора условий, сделавших Cursor успешным.

1/ продуктивность производства софта пока ещё никак не сказалась на его марже

думаю, у каждого найдётся бро, который одновременно работает на 2.5 работах (возможно, дорогой читатель, это вы). Cursor обходится ему примерно в $100 в месяц, а с трёх зарплат он поднимает около $20к в месяц.

несмотря на все стенания «AI забирает работу у разработчиков», мы наблюдаем один из лучших арбитражей последних лет: маржа софта пока не сжалась. ну и кажется это логично: разработчик закрыл тикет быстрее и с меньшими ресурсами→ фича вышла раньше → продукт зарабатывает.

первый лакмус: какие вертикали дают конечным операторам такой же арбитраж, который превращает $20 хотя бы в $2k?

2/ девелоперы и новый TAM

для многих инженеров AI-coding — лучшее, что с ними случалось. но большинство бухгалтеров не просыпаются с мыслью «как бы переизобрести процессы». их старая схема работает, и ценность AI не всегда растёт линейно вместе с зарплатой. ну или попробуйте выпустить вирусный ролик на Youtube «I automated HR policy with "Cursor for HR" and Made $100K in 15 Minutes».

дев-агенты сделали больше, чем ускорили программистов: они позволили не-программистам собирать продукт, зафиксировав самую большую экспансию tam в истории софта.

задача на подумать - в какой вертикали AI способен разрушить привычную логистику создания ценности в плоскости тайтлов.

3/ IDE это отдельный стандартизированный апп

Cursor не просто «плагин к VS Code». он опираются на открытый движок и экосистему расширений. чтобы добавить агента, который подставит код, достаточно вызвать пару хуков, дальше вся инфраструктура (lsp, дебаггер, source-control) уже готова. и даже при том, что VS Code был не самым популярным тулом в enterprise, переход с JetBrains был довольно безболезненный, потому что код хранится в удаленных репозиториях.

сравните это с CAD или BIM. в мире ArchiCAD и SolidWorks главный актив это бинарные форматы и двадцатилетние скрипты AutoLISP. сменить движок значит порвать обратную совместимость, потерять плагины, лишиться сертификаций.

тут отличие в том, что бухгалтер, HR и прочий бэк-офис работают в браузерных saas. и тут мне кажется в этом тезисе настоящая угроза идёт от самого браузера: ai-native браузеры обещают то же, что и вертикальные saas, но на «транспортном слое». если агент сидит внутри браузера и уже имеет доступ к кукам, сессиям и dom-структуре, зачем строить отдельные интеграции? браузер видит всё: форму сделки в HubSpot, счёт в QuickBooks, цепочку писем в Gmail.

понятно, что это случится не скоро, но главный point в том, что пока непонятно, какая среда окажется оптимальной для вертикального saas.

4/ разработка = объективный, шаблонизированный процесс

AI-ассистенту сложно учиться, когда датасет обратной связи размазан на недели и состоит из субъективных оценок. для большинства вертикалей нет метки pass/fail; в коде агент может эволюционировать почти в real-time, а в бэк-офисе превращается в обычную форму автоматизации, нуждающуюся в ручном QA (хотя думаю, пока LLM не «видит» UI как AST, думаю это ок)

tldr; вводные успеха Cursor куда шире, чем context engineering.
не спорю, работу бэк-офисов и бухглатерорв нужно автоматизировать, но подход там должен быть иным во всем от интерфейсов и дизайна контекста до GTM.

без тех же вводных (стандартизированная среда, мгновенный фидбек, прямая связь с P&L, расширение TAM) этот «Cursor для x» станет обычным b2b-saas с длинным циклом продаж и скромным потолком роста.

что думаете?

P.S. я правда не думал много про сценарии, где сам Cursor используется для non-dev задач. но видел, как маркетологи с MCP-сервером неплохо решают свои задачи.
👍218🔥1
Прочитал «The Crux» Румельта в прошлом году - абсолютный маст рид для всех, кто занимается стратегией. Все время собирался написать про нее, но руки не доходили.

Это продолжение «Good Strategy Bad Strategy», где 13 лет назад автор сформулировал ядро хорошей стратегии: диагностика → руководящая политика → согласованные действия. Диагностика была первым пунктом, но в той книге ей уделялось не так много внимания.

«The Crux» целиком посвящен именно диагностике. Большинство стратегических провалов происходят из-за неправильной диагностики и локализации ключевого вызова.

Crux - от латинского «крест», в переносном смысле означает самый сложный, критический момент. В альпинизме так называют самый трудный участок восхождения. В стратегии это ключевой вызов, определяющая точка проблемы, узкое место всей системы. Найдешь его правильно - получишь максимальный эффект от любых действий. Промахнешься - будешь чинить симптомы до бесконечности.

Для меня это был естественный переход к теории ограничений, которую и так применяю в работе. Голдратт говорил то же самое: у любой системы есть одно критическое ограничение, и только работа с ним двигает всю систему вперед. Румельт просто перенес этот принцип на стратегию.

Методы поиска crux:

Румельт разбирает множество способов поиска crux: анализ узких мест, анализ противоречий, анализ властных структур, мышление от первых принципов, метод «пять почему», кластеризацию проблем, группировку симптомов, анализ каскадных эффектов, поиск общих знаменателей, анализ исключений, временной анализ.

Ключевые идеи:

- Цели должны быть следствием диагностики, а не отправной точкой. Сначала понимаешь проблему, потом ставишь цели.

- Рост - это следствие того, что компания делает что-то хорошо, а не самоцель. Когда рост становится целью сам по себе, начинается хаос.

- Crux часто находится не там, где его ищут изначально. Большинство людей фокусируются на симптомах, а не на причинах.

- Хороший crux-анализ требует интеллектуальной честности. Готовности признать, что изначальная гипотеза была неверной.

- Большинство организационных проблем - это проблемы диагностики, а не экзекюшна. Люди работают плохо не потому что ленивые или глупые, а потому что решают не те задачи.

- Crux часто лежит на стыке дисциплин. Поэтому важно смотреть на проблемы под разными углами.

Примеры из книги:

- Кейс с Starbucks в 2008 году. Все думали, что проблема в конкуренции с McDonald’s. Шульц диагностировал по-другому: компания потеряла душу, превратившись в обычную сеть общепита. Crux был в том, что баристы перестали быть кофейными экспертами, а стали операторами автоматов. Решение - не снижение цен, а возвращение кофейной культуры.

- Netflix в 2000-х. Многие видели проблему в конкуренции с Blockbuster за рынок проката DVD. Netflix диагностировал crux по-другому: проблема не в формате доставки дисков, а в том, что вся индустрия завязана на физических носителях. Настоящее узкое место - логистика и ограничения физического мира. Поэтому они сделали ставку на стриминг, когда технология еще только созревала.

Хорошее дополнение к первой книге для тех, кто хочет прокачать навык диагностики проблем. Особенно актуально в быстро меняющихся отраслях, где легко увлечься поверхностными решениями и пропустить корневые причины.​​​​​​​​​​​​​​​​
1👍5625🔥8😢2🎉1
Записки C3PO
Прочитал «The Crux» Румельта в прошлом году - абсолютный маст рид для всех, кто занимается стратегией. Все время собирался написать про нее, но руки не доходили. Это продолжение «Good Strategy Bad Strategy», где 13 лет назад автор сформулировал ядро хорошей…
Судя по комментариям к этому посту, канал надо закрывать. Нет знания, есть только рандом и ошибка выжившего. Остальное все переливание из пустого в порожнее
😁47💯10👍6😱3😎21🤔1
Не смотрел презу OpenAI. Уже давно воспринимаю их, как догоняющих и даже деградирующих. В целом, судя по новостям, не прогадал.

Пока Сама все больше и больше напоминает человека, который выбрал в качестве инструмента - пускание пыли в глаза, как, к примеру, в случае с недавней OSS моделью, которая абсолютно бесполезна.

Я в отпуске, поэтому это наиболее глубокая аналитика, на которую я способен. Простите!

P. S. Добавление чатов в избранное так и не завезли, похоже. А проекты все такие же бесполезные.
😁39👍13😢53😎3🔥2💯2👏1
Гоняю уже несколько часов gpt-5 на своих некодинг и нерабочих сценариях (их попозже). Прогресс относительно предыдущих моделей, конечно, есть. 4o все таки оч старая модель. Относительно о3 и конкурентов есть только одна разница и она существенная для меня.

Почти у всех моделей, кроме, пожалуй, gemini 2.5 pro, есть проблема - ты им что-то говоришь в диалоге типа «а что на счет Х?» и они начинают подыгрывать даже, если ты сказал абсолютную дичь: «да да, ты прав. Х это очень важно. Сейчас напишу тебе, как это делать с Х». Промпты и инструкции не всегда спасают от такого.

Так вот, gpt-5 с thinking ни разу мне не подыграл и всегда идет объективным курсом. А это прям важный поинт для меня, даже если в остальном она такая же, как все.
68🔥28👍14
Не мог понять вектор критики Whoop, который часто доводилось слышать как от знакомых, так и в интернете: «нужно платить за подписку». Не очень было понятно, почему это минус, если аналоги без подписки стоили как годовая или двухлетняя подписка Вупа с возможностью получать обновления устройства. За само устройство-то платить не нужно. Но я тут выяснил, что народ, в частности в Мск, покупает Вуп через посредников, которые берут за сам браслет цену годовой подписки, да ещё и ты сам потом вынужден подписку оплачивать 😳
Please open Telegram to view this post
VIEW IN TELEGRAM
👍17😁112💯1
Ну то есть продакты перекрыли входную карьерную воронку для разрабов, что приведет к их скорому вымиранию, как класса. Звучит будто разрабы это герой мема про велосипедиста с палкой в колесе.
😁53👍9👏2😢2💯1
Впервые ходил в отпуск вовремя и вырубал корпоративный мессенджер. Два ключевых наблюдения:
- ты весь отпуск на чиле и при этом есть энергия изучать локацию, тусить и вот это вот все, а не просто деградировать на пляже, так как ушел в отпуск, потому что не осталось сил работать.
- 66 пропущенных сообщений в корп месенджере. Никто не умер. Даже Гуф.
1🔥78😁21💯124
Кстати, придумал самый легкий тест на аутизм для взрослого человека. Работает, как швейцарские часы. Спрашиваешь, кто виноват в инфляции в России.

Обычно, ответ бывает двух типов:
- Набиуллина/ЦБ
- Какие то макрофакторы, рыночные обстоятельства, ликвидность, изменение денежной массы и тд. Короче, все остальное.

Не благодарите.
😁51🤔11👏5🤯1😢1
Прочитал эссе про «doomprompting» - новый вид зависимости от AI.

Автор описывает, как пустое поле ChatGPT из инструмента для мышления превратилось в бесконечную прокрутку мыслей. Промпты становятся короче, ответы длиннее, и вместо глубокого размышления получаются переговоры с компухтером, который постоянно предлагает «а давайте еще…», «может быть стоит…», «хотите, я добавлю…».

AI выдает что-то на 60% хорошее, человек начинает это редактировать и незаметно становится редактором чужого текста, а не автором своего. Часы такой «продуктивной» работы ощущаются как дело, но не дают ни прогресса, ни обучения.

Хорошее наблюдение про то, где AI полезен, а где нет. В начале (накидать идей) и в конце (проверить результат) - да. Но в середине, где живет суть аргумента - слаб. Когда люди просят целиком накидать документ или, к примеру, стратегию, получают красивую пустышку.

Автор предлагает «медленный AI» со встроенным сопротивлением. ChatGPT уже тестирует режим Study. С другой стороны, лимиты на использование, которые всех бесят, случайно делают правильную вещь - заставляют остановиться и подумать.

Классическая история: обещали инструмент для мышления, получили еще один способ его избежать.

Для себя давно заметил, что самое полезное от работы с AI - процесс мышления над задачей во время написания инструкций и указаний. Получается такой метод уточки, но вместо уточки что-то, что может еще и ответить.
👍38🔥12💯5🤔21
Поиграл тут в бету BF6. Господи, как же я скучал по этому сумасшедшему аттракциону!

Буквально за пару минут на экране разворачивается Майкл Бей: дроп на точке возрождения, сразу в мясо, тиммейты падают как мухи, вражеский танк выкатывается и начинает всех расстреливать. Бегу прятаться в здание, вижу как наш вертолет закручиваясь красиво падает в огненном шлейфе, танк херачит по моему укрытию, отвечаю с РПГ, бум, башня отлетает и сносит соседнее здание, куда я собирался переместиться. На фоне адской перестрелки подъезжает тиммейт на БМП, крошит чужую пехоту, но тут же прилетает F-16 с мавериком и вскрывает его. Все горит, взрывается, дымится, а параллельно мой союзник фигачит со стингера по летуну, он красиво падает буквально в паре метров от меня.

И это все за ДВЕ МИНУТЫ!

Очень люблю за это Battlefield - это была единственная игра, где можешь почувствовать себя в центре голливудского блокбастера, причем не по сценарию, а спонтанно. В востороге, что это вернулось. Спустя почти 10 лет!

Хороший пример того, что если дать людям классно работающую песочницу, камень/ножницы/бумагу и отлично продуманный дизайн окружения, чтобы это заработало, а остальное люди сами себе скреативят.
🔥415😁3👍1🤔1😢1
Сама, где мои бабки за консультацию?
https://news.1rj.ru/str/seeallochnaya/2764
😁27💯2
Ввели у себя во вселенной систему “грейдирования” ассистентов. Сравниваем, на каком уровне работает ассистент: человек, эксперт или топ-эксперт. Чем выше грейд, тем больше ценности получает пользователь от ассистента.

Простой пример. Есть тревел-ассистент, одна из задач которого — подбирать авиабилеты под задачу пользователя (“когда в октябре и дешевле лететь в Испанию из мск с минимальным количеством пересадок”). Для него есть 3 грейда:
1. Обычный человек — с каким качеством человек сам для себя подберёт билеты (человек не всегда может найти лучшее предложение — заленится долго искать или просто просмотрит)
2. Консьерж-сервис / обычный ассистент — человек, на которого могут делегировать такую задачу
3. Турагент — человек, для которого это является основной работой

Если ассистент работает на уровне обычного человека, пользователь получает ценность в виде экономии времени — ему не надо самостоятельно делать кучу поисков и просматривать миллион билетов, сравнивать и выбирать лучший. Ассистент сделает это за него с таким же уровнем ошибки, как сделал бы сам пользователь.

Если ассистент работает на более высоком грейде, пользователь начинает экономить время и деньги, которые отдал бы эксперту за решение его задачи.

Как сравнивать
Придумали грейды — как понять, до какого из них “дорос” ассистент?

Глобально есть 2 варианта:
⁃ Абсолютный скоринг — ставим оценку каждому варианту решения задачи по какой-то шкале, потом сравниваем оценки. Например, человек подобрал на троечку, ассистент на 3,5, консьерж — 4, турагент — 5 => ассистент перебил человека, но не перебил остальные грейды.
⁃ Sbs (side-by-side) — попарно сравниваем ответы каждого варианта решения задачи, строим рейтинг на основе win-rate таблицы (как в спортивных турнирах). Сравниваем: человек vs ассистент, человек vs консьерж, человек vs турагент итд. Собираем победы в табличку и строим рейтинг, например, по количеству побед.

Чаще используют sbs, потому что меньше искажений от шкалирования — даже людям сложно одинаково оценить один и тот же ответ по шкале. А ещё sbs позволяет понять, какой ответ предпочтительнее, даже если по абсолютному скорингу они равны.

В итоге
У ассистента есть грейд (всё как на работе, да). А мы понимаем, какую ценность получат пользователи от нашего продукта. И можем её грамотно транслировать.



Вообще, я собрала целый доклад, где структурировала всю базу про создание LLM-based продуктов. Эвалы, бенчи, корзинки, LLM as a judge и другие умные слова, суть которых надо понимать, чтобы создать качественный LLM-продукт. Буду рассказывать на онлайн-конференции WANNABE AI GENIUS.
Сразу после меня будет доклад Севы Викулина из Яндекса, который расскажет, как довести до прода прототип, который выбил хорошие метрики качества — как делать на своих моделях, сжимать/ускорять их, чтобы они стоили не как самолёт… Супер полезно и интересно!

30 августа с 11 до 17 по мск
Онлайн
Билеты тут
11🤔10👍8🔥3😁2
Мне кажется, что многое можно сказать о личности по самым юзаемым реакциям в слаке
😁38💯4
Вчера был забавный кейс на интервью с продуктовым кейсом. Когда озвучивал условие задачи допустил ошибку в озвучке тотал суммы, но кандидатка перепроверила сразу же все множители и сказала, что не сходится. Получился такой не баг, а фича! И я понял, что большинство кандидатов до этого не перепроверяли математику 🤔
Please open Telegram to view this post
VIEW IN TELEGRAM
😁59👍11🔥52
Спросил тут у перплексити, как можно добраться до Фетхие
😁71😎62🤔1
Команда активно превращается в фан группу Румельта. "Good Strategy Bad Strategy" уже прочитали, переходят на The Crux
16
Forwarded from Albina Munirova
This media is not supported in your browser
VIEW IN TELEGRAM
2😎2