Записки C3PO – Telegram
Записки C3PO
5.08K subscribers
70 photos
5 videos
225 links
Product Director @ T-Bank AI, ex. YouDo

Пишу о Product & People Management, AI, своих наблюдениях и прочих бесполезных вещах.
Download Telegram
Forwarded from Royale With Cheese
Я периодически читаю блог Джона Грубера уже лет десять, и всё это время его можно было считать одним из главных евангелистов Apple.

Не раз и не два он хорошо объяснял изящество некоторых решений компании. Давал хорошие аргументы в её пользу. Но всегда без фанатизма, сухо и по полочкам.

Я не замечал за Грубером склонности к алармизму, но 12 марта он выдал пост, который едва ли не сводится к тому, что APPLE — ВСЁ. В нём Грубер рассказывает, в какую катастрофу для Apple постепенно превращается Apple Intelligence.

На днях Apple отложила новую Siri (некоторые обещанные на WWDC'24 фичи не доедут ни к iOS 19, ни даже к концу года), добавила на все свои промо-страницы дисклеймеры и удалила рекламу новой ИИ-Siri с Беллой Рамзи.

Грубер критикует Apple даже не за то, что она безбожно отстаёт от конкурентов в сфере ИИ, а за то, что она так откровенно не врала о своих продуктах со времён девяностых, когда компания без Джобса летела к банкротству на полной скорости.

Как ни странно, вера в IT-продуктах — довольно важная штука. Технологические гиганты часто начинают рекламировать продукты задолго до их готовности — они верят в то, что заявленная реализация возможна, и технологии сойдутся в нужной точке ближе к релизу.

Так вот: в случае с Apple Intelligence компания одновременно просчиталась в своих прогнозах, соврала журналистам и пользователям и теперь по сути будет заново анонсировать свой подход к ИИ, хотя якобы представила его публике год назад.

Тем более, что Bloomberg заполучил цитаты с внутренней встречи компании, где выяснилось, что сама продуктовая команда не понимает, как, что и зачем выйдет. Ситуацию внутри называют «ugly», а разработчики на этом проекте страшно выгорают.

Грубер считает, что Apple Intelligence может стать для компании грандиозной PR-катастрофой, после которой восстановить доверие и силу бренда будет непросто.

Тим Кук уже должен был провести встречу-разгром [в духе тех, что проводил Джобс], чтобы обсудить проблемы с Siri и Apple Intelligence. Если такая встреча не прошла и не состоится скоро, я боюсь, это конец. Поезд ушёл. Когда посредственность, оправдания и ложь укореняются, они берут верх. Культура превосходства, ответственности и честности не терпит принятия любого из этих явлений и быстро разрушается при принятии всех трёх.


Я не думаю, что Apple уже можно хоронить. У неё сейчас слишком много денег и влияния, чтобы исчезнуть с рынка как когда-то исчезла Nokia. Даже сам Грубер оговаривается, отмечая, что это всё-таки самая успешная компания в истории.

Но сейчас уже совершенно точно можно признать, что запуск Apple Intelligence — факап грандиозных масштабов, который будет отравлять для компании все ближайшие запуски и презентации.

Apple целый год пытается продавать воздух. Рисует его на билбордах. Обклеивает им свои магазины. В то время как её конкуренты всё сильнее отрываются в области ИИ и каждый день внедряют его в массовые продукты — делают то, чего мы обычно ждём от самой Apple.

Я, думаю, в крайнем случае Apple просто купит какого-нибудь ИИ-гиганта (если позволят антимонопольщики), как она периодически делает, и разом нагонит отставание. Но всё равно забавно, что на компанию, известную своим стремлением к совершенству, бросает тень ИИ — продукт, у которого ошибки и несовершенства в ДНК.
👍154
Читал, значит, недавнюю статью Т-Банка про тренировку их внутренней языковой модели. Там отсылаются на исследование, в котором говорится, что добавление в датасет обучания LLM’ки кода, улучшает её способности рассуждать.

Вспомнил про другой эксперимент, где в датасет добавляли говнокод и всякие sql иньекции, а модель начинала восхвалять Гитлера и Сталина и проявляла симпатию к Скайнет.

Теперь представьте, что в недалеком будущем вам встретится робот, обученный на сетке, где в датасет внедрили такой код… даже знаю, как это будет выглядеть.
😁30👍1
Мое недавнее хобби тестировать разные Deep Research'и потихоньку начало превращаться в разочарование, ибо детище Open AI, как говорил ранее, имеет фундаментально другой уровень качества результатов. Потыкал я много: Elicit, Genspark, Perplexity и тд. И только Grok давал реально нормальный результат, но разрыв с OAI был, все равно, сильным.

Но вот я потестировал https://liner.com/news/introducing-deepresearch и это очень круто, особенно, для своих денег. К сожалению, у меня бага с шерингом и не могу скинуть примеры. Из минусов:
- баги
- иногда теряет странным образом контекст
- на английском пишет сильно лучше, чем на русском. У oai такого разрыва не наблюдал
15👍2
Еще топ AI вещь, которая прям разорвала и реально Game Changer - Highlight AI.

Я уже писал про Superwhisper, который позволил мне сильно поменять и улучшить мой workflow, но мне дико не хватало Copilot для всего, который мог бы понимать контекст каждого апа, видеть контент, быть таким курсором для моего мак.

Просто висит штука, с которой можно общаться, как голосом, так и текстом. Понимает контекст апа и его содержимое, видит экран, можно настроить шорткаты, mentions, кучу разных хоткис, системных промтов и инструкций, работает очень UX френдли. Кажется, мой workflow вышел на новый уровень. В переписках, к примеру, вообще топ, так как можно просто надиктовать характер ответа, он поймет контекст переписки и выдаст нужный ответ.
🔥22😱126👍3🤔2
Записки C3PO
Еще топ AI вещь, которая прям разорвала и реально Game Changer - Highlight AI. Я уже писал про Superwhisper, который позволил мне сильно поменять и улучшить мой workflow, но мне дико не хватало Copilot для всего, который мог бы понимать контекст каждого…
Кстати, забыл добавить, что есть поддержка MCP серверов и есть соответсвующий браузер плагинов на их основе. Можно, к примеру, так научить Highlight взаимодействовать с файловой системой, эпловыми апами, браузером, всякими Notion, Slack и прочим добром.
👍11🔥4
Вообще, кажется, что MCP это очередной важный рубикон, который сильно изменит ландшафт. Думаю, что за ним будущее. Модели сильно расширяют свои возможности.

К примеру, крышу сносит от недавнего релиза Zapier, который позволяет использовать любой поддерживаемый ап и workflow в Zapier. По сути вы открываете для себя мощь почти бесчисленного количества интеграций.
https://zapier.com/mcp
🔥11👍4
Forwarded from CX: Стратегическая логика (Михаил Руденко)
Небольшая рефлексия после эфира, без лишней политкорректности для уважаемых подписчиков:)

Мы всё еще больше говорим про инструменты для деятельности, чем про саму деятельность, оставляя ее в серой зоне недосказанности и подразумеваемости. Но это ловушка: чтобы создать хороший и полезный инструмент, нужно разбираться в деятельности, для которой он создается.

Вы не сможете создать молоток, не зная как работает плотник. Вы не сможете создать инструмент для управления отношениями с клиентами, не понимая как компании эти отношения строят.

То, что вижу я: одним из главных препятствий для развития компаний является поверхностное и очень упрощенное понимание своего клиента (или сотрудника). Да, в распоряжении компаний есть куча данных, но если их накладывать на примитивные модели, то это всё еще просто куча данных. А модели не просто примитивные – у большинства их нет вообще.

Та самая маркетинговая близорукость, которую Левитт описывал в 1960 году, никуда не исчезла. Только теперь компании обкладываются автоматизацией, чатботами, ИИ и прочими инструментами, помогающими избежать прямого понимания своего клиента. Теперь мы близоруки технологично и автоматизированно, а кринжа в чатах за нас наваливает искуственный интеллект.

Вот и вся разница.
👍247💯4🔥2😁1
Немного кринжа от гопоты
😁16😎4👍31
Forwarded from nonamevc
tell me you're forbes30u30 founder without telling me you're forbes30u30 founder
😁25
Посчитал, сколько выходит в месяц трат на AI-штуки и подписки на них. Почти 500 баксов. Считать ROI, конечно же, не буду. Счастье в неведении.
😁65😱103👍2
Частый тезис в адрес разных фондов, что вот, мол, они не обгоняют индекс (чаще SPX), но тут есть одна ловушка, в которую я сам много раз попадал. Хорошие фонды дают вам доходность стабильного характера почти всегда вне зависимости от текущего состояния рынка, а SPX вам даст хорошую доходность на дистанции, когда фазы падения размазываются.

Вот представьте, что вы вложили деньги в индекс, а потом вам надо их снять, чтобы купить квартиру, но вот так получилось, что здесь и сейчас Трамп решил станцевать брейк-данс, и ваш портфель окрасился в красное. Неудобно. С фондами в такой просак попадаешь с сильно меньшей вероятностью.

Речь, конечно, про хорошие фонды. От ребят из инвестиционного сектора не раз слышал, что большинство фондов в целом никогда не показывают нормальную рыночную доходность, а просто рубят капусту в стиле "Волка с Уолл-стрит".
10😁3👍2
Наконец, завезут закладки в чаты!
😁26
Forwarded from Denis Sexy IT 🤖
Так, OpenAI сегодня что-то покажет – что-то такое, от чего Сэм просыпается ночью 😁
Please open Telegram to view this post
VIEW IN TELEGRAM
13
Немного новостей!

В начале года я покинул Юду. Провел там почти 6.5 лет – целая эпоха! Пришел когда-то заниматься данными (Head of Data Science), потом рулил продуктом (CPO), был GM, а в прошлом году немного побыл даже и.о. CEO. Безмерно благодарен компании за рост, крутой опыт и возможность его получать! И лично Денису Кутергину за проявленное доверие, ибо без него этого всего бы не было 💪.

Но настало время двигаться дальше к новым вызовам! Теперь я в AI центре Т-Банка работаю директором по продукту в команде Вити Тарнавского. Делаем пользовательские продукты вокруг LLM, агентов и прочего ИИ добра, конвертируя современные достижения в вэлью для людей 🤖.

В последние пару лет много игрался с AI, пробовал всякое и использовал в работе. Наверное, это стало моим основным хобби. А теперь это и моя работа! Что может быть лучше?

В своё время мне удалось запрыгнуть в один из первых составов хайп-трейна дата сатанизма, поэтому не мог пропустить новую волну в AI. Считаю важным для себя быть там, где создаётся что-то новое и полезное, а мои навыки могут быть максимально полезны. Пришло время объединить мои продуктовую, техническую и ML экспертизы!

Заодно хочу рассказать, что у нас в AI центре много вакансий.

В команду Поиска ищем:
- Product Manager
- Lead Product Analyst

В команду "Ботов" Даниэля:
- Lead Product Manager
- Product Manager
- Machine Learning Engineer

В команду "ML Platform" Жени Харитонюк:
- Lead Technical Product Manager в LLM Platform
- Lead Product Manager в CV Platform
- Lead Product Manager в Copilots Team

У нас очень крутая и драйвовая команда, частью которой вы можете стать! И мы делаем офигенские продукты, про которые обязательно буду писать! А в будущем их будет только больше 😐
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥4514👍8😁3💔3😢2😱1
Записки C3PO
Еще топ AI вещь, которая прям разорвала и реально Game Changer - Highlight AI. Я уже писал про Superwhisper, который позволил мне сильно поменять и улучшить мой workflow, но мне дико не хватало Copilot для всего, который мог бы понимать контекст каждого…
В Highlight AI появилась крутая штука - Magic Dot. Возле курсора всегда висит точка, наводишь, можно выделить текст, пишешь/диктуешь и получаешь в этом же текстовом инпуте нужный текст. Опыт Notion AI везде на Mac OS. Короче, Apple Intelligence, который мы хотели и заслужили.
👍15🤔21
LM Arena запустили новую арену для поиска - Search Arena. Как и обычная арена, выбор моделей ослеплен, но в данном случае уже оцениваются поисковые возможности моделей, где есть функция поиска по интернету.

Прежде чем говорить про результаты лидерборда, кажется, нужно разобраться, как вообще работают все эти LLM поисковики. Там есть в general случае следующие этапы:
- Получая пользовательский поисковый запрос, LLM генерируют один или несколько новых запросов. А может и оставить изначальный в зависимости от кейса. Модель как раз и разбирается, как лучше сделать.
- Далее эти запросы отправляются в поисковый индекс и отбираются top-k кандидатов с запасом.
- Происходит merge кандидатов с дедупликацией, фильтрацией и применением каких-то "быстрых" правил, бизнес-логики и чисткой контента с выделением оттуда полезной нагрузки для дальнейшей части пайплайна.
- Rerank: эти k кандидатов реранжируются по какой-то формуле (может быть модель, может быть просто сортируются по релевантности самого индекса, а может просто эмбединги сверяются с изначальным запросом и т.д.) и из них вытаскиваются уже top-n наиболее релевантных.
- Последний этап, где уже эти top-n отдаются в LLM, и она на основе корпуса этих документов находит ответ на изначальный запрос, по сути делая банальную суммаризацию.

На Search Arena, как вы уже, наверное, догадались, происходит весь этот пайплайн end-2-end. То есть это соревнование не просто голых моделек, а всего пайплайна целиком.

И вот на лидерборде мы видим, что лучший результат показывают:
- гугловая Gemini-2.5-Pro-Grounding, которая на всех бенчах выдает SOTA результаты (Grounding - это именно версия, которая может искать и приземлять ответы на реальные источники).
- Sonar Reasoning Pro High от Perplexity - файнтюненная на поисковых задачах самая большая модель от Perplexity с ризонингом.

Следом идут 4 позиции всех остальных версий Sonar.

Perplexity, насколько я знаю, юзают индекс Bing, который в среднем будет хуже гуглового, а сама Gemini вовсе SOTA модель, которая уделала всех почти во всех задачах. К тому же у Google явно лучше экспертиза на этапе реранкинга. То есть Perplexity, имея хуже индекс, потенциальное отставание в реранкинге и меньший ресурс, смогли сделать свою search модель, которая создает инкремент, который компенсирует это отставание и позволяет в итоге получить тот же результат. Это похвально.

Но надо понимать, что Search Arena только появилась, данных мало, и не факт, что лидерборд в духе Kaggle не перетрясет через месяц-два.
👍15🔥84
Читал тут, значит, статью на The Verge, что OpenAI делают свою соцсеть, и наконец понял, кого они мне напоминают - подростка с СДВГ. Так же в расфокусе, хватаются за все подряд, не доводят ничего до конца, все вроде работает и вау, и все в шоке от того, как круто, но по факту в зачаточном состоянии, недоведенное до полноценного состояния.

Так-то все логично и понятно, почему так. Закладки в чате и отсутствие зоопарка моделей устойчивую бизнес-модель не найдут, ибо большинство юзеров юзают дефолтную модель и не отдают себе отчет о каких-то рассуждалках и прочих задротских штуках, а подписки не дают зарабатывать достаточно, чтобы окупать мероприятие здесь и сейчас. В будущем, к тому же, из-за роста конкуренции и Open Source моделей технологический moat будет слабеть, технологии будут коммодитизироваться, а маржинальность падать. Каждый технологический виток будет стоить все дороже.

Поэтому, как мы говорили не раз и разбирали в посте про 7 Powers, у OpenAI задача обрасти как минимум одной из трех "сил": scale economies, switching cost или network effects. Сетевые эффекты - это самая мощная и могучая сила и барьер для конкурентов, но самая сложная в имплементации. Соцсети == Network Effects.

В целом, вариантов у OpenAI не так уж и много, поэтому круто видеть, что они не боятся и итерируются. СДВГ тут скорее суперсила и источник энергии для быстрых итераций. Главное потом убрать СДВГ'шников от руля, чтобы можно было укрепить найденную модель.
👍146😁5💯2👏1
У меня есть одна любимая задача для проверки LLM в скиле написания документов, так как это почти самая частая моя задача. Даю недоделанный док со стратегией "одного маркетплейса", к которому прилагается шаблон этого документа и артефакты с юзер/маркет ресерчем и драфтами идей стратегии.

Закинул эту задачу в новую o3. В промте даются четкие инструкции, что если инфы в артефактах нет, то ее не нужно выдумывать, а задача именно дописать док и улучшить уже написанное. Что вы думаете? o3 напридумывала кучу цифр и фактов, которых не было в приложенных документах, текст мне лично не нравится. Может показаться, что o3 просто подошла творчески к задаче и придумала классные идеи, но идеи фигня, а цифры неверные. Sonnet 3.7 Thinking, к слову, делает все прям хорошо.

P. S. Как разрулю доступ к Gemini 2.5 Pro, расскажу про нее. Чую, что она станет моей основной моделью.
19🔥3👍2
Пишут, что «Джеймс Уэбб», обнаружил в атмосфере экзопланеты химические вещества, которые на Земле обычно связаны с деятельностью живых организмов: диметилсульфид и диметилдисульфид, которые преимущественно вырабатываются морским фитопланктоном и другими микробами💆‍♂️
Please open Telegram to view this post
VIEW IN TELEGRAM
20🔥10