NGI | Влад Корнышев про AI и создание AI-продуктов – Telegram
NGI | Влад Корнышев про AI и создание AI-продуктов
2.22K subscribers
118 photos
27 videos
2 files
277 links
Простым языком рассказываю об AI, Product Management и работе AI-продактом.

Автор канала - @vladkor97, консультирую AI стартапы, помогаю запускать MVP, ex-R&D продакт в Skyeng, ex-AI продакт в Pearson. Создаю инновации следующего поколения с 2019 года.
Download Telegram
Размышления про Cursor: как я писал код с AI до него и будут ли нужны такие редакторы кода?

По большому счету ключевой плюс Cursor - это удобство коммуникации с LLM. Все, что делает сервис - это управление вашим контекстом, через передачу в LLM релевантных строк кода, с последующим внесением изменений. Но основную работу при этом делают сами LLM. И если раньше управление контекстом на стороне Cursor сильно помогало, то вместе с ростом возможностей LLM, данный тул становится менее актуальным. Появление Reasoning моделей и смена модели монетизации Cursor делает более важным то, как управляете контекстом ВЫ, а не какие данные выдернет из кода за вас ИИ-агент. При всем при этом, Cursor нужно зарабатывать, поэтому компании может быть просто невыгодно, чтобы автоматическое управление контекстом было максимально эффективным. Их уже неоднократно обвиняли в том, что этот самый контекст они режут.

И здесь мне вспомнилось, как я впервые писал код с ИИ

Моими инструментами были VS Code и Google AI Studio. В AI Studio у меня был здоровенный системный промпт с контекстом по проекту. Далее - я просил ИИ набросать мне структуру проекта по файлам и папкам, воспроизводил эту структуру у себя на компьютере и также добавлял информацию о ней в контекст промпта. Первые несколько сообщений в чате у меня предназначались для TO DO - листа, в котором я отмечал, что сделано, а что предстоит сделать и последней версии кода, где я указывал название файла и следом вставлял нужный код. При добавлении новой фичи я просил Gemini написать мне код и сказать, куда я должен его вставить. После - тестировал и обновлял сообщения с TO DO и текущим кодом. При появлении багов - игрался с температурой. Если баг был в конкретном файле - выносил его в отдельный чат с информацией по этому багу. Gemini Flash Thinking я использовал для "обдумывания" решений, а Gemini 1.5 PRO - для реализации "обдуманного". Таким образом я написал свой первый проект на 1800 строк кода, и он работал.

Сейчас, используя Cursor, я поймал себя на том, что выполняю те же самые действия, только большую часть не в AI Studio, а в Cursor. Потому что делать это там проще, но при этом я имею меньше контроля над параметрами моделей, а также над их поведением. Кроме того, со снятием лимитов на вызов тулов, я заметил, что в отличие от работы напрямую в AI Studio я хуже знаю структуру проекта. Чтобы ее понять - мне нужно продираться через кучу мусорных попыток агента что-то сделать. Мусорных - потому что у меня меньше контроля над контекстом, а Claude пытается все переделать по 10 раз, переписывая рабочие куски кода. При этом самый интересный момент здесь состоит в том, что те проблемы, которые мне не может решить ни одна из моделей в Cursor (включая Gemini) - AI Studio щелкает как орешки. Почему? Опять-таки, из-за управления контекстом.

Что будет дальше?
Неважно, вайбкодите вы или кодите - учитесь управлять контекстом. Здесь преимущество будет у разработчиков и тех, кто уже многократно спотыкался на ошибках агентов, используя Cursor. Кроме этого, я бы советовал следить за разработками самих авторов моделей, т.к. они наконец-то начинают делать шаги в сторону создания своих агентов и упрощения кодинга. Claude Code - яркий тому пример, а тот же Canvas в Gemini реализован очень круто. Недавно в AI Studio добавили режим Build, который работает как редактор кода. Если бы они в этот режим добавили настройки LLM, которые доступны в режиме чата - я бы отказался от всех AI-редакторов кода, т.к. это бы дало мне максимальный контроль за тем, что я создаю.

Будет ли нужен Cursor в будущем? Я думаю, что у него однозначно будет свое место, однако если компания продолжит двигаться в сторону автономности, то более серьезные разработчики и те, кому важно знать, что за код пишет ИИ, скорее перейдут на появляющиеся альтернативы.
👍107🔥6🤔1
Дополнение про практикум в понедельник

Друзья, ранее я анонсировал эфир в грядущий понедельник, 21 июля, в 19 00 по МСК. Детали эфира в посте выше.

Для тех, кому нужна ссылка в календарь - создал событие на Timepad, чтобы вы точно не пропустили. Материалы эфира в процессе подготовки, будет много интересного. Особенным этот эфир делает то, что вести мы его будем на пару с Колей Шейко - автором канала AI и Грабли.

Мы с Колей занимаемся очень похожими вещами - внедрением ИИ в бизнес, но с разных сторон. Если я технический продакт, то Коля - это продуктовый технарь, но цели у нас общие - делать ИИ доступным и понятным и разрабатывать полезные ИИ-системы. Эфир решили разбить на две части, где каждый поделится своей экспертизой.

А пока ждете эфир - подписывайтесь на Колю, если этого еще не сделали. У него один из немногих каналов, на которых у меня не отключены уведомления :)
🔥75
🚀 NGI дайджест (№17)

1. Учимся делать продукты, играя в игры - небольшой оффтопик про то, как я черпаю вдохновение из геймдева

2. Почему AI не нужен 99% бизнеса - рассказал про основные причины и типичные ошибки, которые приводят к проектам-пустышкам

3. Размышления про Cursor: как я писал код с AI до него и будут ли нужны такие редакторы кода? - поделился своим воркфлоу разработки без курсора и мыслями о том, как работать дальше

4.
Про практикум по управлению контекстом LLM - добавил ссылочку на таймпад. Приходите завтра, в 19 00 по Мск. Запись будет только для моего закрытого комьюнити, для остальных - только онлайн 🙂

Прошлый дайджест тут
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6
Чего избегать, обучаясь ИИ

Как только началась ИИ-лихорадка, на рынке появилась куча магистров промптинга и AI-экспертов. Наиболее частые их продукты - это курсы по промптам и списки готовых промтов. Спустя какое-то время данная тенденция подуспокоилась (списков стало меньше), но на фоне последних прорывов в LLM сейчас все вспыхнуло с новой силой. Непосвященному человеку разобраться, где нормальный контент, а где мусор - практически нереально. Решил написать два поста: в этом расскажу, чего избегать, а в следующем - на что лучше смотреть

Итак, мой антирейтинг!
Готовые списки промптов. Самое бестолковое, что только есть. Во-первых, большинство таких списков генерируется авторами через ChatGPT по запросу "Сделай мне список из 50 топовых промптов". Во-вторых, даже если они писали их сами - промпты имеют свойство устаревать и зависеть от модели: что работает с GPT 4o не будет так же работать с вашей Gemini Flash 2.5 или DeepSeek R1, а вместе с обновлением версии модели - промпт нужно будет адаптировать. В-третьих, определенные промпты работают в определенных воркфлоу, если ваш рабочий процесс отличается от автора - все промпты превратятся в тыкву.

Курсы по промптингу от неспециалистов в AI. Можно увидеть кучу маркетологов, менеджеров и других ребят, продающих курсы по промптингу в своей сфере. Проблем здесь две: во-первых, зачастую эти ребята не знают основ работы ИИ и продают то, что они нащупали сами, а не то, что реально может ИИ. Это работает в моменте, но на дистанции уже не так эффективно. Во-вторых, авторы копают глубоко в сторону своей экспертизы, но не в ИИ. Если вы крутой спец - вам нужны не сценарии других, вам нужно понимание ИИ вглубь, а кейсы вы уже сами найдете. Специализированные курсы могут быть полезны, когда у вас уже есть багаж с AI, но зачастую вы уже будете способны сами разобраться.

Курсы по конкретным инструментам. Сфера AI развивается очень стремительно. Сегодня инструмент есть - завтра его нет, либо на него повышают цену. В промышленных масштабах это называется вендор-лок: мы лишаем себя возможности пользоваться альтернативами и "садимся на иглу" определеннного провайдера, терпя повышения цен и прочие неприятности. Поэтому все курсы в стиле "Стань профи в Midjourney/Cursor и.т.д." мы игнорируем, пока не научимся основным навыкам: базовому владению ИИ и базе применения в той же генерации картинок/написании кода и.т.д.

Курсы с детерменированными заданиями. Часто можно увидеть, что в курсах дают задания, где нужно пройти определенный сценарий и получить определенный результат. И это максимально далеко от реальности. Вам дают "вылизанный" сценарий, который будет снижать недеретменированность AI, чтобы создать у вас ощущение освоения навыка. А когда доходит до использования ИИ в реальной жизни - у вас "не получается". Задания должны быть такими, чтобы у вас не получалось в процессе, чтобы вы могли ошибаться, учиться на ошибках и где надо - получать ОС от инструктора. Сложно должно быть в начале, когда у вас есть поддержка, а не наоборот.

Курсы "без воды". Все хотят практики, все хотят сразу результат. Есть спрос - будет и предложение. Вот только водой называют основы ИИ. Проблема в том, что не зная теории, вы не будете уметь правильно формировать ожидания от ИИ. Вы же не поедете в кругосветку на машине, не изучив маршрут и опыт других? Вот и с AI так же.

А что бы вы добавили в такой антирейтинг?
1🔥14👍118👌1
Встреча закончилась. Проходила в Google meet, т.к. телеграм решил прилечь 🙂

Решили все-таки выложить запись в открытый доступ, завтра опубликуем в каналах и у меня и у Коли :)
👍12🔥71
Запись эфира по управлению контекстом!

Очень многие просили запись эфира. Просили - делаем! Получилось немного сумбурно, зато сам эфир получился живым.

Запись тут: https://youtu.be/PqiRIpkUhTk

Хотите больше эфиров - предлагайте тему в комментарии, лайк, репост, подписка - и мы все организуем 🙂
12👍11🔥10
Изучение ИИ: что действительно работает

Ранее я писал о том, чего избегать при обучении, сегодня - о том, что наоборот полезно. Здесь стоит упомянуть один из моих предыдущих постов, где я рассказывал о том, где учиться AI, сегодняшний пост - отличное дополнение к нему.

Так как же освоить ИИ?
Метод 1: сделай сам. Самый полезный совет. AI - не та сфера, где все известно и есть какой-то рецепт успеха. Это связано как с молодостью самого AI, как направления - люди просто не придумали “Как надо”, так и тем, что у каждого человека свои кейсы.

Поэтому лучший совет, который я могу дать - это идти пробовать. Вышел новый сервис? Идите пробуйте его. У вас нетипичная задача? Подключайте LLM. Не нагуглили как что-то сделать? ИИ вам в помощь! Большинство специалистов по AI учились самостоятельно. 90% того, что я знаю об ИИ - мой практический опыт. Большинство ML-инженеров вокруг меня - вообще не ML-инженеры по образованию, есть много юристов, экономистов, математиков. Мы получаем навыки через практику, это же следует делать и обычным пользователям/

Метод 2: YouTube и индусы. Как гласит старинная мудрость “Нет ничего в этом мире, про что какой-нибудь индус не снял бы видео на YouTube”. Это относится и к AI. Прежде чем искать очередной курс и отдавать свои кровные - поищите на YouTube. Большинство курсов - это пересказы роликов с ютуба. Это не значит, что курсы бесполезны. Преимущество курсов - это системность, опыт авторов и обратная связь, нетворкинг, а также отсутствие необходимости более тщательно отбирать материалы. Вы платите за экономию своего времени и связи, но практически с любым вопросом вам поможет разобраться YouTube.

Метод 3: коммьюнити вокруг AI-тулов. Источник просто безумного количества пользы! Ищите Discord и Telegram-каналы, посвященные инструментам, которые вас интересуют. Не передать, какое количество информации я оттуда подчерпнул. С вами бесплатно поделятся тем, за что в ином случае вы бы заплатили очередные 200 баксов. Вокруг AI очень сильное комьюнити и не пользоватсья им - большая ошибка.

Метод 4: курсы от компаний-разработчиков. Hugging Face, Google, OpenAI, Anthropic, DeepLearning - у всех них просто огромное количество БЕСПЛАТНЫХ курсов. Я взял себе за привычку регулярно проходить чуть ли не все, что там выходит. Часто проводят живые вебинары, где решают какую-то проблему. Следите за блогами разработчиков интересущих вас тулов - там постят полезный контент регулярно.

Метод 5: чтение научных статей. Может быть скучным, но пользы оромное количество. Я регулярно выцепляю что-нибудь с arxiv. Помогает заполнить FOMO и лучше понимать, как работает ИИ, в чем его силы и слабости и какие есть юзкейсы.

Метод 6: узкие специалисты. Многие в AI, включая меня, ведут свои каналы. Лично я подписан на нескольких авторов в телеге, чьи каналы приносят мне реальную пользу. Завтра я выложу списком те каналы, на которые я подписан с коротким описанием того, чем конкретно каждый меня заинтересовал и какую пользу позволяет извлекать.

Такой получился лично мой список. В комментариях делитесь, что именно нашли полезным для себя 🙂
6👍3011🔥9
Каналы, которые я читаю по AI

В продолжение вчерашнего поста здесь будет подборка того, что я читаю сам.

@ai_newz - пусть я получаю основные новости из рассылок и шарясь по HuggingFace, мне нравится канал Артема, т.к. часто тут не только новости, но и какие-то крутые мысли.

@oestick - канал Коли, с которым мы вместе проводили эфир. Много технической информации, при этом довольно часто на языке бизнеса. Здесь практические фишки работы с LLM в доступном изложении.

@ProductsAndStartups - канал Байрама Аннакова, здесь много про AI в бизнесе, этику, тренды и продукт. Следил за Байрамом задолго до увлечения AI - умнейший человек, у которого можно учиться всегда, насколько бы круты вы ни были в своей сфере.

@seeallochnaya - еще один крупный канал. Читаю его в основном из-за периодических анализов статей. Позволяет заполнить FOMO от того, что я сам мог пропустить.

@nobilix - Рефат делает много практических разборов AI-инструментов. Всегда детально, но при этом кратко, всегда с демонстрационными видео, читаю каждый пост.

@kantor_ai - канал экс-руководителя МТС AI. С Виктором познакомились в 2022 и он прямо очень крутой. Здесь больше про классический ML и какие-то заметки, близкие к бизнесу.

@ai_and_law_rus - канал про законадательное регулирование ИИ, помогает заполнить FOMO.

@kdoronin_blog - много практических разборов с упором на AI агентов на любой вкус и цвет.

@neuraldeep - идеальный канал для тех, кто хочет зарыться в техническую часть AI. Точно не для легкого чтения, скорее для тех, кто точно понял, что хочет лучше понять AI изнутри и побольше узнать про эксперименты.

@etechlead - канал для тех, кто хочет погрузиться в разработку и вайб-кодинг. Очень много разношерстных материалов по этой тематике.

@countwithsasha - реклама и аналитика мои не самые сильные стороны, канал Саши помогает легче ориентироваться в применении AI в этих сферах

@the_ai_architect - Тимур - действующий разработчик. Много пишет про кодинг с ИИ и его практическое применение, при этом простым языком.

@lechim_ai - я очень люблю Медтех. Илья - Head of AI очень крутого стартапа Третье мнение, куда я даже получил оффер в 2021. С тех пор слежу за компанией, а не так давно Илья завел канал про медтех.

@baginsai - Саша пишет про практическое применение AI, кейсы, скидки и всякие другие полезности.

@max_about_ai - еще один канал с техническим уклоном. Максим всегда пишет четко, по делу и про то, что пробовал сам и точно работает.

@eternalmind - здесь посты выходят не так часто, но основная тематика находится на стыке когнитивистики, философии, критического мышления и AI.

@alexs_journal - практические разборы AI-инструментов и всего, что вокруг них: промптинг-гайды, лайфхаки и прочее.

Постарался включить максимум источников, чтобы вам было из чего выбрать 🙂 Сохраняйте список себе, знакомьтесь с авторами, если понравилось - подписывайтесь. Пост - не реклама и не взаимопиар, а реально то, что я читаю.
24🔥17👍4🤯1
В эти выходные я впервые за более, чем полгода позволил себе ничего не делать по работе (почти). И, хочу сказать, как же это прекрасно, особенно на контрасте с тем графиком, что у меня был в последние пару месяцев.

Мое “ничего не делать” состояло из:
- сделать зарядку
- позалипать на YouTube
- выйти на прогулку
- провести силовую тренировку
- поиграть в приставку
- выйти перед сном на пробежку (хотя я ненавижу бегать, но велик остался в США)

В воскресенье поработал буквально пару часиков, но суббота была полностью на чилле.

В итоге словил потерянный в конце 2024 life-work balance и теперь влетаю в понедельник с новыми силами 😅

Кто так же, как и я, погряз в работе - рекомендую такой же “день безделья”. Всем продуктивной рабочей недели, пост с контентом выйдет сегодня ближе к вечеру 🙂
20👌2👍1
“Раньше было лучше”: Cursor испортился и так может любой AI-инструмент

На занятие вайбкодингом я потратил уже более 1000 часов. За это время перепробовал многое: писал код в AI Studio, применял Github Copilot и Cline в VS Code, тыкал консольные инструменты вроде Gemini CLI, но раз за разом возвращался в Cursor. Все потому, что здесь были хорошие лимиты, неплохая система управления правилами и контекстом. Однако после ряда последних обновлений я заметил, что Cursor начал меня бесить. Сначала я думал, что это я перегорел к кодингу, т.к. очень много им занимался, но достаточно было скачать Kiro, чтобы понять, что перегорел не я, а Cursor. Все, что опишу ниже - мои личные наблюдения и предположения, опыт других может отличаться.

Что не так с Cursor?
Вы быстрее упираетесь в лимиты - с новой бизнес-моделью я за все время впервые уперся в лимиты, сделав лишь один не самый большой проект. Старая схема с 500 запросами в месяц позволяла мне сделать два-три средних проекта, тратя на каждый 150-200 запросов. Здесь у меня вышло предупреждение о скором достижении лимитов где-то на середине проекта. При том, что я делаю все не то что так же, как и раньше - напротив, я делаю меньше ошибок, лучше управляю контекстом, даю более качественные инструкции, чем раньше, но запросы улетают быстрее. По ощущениям текущий лимит запросов составляет где-то 300.

Я стал тратить больше времени на получение результата и испытываю проблему нехватки настроек - после того, как Cursor убрали ограничение на 25 действий агента подряд, вместе с последними “инициативными” моделями даже простое действие вам нужно ожидать гораздо дольше, чем раньше. Если раньше модель в любом сценарии останавливалась после 25 действий, вы могли оценить результат и принять решение, то сейчас оно так не работает. Что Claude, что Gemini, решив ваш первоначальный запрос, сформулированный как “сделай только это и ничего больше” - с радостью отправляются делать что-то еще. В итоге вам нужно сидеть с открытым редактором и вовремя его останавливать, иначе вы не протестируете нормально свой продукт. Лично мне очень не хватает возможности поставить лимит на действия агента самостоятельно.

Ухудшилась работа даже на маленьких проектах - я провел несколько воркшопов по вайбкодингу, где кодил сам и смотрел, как кодят мои студенты. Работу мы всегда начинаем с настройки Rules и проработки ТЗ для простого телеграм-бота. Я лично отсматривал ТЗ и первый промпт каждого. И каково же было мое удивление, когда на первом же этапе, где надо сделать, чтобы бот реагировал на нажатие кнопки start, у половины это простое действие не получилось. Cursor упускал важные детали реализации, например, предлагая свои библиотеки, забывая про установку зависимостей и много чего еще. Ощущение, будто они еще сильнее испортили управление контекстом. Решение здесь в формировании более детальных инструкций и декомпозиции, но раньше такая задача решалась с одного запроса.

В итоге у нас получается противоречие: вроде как инструмент изменили, чтобы больше кодить “на вайбе”, но при этом система стала требовать больше внимания в процессе. Без этого внимания вы либо сделаете фиговый код либо прожжете свои деньги. Новички будут быстро исчерпывать лимиты, не обладая нужными знаниями (тут им можно предложить тариф MAX, в котором лимиты и контекст больше), а более опытные пользователи, вроде меня, вынуждены будут либо подстраивать свой рабочий флоу под новую реальнотcь, либо так же переходить на MAX, ну или слать нафиг Cursor, уходя в другую IDE. Ощущение, что Cursor тупо погнались за баблом и делают это не лучшим образом. Когда закончится моя годовая подписка, если станет еще хуже - сменю инструмент.

Лично для меня выводы такие:
⁃ не покупать годовые подписки на AI-тулы
⁃ пробовать больше новых инструментов, чтобы иметь возможность на них соскочить
⁃ не привязываться к конкретным фичам, а формировать универсальные core-компетенции
310👍5🔥4
Как сформировать AI-майндсет? Ваш главный тренажер - это жизнь, а не рабочие задачи

Все мы уже наслышаны о том, как AI повышает вашу рабочую продуктивность. Но есть огромная разница между “я использую LLM в работе” и “LLM помогают мне быть эффективнее”. Использование LLM в рабочих задачах скоро станет базовой гигиеной, а настоящая эффективность - это не только про работу, но и про жизнь в целом.

Вспомните компьютеры. Когда-то они были инструментом для сложных расчетов, а сегодня пронизывают всю нашу жизнь. Вы читаете этот пост с компьютера - неважно, с ноутбука, планшета или телефона. Заказ еды, бронирование путешествий, работа - для всего этого мы используем компьютер.

Эффективный человек - это тот, кто жонглирует возможностями компьютера, встраивая их в единую систему жизни. Он планирует свой день через Google Calendar, ведет таск-трекер и управляет финансами через приложения. Он использует смарт-часы для мониторинга сна и тренировок, чтобы всегда быть бодрым, дома у него робот-пылесос с функцией мытья полов, потому что время на уборку можно потратить на что-то важнее. Наверняка в этом описании вы узнали кого-то из знакомых, кто всегда все успевает, имеет свой бизнес и путешествует по миру. И эффективен он не просто из-за компьютеров, а потому что нашел те зоны, которые можно с их помощью оптимизировать.

Ровно так же, чтобы быть эффективным с ИИ, нужно сформировать майндсет, который поможет системно встроить его в ваши процессы. И этот майндсет формируется не на работе, а за ее пределами: на ваших хобби и бытовых задачах.

Вот несколько кейсов из моей практики:
1. Перепаять гитару. Вместо того чтобы часами рыться на форумах, я иду к ИИ. Прошу объяснить основы пайки, подобрать видео на YouTube и найти конкретную схему распайки на сайте производителя. Итог: я не просто решил задачу, а освоил новый навык с минимальными затратами времени.
2. Спланировать путешествие. Перед тем как зарыться в Booking и Aviasales, я прошу ИИ накидать мне черновик маршрута: интересные локации, логистика между городами, примерный бюджет. Получив эту базу, я уже иду в специализированные сервисы с четким пониманием, что искать. Попутно я качаю навыки анализа и синтеза с ИИ.
3. Сгенерировать сертификаты для тренингов. Менять вручную десятки имен в Figma - это ад. Вместо этого я прошу ИИ написать мне HTML, который генерирует именные сертификаты из шаблона и списка участников. Задача, которая раньше отнимала час, теперь решается за 5 минут. Бонусом качнул навык ИИ-кодинга.
4. Починить кофе-машину. Классика: что-то не работает, инструкция потеряна. Вместо того чтобы гуглить модель и перебирать десятки ссылок, я фоткаю кофе-машину и иду в Perplexity с простым запросом: "Кофе-машина De'Longhi не наливает кофе с надетым рожком, что делать?". Через минуту у меня есть список вероятных причин и пошаговые инструкции по их устранению.

Как это суммируется в общую эффективность
Помимо прокачки навыков и экономии времени, у такого подхода есть дополнительные бонусы:
- ИИ забирает на себя бытовой шум. Мой мозг не тратит энергию на десятки микрорешений и подходит к сложным рабочим задачам свежим.
- Интуитивное мастерство. Тренируясь на низкорисковых задачах, я набиваю руку. Когда на работе возникает реальная проблема, я уже интуитивно знаю, какой инструмент и подход выбрать, чтобы получить инсайт, а не просто ответ.
- Гибкость мышления. Работа загоняет в шаблоны. Использование ИИ в бытовых задачах заставляет меня мыслить шире, и эта гибкость напрямую переносится на рабочие проекты.

И через такие маленькие оптимизации ИИ для меня перестает быть «рабочим инструментом» и становится продолжением моего мышления. И вот теперь уже можно говорить про то, что он делает меня эффективнее.

А какие нерабочие задачи вы решаете с помощью ИИ и как вам это помогает? Делитесь в комментариях.
13👍10🔥8🤣1
Forwarded from AI и грабли
Неделю назад я был на эфире у Влада про Context Engineering. Наконец у меня дошли руки выписать несколько мини-тейков, чтобы не смотреть все два часа (некоторые достаточно противоречивые, как мы любим):

* Контекст-инжиниринг – просто часть промпт-инжиниринга. Просто теперь все важнее не просто правильно собирать слова в инструкции, но и подтягивать релевантные данные извне.

Примеры:
* Дамп дневника → понимает личный контекст → лучше ответы на вопросы про отношения или зоны личностного роста, ошибки мышления
* Информация с созвонов компании → точнее ответы на бизнес вопросы
* Выгрузка канала → перенимает стиль текста и зоны фокуса
* Документация → корректное использование библиотек (кстати, context7 MCP, кто еще не)


* Можно легко перегрузить контекстом. Аналогия – когда на разработчика вывалили весь контекст, который был в голове у менеджера, и теперь разработчик парализован, потому что постоянно вылетает в мысли про смежные зоны и ограничения.

На техническом уровне это объясняется слабым навыком моделей фильтровать неважную часть контекста – "если в условиях это зачем-то дано, значит, мне нужно это как-то использовать"


* Отсюда берется полезный паттерн: отдельно чат – "менеджер", где много контекста, и идет основное размышление и планирование, а отдельно чаты – "исполнители", которые занимаются узкой задачей, владея только нужным для конкретной задачи контекстом

* Другой полезный паттерн – стараться решить задачу в один-два запроса вместо того, чтобы бесконечно корректировать в режиме долгого диалога. То есть, если не получается, то менять исходный запрос, а не писать новые сообщения-корректировки.

Спекулятивное объяснение: в режиме диалога каждая фраза юзера – отдельная инструкция и модели сложно собрать их в одну непротиворечивую, да еще и не зацикливаться на подтверждении своих прошлых ответов.


* Модели хуже обращают внимание на контекст в середине. Одно из решений – просить модель повторить релевантный блок, прежде, чем генерировать финальный ответ. Так, она сама поместит его в конец своей "оперативной памяти", где внимание не проседает

* Просите модель собрать для вас инструменты для сбора данных. На эфире мы попробовали два способа, актуальных для неразработчиков (и не требуют деплоя):
1. Самодостаточный html файл, который открывается в любом браузере
2. JS код, который вставляем в браузерную консоль.

* Есть еще варианты всяких агентов, где деплой уже настроен (Lovable, Perplexity Labs, Manus, Google Apps) или вообще ChatGPT Interpreter, который сам напишет код, сам его запустит.
13👍4
Как Сэм Альтман учит людей цифровой халатности

Мало кто сегодня не знаком с Сэмом Альтманом - миллионер, плейбой, филантроп и глава OpenAI. У Сэма огромная, не побоюсь этого слова, фанбаза, называющая его гением, которая буквально смотрит ему в рот и радуется, когда он отвечает их твиты. Мое отношение к Альтману совершенно иное, но о нем я расскажу в каком-нибудь следующем посте. Сегодня же хочется поговорить о цифровой халатности.

“А это тут при чем?” скажете вы. А при том, что буквально на днях с Сэмом вышло интервью, в котором этот момент был затронут.

Вот что он сказал:
Люди, особенно молодёжь, всё чаще делятся с ChatGPT самым личным, используют его как терапевта, коуча и обсуждают проблемы в отношениях. При этом, в случае уголовного преследования, Open AI могут обязать выдать эти данные органам. Я считаю, что это абсолютно неправильно. Мы должны обеспечить такой же уровень конфиденциальности при общении с ИИ, как и при разговоре с терапевтом.


Конфиденциальности? Серьезно? Ты и твои люди могут читать и обучать модели вообще на ВСЕХ даннных. И за всей этой свободой слова и неприкосновенностью переписки скрывается жажда наживы через поощрение цифровой халатности. Примерно такой же, из-за которой на днях навернулась вся инфраструктура Аэрофлота, когда выяснилось, что некоторые сотрудники хранили свои пароли на рабочем столе в файле password.txt 🤦

Суть проблемы
За годы пользования комьютером люди так и не научились базовым навыкам кибербезопасности! При этом, в эпоху ИИ важность этих навыков возрастает экспоненциально. Взаимодействуя с ИИ системами нужно четко разделять, что должно быть тайным, а что нет. Альтман же очеловечивает ИИ, вот только чтобы вытащить что-то из головы того же терапевта зачастую нужно применить физическую силу, что, как правило, незаконно 😁

Опустим тему силовых структур и обратим внимание на главное: какую бы информацию вы бы ни сообщили ChatGPT, как я писал выше - она не будет конфиденциальной чисто по своей природе. AI нужны данные для масштабирования и все ваши диалоги будут храниться на серверах компании. Да, в обезличенном виде, но если вы упоминали конкретные имена, финансовые данные или другую чувствительную информацию - это не имеет значения, вы уже себя раскрыли. И вам никто и никогда на 100% не гарантирует, что это не будет где-то использоваться. Это БАЗА кибербезопасности: доверяй, но не на 100%. Поэтому главное правило при работе с ИИ - это “обезличивай, очищай и думай, прежде чем отправить следующее сообщение”.

Под прикрытием заботы о свободах в условиях отсутствия AI грамотности населения мы попадаем в ситуацию, когда корпорации будут знать о нас то, что не должны знать. Люди сами позволяют компаниям копаться в своем грязном белье, не зная наверняка, как эта информация будет использована.

Допуская такую халатность мы делаем себя уязвимыми для любых манипуляций, а в мире бизнеса, где рулят такие люди, как Альтман, манипуляции - это лишь вопрос времени. Законы не успеют проработать до возникновения первых прецендентов, а учитывая, что первые лица большинства государств часто не отличаются умом и сообразительностью и могут использовать ChatGPT “для всего”, такие законы могут никогда не появяться, т.е. объектами манипуляций будут эти самые лица.

Маркетинговый ход или наивность?
Давайте честно: Альтман - бизнесмен, а не борец за свободы. Ему нужен самый ценный датасет - ваши личные данные. Заявляя о “терапевтической” конфиденциальности, он гениально смещает фокус со сбора данных на юридическую защиту. Он как бы говорит “Мы сделаем все для вашей защиты, только расскажите нам о себе все”.

Что делать? Воспитывать AI-гигиену!
Золотое правило: не делитесь с облачным ИИ тем, что не готовы увидеть на рекламном баннере.
Для личного - только локальный ИИ. Ваши данные остаются вашими. Ollama и LM Studio вам помогут.
Не очеловечивайте машину. ChatGPT - не друг, а инструмент корпорации, симулирующий эмпатию. Помните об этом, когда захотите излить ему душу.

А вы доверяете свои секреты ChatGPT? Или уже выработали свои правила AI-гигиены?
3👍1514🔥6🤔1
Уже неоднократно были ситуации на рынке LLM, когда в бенчмарке модель себя показывает просто божественно, а при реальной работе превращается в тыкву.

В таком случае каждый человек выбирает какие-то свои методы для того, чтобы оценить работу той или иной модели. Например, Коля у себя на прошлой неделе писал про Evaluations. Но это штука довольно техническая.

Мои друзья из LLM Arena (авторы бенчмарка для русскоязычных LLM), сейчас проводят опрос среди тех, кто так или иначе взаимодействует с LLM по поводу того, как вы оцениваете качество моделей.

Попросили репостнуть и я очень приветствую такую инициативу, т.к. хочется увидеть что-то более объективное, чем бенчмарки, а если это сделает кто-то из тех, кого я знаю - это будет вдвойне круто :)
1🔥1
Forwarded from LLM Arena
😨 Бенчмаркинг LLM в кризисе?

Классические лидерборды больше не отражают реальную эффективность моделей в прикладных задачах. Мы видим, что специалисты комбинируют метрики и сигналы, чтобы подобрать идеальную LLM под свой уникальный кейс.

Мы проводим новое исследование, чтобы понять:

🔹Как профессионалы выбирают решение на базе LLM.
🔹Какие данные, инструменты и сигналы реально помогают.

🧑‍💻 Для кого?

Приглашаем всех, кто профессионально связан с AI-продуктами и работает с LLM: ML-инженеры, дата-сайентисты, исследователи, продакты, MLOps и индивидуальные контрибьюторы.

➡️ Пройти опрос: https://forms.gle/dDWeWaWbxhk6qsNL7

🙏 Будем признательны за репост — это поможет собрать более широкую и качественную выборку. Мы обязательно поделимся результатами исследования по его завершению.
Please open Telegram to view this post
VIEW IN TELEGRAM
2👍2
По поводу локального ИИ

В продолжение моего вчерашнего поста про AI гигиену. Буквально вчера вышло обновление Ollama, сделавшее этот сервис более доступным для простых пользователей: они сделали нормальный интерфейс (раньше работало только через терминал и нужно было возиться с настройкой).

Для приватных задач я настоятельно рекомендую ее к установке. Я как-то делал тест локальных моделей. С тех пор изменений произошло не так много.

Базовые рекомендации такие
Для транскрибации: используем Vibe (бесплатно, есть на мак и винду), MacWhisper, SuperWhisper (эти два только на мак, платные). Также есть сервис Spokenly, оказалось, что его разработчик - @valdomars - подписчик моего канала 😅 Модель выбирайте Whisper Large v3 Turbo, она быстрая, точная и будет работать практически на любых современных компьютерах.

Для работы с LLM: теперь можно смело брать Ollama. Какую модель взять? Берите Gemma 3, обязательно QAT (у них меньше потери при сжатии, так как модель проходит через специальный процесс, который их снижает).

Чтобы скачать модель, устанавливаем Ollama, дальше открываем терминал и используем одну из следующих команд:

Если у вас слабый комьютер с меньше 8 гб объединенной памяти (для Mac)/видео памяти (для Windows)
ollama pull gemma3:1b-it-qat


Если у вас есть 8 гб объединенной/видео памяти
ollama pull gemma3:4b-it-qat


Если у вас 16 гб объединенной/видео памяти
ollama pull gemma3:12b-it-qat


Если у вас 32 и выше гб объединенной/видео памяти
ollama pull gemma3:27b-it-qat


После того, как модель скачается - она будет доступна в приложении Ollama, там вы сможете с ней общаться как с обычным ChatGPT. Не забудьте увеличить контекстное окно модели, по умолчанию оно всего 4000 токенов.

Любые вопросы по настройке пишите в комментариях, всем отвечу :)
🔥1910👍7
Красиво, но бесполезно: как Perplexity Comet убедил меня, что у AI-браузеров нет будущего

После череды разочарований в AI-браузерах вроде Dia и Genspark моей последней надеждой был Comet от Perplexity. Я с симпатией отношусь к их основному продукту, а хайп вокруг нового браузера обещал настоящую революцию. На днях я получил инвайт и теперь я не верю в концепцию AI-браузеров в ее текущем виде.

Comet встречает вас великолепным онбордингом с приятной музыкой и красивым UI. Продукт преподносится так красиво, что им ХОЧЕТСЯ пользоваться. Но как только дело доходит до реальных задач, вся магия рассеивается.

Вот шесть причин, почему
1. AI-сайдбар ломает привычки, не давая ничего взамен
Устоявшиеся паттерны использования браузеров формировались десятилетиями. Идея, что боковая панель с чатом - это удобно и эффективно, кажется мне в корне неверной. Люди все время существания интернета пользовались графическим интерфейсом. Теперь нас пытаются «пересадить» в чат. Это не нативно, не интуитивно и не дает никакой практической пользы. Чтобы AI-браузинг взлетел, нужен принципиально иной способ взаимодействия, а не просто прикрученный сбоку чат-бот.

2. AI не нужен графический интерфейс
Интернет создан для людей, а не для LLM. Нам важны интерфейсы, визуальная иерархия и эстетика. AI всё это не нужно - для него нативны HTML, XML и Markdown. Сейчас AI бразуеры работают за счет мультимодальности: они понимают текст и визуал страницы.

На практике это оборачивается медленным циклом: «распознать элементы сайта → нажать кнопку → распознать элементы нового окна → нажать следующую кнопку». Пока агент думает, я успеваю руками получить результат в несколько раз быстрее.

3. Изоляция вместо экосистемы
Для меня это критический недостаток. В Chrome я могу начать работу на Mac, продолжить на iPad и подхватить на Android-смартфоне. Вкладки, история, пароли - всё синхронизируется. Все AI-браузеры, что я пробовал, существуют только под macOS. В 2025 году выпускать продукт без кроссплатформенной экосистемы - значит делать его бесполезным для огромной аудитории.

4. Зачем нужны аналоги, когда есть Chrome + Gemini?
Давайте честно: все AI-браузеры построены на Chromium. По сути, это надстройки над Chrome с парой новых функций. Но в бета-версиях Chrome уже тестируется глубокая интеграция с Gemini. Как только Google раскатит обновление на всех, смысл в этих нишевых продуктах просто испарится. У Chrome есть всё, чего нет у стартапов: пользовательская база, кроссплатформеность и бесшовная интеграция с сервисами Google. Игра проиграна еще до ее начала.

5. Голосовые ассистенты сделают это лучше
Допустим, сценарии вроде «забронируй мне столик» или «купи билеты на самолет» станут реальностью. Но зачем для этого браузер? Эти задачи гораздо нативнее решаются через голосовых ассистентов. Google уже внедряет продвинутые функции для шопинга в Gemini в США. Нет сомнений, что ChatGPT и другие ассистенты скоро будут делать то же самое, обращаясь к сайтам через API или читая их код, а не медленно «кликая» по кнопкам.

6. Практический тест: полный провал на реальных задачах
Я дал Comet две простые задачи:
- Найти на Авито игру для Nintendo Switch ценой до 3000 рублей и добавить в корзину.
- Найти на Aviasales билеты на самолет на определенные даты с нужными мне фильтрами.

Результаты оказались плачевными.

В первом случае Comet пролистал одну страницу, не нашел игру и добавил в корзину… консоль Nintendo Switch Lite. Сообщение от него гласило «Бро, я не нашел игру, но положил тебе в корзину приставку».

С билетами ситуация не лучше. Из десяти нужных дат агент проверил только две и выдал первый попавшийся результат - с лишними пересадками и по завышенной цене. Руками я нашел вариант лучше за пару минут.

Итог: Текущее поколение AI-браузеров - это медленные, неудобные и изолированные продукты, которые пытаются решить задачи, лучше подходящие для других инструментов. И всё это - в тени Google, который готовится забрать этот рынок себе.

Возможно, я ошибаюсь, и у этой технологии есть будущее, которое я пока не вижу. А что вы думаете об AI-браузерах? Есть ли у них шанс?
218👍13🔥10👌3