Forwarded from Блокнот в винных пятнах
В мире, особенно с проникновением AI во все сферы жизни, только и разговоров, что мы живем в эпоху девальвации визуального искусства, в частности фотографии. Несмотря на то, что я нахожусь непосредственно на острие AI, я постоянно отвергал даже саму возможность его использования в творчестве. Сегодня я вдруг понял, что пришло время признать новую реальность. AI уже везде.
Вообще, если разобраться, фотография, которой я увлечён почти 20 лет, сама появилась на стыке технологий: живопись фиксировала реальность, но появление фотопроцесса сломало эту функцию, и возник новый вид искусства. Таких примеров много: театр + фото + механика → кино, музыка + электричество (синтезаторы, семплеры) → появились жанры, невозможные без технологии. Мы знаем много примеров того, как с развитием технологий меняется язык мышления, в том числе в искусстве.
А что если «картинки от нейросети» нужно воспринимать не так, а скорее в качестве диалога и итераций с художником? Ведь и написание промпта - это в каком-то роде искусство (хоть я и считаю, что это скорее сугубо инженерная задача ). И тогда художник становится режиссёром процесса и это уже волне тянет на искусство.
Сегодня, неожиданно для себя, провёл серию экспериментов с новой GPT Image 1.5 от OpenAI над своими черновиками рисунков и рандомными фотографиями. Спешу поделиться результатами. Материал специально брал не самый лучший. Приятного просмотра.
Обязательно напишите ваше мнение, а как как вы относитесь к симбиозу привычных видов искусства с AI?
Спойлер: я чувствую некоторое воодушевление от того, что так может родиться что-то потрясающе новое и свежее.
Вообще, если разобраться, фотография, которой я увлечён почти 20 лет, сама появилась на стыке технологий: живопись фиксировала реальность, но появление фотопроцесса сломало эту функцию, и возник новый вид искусства. Таких примеров много: театр + фото + механика → кино, музыка + электричество (синтезаторы, семплеры) → появились жанры, невозможные без технологии. Мы знаем много примеров того, как с развитием технологий меняется язык мышления, в том числе в искусстве.
А что если «картинки от нейросети» нужно воспринимать не так, а скорее в качестве диалога и итераций с художником? Ведь и написание промпта - это в каком-то роде искусство (
Сегодня, неожиданно для себя, провёл серию экспериментов с новой GPT Image 1.5 от OpenAI над своими черновиками рисунков и рандомными фотографиями. Спешу поделиться результатами. Материал специально брал не самый лучший. Приятного просмотра.
Обязательно напишите ваше мнение, а как как вы относитесь к симбиозу привычных видов искусства с AI?
Спойлер: я чувствую некоторое воодушевление от того, что так может родиться что-то потрясающе новое и свежее.
👍2
Forwarded from e/acc
Менеджеры в Anthropic теперь тратят 70% времени на проверку AI-кода вместо написания своего. Вся ценность менеджмента - быть мостом между мышлением и действием - автоматизируется.
Gartner прогнозирует, что к 2026 году 20% компаний вырежут половину менеджеров среднего звена. McKinsey ожидает 50-100 агентов на одного человека в зрелых внедрениях.
AI работает. Но 95% компаний не получают возврат на инвестиции от AI внедрений. Почему?
Проблема организационная. Компании прикручивают AI к сломанным процессам вместо того, чтобы переделать как работа делается.
Компании, которые правильно это делают, переходят от функциональных иерархий к сетям, ориентированным на результат.
Традиционный customer success: VP наверху, директор Sales Ops управляет L1/L2/L3 поддержкой, директор Customer Success управляет CSM и онбордингом. Куча людей делают кучу координации.
Agentic-компании делают иначе. Customer resolution в центре. Триаж-агенты анализируют запросы, knowledge-агенты синтезируют документацию, routing-агенты решают эскалации, follow-up агенты отслеживают удовлетворенность, люди-специалисты обрабатывают реально сложные сценарии.
Механизм координации сдвигается от управленческой иерархии к сети агентов.
McKinsey идентифицировал три новых архетипа менеджмента.
M-shaped Supervisor: широкий дженералист, оркеструющий агентов через несколько доменов. Системный мыслитель с высокой AI-грамотностью. Управляет результатами, не людьми.
T-shaped Expert: глубокий специалист, обрабатывающий эскалированные исключения, кейсы которые агенты не могут решить. Нюансированное суждение. Умение коучить.
AI-Augmented Frontline: работник, использующий агентов для рутинных задач, фокусируясь на высокоценной человеческой работе. Знает промт-инжиниринг. Имеет эмпатию.
Заметьте чего не хватает. Классического среднего менеджера, чья работа была получать инфу снизу, синтезировать, передавать вверх. Эта функция брокеринга информации становится избыточной когда агенты собирают, синтезируют и действуют со скоростью машины.
Обычный span of control в менеджменте - 12-15 прямых подчиненных. Число Данбара, биологический лимит человеческой координационной емкости.
Некоторый известный мне стартап оперирует с 5 людьми, надзирающими 60 постоянно работающих агентов. McKinsey проектирует 50-100 агентов на человека в зрелых внедрениях.
Проблема в том, что больше автономии создает больше сложности, не меньше.
Агенты принимают решения в миллисекундах. Люди обрабатывают в минутах или часах. На скорости машин координационные вызовы множатся. Традиционные оргструктуры никогда не сталкивались с этим несовпадением временных масштабов.
Появляющееся решение - иерархические агентские устройства где супер-агенты оркеструют кластеры специализированных агентов, с людьми предоставляющими надзор на более высоких уровнях. Это реально новая организационная конструкция, что-то между софтверной архитектурой и оргдизайном.
У нас нет хорошего языка для этого пока. Это обычно признак чего-то важного.
Это матчится с тем что Karri Saarinen описывает: обращаться с агентами как с распределенными удаленными работниками, не магическими черными ящиками. Четкое владение, async координация, оценка на основе результатов.
Этот сдвиг создает массивную возможность для фаундеров. Рынок оркестрации агентов растет до ~$10B в 2026. Больший play - организационная инфраструктура: платформы governance, протоколы agent-to-agent, HR-слой для нечеловеческих работников, управление идентичностью, атрибуция затрат, отслеживание перформанса. Deloitte называет это FinOps для агентов.
Этот паттерн повторяется через каждый крупный технологический переход:
- индустриальная революция создала фабричную иерархию
- компьютерная революция создала матричную организацию
- агентская революция создает что-то новое, Сетевую организацию.
Те, кто относятся к этому как к развертыванию софта, провалятся. Это ближе к оргдизайну и теории менеджмента чем к чистому софту.
Победители будут те, кто могут вообразить как работа выглядит когда исполнение становится дешевым и координация становится всем.
Gartner прогнозирует, что к 2026 году 20% компаний вырежут половину менеджеров среднего звена. McKinsey ожидает 50-100 агентов на одного человека в зрелых внедрениях.
AI работает. Но 95% компаний не получают возврат на инвестиции от AI внедрений. Почему?
Проблема организационная. Компании прикручивают AI к сломанным процессам вместо того, чтобы переделать как работа делается.
Компании, которые правильно это делают, переходят от функциональных иерархий к сетям, ориентированным на результат.
Традиционный customer success: VP наверху, директор Sales Ops управляет L1/L2/L3 поддержкой, директор Customer Success управляет CSM и онбордингом. Куча людей делают кучу координации.
Agentic-компании делают иначе. Customer resolution в центре. Триаж-агенты анализируют запросы, knowledge-агенты синтезируют документацию, routing-агенты решают эскалации, follow-up агенты отслеживают удовлетворенность, люди-специалисты обрабатывают реально сложные сценарии.
Механизм координации сдвигается от управленческой иерархии к сети агентов.
McKinsey идентифицировал три новых архетипа менеджмента.
M-shaped Supervisor: широкий дженералист, оркеструющий агентов через несколько доменов. Системный мыслитель с высокой AI-грамотностью. Управляет результатами, не людьми.
T-shaped Expert: глубокий специалист, обрабатывающий эскалированные исключения, кейсы которые агенты не могут решить. Нюансированное суждение. Умение коучить.
AI-Augmented Frontline: работник, использующий агентов для рутинных задач, фокусируясь на высокоценной человеческой работе. Знает промт-инжиниринг. Имеет эмпатию.
Заметьте чего не хватает. Классического среднего менеджера, чья работа была получать инфу снизу, синтезировать, передавать вверх. Эта функция брокеринга информации становится избыточной когда агенты собирают, синтезируют и действуют со скоростью машины.
Обычный span of control в менеджменте - 12-15 прямых подчиненных. Число Данбара, биологический лимит человеческой координационной емкости.
Некоторый известный мне стартап оперирует с 5 людьми, надзирающими 60 постоянно работающих агентов. McKinsey проектирует 50-100 агентов на человека в зрелых внедрениях.
Проблема в том, что больше автономии создает больше сложности, не меньше.
Агенты принимают решения в миллисекундах. Люди обрабатывают в минутах или часах. На скорости машин координационные вызовы множатся. Традиционные оргструктуры никогда не сталкивались с этим несовпадением временных масштабов.
Появляющееся решение - иерархические агентские устройства где супер-агенты оркеструют кластеры специализированных агентов, с людьми предоставляющими надзор на более высоких уровнях. Это реально новая организационная конструкция, что-то между софтверной архитектурой и оргдизайном.
У нас нет хорошего языка для этого пока. Это обычно признак чего-то важного.
Это матчится с тем что Karri Saarinen описывает: обращаться с агентами как с распределенными удаленными работниками, не магическими черными ящиками. Четкое владение, async координация, оценка на основе результатов.
Этот сдвиг создает массивную возможность для фаундеров. Рынок оркестрации агентов растет до ~$10B в 2026. Больший play - организационная инфраструктура: платформы governance, протоколы agent-to-agent, HR-слой для нечеловеческих работников, управление идентичностью, атрибуция затрат, отслеживание перформанса. Deloitte называет это FinOps для агентов.
Этот паттерн повторяется через каждый крупный технологический переход:
- индустриальная революция создала фабричную иерархию
- компьютерная революция создала матричную организацию
- агентская революция создает что-то новое, Сетевую организацию.
Те, кто относятся к этому как к развертыванию софта, провалятся. Это ближе к оргдизайну и теории менеджмента чем к чистому софту.
Победители будут те, кто могут вообразить как работа выглядит когда исполнение становится дешевым и координация становится всем.
👍2
Forwarded from Share.AI | Инсайты, события, комьюнити
Новые релизы на CES 2026
Как и ожидалось, искусственный интеллект находится в центре внимания, и практически все релизы прямо или косвенно связаны с ИИ. Пройдемся по самым интересным:
1. CEO Nvidia открыл выставку CES 2026
- Rubin Platform новый флагманский AI-платформенный стек.
- Анонсировали серию открытых моделей, ориентированных на реальные сферы применения: медицину, климатическое моделирование, робототехнику и симуляцию, автономное вождение и reasoning-VLA.
- Был показан автомобиль на базе NVIDIA DRIVE с AI-управлением.
вся презентация
2. Uber, Lucid и Nuro впервые представили серийную версию роботакси.
3. Google показали новый функционал Gemini, который в ближайшее время появятся на платформе Google TV. Понятно, что все завязано на ИИ: поиск, работа с личными фотографиями и видео, а также управление телевизором с помощью голосовых команд.
4. Casio представили ИИ-питомца под названием Moflin. У робота более 10 сенсорных систем, позволяющих реагировать на прикосновения. Moflin создан прежде всего для ухода за пожилыми людьми: он обучается поведенческим паттернам пользователей, включая особенности голоса.
5. "BlackBerry" вернулся?😁 Clicks, известная чехлом, который превращает смартфон в подобие BlackBerry за счет физической клавиатуры с кнопками, представила смартфон Communicator стоимостью $499.
Как и ожидалось, искусственный интеллект находится в центре внимания, и практически все релизы прямо или косвенно связаны с ИИ. Пройдемся по самым интересным:
1. CEO Nvidia открыл выставку CES 2026
- Rubin Platform новый флагманский AI-платформенный стек.
- Анонсировали серию открытых моделей, ориентированных на реальные сферы применения: медицину, климатическое моделирование, робототехнику и симуляцию, автономное вождение и reasoning-VLA.
- Был показан автомобиль на базе NVIDIA DRIVE с AI-управлением.
вся презентация
2. Uber, Lucid и Nuro впервые представили серийную версию роботакси.
3. Google показали новый функционал Gemini, который в ближайшее время появятся на платформе Google TV. Понятно, что все завязано на ИИ: поиск, работа с личными фотографиями и видео, а также управление телевизором с помощью голосовых команд.
4. Casio представили ИИ-питомца под названием Moflin. У робота более 10 сенсорных систем, позволяющих реагировать на прикосновения. Moflin создан прежде всего для ухода за пожилыми людьми: он обучается поведенческим паттернам пользователей, включая особенности голоса.
5. "BlackBerry" вернулся?😁 Clicks, известная чехлом, который превращает смартфон в подобие BlackBerry за счет физической клавиатуры с кнопками, представила смартфон Communicator стоимостью $499.
🤷♂1👍1
Фейк или слив, но что если носимый девайс OpenAI это ручка? С камерой и микрофоном, с распознаванием заметок от руки. Звучит очень скевоморфично, а ведь это сильно более понятно, чем некая брошь.
https://youtu.be/xMCcR9Q-QyY?si=J_fCZLE_bwK3E7Ql
https://youtu.be/xMCcR9Q-QyY?si=J_fCZLE_bwK3E7Ql
YouTube
OpenAI’s AI Pen Might Be the First AI Device That Works
Checkout my newsletter : - https://aigrid.beehiiv.com/subscribe
🐤 Follow Me on Twitter https://twitter.com/TheAiGrid
🌐 Learn AI With Me : https://www.skool.com/postagiprepardness/about
Links From Todays Video:
Welcome to my channel where i bring you the…
🐤 Follow Me on Twitter https://twitter.com/TheAiGrid
🌐 Learn AI With Me : https://www.skool.com/postagiprepardness/about
Links From Todays Video:
Welcome to my channel where i bring you the…
👍2
Forwarded from 42 секунды
TechCrunch: Бывшая глава Yahoo привлекла $8 млн для разработки ИИ-помощников нового поколения
– Марисса Майер привлекла инвестиции для стартапа Dazzle
– Dazzle ориентирован на ИИ-помощников нового поколения
– Детали про свой новый стартап Майер пока не раскрывает
– Dazzle получил 8 млн финансирования по оценке $35 млн
– Инвесторы: Kleiner Perkins, Bling Capital, Slow Ventures и др.
– Марисса Майер также вложила в Dazzle собственный капитал
– Однако отмечается, что раунд возглавил фонд Kleiner Perkins
– Раньше Майер развивала стартап под названием Sunshine
– Стартап помогал управлять контактами и обмениваться фото
– Sunshine не увенчался успехом, Майер решила закрыть проект
@ftsec
– Марисса Майер привлекла инвестиции для стартапа Dazzle
– Dazzle ориентирован на ИИ-помощников нового поколения
– Детали про свой новый стартап Майер пока не раскрывает
– Dazzle получил 8 млн финансирования по оценке $35 млн
– Инвесторы: Kleiner Perkins, Bling Capital, Slow Ventures и др.
– Марисса Майер также вложила в Dazzle собственный капитал
– Однако отмечается, что раунд возглавил фонд Kleiner Perkins
– Раньше Майер развивала стартап под названием Sunshine
– Стартап помогал управлять контактами и обмениваться фото
– Sunshine не увенчался успехом, Майер решила закрыть проект
@ftsec
👍2
Почему-то пишут в соц-сетях, что Claude Code доехал до приложения Claude только сегодня, хотя вроде еще в ноябре-декабре.
Но в общем, если вы давно не открывали Claude апп, то попробуйте его как более простой интерфейс для Claude Code чем терминал. Ну или как альтернативу или приложение к Cursor.
Из странных багов — у меня не получается продолжить сессию когда закончились токены, даже по возврату в чат в нужное время. Если сталкивались и обошли, расскажите как.
Но в общем, если вы давно не открывали Claude апп, то попробуйте его как более простой интерфейс для Claude Code чем терминал. Ну или как альтернативу или приложение к Cursor.
Из странных багов — у меня не получается продолжить сессию когда закончились токены, даже по возврату в чат в нужное время. Если сталкивались и обошли, расскажите как.
👍2
Forwarded from Радиорубка Лихачёва
OpenAI анонсировала ChatGPT Health
Пространство для фокуса на темах о медицине и личном здоровье.
Пользователи и так уже общаются с ChatGPT, чтобы разобраться в своих анализах, обсудить симптомы, получить помощь и поддержку. 230 миллионов каждую неделю — это очень много от почти миллиардной аудитории сервиса. И OpenAI раньше тоже старались улучшить ответы на эти щепетильные темы, особенно ввиду обвинений в доведении некоторых пользователей до суицида.
Но теперь речь об отдельном пространстве внутри приложения, данные из которого не будут использоваться в других чатах. А главное: можно подключить внешние источники информации о здоровье, такие как Apple Health, чтобы ChatGPT имел постоянно актуальные данные о здоровье.
Я тут вижу потенциально сильный удар по всем welness-сервисам. Если такой сервис сгружает данные в условный Apple Health для удобства пользователя, теперь ChatGPT сможет забрать на себя весь слой взаимодействия с этой информацией.
Например, у меня есть кольцо Oura. Оно круглосуточно получает данные с нескольких датчиков о движении, пульсе и даже температуре тела, и хотя хранит многие из них в Apple Health, но в приложении Oura есть AI-советник, который может помогать объяснять тренды здоровья, давать рекомендации и дополнительную ценность к существующим дашбордам. Но я не загружаю туда никакие дополнительные данные, а в ChatGPT — бывает.
Создав ChatGPT Health как пространство для слива таких данных, OpenAI постепенно накопит там такой массив данных о пользователе из разных источников, что пользоваться другими сервисами для изучения и обсуждения собственного самочувствия будет не эффективно. К тому же тут можно пообщаться голосом, показывать фотки и видео, сгружать массивы документов.
Я даже не могу представить, сможет ли у какого-то сервиса получиться защититься от такой стратегии. Да, носимую электронику можно по-прежнему продавать, но её маржинальность под угрозой из-за Xiaomi и других демпингующих производителей из Китая. А вся дополнительная ценность сервисов вокруг обработки информации постепенно перейдёт в ChatGPT. Даже Apple Health, который создавался как дата-платформа как раз для того, чтобы как Кольцом Всевластия править всеми health-сервисами, теперь просто прокладка на пути OpenAI, ведь момент с запуском собственного конкурента Apple упустила.
Другие возможности подключения сервисов:
— Peloton для тренировок;
— Weight Watchers для диеты;
— Function для анализов;
— Данные из медкарты (тут явно в избранных медзаведениях);
— И даже Instacart для заказа еды в соответствии с ограничениями и диетой.
Впрочем, до доминирования пока ещё далеко. Чтобы воспользоваться ChatGPT Health, нужно подать заявку в список ожидания, ссылка на который сейчас показывает 404. Также это не будет работать в Европе, Великобритании и Швейцарии. Ну и надо помнить, что суды в США могут получить доступ к данным из чатов — OpenAI об этом в анонсе, конечно же, не говорит.
Пространство для фокуса на темах о медицине и личном здоровье.
Пользователи и так уже общаются с ChatGPT, чтобы разобраться в своих анализах, обсудить симптомы, получить помощь и поддержку. 230 миллионов каждую неделю — это очень много от почти миллиардной аудитории сервиса. И OpenAI раньше тоже старались улучшить ответы на эти щепетильные темы, особенно ввиду обвинений в доведении некоторых пользователей до суицида.
Но теперь речь об отдельном пространстве внутри приложения, данные из которого не будут использоваться в других чатах. А главное: можно подключить внешние источники информации о здоровье, такие как Apple Health, чтобы ChatGPT имел постоянно актуальные данные о здоровье.
Я тут вижу потенциально сильный удар по всем welness-сервисам. Если такой сервис сгружает данные в условный Apple Health для удобства пользователя, теперь ChatGPT сможет забрать на себя весь слой взаимодействия с этой информацией.
Например, у меня есть кольцо Oura. Оно круглосуточно получает данные с нескольких датчиков о движении, пульсе и даже температуре тела, и хотя хранит многие из них в Apple Health, но в приложении Oura есть AI-советник, который может помогать объяснять тренды здоровья, давать рекомендации и дополнительную ценность к существующим дашбордам. Но я не загружаю туда никакие дополнительные данные, а в ChatGPT — бывает.
Создав ChatGPT Health как пространство для слива таких данных, OpenAI постепенно накопит там такой массив данных о пользователе из разных источников, что пользоваться другими сервисами для изучения и обсуждения собственного самочувствия будет не эффективно. К тому же тут можно пообщаться голосом, показывать фотки и видео, сгружать массивы документов.
Я даже не могу представить, сможет ли у какого-то сервиса получиться защититься от такой стратегии. Да, носимую электронику можно по-прежнему продавать, но её маржинальность под угрозой из-за Xiaomi и других демпингующих производителей из Китая. А вся дополнительная ценность сервисов вокруг обработки информации постепенно перейдёт в ChatGPT. Даже Apple Health, который создавался как дата-платформа как раз для того, чтобы как Кольцом Всевластия править всеми health-сервисами, теперь просто прокладка на пути OpenAI, ведь момент с запуском собственного конкурента Apple упустила.
Другие возможности подключения сервисов:
— Peloton для тренировок;
— Weight Watchers для диеты;
— Function для анализов;
— Данные из медкарты (тут явно в избранных медзаведениях);
— И даже Instacart для заказа еды в соответствии с ограничениями и диетой.
Впрочем, до доминирования пока ещё далеко. Чтобы воспользоваться ChatGPT Health, нужно подать заявку в список ожидания, ссылка на который сейчас показывает 404. Также это не будет работать в Европе, Великобритании и Швейцарии. Ну и надо помнить, что суды в США могут получить доступ к данным из чатов — OpenAI об этом в анонсе, конечно же, не говорит.
👍3
Google выкатил в Gmail AI Inbox и AI Overview для платных подписчиков в USA
🤷
https://blog.google/products-and-platforms/products/gmail/gmail-is-entering-the-gemini-era/
🤷
https://blog.google/products-and-platforms/products/gmail/gmail-is-entering-the-gemini-era/
🤷♂3
Forwarded from Cерафимодальный AI
Ральф Виггум
В мире вайбкодинга новый шериф — агентный подход под названием Ralph Wiggum. Я столько ждал, что кто-то на русском разберётся, о чем весь шум, что сам стал этим человеком.
Ральф, если что, герой Симпсонов восьми лет от роду с задержкой развития, на которого всем плевать. Хорош он лишь в двух вещах — «спать и действовать» (цитата по симпсонвики), и именно эти характеристики и становятся определяющими для нашего рассказа. Ральф Виггум это: скрипт, который работает, пока вы спите. Всё.
Но как именно это работает? Чтобы в этом разобраться, нужно кратко обозреть на прошлое и настоящее вайбкодинга.
Весной прошлого года я вел внутренний воркшоп об основах вайбкодинга. Если вы давно подписаны на канал, то знаете, что из той полуторачасовой сессии родился Бот Вояж, которым я с удовольствием пользуюсь до сих пор в путешествиях. Но как он был построен?
К слову, я думаю начать преподавать агентский кодинг для непрограммистов на широкую аудиторию: если вы думаете, что вам нужен такой семинар/практикум/серия лекций — пишите, договоримся.
Эры вайбкодинга можно выделить следующие.
1. Скромное обаяние новизны
Также известное как «я дал ChatGPT задание написать калькулятор и он справился, программисты больше не нужны, отсосите какосеки»
2. Долина разочарования
«Но когда я попросил гпт сделать именно тот калькулятор, который нужен мне, он выдал кучу ошибок и стёр исходный код. Этот манёвр обошёлся мне в 430 долларов, ai — пузырь на плато, робот не напишет симфонию, вайбкодеры — слоператоры!»
3. Адаптация
Cursorrules, Claude.md, PRD.md и тест дривен девелопмент: оказывается, если со всех сторон обложить код-агентов бесконечными правилами и ограничениями, то можно за какое-то вменяемое количество итераций все же заставить его написать ровно тот код, который тебе нужен. Прямо как с живыми программистами.
Кстати, на этом этапе и написаны большинство моих проектов, включая тот самый семинар с бот-экскурсоводом. Фактически, мы час писали документацию, потом Курсор 10 минут писал по ней код, а затем мы его задеплоили и приклеили к телеграму
4. Первые автономные код-агенты
Прежде всего, Клод Опус 4.5 (на клодкоде или в курсоре), но и GPT Codex с Gemini не сильно отстают.
Важная часть этого этапа — возврат к шагу два, но теперь агенты начинают адекватно воспринимать обратную связь и более-менее успешно ей следовать.
5. Сегодняшний момент: Курсор 2 и Клод Код 2
Среды, заточенные уже на более профессиональные пайплайны: прежде всего, work tree, когда под каждый новый таск заводится отдельный бранч в гите (причём их может быть несколько на одну задачу, и человек сам выбирает, решение в каком из них ему нравится больше), и субагенты с хуками в клодкоде (совсем запретная магия, давайте про это в другой раз).
На этом этапе любой 0->1 девелопер, который просто хотел повайбиться с Клодиком под одеялком чтобы собрать свой первый b2b SaaS калькулятор окончательно понимает, что здесь ему больше не рады.
Мой собственный док сегодня включает как минимум:
- PRD
- имплементейшен план
- файл со структурой проекта
- файл с техспеками
- ридми
- ченджлог
- рулз с приказом вносить все изменения в ченджлог и пушить все измененить в конце каждого значимого оборота (но это все равно не работает).
Если вы не поняли абсолютно ничего из этого списка, поздравляю, вы совершенно нормальный человек, который совершенно точно случайно не проебет 1300 евро на боте который выдает инвайты в Сору 2.
НО ИМЕННО ЭТУ ПРОБЛЕМУ И ПЫТАЕТСЯ РЕШИТЬ РАЛЬФ
Вместо того, чтобы грузить людей непонятной и выглядящей откровенно сомнительной хуитенью, Ральф использует баш скрипт, который гоняет все эти шаги по кругу.
Как именно это устроено (простите, снова список, я не ИИ, честно):
1. Конверсейшнл чат-бот, с которым вы естественным языком общаетесь, что вы хотите построить, а он в ответ формирует ТЗ — тот самый PRD.md.
“Хочу ну типа калькулятор но чтобы когда типа на ноль делишь чтобы он типа переворачивался и писал цифрами SOSI EBLO“
2. Этап, который разбивает получившееся ТЗ на сценарии, и формирует (вместе с вами) критерии выполнения.
В мире вайбкодинга новый шериф — агентный подход под названием Ralph Wiggum. Я столько ждал, что кто-то на русском разберётся, о чем весь шум, что сам стал этим человеком.
Ральф, если что, герой Симпсонов восьми лет от роду с задержкой развития, на которого всем плевать. Хорош он лишь в двух вещах — «спать и действовать» (цитата по симпсонвики), и именно эти характеристики и становятся определяющими для нашего рассказа. Ральф Виггум это: скрипт, который работает, пока вы спите. Всё.
Но как именно это работает? Чтобы в этом разобраться, нужно кратко обозреть на прошлое и настоящее вайбкодинга.
Весной прошлого года я вел внутренний воркшоп об основах вайбкодинга. Если вы давно подписаны на канал, то знаете, что из той полуторачасовой сессии родился Бот Вояж, которым я с удовольствием пользуюсь до сих пор в путешествиях. Но как он был построен?
Эры вайбкодинга можно выделить следующие.
1. Скромное обаяние новизны
Также известное как «я дал ChatGPT задание написать калькулятор и он справился, программисты больше не нужны, отсосите какосеки»
2. Долина разочарования
«Но когда я попросил гпт сделать именно тот калькулятор, который нужен мне, он выдал кучу ошибок и стёр исходный код. Этот манёвр обошёлся мне в 430 долларов, ai — пузырь на плато, робот не напишет симфонию, вайбкодеры — слоператоры!»
3. Адаптация
Cursorrules, Claude.md, PRD.md и тест дривен девелопмент: оказывается, если со всех сторон обложить код-агентов бесконечными правилами и ограничениями, то можно за какое-то вменяемое количество итераций все же заставить его написать ровно тот код, который тебе нужен. Прямо как с живыми программистами.
Кстати, на этом этапе и написаны большинство моих проектов, включая тот самый семинар с бот-экскурсоводом. Фактически, мы час писали документацию, потом Курсор 10 минут писал по ней код, а затем мы его задеплоили и приклеили к телеграму
4. Первые автономные код-агенты
Прежде всего, Клод Опус 4.5 (на клодкоде или в курсоре), но и GPT Codex с Gemini не сильно отстают.
Важная часть этого этапа — возврат к шагу два, но теперь агенты начинают адекватно воспринимать обратную связь и более-менее успешно ей следовать.
5. Сегодняшний момент: Курсор 2 и Клод Код 2
Среды, заточенные уже на более профессиональные пайплайны: прежде всего, work tree, когда под каждый новый таск заводится отдельный бранч в гите (причём их может быть несколько на одну задачу, и человек сам выбирает, решение в каком из них ему нравится больше), и субагенты с хуками в клодкоде (совсем запретная магия, давайте про это в другой раз).
На этом этапе любой 0->1 девелопер, который просто хотел повайбиться с Клодиком под одеялком чтобы собрать свой первый b2b SaaS калькулятор окончательно понимает, что здесь ему больше не рады.
Мой собственный док сегодня включает как минимум:
- PRD
- имплементейшен план
- файл со структурой проекта
- файл с техспеками
- ридми
- ченджлог
- рулз с приказом вносить все изменения в ченджлог и пушить все измененить в конце каждого значимого оборота (но это все равно не работает).
Если вы не поняли абсолютно ничего из этого списка, поздравляю, вы совершенно нормальный человек, который совершенно точно случайно не проебет 1300 евро на боте который выдает инвайты в Сору 2.
НО ИМЕННО ЭТУ ПРОБЛЕМУ И ПЫТАЕТСЯ РЕШИТЬ РАЛЬФ
Вместо того, чтобы грузить людей непонятной и выглядящей откровенно сомнительной хуитенью, Ральф использует баш скрипт, который гоняет все эти шаги по кругу.
Как именно это устроено (простите, снова список, я не ИИ, честно):
1. Конверсейшнл чат-бот, с которым вы естественным языком общаетесь, что вы хотите построить, а он в ответ формирует ТЗ — тот самый PRD.md.
“Хочу ну типа калькулятор но чтобы когда типа на ноль делишь чтобы он типа переворачивался и писал цифрами SOSI EBLO“
2. Этап, который разбивает получившееся ТЗ на сценарии, и формирует (вместе с вами) критерии выполнения.
👍2
Forwarded from Cерафимодальный AI
>> часть 2 (дожили, приходится треды в телеграме писать)
Но как именно мы поймем, что часть про соси ебло выполнена? когда при выполнении операции с делением на ноль откроется браузер, в нем запустится наш калькулятор, у него на экране будет 0783 1505, и затем он перевернётся.
Хитрая часть, которую придумали в фреймворке Ральфа: для пущей надежности сценарии здесь превращаются из обычного тектового формата в длинный JSON файл, где у каждого сценария стоит статус 0 или 1. Фактически, это то же, что я на коленке делал с implementation_plan.md, только структурированное.
3. После этого запускаем сам баш скрипт. На вход нужно указать, сколько максимум лупов он может провернуть (в конце концов, это все ваши деньги на токены).
4. Когда он доходит до конца выполнения первой задачи, он запускает цикл проверки — те самые критерии приёмки.
5. Критически важная часть: в конце цикла агент обязан ОБНОВИТЬ ТЗ и НАПИСАТЬ ЛОГ. То есть отчитаться, справился ли он с задачей, что пошло не по плану, что отличалось от ожиданий, и какие особенности имплементации решения нужно учесть в будущем. Да, это тоже часть, которая у меня была в курсоррулез и регулярно не срабатывала — но здесь вызывается безжалостным детерминированным циклом.
6. Наконец, финальное фундаментальное отличие от вайбкодинга в Курсоре или КлодКоде: после завершения лупа агент не передает контекст далее. Следующий цикл принимает новый инстанс агента с чистой памятью. Однако у него уже обновлено ТЗ прошлым агентом и переданы только минимальные необходимые сведения. Он смотрит на файл с тз, и смотрит, у каких ещё сценариев не поставлены единички. Колесо Сансары заходит на новый оборот.
7. Вы, как и положено Ральфу, спите, чтобы с утреца пораньше узнать, куда же вас привела эта опричная гусеница.
Репозиторий, в котором лежат все скрипты и файлы: https://github.com/snarktank/ralph?tab=readme-ov-file
Подход в деталях изложен в твиттере: https://x.com/ryancarson/status/2008548371712135632?s=46&t=MNy-LfGucqQvXbR6Iwg3DQ
Там же есть живой пример. Только учтите, что они там рекламируют свою какую-то платформу АмпКод, я хз что это, нужно все запускать через Клод
Всем Виггум!
Но как именно мы поймем, что часть про соси ебло выполнена? когда при выполнении операции с делением на ноль откроется браузер, в нем запустится наш калькулятор, у него на экране будет 0783 1505, и затем он перевернётся.
Хитрая часть, которую придумали в фреймворке Ральфа: для пущей надежности сценарии здесь превращаются из обычного тектового формата в длинный JSON файл, где у каждого сценария стоит статус 0 или 1. Фактически, это то же, что я на коленке делал с implementation_plan.md, только структурированное.
3. После этого запускаем сам баш скрипт. На вход нужно указать, сколько максимум лупов он может провернуть (в конце концов, это все ваши деньги на токены).
4. Когда он доходит до конца выполнения первой задачи, он запускает цикл проверки — те самые критерии приёмки.
5. Критически важная часть: в конце цикла агент обязан ОБНОВИТЬ ТЗ и НАПИСАТЬ ЛОГ. То есть отчитаться, справился ли он с задачей, что пошло не по плану, что отличалось от ожиданий, и какие особенности имплементации решения нужно учесть в будущем. Да, это тоже часть, которая у меня была в курсоррулез и регулярно не срабатывала — но здесь вызывается безжалостным детерминированным циклом.
6. Наконец, финальное фундаментальное отличие от вайбкодинга в Курсоре или КлодКоде: после завершения лупа агент не передает контекст далее. Следующий цикл принимает новый инстанс агента с чистой памятью. Однако у него уже обновлено ТЗ прошлым агентом и переданы только минимальные необходимые сведения. Он смотрит на файл с тз, и смотрит, у каких ещё сценариев не поставлены единички. Колесо Сансары заходит на новый оборот.
7. Вы, как и положено Ральфу, спите, чтобы с утреца пораньше узнать, куда же вас привела эта опричная гусеница.
Репозиторий, в котором лежат все скрипты и файлы: https://github.com/snarktank/ralph?tab=readme-ov-file
Подход в деталях изложен в твиттере: https://x.com/ryancarson/status/2008548371712135632?s=46&t=MNy-LfGucqQvXbR6Iwg3DQ
Там же есть живой пример. Только учтите, что они там рекламируют свою какую-то платформу АмпКод, я хз что это, нужно все запускать через Клод
Всем Виггум!
👍3
Forwarded from GPT/ChatGPT/AI Central Александра Горного
ChatGPT впервые решил одну из задач Эрдёша
Пару месяцев назад вице-президент OpenAI попал в неловкую ситуацию, когда с гордостью объявил, что «GPT-5 решила десять нерешённых задач Эрдёша». Тогда выяснилось, что ChatGPT ничего не решал, а нашёл решения в опубликованных научных работах.
На днях ChatGPT действительно решил одну из сотен математических задач Эрдёша. В работе участвовала связка моделей: GPT-5.2 Thinking предложила подход к решению, а GPT-5.2 Pro cгенерировала доказательства и оформила их в LaTeX. Затем математический AI Aristotle перевел всё на язык Lean, чтобы решение можно было проверить на компьютере.
Моделями управляли два энтузиаста с Reddit. Известно, что один из них — студент-математик.
https://www.erdosproblems.com/forum/thread/728
Пару месяцев назад вице-президент OpenAI попал в неловкую ситуацию, когда с гордостью объявил, что «GPT-5 решила десять нерешённых задач Эрдёша». Тогда выяснилось, что ChatGPT ничего не решал, а нашёл решения в опубликованных научных работах.
На днях ChatGPT действительно решил одну из сотен математических задач Эрдёша. В работе участвовала связка моделей: GPT-5.2 Thinking предложила подход к решению, а GPT-5.2 Pro cгенерировала доказательства и оформила их в LaTeX. Затем математический AI Aristotle перевел всё на язык Lean, чтобы решение можно было проверить на компьютере.
Моделями управляли два энтузиаста с Reddit. Известно, что один из них — студент-математик.
https://www.erdosproblems.com/forum/thread/728
Forwarded from эйай ньюз
This media is not supported in your browser
VIEW IN TELEGRAM
Оказывается, у Google Vids есть свои AI-аватары
В отличие от HeyGen и прочих, они сделаны на основе Veo 3.1, причём максимальная длина клипа — 30 секунд с последующим липсинком.
Пайплайн немного странный. Во-первых, откуда 30 секунд, Video extend? Во-вторых, зачем липсинк? Veo вроде и так неплохо генерил синхронизированное аудио. Или это такой костыль, чтобы смэтчить голос? Удивительно, но этот винегрет из надстроек и палок выглядит не так уж и плохо.
Правда, возможности сделать кастомного аватара нет — набор ограничен 12 персонажами. К тому же поддерживается только английский.
В общем, эксперименты Google Labs выглядят более готовыми к проду, чем нововведения в Google Vids.
Кстати, дают 20 генераций в неделю.
@ai_newz
В отличие от HeyGen и прочих, они сделаны на основе Veo 3.1, причём максимальная длина клипа — 30 секунд с последующим липсинком.
Пайплайн немного странный. Во-первых, откуда 30 секунд, Video extend? Во-вторых, зачем липсинк? Veo вроде и так неплохо генерил синхронизированное аудио. Или это такой костыль, чтобы смэтчить голос? Удивительно, но этот винегрет из надстроек и палок выглядит не так уж и плохо.
Правда, возможности сделать кастомного аватара нет — набор ограничен 12 персонажами. К тому же поддерживается только английский.
В общем, эксперименты Google Labs выглядят более готовыми к проду, чем нововведения в Google Vids.
Кстати, дают 20 генераций в неделю.
@ai_newz
Forwarded from e/acc
хочется поделиться некоторыми фактами, которые стали очевидны за последние три недели примерно всему интернету
1. эра слоп-кода закончилась. да, если руки из ягодиц, то вы все равно будете производить слоп, но это больше не ограничения системы, а только лень/глупость пользователя.
2. любой человек может сегодня создать любой софт, нужно только желание и фокус. вопрос "зачем?" и вопрос мотивации/агентности это делать и доводить до конца LLM не снимают.
3. лучшие организации (на скриншоте СЕО Shopify) получат 100х преимущество от AI-native процессов, худшие — не получат никакого и останутся за гранью релевантности
4. (my bet) то, что сегодня происходит с кодом, в течении года будет происходить со всеми областями knowledge work: продажи, юристы, финансы, контент, логистика, управление, наука, what have you
5. каждый человек теперь является корпорацией, в которой вы - босс, а на вас работают десятки агентов. вашей задачей становится теперь миссия, стратегия, структура управления, постановка задач в этой корпорации
6. каждая компания теперь не просто коллектив людей, но кибернетическая организация, в которой на каждого человека приходятся десятки агентов. структура менеджмента меняется. организационный дизайн перестраивается. это куда важнее (и больнее, дороже), чем классическая «ИТ-трансформация» и «внедрения»
7. навык выстраивать собственную агентскую систему для жизни и бизнеса становится одним из важнейших, а важнейшим — по-прежнему агентность. особенно сейчас, когда возможностей в мире больше, чем когда-либо. но и времени заработать денег тоже всё меньше :)
8. софт постепенно (от простого к все более сложному) перестает быть чем-то уникальным, маржа падает. если клиенту не хочется платить $50 в мес, то он может сделать себе похожий продукт и использовать по себестоимости
9. любая железка — это информационный поток. любой робот — это софт. в конечном счете, это не про то чтобы двинуть атомы из точки а в б, а про процесс: нанять людей, прочитать их резюме, провести интервью, собрать инструкции, заказать оборудование, заполнить таможенные декларации, найти поставщика, купить метериалы, заказать доставку, запустить машины, построить процесс, произвести детали, собрать робота, договориться с ритейлером, продать робота, посчитать налоги.
1. эра слоп-кода закончилась. да, если руки из ягодиц, то вы все равно будете производить слоп, но это больше не ограничения системы, а только лень/глупость пользователя.
2. любой человек может сегодня создать любой софт, нужно только желание и фокус. вопрос "зачем?" и вопрос мотивации/агентности это делать и доводить до конца LLM не снимают.
3. лучшие организации (на скриншоте СЕО Shopify) получат 100х преимущество от AI-native процессов, худшие — не получат никакого и останутся за гранью релевантности
4. (my bet) то, что сегодня происходит с кодом, в течении года будет происходить со всеми областями knowledge work: продажи, юристы, финансы, контент, логистика, управление, наука, what have you
5. каждый человек теперь является корпорацией, в которой вы - босс, а на вас работают десятки агентов. вашей задачей становится теперь миссия, стратегия, структура управления, постановка задач в этой корпорации
6. каждая компания теперь не просто коллектив людей, но кибернетическая организация, в которой на каждого человека приходятся десятки агентов. структура менеджмента меняется. организационный дизайн перестраивается. это куда важнее (и больнее, дороже), чем классическая «ИТ-трансформация» и «внедрения»
7. навык выстраивать собственную агентскую систему для жизни и бизнеса становится одним из важнейших, а важнейшим — по-прежнему агентность. особенно сейчас, когда возможностей в мире больше, чем когда-либо. но и времени заработать денег тоже всё меньше :)
8. софт постепенно (от простого к все более сложному) перестает быть чем-то уникальным, маржа падает. если клиенту не хочется платить $50 в мес, то он может сделать себе похожий продукт и использовать по себестоимости
9. любая железка — это информационный поток. любой робот — это софт. в конечном счете, это не про то чтобы двинуть атомы из точки а в б, а про процесс: нанять людей, прочитать их резюме, провести интервью, собрать инструкции, заказать оборудование, заполнить таможенные декларации, найти поставщика, купить метериалы, заказать доставку, запустить машины, построить процесс, произвести детали, собрать робота, договориться с ритейлером, продать робота, посчитать налоги.
👍1