NEW BOT Телеграм, страница

Cерафимодальный AI

Gemini 3, флагманская модель Google

Чтобы внимательно её изучить, нужно несколько недель прицельного использования, которых у меня конечно не было. Зато они были у моего любимого популяризатора AI Итана Моллика, которому дали ранний доступ. Сегодня он опубликовал обзор, который напоминает эссе «чего мы достигли с момента запуска ChatGPT» — о парадигмальном сдвиге от чатбота к помощнику.

https://www.oneusefulthing.org/p/three-years-from-gpt-3-to-gemini

Эссе состоит из двух частей. Первая — про недооцененную важность AI-разработки для непрограммистов:

A fundamental perspective powering AI development is that everything you do on a computer is, ultimately, code, and if AI can work with code it can do anything someone with a computer can: build you dashboards, work with websites, create PowerPoint, read your files, and so on

Цитируя классика, everything's computer.

Вторая — про «PhD уровень» LLM, которая скорее сводится к нескольким ультрасложным кейсам, которые Gemini шутя решил (и к честности которых у меня есть вопросы). Очевидно, что делать дорогие и достаточно сложные рисёчи без постоянного присмотра человека LLM уже научились, я регулярно наблюдаю это в последний месяц, когда даю задачку Клоду на ночь, а с утра обнаруживаю её выполненной без ошибок.

Human in the loop, по Моллику, наконец-то меняется с «исправлять ошибки за нейросетями» до «руководить их работой».

Ты тимлид, Гарри.

www.oneusefulthing.org

Three Years from GPT-3 to Gemini 3

From chatbots to agents

❤6

576 viewsedited 19:30

Cерафимодальный AI

❤2

561 views21:14

Cерафимодальный AI

❤‍🔥10

514 views12:36

Cерафимодальный AI

тем временем Клод: попросил поставить ему дизлайк, чтобы на мой фичреквест точно обратили внимание его разработчики.

❤‍🔥11💔6👍4🤔1

653 views12:37

Cерафимодальный AI

адвент-календарь со промиками на AI-инструменты. в программе 11labs, n8n, lovable, и ещё куча менее известных

https://www.25daysofagents.com

25Daysofagents

25 Days of Agents | An Advent Calendar for AI Agents

25 Days of Agents is an advent calendar for AI agent builders. Get exclusive deals from top AI companies like ElevenLabs, Exa, Firecrawl, and more. A new deal unlocks every day at 5PM GMT from December 1st to 25th.

❤2

673 viewsedited 16:12

Cерафимодальный AI

Forwarded from Aleksei Shipulin

"Гена, ты меня просил принести полотенце, вот я пошёл в спальню..." Нет, как-то странно, надо покороче. *Thinking* "Гена, помнишь, ты просил меня..." Слишком долго. *Pondering* *9 websites searched* "Гена, вот то самое полотенце...". Стоп, почему то самое. *Gathering thoughts* Надо проще. "Гена, вот твоё полотенце". Нет, можно лучше. *Summarizing* "Гена, возьми". Нет, проще. "Гена, на". "Гена, на". "Гена, на". "Гена, на". "Ге

😁29❤4😭2❤‍🔥1

667 views17:27

Cерафимодальный AI

говорит на кложьем

🔥8😁1

471 views00:19

Cерафимодальный AI

Подкаст с CPO Codex от OpenAI, куча прикольных тейков — про дизайн в OpenAI, бутылочное горлышко человеческих возможностей и интерес ревьюинья кода. Главный, конечно, про вырастание ценности продуктовых исследований: знать что и для кого строить становится важнее, чем как.

Что значит: 1. имейте у себя продакт-рисеч команду, и 2. будьте уверены, что эта команда ai-ready; многие MR и UX рисечеры сегодня, на мой взгляд, двигаются недостаточно быстро. Слава богу у нас наоборот, одна только моя группа зашиппила 4 AI исследовательских инструмента за последние полгода.

Я сам, скажу честно, Кодексом почти не пользовался, но слышал от друзей и ai-броз что он турбо хорош.

Если вы запускаете компанию сегодня, глубокое понимание конкретного клиента важнее, чем умение строить продукт. Строить становится проще. Знать, что именно строить — и для кого — вот в чём теперь настоящее преимущество.

Написание кода, возможно, становится универсальным способом, которым ИИ выполняет любые задачи. Вместо того чтобы кликать по интерфейсам или выстраивать отдельные интеграции, ИИ работает лучше всего, когда пишет небольшие программы на лету. Из этого следует, что умение программировать должно быть встроено в каждого ИИ-ассистента, а не только в специализированные инструменты для разработчиков.

Дизайнеры в OpenAI теперь сами пишут и выкатывают код. Команда дизайна поддерживает полностью рабочий прототип, созданный с помощью ИИ. Когда у них появляется идея, они сразу её программируют, тестируют и нередко сами отправляют в продакшен. Инженеры подключаются, только когда кодовая база становится особенно сложной.

Главное узкое место в продуктивности работы с ИИ — не сам ИИ, а скорость человеческого набора текста. Ограничивающие факторы — как быстро вы можете печатать промпты и как быстро проверять то, что сгенерировал ИИ. Пока ИИ не научится надёжнее валидировать собственные результаты и проактивно предлагать помощь, мы не увидим полного прироста продуктивности, который эти инструменты могли бы дать.

Писать код становится менее увлекательным занятием, чем ревьюить код, написанный ИИ. Инженеры любят творческий поток созидания. Теперь всё больше времени уходит на чтение того, что породил ИИ. Следующий вызов — сделать этот процесс проверки быстрее и приятнее.

YouTube

Inside OpenAI: 2026 is the year of agents, AI’s biggest bottleneck, and why compute isn’t the issue

Alexander Embiricos leads product on Codex, OpenAI’s powerful coding agent, which has grown 20x since August and now serves trillions of tokens weekly. Before joining OpenAI, Alexander spent five years building a pair programming product for engineers. He…

👍4❤1

512 viewsedited 05:21

Cерафимодальный AI

Ральф Виггум

В мире вайбкодинга новый шериф — агентный подход под названием Ralph Wiggum. Я столько ждал, что кто-то на русском разберётся, о чем весь шум, что сам стал этим человеком.

Ральф, если что, герой Симпсонов восьми лет от роду с задержкой развития, на которого всем плевать. Хорош он лишь в двух вещах — «спать и действовать» (цитата по симпсонвики), и именно эти характеристики и становятся определяющими для нашего рассказа. Ральф Виггум это: скрипт, который работает, пока вы спите. Всё.

Но как именно это работает? Чтобы в этом разобраться, нужно кратко обозреть на прошлое и настоящее вайбкодинга.

Весной прошлого года я вел внутренний воркшоп об основах вайбкодинга. Если вы давно подписаны на канал, то знаете, что из той полуторачасовой сессии родился Бот Вояж, которым я с удовольствием пользуюсь до сих пор в путешествиях. Но как он был построен?

К слову, я думаю начать преподавать агентский кодинг для непрограммистов на широкую аудиторию: если вы думаете, что вам нужен такой семинар/практикум/серия лекций — пишите, договоримся.

Эры вайбкодинга можно выделить следующие.

1. Скромное обаяние новизны
Также известное как «я дал ChatGPT задание написать калькулятор и он справился, программисты больше не нужны, отсосите какосеки»

2. Долина разочарования
«Но когда я попросил гпт сделать именно тот калькулятор, который нужен мне, он выдал кучу ошибок и стёр исходный код. Этот манёвр обошёлся мне в 430 долларов, ai — пузырь на плато, робот не напишет симфонию, вайбкодеры — слоператоры!»

3. Адаптация
Cursorrules, Claude.md, PRD.md и тест дривен девелопмент: оказывается, если со всех сторон обложить код-агентов бесконечными правилами и ограничениями, то можно за какое-то вменяемое количество итераций все же заставить его написать ровно тот код, который тебе нужен. Прямо как с живыми программистами.

Кстати, на этом этапе и написаны большинство моих проектов, включая тот самый семинар с бот-экскурсоводом. Фактически, мы час писали документацию, потом Курсор 10 минут писал по ней код, а затем мы его задеплоили и приклеили к телеграму

4. Первые автономные код-агенты
Прежде всего, Клод Опус 4.5 (на клодкоде или в курсоре), но и GPT Codex с Gemini не сильно отстают.

Важная часть этого этапа — возврат к шагу два, но теперь агенты начинают адекватно воспринимать обратную связь и более-менее успешно ей следовать.

5. Сегодняшний момент: Курсор 2 и Клод Код 2
Среды, заточенные уже на более профессиональные пайплайны: прежде всего, work tree, когда под каждый новый таск заводится отдельный бранч в гите (причём их может быть несколько на одну задачу, и человек сам выбирает, решение в каком из них ему нравится больше), и субагенты с хуками в клодкоде (совсем запретная магия, давайте про это в другой раз).

На этом этапе любой 0->1 девелопер, который просто хотел повайбиться с Клодиком под одеялком чтобы собрать свой первый b2b SaaS калькулятор окончательно понимает, что здесь ему больше не рады.

Мой собственный док сегодня включает как минимум:
- PRD
- имплементейшен план
- файл со структурой проекта
- файл с техспеками
- ридми
- ченджлог
- рулз с приказом вносить все изменения в ченджлог и пушить все измененить в конце каждого значимого оборота (но это все равно не работает).

Если вы не поняли абсолютно ничего из этого списка, поздравляю, вы совершенно нормальный человек, который совершенно точно случайно не проебет 1300 евро на боте который выдает инвайты в Сору 2.

НО ИМЕННО ЭТУ ПРОБЛЕМУ И ПЫТАЕТСЯ РЕШИТЬ РАЛЬФ

Вместо того, чтобы грузить людей непонятной и выглядящей откровенно сомнительной хуитенью, Ральф использует баш скрипт, который гоняет все эти шаги по кругу.

Как именно это устроено (простите, снова список, я не ИИ, честно):

1. Конверсейшнл чат-бот, с которым вы естественным языком общаетесь, что вы хотите построить, а он в ответ формирует ТЗ — тот самый PRD.md.
“Хочу ну типа калькулятор но чтобы когда типа на ноль делишь чтобы он типа переворачивался и писал цифрами SOSI EBLO“

2. Этап, который разбивает получившееся ТЗ на сценарии, и формирует (вместе с вами) критерии выполнения.

❤11🔥4👌1

844 viewsedited 17:52

Cерафимодальный AI

>> часть 2 (дожили, приходится треды в телеграме писать)

Но как именно мы поймем, что часть про соси ебло выполнена? когда при выполнении операции с делением на ноль откроется браузер, в нем запустится наш калькулятор, у него на экране будет 0783 1505, и затем он перевернётся.

Хитрая часть, которую придумали в фреймворке Ральфа: для пущей надежности сценарии здесь превращаются из обычного тектового формата в длинный JSON файл, где у каждого сценария стоит статус 0 или 1. Фактически, это то же, что я на коленке делал с implementation_plan.md, только структурированное.

3. После этого запускаем сам баш скрипт. На вход нужно указать, сколько максимум лупов он может провернуть (в конце концов, это все ваши деньги на токены).

4. Когда он доходит до конца выполнения первой задачи, он запускает цикл проверки — те самые критерии приёмки.

5. Критически важная часть: в конце цикла агент обязан ОБНОВИТЬ ТЗ и НАПИСАТЬ ЛОГ. То есть отчитаться, справился ли он с задачей, что пошло не по плану, что отличалось от ожиданий, и какие особенности имплементации решения нужно учесть в будущем. Да, это тоже часть, которая у меня была в курсоррулез и регулярно не срабатывала — но здесь вызывается безжалостным детерминированным циклом.

6. Наконец, финальное фундаментальное отличие от вайбкодинга в Курсоре или КлодКоде: после завершения лупа агент не передает контекст далее. Следующий цикл принимает новый инстанс агента с чистой памятью. Однако у него уже обновлено ТЗ прошлым агентом и переданы только минимальные необходимые сведения. Он смотрит на файл с тз, и смотрит, у каких ещё сценариев не поставлены единички. Колесо Сансары заходит на новый оборот.

7. Вы, как и положено Ральфу, спите, чтобы с утреца пораньше узнать, куда же вас привела эта опричная гусеница.

Репозиторий, в котором лежат все скрипты и файлы: https://github.com/snarktank/ralph?tab=readme-ov-file

Подход в деталях изложен в твиттере: https://x.com/ryancarson/status/2008548371712135632?s=46&t=MNy-LfGucqQvXbR6Iwg3DQ

Там же есть живой пример. Только учтите, что они там рекламируют свою какую-то платформу АмпКод, я хз что это, нужно все запускать через Клод

Всем Виггум!

❤7🔥6

528 viewsedited 17:58

Cерафимодальный AI

Browser Company (Dia, Arc) сманил лид дизайнера Safari

Вдогонку Джош Миллер, основатель, выкатил пост, про то, как меняется подход к дизайну в компании. Самое главное — владение Клод Кодом это принципиально важный новый навык. "AI-фанбои производят в твиттере слишком много шума, но эта штука — реальная. Если вы не начнёте как можно скорее работать с Клод Кодом как основным инструментом, ваша команда отстанет (как отстали те, кто не сделал ставку на полноценные мобильные приложения в начале десятых)". Общая идея такая: у нас стартап, поэтому наши дизайнеры должны отправлять пулл реквесты, непрограммисты — прототипировать и пробовать свои собственные идеи, а программисты — иметь возможность быстро экспериментировать с новыми подходами без ущерба основной работе.

Второе и главное — они запускают позицию "Дизайн продюсера", который будет координировать работу их разных дизайн лидов, и состыковывать её с другими функциями в компаниями (видимо, как раз ai-направления). Я вообще говоря думал, что это называется "Артдиректор", но видимо подразумевается, что это какая-то более интегральная роль. Вообще браузер компани очень симпатичные, жаль, что исследователей они особо не ищут.

https://x.com/joshm/status/2009705767490990418

X (formerly Twitter)

Josh Miller (@joshm) on X

Claude Code is changing how The Browser Company hires and works

🔥7❤1👏1

574 viewsedited 15:28

Cерафимодальный AI

Первый девайс от OpenAI — небольшой смартспикер. Конец 2026

upd: https://www.axios.com/2026/01/19/openai-device-2026-lehane-jony-ive

Axios

Exclusive: OpenAI aims to debut first device in 2026, exec tells Axios

Lehane listed "devices" as one of the big coming attractions for OpenAI in 2026.

413 viewsedited 18:47

Cерафимодальный AI

Permanent underclass

Гершуни уже хорошо описал на русском: идея, что если в ближайшие 2-10-15 лет вы не успеете заработать капитал, достаточный чтобы жить на дивиденды, вы окажетесь в «вечной бедности», я бы так адаптировал термин.

Предпосылки: интеллектуальную деятельность уже начинают поджимать агенты, физический труд скоро начнут роботы, и где-то в ближайшем будущем неизбежно предстоит пройти точку, где на 90% работ выгоднее будет нанять не нас. Никого из нас.

В твиттере развернулся целый психопатический бум, люди переживают фомо, если у них на фоне не крутится круглосуточно ральф-луп (что это такое я уже рассказывал), потому что оценка в два года уже не кажется такой уж невозможной (я в два года не верю, но глобально все действительно ведёт туда, так что давайте размажем колокол наибольшей вероятности от 2 до 17 лет с сегодняшнего дня).

Единственное, что мне есть добавить к дискуссии — историю об обязательном школьном образовании. Как мы хорошо помним из Оливера Твиста, прошлая промышленная революция сопровождалась бурным ростом детской преступности: индустриализация и нормализованный (а главное, дешевый) детский труд направили давление социального осмоса в города, но оказавшиеся за бортом приемлемой жизни дети сколачивались в полу-, а иногда и полностью преступные образования, потому что — ну а как ты ещё найдёшь себе хлеб, если ты permanent underclass? Появление обязательного детского образования в числе прочего решало эту проблему (кто-то скажет — в первую очередь). Причём качество этого образования было вопросом далеко вторичным по сравнению с необходимостью убрать детей с улицы и помешать сбиваться в шайки. У кошки четыре ноги, позади у ней длинный хвост, но трогать её не моги, за её малый рост, малый рост.

Опыт сообществ с радикальным неравенством показывает, что ничего совсем уж невозможного в устойчивой системе, где на 5 процентов богатых приходится 95 бедных, нет (ваши родственники-то что, как и мои, из крестьян?) — однако без обязательной повинности в виде непрерывного каторжного труда, велика вероятность, что эти 95% займутся тем же, чем люди занимались веками: начнут сбиваться в чвк, чтобы отбивать безусловный базовый доход у тех, кто сбился в чвк поменьше.

Поскольку такая система не выглядит стабильно, я бы предложил переиспользовать надёжную схему и ввести дотационное обязательное высшее образование. Качество, опять же, не так важно.

0:05

e/acc

Главной общеполитической темой начала 2026 стала идея permanent underclass. Что это значит?

По мере полной автоматизации когнитивной и физической работы, социоэкономическая способность людей заработать дополнительный капитал будет исчезать. Большинство…

❤4👏1

534 viewsedited 08:04

Клод пророс в Эксель

Клод это будущее офисной работы, примерно как быть «опытным пользователем ПК» в двухтысячных.

claude.com/claude-in-excel

❤6

1.13K views08:14

Cерафимодальный AI

На главной образовательной ai-платформе, Deeplearningai от Эндрю Нг, короткий (2 часа) курс по Skills — главному, а главное простому агентскому навыку, который стоит освоить прямо сейчас.

Вообще, начать пользоваться скиллами проще простого: открываешь клод и пишешь: хочу скилл, чтобы он делал это и то, вот в такой последовательности — и он сам всё собирает, и ты затем к нему обращаешься, когда нужно использовать эту последовательность. Например, создать презентацию в каком-то конкретном оформлении, или написать текст по заданному шаблону.
Но дальше — больше: как сделать, чтобы этим скиллом могли пользоваться не только вы, но и агенты? Вы же не собираетесь сами до скончания веков презентации делать? Вот тут уже пригодится курс.

https://youtu.be/qD_5iCe1s1E?si=vXMoRVGkyKinGlX9

YouTube

Learn to equip AI agents with reusable skills

Enroll now in Agent Skills with Anthropic: https://bit.ly/469a15J

In this course, built in collaboration with Anthropic and taught by Elie Schoppik, Head of Technical Education at Anthropic.

This course shows how to make AI agents more reliable, reusable…

❤9

557 views21:55

Cерафимодальный AI

Удивительная, но в то же время грустная новость: Apple хотели построить свою новую Сири на Клоде, но Антропики заломили такую цену, что в итоге Эпол запартнерился с Джеминай — хотя внутри самого Эпла всё было готово к Клоду, у них даже есть своя собственная версия.

Как пользователь айфона и Клода я конечно очень расстроен: если что-то и могло утереть нос андроедовскому Джеминаю, так это Клод.
А теперь разница между айфоном и андроидом совсем сотрется.

😭7❤3

430 viewsedited 22:38

Тем временем гугловский Project Genie с ворлд модел выглядит пугающе круто. Мне текстовые нейросети как-то комфортнее, думаю, лет через 10 я буду вспоминать нынешний период с приятной ностальгией.

https://blog.google/innovation-and-ai/models-and-research/google-deepmind/project-genie/

👍8

494 viewsedited 22:43

Cерафимодальный AI

Помните, как пустырь напротив обтянули забором, на котором были нарисованы красивые рендеры со счастливыми людьми, а спустя два года непрерывной стройки на этом месте появилось самое чудовищное здание, которое в состоянии представить и изваять человек?
Проект «антирендер» решает эту проблему: вы загружаете красивую картинку, а в ответ получаете реалистичную фотографию этого места в условный ноябрьский четверг.

https://antirender.com

❤8🔥5🥰1👀1

474 views21:55

Cерафимодальный AI

но какие-то следы присутствуют: нативная интеграция Claude Agent SDK в ~~приложения для айфона.~~ в комментариях поправляют — нет, в XCode как в IDE завезли Claude и Codex чтобы вайбкодить приложения. в самих приложениях всё как прежде.

❤1

438 viewsedited 20:15

Cерафимодальный AI

0:34

This media is not supported in your browser

VIEW IN TELEGRAM

также: Мистраль роботикс нанимают (и понимают самое главное в ai-экономике, турбокрутые чуваки. обожаю их ещё со времён логотипа из вордарта и весов, выложенных на торренты)

❤1👍1🤔1

448 views20:23

About

Blog

Apps

Platform