сбежавшая нейросеть – Telegram
сбежавшая нейросеть
12K subscribers
140 photos
53 videos
132 links
Авторский канал про искусственный интеллект: новости, примеры использования, мысли в тему и не очень. Подписывайтесь!

Для связи: @runawayllm_bot
Download Telegram
Самоцензура ИИ

На выходных решил потратить немного времени и углубиться в тему лекарств, разрабатываемых с помощью ИИ. Я уже немного изучил тему AlphaFold 2/3 и даже рассказывал на канале, но в этой области существует огромное количество моделей и платформ, а испытания первых лекарств, созданных с их помощью, намечены на начало 2025 года - если все получится, то медицину, возможно, ждет революция.

В общем, тема заслуживает отдельного поста, а может и нескольких, которые я напишу, когда окончательно разберусь сам. Пока же немного о другом.

Вчера изучал новую ИИ-платформу для разработки лекарств, разработанную в Австралии. С ходу ничего не понял, закинул ссылки на новости в ChatGPT o3, попросил пояснить — и получил от ворот поворот. Ответ нарушает наши политики безопасности и что-то там.

Понятно, что произошло с ChatGPT o3. Платформа от австралийских ученых предназначена для проектирования белков с нуля, чтобы объяснить мне это - надо раскрыть принципы проектирования этих самых белков. Белки могут быть лекарством, а могут быть ядом в общем, система безопасности ChatGPT o3 подумала, что вдруг я какую чуму на кухне приготовить собираюсь. И заблокировала ответ на вполне безобидный вопрос.

Увы, это не единственный случай, где системы безопасности ИИ перегибают палку. Я часто пишу с помощью ИИ креативные истории и разыгрываю сценарии текстовых ролевых игр — так некоторые модели для этого не годятся вообще.

Если посмотреть на сценарии книг, фильмов и видеоигр, созданных людьми, то они полны тяжелых тем, вроде насилия, предательства, похищений людей и прочих, еще более жестоких, вещей.

Но ИИ — технология новая и находящаяся под пристальным вниманием. Если человек напишет книгу про дистопическое будущее, где наши потомки прозябают под пятой ИИ-тирана - то про нее скорее всего пробурчат что-то вроде “фу, банальщина, у Гибсона все это уже было”. Если подобное напишет ИИ — то скандал может подняться нешуточный.

При этом ИИ как технология развивается с такой бешенной скоростью, что регулирование просто не поспевает. Поэтому разработчикам ИИ приходится брать эту ответственность на себя, причем у каждого свой подход — вот и получаются истории вроде той, что случилась со мной.

С точки зрения пользователя любая самоцензура ИИ — скорее вред. Мы вроде как взрослые люди и сами можем нести ответственность — в том числе перед собой — за то, как используем продукт, подписку на который оплатили. Да, ИИ пользуются и дети — но для них давно уже пора добавлять детский режим, чего я пока не наблюдаю ни в одной из подписок.

Что же до безопасности, то я не верю, что жесткие фильтры на уровне моделей смогут помочь. Если человеку приспичит с помощью ИИ разыграть сценарий на грани — то он продолжит поиски. И рано или поздно это создаст серый рынок дообученных opensource-моделей, в которых границы дозволенного будут отодвинуты намного дальше. Какой вариант хуже — мне кажется, понятно.

Отмечу, что у разных компаний разные взгляды на самоцензуру ИИ. По личному опыту, куда больше ограничений в ChatGPT и Claude, а вот Grok 4 и Gemini 2.5 Pro (а ведь это Google) зажаты куда меньше и способны выдавать истории практически “на грани”. Кстати, в вопросе с ИИ-платформой мне в итоге помог разобраться именно Grok 4.
👍26🔥9👏4
Делаем раз — 8 июля X-бот на базе Grok 3 на 16 часов сходит с ума, дает неполиткорректные ответы и представляется МехаГитлером. Модель отключают, а расследование показывает, что произошло это из-за части устаревшего системного промпта, которую вернули в результате неудачного обновления.

Делаем два — 11 июля новинку Grok 4 уличают в том, что если модели задать политический вопрос, то она идет в X Илона Маска и проверяет, что думает ее создатель на тему (на данный момент тоже исправлено).

Делаем три — 14 июля xAI анонсирует Grok For Government, отдельный набор моделей, адаптированных под нужды правительства США. Первый контракт на 200 миллионов долларов уже подписан с Министерством обороны.

Нет, без Илона Маска эта индустрия была бы невероятно скучной...
😁39👍16🔥43
А что там у ChatGPT?

Пусть Grok 4 и продолжает занимать новостную повестку почти целиком, сегодня предлагаю сделать небольшую разгрузку от детища Илона Маска. Те, кто долго и внимательно читают мой канал, заметили, что я не любитель ChatGPT. Но когда у меня спрашивают, какую ИИ-подписку взять, особенно первой, я всегда называю именно ChatGPT.

Почему так? OpenAI пришли на рынок массовых чат-ботов первыми, что дало огромное преимущество – весной Сэм Альтман называл количество пользователей ChatGPT в 800 млн ежемесячно (там есть вопросы к тому, как оценивали, но цифра в любом случае будет впечатляющей). Но стало и проклятьем: когда ты первый – то на тебя направлены все взгляды.

Например, новости о том, как Meta* (признана экстремистской в России) платит ведущим ИИ-исследователям по $100 млн за переход, в первую очередь анализируют со стороны OpenAI – сколько специалистов компания потеряла (немало на самом деле) и как ей теперь жить. И намного реже вспоминают, что ИИ-подразделение самой Meta* после неудачного релиза Llama-4 находится в кризисе, который Цукерберг пытается залить безумными деньгами.

Grok 4 выходит и показывает крутые цифры в бенчмарках – сравнивать его в первую очередь будут с ChatGPT o3, а уже потом с Gemini и Claude. Очевидно, что конкуренция на рынке растет и недавнему стартапу OpenAI предстоит пройти “испытание взрослением”. Но как по мне – компания более чем готова. И поэтому я продолжаю советовать подписку ChatGPT с легкой душой.

У OpenAI явно есть большой задел по моделям – массовая 4o вышла год назад и с тех пор успешно дорабатывается, а “мощная” o3 в экспериментальном виде была готова еще в декабре. Легкая o4-mini уже обходит o3 в некоторых бенчмарках, так что если предположить, что ее полную версию положат в основу ChatGPT-5 – то можно ждать впечатляющий результат.

Параллельно OpenAI вкладывает огромные ресурсы в перспективные инструменты использования ИИ. Есть агенты Codex-1 (для программирования) и Operator (для работы в сети и за компьютером “как человек”), есть почти готовое обновление Canvas, где пользователи смогут совместно редактировать документы и прибегать к помощи ИИ. Ходят слухи и об операционной системе на базе ИИ – это проект отдаленного будущего, но если получится, то он может полностью поменять наше представление о работе с ПК и смартфоном.

Даже меню с зоопарком из разных моделей, за которое все пинают OpenAI (я и сам его ненавижу) – во многом результат того, что компания пытается экспериментировать с разными ИИ, заточенными под разные задачи. Модель на каждый день (4o), мощная размышляющая (o3), размышляющая, но побыстрее (o4-mini), умеющая кодить быстро (4.1) – все они дают больше возможностей для экспериментов. А OpenAI таким образом собрала хорошую аналитику по использованию – и эти данные наверняка учтены при создании GPT-5, которая сама будет определять, как лучше решить конкретную задачу.

Наконец, с позиции среднего пользователя выделю еще два момента. Во-первых, лучший среди ИИ интерфейс – и в онлайн-версии, и в мобильных приложениях. У ChatGPT отличная реализация памяти, canvas и пользовательских настроек, а также минимум багов. Gemini и Grok отстают по большинству параметров, а у Claude хоть и крутой, вылизанный интерфейс, но по функциям все намного хуже.

Во-вторых, конечно, распространенность. Меня порой удивляет, как много людей используют ChatGPT вообще не представляя, что есть другие ИИ, как минимум не хуже. Но с другой стороны – именно для ChatGPT накоплен самый большой опыт использования, на этих моделях в первую очередь тестируют большинство промтов, на них экспериментируют с совершенно новыми кейсами. Если вы не энтузиаст, а просто используете ИИ для ежедневных задач – то именно ChatGPT гарантирует, что вы быстрее всего найдете нужные руководства и получите совет.

Конечно, рынок будет меняться – за огромными деньгами в ИИ пришли уже почти все крупные корпорации. Но тут еще большой вопрос, кто кого победит в состязании с OpenAI.
👍3823
Media is too big
VIEW IN TELEGRAM
Аниме-собеседница Эни (добавили в Grok, пока только на iOS) поздравляет читателей канала с большим событием – двумя тысячами подписчиков. На русском тоже умеет, но английский у нее все-таки лучше.

В первую очередь повторю то, о чем уже как-то писал: годы в медиа научили меня, что главное – это читатели. Так что спасибо, что вы есть: когда я начинал вести канал, то писал в основном для себя, теперь замечаю, что все больше стараюсь для вас. Так – интереснее.

Пользуясь случаем также хочу поблагодарить человека, без которого этот канал рос бы не так быстро. С Игорем Варнавским я работал вместе в самом начале своей редакторской карьеры и уже тогда он был очень внимательным и дотошным специалистом – из таких, которые доводят любой материал почти до идеала (может и до идеала, но раскрою секрет – идеальные тексты читают хуже). А еще Игорь увлечен технологиями не меньше моего и рассказывает про них на своем канале – например, вот он спорит со мной о будущем образования в эпоху нейросетей.

Сейчас у Игоря свое контент-агентство “Простыми словами”, он занимается созданием контента под ключ – от написания статей до ведения блогов и сайтов (читайте вот рассказ о GEO и SEO в наше бурное время). Поэтому, стартуя канал, именно к Игорю я пошел за помощью – и получил немало советов, которые помогли не набить шишек по дороге.

Дальше, надеюсь, тоже будет без шишек – тем более, что у меня полно интересных тем, о которых хочется рассказать на канале. Так что оставайтесь на связи, продолжим давать огня!
29🔥13👍12
OpenAI анонсировала трансляцию сегодня в 20:00 по Москве. Четверг – любимое время компании показывать что-то новенькое, поэтому можно попробовать угадать, что это будет. Вот о каких крупных проектах известно.

Operator

Это ИИ-агент, который может управлять ПК так, как управляет им человек – кликать мышкой, набирать команды с клавиатуры, заказывать для вас что-то в интернете. Агенты почти всеми называются новым шагом в ИИ, но их развитие продвигается медленно – слишком уж сложны человеческие интерфейсы для современных языковых моделей.

Сейчас Operator доступен в подписке ChatGPT Pro, работает когда как. На новую версию намекает ролик с анонсом трансляции, который OpenAI выложила в X: в нем виден движущийся курсор мыши. Остается вопрос – чем новый Operator будет отличаться от предыдущего?

ChatGPT-5

И вот тут можно начинать спекуляции. ChatGPT-5 мы ждем от OpenAI больше всего. Сэм Альтман подтвердил, что компания целится в летнее окно релиза, но многое будет зависеть от того, как модель пройдет проверки безопасности.

Однако у OpenAI уже были случаи, когда модель выпускали постепенно. Например, ChatGPT o3 изначально была запущена как основа режима DeepResearch (глубокие исследования в интернете) – и только потом ее сделали доступной в виде привычного всем чат-бота.

Operator сейчас также работает на o3, и один из вариантов сделать его лучше – перевести на ChatGPT-5. Это позволит постепенно начать ввод новой модели в работу, проводя оставшиеся проверки. Ну и давно пора раскатывать этот функционал на подписку Plus.

Браузер на базе ChatGPT

Браузеры на основе ИИ – другое активно развивающееся направление сейчас. Perplexity только что запустила тестирование своего Comet, а несколько инсайдеров подтверждают, что ведется разработка браузера на базе ChatGPT.

У OpenAI здесь вполне коммерческая цель – залезть на территорию Chrome. Главная ценность браузера от Google – информация о пользователях, которую он собирает и которая затем используется для точной настройки рекламы (с нее Google получает три четверти своего дохода). В OpenAI понимают, что текущая схема монетизации вряд ли даст компании возможность окупаться и также целятся в модель, где пользователям будут показывать рекламу.

Другой вопрос – зачем браузер самим пользователям. Первые отзывы о Comet в основном такие – “прикольная штука, но какая от нее польза – не понимаю”. Посмотрим, может у OpenAI получится интегрировать ИИ лучше.

Новая версия Canvas

Canvas – режим предпросмотра и редактирования кода и документов внутри ChatGPT. Он уже настолько удобен, что я иногда заменяю им офисные приложения. Есть информация, что у OpenAI готова новая версия, которая заменяет офисный пакет – с совместным редактированием документов и помощью ИИ.

Сложность здесь в потенциальном конфликте с Microsoft, которая является основным инвестором OpenAI и с офисным пакетом которой будет конкурировать новая версия Canvas.

Модель с открытыми весами

Несмотря на название, OpenAI давно ушла от open source моделей – последней такой была GPT-2, выпуская которую разработчики набили немало шишек с безопасностью. Что-то похожее сейчас происходит и с новой открытой моделью компании: о ней вполне официально говорят с весны, но сроки выхода постоянно сдвигаются. В OpenAI справедливо опасаются, что открытая модель может быть модифицирована и использована для разработки оружия, организации кибератак и прочих нехороших вещей.

Буквально неделю назад этот четверг назывался потенциальной датой выхода модели – но затем Сэм Альтман сказал, что команде нужно дополнительное время на новые проверки. Так что шансы минимальны.

Если говорить о моем мнении, то анонс ChatGPT-5 выглядит самым интересным, но я бы не отказался от его переноса на пару недель. С прошлого четверга я активно тестирую Grok 4 и наконец-то научился нормально с ним работать – модель мощная, но требует определенного подхода, как и ChatGPT o3. Переключаться сейчас на новый ИИ (а мне придется из-за любопытства) – настоящее издевательство.

Так что Operator на базе ChatGPT-5 и в подписке Plus для меня был бы лучшим подарком от OpenAI.
👍1713🔥5🥰1👏1😁1
Для ChatGPT представили агентский режим – это развитие функций Operator (использование ПК) и DeepResearch (глубокий поиск в сети), а также новые возможности. Agent постепенно научится делать все, что вы делаете на ПК — от поиска и заказа отелей до создания презентаций на основе нужных данных.

Детали о ChatGPT Agent рассказал на “Хабре”, читайте с удовольствием. И традиционная просьба — если у вас есть прокачанный аккаунт на Habr, то поставьте плюс в карму, за мной не станется.

Ну а вдогонку к анонсу Agent скажу вот о чем. Когда на прошлой неделе вышел Grok 4, то модель в первые дни меня очень разочаровала, так как в повседневных задачах она оказалась местами даже хуже той же Gemini 2.5 Pro — в основном, из-за того, что не так складно пишет на русском.

Только спустя неделю я понял, в чем силен Grok 4 — причем исключительно в сложных примерах и при грамотном промптинге. Суть в том, что обычные пользователи вроде меня не кидаются задачками из бенчмарков, а чаще используют ИИ в режиме чат-бота. И здесь все современные модели если не достигли предела, то близки к нему — заметить разницу получается через несколько дней.

Прогресс ИИ смещается в другие направления, два из которых мы увидели на этой недели. Первое — как раз агенты. В этом режиме модель превращается из полезного собеседника в полноценного ассистента, который будет помогать в самых разных задачах.

Каких именно — пока даже боюсь представить, поэтому здорово, что ChatGPT Agent запускают уже сейчас и сразу на подписку Plus, в которой будет доступно 40 запросов в месяц. Как появится у меня — сразу начну тестировать!

Второе направление — это эволюция того, как ИИ взаимодействует с пользователем. Сейчас мы используем текст и голос, но для Grok на этой неделе запустили виртуальных компаньонов.

Выбор первой пары спорный — флиртующая аниме-девушка и грубоватая панда — но суть не в этом. Компаньоны — это полноценные трехмерные аватары для ИИ. Они двигаются, танцуют, меняют наряды и показывают эмоции. А через камеру они “видят” пользователя, комментируют его внешность и пытаются считать эмоции. Пока выглядит как забава, но где-то через год это может стать основным способом коммуникации с ИИ.

В общем, как говорил много раз — прогресс в сфере искусственного интеллекта продолжает мчать на космической скорости. И это здорово.
26👍20
Нобелевский лауреат и глава Google DeepMind Демис Хассабис заявляет, что ИИ поможет найти лекарства от всех болезней за 10-15 лет. А Isomorphic Labs,
отпочковавшаяся от DeepMind, в этом году начнет испытывать на людях первые ИИ-лекарства от рака. Как и обещал — разобрался, о чем речь.

Смотрите, современная разработка лекарств (да лечение болезней в целом) — это работа с большими объемами информации. Сначала надо понять причину болезни. Это может быть мутировавший белок, который вызывает рак. Или вирус, инфицирующий клетки. Для решения ученые берут массивы данных заболевших людей, сравнивают их между собой и с данными здоровых, и пытаются найти что-то общее, что и вызывает болезнь.

Проблема в том, что все люди разные, болячка редко бывает одна, да и сам организм — невероятно сложная штука, в котором параллельно происходит множество процессов. ИИ уже помогает распутывать эти головоломки, чтобы перейти к следующему этапу — поиску лекарства.

Лекарства тоже бывают разными, но чаще всего — это молекула, которая “находит” в организме проблемные клетки, “цепляется” к ним и выполняет определенные действия, например, подавляя активность или даже уничтожая. Но как она это делает? На поверхности клетки есть рецепторы — белковые молекулы уникальной формы. Соответственно, нужно узнать их форму и подобрать молекулу совпадающей формы.

Долгое время определение формы белков считалось одной из самых сложных задач в химии. Для решения использовались методы, стоившие миллионы долларов, занимавшие годы для одного белка, и не отличавшиеся большой точностью. А потом появился ИИ AlphaFold 2 от Google DeepMind, который в 2020 году рассчитал структуру 98% белков человеческого организма (всего в базе данных сейчас 200 миллионов структур).

Результаты выложили в сеть — любой аспирант может скачать то, что недавно стоило миллионы долларов и год работы. За это в 2024 году Дэмис Хассабис и Джон Джампер из DeepMind получили Нобелевку, поделив ее с Дэвидом Бейкером, который занимался компьютерным моделированием белков.

Мы знаем форму рецептора — осталось подобрать лекарство. Вот только в базе миллиарды молекул, и выбрать кандидаты из них — та еще задача. Для этого предназначена новая AlphaFold 3, а также ИИ других команд — они быстро моделируют взаимодействие молекул с мишенями и указывают на подходящие.

Если подходящей молекулы нет — то ее теперь можно создать с нуля, для чего предназначены специальные генеративные модели. Принцип похож на ИИ-создание изображений: нейронка получает нужные характеристики, а затем пытается предложить структуру.

Например, в эксперименте ученых из Университета Монаша и Университета Мельбурна ИИ начал с 5000 вариантов дизайна белка для борьбы с кишечной палочкой E.Coli — это супербактерия, устойчивая к современным антибиотикам. Из стартовых вариантов другая ИИ-модель отобрала 96 лучших, которые синтезировали и опробовали на реальных бактериях. 4 лучших уйдут на дальнейшие тесты.

В итоге разработка кандидатов в лекарства ускоряется с 5-7 лет до примерно 6 месяцев. Конечно, дальше начинаются клинические тесты. Их пройдут далеко не все лекарства, а самым успешным до одобрения предстоит пройти все три клинических фазы общей продолжительностью в примерно те же 5-7 лет.

ИИ планируют использовать и в тестировании, но сильного ускорения не будет — спешка не нужна, если речь идет о воздействии на организм человека. Однако даже если ИИ поможет сократить только этап разработки лекарств на 5 лет, то это значит, что больные получат лечение на 5 лет раньше. Для кого-то эти годы станут спасением.

И последнее. Сейчас известно около 11 тысяч болезней, 7 тысяч из которых — редкие. Если ИИ-лекарства “выстрелят”, то сбудется прогноз Хассабиса — и мы найдем спасение от большинства болезней. Будет ли оно доступно всем? И как тогда вообще изменится наше общество? Все это — тема для отдельного рассказа.
👍75👏2215🔥9
Пост про ИИ-лекарства набрал рекордное количество реакций — мне приятно, что подобный контент находит отклик у читателей канала. Продолжение обязательно будет, но давайте пропустим вперед OpenAI, которая тихонько спустилась с горы с двумя новостями.

Сейчас все более важной метрикой оценки ИИ становится умение выполнять длительные задачи. Из эпохи чат-ботов мы переходим в эпоху ИИ-агентов, а здесь без работы вдолгую не обойтись: даже планирование поездки в другой город — это сложная многоэтапная работа, что же говорить про бизнес-задачи.

На этом фоне особенно интересны результаты выступления экспериментальных моделей OpenAI в двух важных состязаниях.

Второе место на AtCoder World Tour Finals 2025 Heuristics

AtCoder World Tour Finals — очный финал одного из самых престижных соревнований по программированию, на который попадают лучшие из лучших. Проходит в двух категориях — алгоритмическое и эвристическое программирование. В каждой категории было по 12 участников, а в эвристике к ним присоединилась OpenAIAHC — экспериментальная модель от OpenAI.

Эвристическое программирование — быстрый поиск достаточно хорошего варианта решения проблемы в ситуации, когда лучший вариант невозможен. Как пример можно привести навигатор (хотя в нем эвристический алгоритм комбинируется с другими приемами) — в большом городе с постоянно меняющейся обстановкой нереально сходу найти лучший маршрут, поэтому система подбирает несколько достаточно хороших вариантов.

AtCoder World Tour Finals длился 10 часов — участники начинают с быстрых работающих решений, а затем полируют их, выжимая максимум. OpenAIAHC заняла второе место, на 9,5% уступив Пржемыславу Psycho Дебиаку — легендарному программисту из Польши. Пржемыслав рассказал, что финал полностью выжал его, а затем пошутил, что чувствует себя “последним рубежом обороны”.

Интересно, что OpenAIAHC лидировала значительную часть соревнования, уступив лишь к концу. То есть ИИ уже невероятно силен в построении быстрых решений, человек же вышел вперед, когда для дальнейшего улучшения потребовались креативные подходы.

Золотая медаль Международной математической олимпиады 2025

Другая (а может и та же самая, в OpenAI не раскрывают деталей) экспериментальная модель решила пять из шести задач Международной математической олимпиады 2025 года (IMO 2025) — самого сложного и престижного состязания для школьников. Это уровень золотой медали, которую получили 67 участников из 630.

IMO 2025 состоит из двух этапов по 4,5 часа, при этом модель подходила к каждой задаче как живой участник: читала условие и писала подробное решение, не используя веб-поиск и вспомогательные инструменты. На решение одной задачи уходило до 100 минут, что показало возможность модели планировать свои действия вдолгую и придерживаться намеченного плана действий. Важно отметить, что OpenAI не участвовала в IMO 2025 напрямую, а воспроизвела состязание “внутри”, дополнительно пригласив несколько профессиональных математиков для валидации результатов.

Тем не менее, компанию поздравил даже Гэри Маркус — исследователь в области ИИ, который известен своим скептицизмом по поводу современных моделей. Далее Гэри подсыпал немного соли, справедливо попросив OpenAI раскрыть подробности.

Математик Теренс Тао, который еще 14 июня на подкасте Лекса Фридмана утверждал, что вряд ли ИИ возьмет золото IMO в ближайшие два года, также поздравил OpenAI, попросил раскрыть все подробности и призвал организаторов IMO включить ИИ в программу 2026 года, обеспечив прозрачность.

В OpenAI пока ограничились публикацией решений задач, а также заявили, что речь идет о general purpose модели — то есть ИИ, который обучают для решения широкого круга задач, а не “натаскали” специально под IMO 2025. В ближайшие месяцы запускать ее в широкий доступ не планируется — перед нами скорее прототип того, что ляжет в основу условного “ChatGPT-6”.

Ну а пока продолжаем ждать ChatGPT-5 – после таких успехов OpenAI, я практически уверен, что и новая “народная” модель не разочарует.
🔥25👍136
Итак, давайте вернемся к теме “ИИ создаст лекарства ото всех болезней”. Сначала краткое содержание первого поста:

— в современном мире определение причин болезни и разработка лекарств от нее — во многом работа с большим количеством информации;

— нейросети могут сократить разработку, тестирование и одобрение лекарств с текущих 10-20 до 5-10 лет - то есть, в два раза.

Всего известно около 11 тысяч болезней, ИИ-технологии и вычислительные мощности растут с огромной скоростью, что позволяет людям вроде Нобелевского лауреата Дэмиса Хассабиса предсказывать открытие лекарств от большинства болезней в ближайшие 10-15 лет. Смелое заявление, но даже если это произойдет за 25 лет — то станет внушительным прорывом. Но как он на нас отразится?

Лекарство важно не только разработать, но и внедрить. И здесь популярно утверждение, что ИИ-препараты будут доступны только богатым.

На самом деле, это очень спорно. Традиционные методы разработки лекарств давно добились почти всех легких побед, создание новых препаратов занимает кучу времени и стоит больших денег, которые затем надо отбивать. ИИ не только ускоряет, но и удешевляет этот процесс: напомню про AlphaFold 2, которая рассчитала форму почти всех белков — то, что раньше занимало годы и стоило миллионы долларов для одного белка, теперь просто лежит в свободном доступе в сети.

Следующий момент — бизнес всегда стремится к массовости. Медицинский рынок один из самых больших в экономике и на нем просто глупо делать ставку на единичный продукт, когда можно продавать десятки миллионов.

И, наконец, главное. В развитых странах численность населения падает, а само оно стремительно стареет. Можно сколько угодно фантазировать, как ИИ выгонит всех с работы, но пока что рабочих рук не хватает, а нагрузка на пенсионный и социальные фонды постоянно растет. Так что если у властей появится возможность за счет новых лекарств продлить трудоспособный возраст — уверен, это станет одним из ключевых приоритетов.

Риск неравенства все равно есть. Разработка ИИ-моделей и ИИ-лекарств сосредоточена в развитых странах, поэтому и датасеты используются те, которые собрали в этих странах. У жителей развивающихся стран немного другая генетика, есть свои типичные болезни, да и экономика слабее — поэтому до них ИИ-лекарства доберутся позже и будут работать хуже. Хотя бы частично выровнять этот дисбаланс — вызов для ВОЗ и прочих международных организаций.

Кроме того, остаются еще два важных фактора — врачи и пациенты. ИИ уже успешно используется как помощник в постановке диагнозов и выборе лечения, но создать стандарты и переучить на них всех медиков (а в этой среде полно консерваторов!) — задача не менее сложная, чем разработка лекарств.

Как и работа с пациентами. Наверное, каждый был свидетелем ситуации: человек долгое время чувствует себя плохо, многие симптомы на лицо — а идти ко врачу отказывается. А порой еще и лечится таблетками, которые посоветовали друзья. Или до врача дошел, бумажку с лечением получил, а назначения игнорирует. Увы, многие люди боятся лечиться даже больше, чем болеть. И когда в лечении начнет принимать участие ИИ — эти страхи во многом вырастут.

Но представим, что лекарства от всех болезней изобретены, врачи обучены их применению, пациенты доверяют новым технологиям, распределение ведется справедливым образом, Нобелевские премии выданы, а офисы крупнейших медицинских компаний закрываются за ненадобностью…

Нет, стоп, на этом история не заканчивается. Во-первых, где вы видели бизнес, который закроется добровольно? Вылечив все известные болезни, исследователи обратят свой взор на главную — старение. Именно так: современная медицина склоняется к тому, чтобы считать старение еще одной болезнью, а в природе есть примеры видов, которые победили возраст (пусть они и редки). Во-вторых, победа над болезнями и начало борьбы со старением так перевернут наше общество, что все текущие вызовы и проблемы могут показаться полной ерундой.

Но это — тема для следующего длинного и (надеюсь!) интересного поста.
🔥37👍16
Ух ты, у нас скандал между Google и OpenAI

Буквально вчера я рассказывал о достижении экспериментальной модели OpenAI, которая взяла золото Международной математической олимпиады 2025 (IMO 2025). Результат однозначно крутой: это самое престижное соревнование для школьников, задачи на нем выполняются до 100 минут — то есть модели нужно уметь вдолгую планировать свои действия и не терять контекст.

Но оказывается, что помимо OpenAI золотую медаль взяла модель Gemini DeepThink. И в Google не сказать, что довольны действиями конкурента — по этому поводу высказался даже глава DeepMind Демис Хассабис в X.

Я провел короткое расследование и вот что выяснил. Оказывается, на IMO 2025 в этом году впервые провели специальный ивент для разработчиков ИИ, в рамках которого задачи олимпиады решали разные модели. При этом организаторы попросили ИИ-команды опубликовать результаты только после того, как будут опубликованы результаты состязания между школьниками. На это были две причины:

1. Важно было тщательно проверить решения ИИ-моделей.

2. Организаторы хотели, чтобы основную славу получили все-таки главные участники IMO 2025 — лучшие школьники со всех уголков мира.


Не совсем ясно, участвовали ли OpenAI в приглашенном ивенте или просто взяли задания IMO 2025 и решили их внутри. Но факт остается фактом — по отношению к главным участникам получилось некорректно.

В Google же могут похвастаться результатом, который официально подтвержден оценщиками IMO 2025. А еще — получают гигантский плюс в карму за то, что остались людьми в гонке машин. Спасибо, Демис.
🔥34👍189
Нашел в X Итана Моллика лучший промпт для Google Veo 3:

[video game] as a community theater production.


Community theater — это как у нас “театр самодеятельности”. Собирается с десяток увлеченных темой любителей, делают наряды и реквизит из подручных средств, а затем устраивают представление для своих родственников и друзей — в общем, всех тех, у кого ну совсем нет возможности улизнуть из зала.

Сам Итан создал промпт под видеоигры, поэтому я прогнал его на нескольких известных проектах — Cyberpunk 2077, Mass Effect и World of Tanks. Но вообще можно вбить название известного фильма или книги — сработает не хуже.

Кстати если решите поэкспериментировать, то берите что-нибудь популярное в англоязычном интернете, так как Veo 3 обучали в основном на видео оттуда.

Почему считаю (в шутку, на самом деле) идеальным промптом? По роликам World of Tanks и Mass Effect хорошо видно, что Veo 3 уже создает качественную тематическую картинку, но не до конца понимает, что происходит в сцене. Поэтому герои начинают делать действия невпопад, проговаривают чужие реплики — в общем, как и положено в театре самодеятельности.

Но не переживайте — это сейчас у нас самодеятельность, а через полгода и на областной уровень выйдем!
😁316
Боитесь, что ИИ лишит вас работы? Срочно учитесь на энергетика!

Шутка… а может и нет. Смотрите, буквально пару дней назад Сэм Альтман поделился планами OpenAI развернуть более миллиона GPU для обучения и обработки ИИ уже к концу этого года. Я сначала вздрогнул, а потом прогнал Deep Research и выяснил, что OpenAI не замышляет чего-то особенного. Meta* (признана экстремистской в России) планирует развернуть 1,3 миллиона ускорителей к концу года, xAI — миллион и более ускорителей в начале 2026-го. Планы Google и Anthropic менее публичны, но речь идет о примерно таком же количестве чипов.

Миллионным парком компании не ограничатся — в 2027-28 годах эти цифры вырастут еще в несколько раз. Плюс добавьте множество мелких фирм, которые также тренируют свои модели — зачастую на единичных GPU, но суммарно тоже набегает приличное количество. Плюс не забываем, что на горизонте революция в робототехнике.

Все эти чудеса цивилизации будут требовать ровно одного — электроэнергии. И уже сейчас энергетика нередко оказывается слабым звеном — вспомним, как xAI на лету разворачивала газовые генераторы для своего Colossus в Мемфисе, из-за чего сейчас с ней судятся местные власти.

Сегодня Anthropic опубликовала доклад, который предупреждает — если США не начнут вкладываться в инфраструктуру, то они рискуют проиграть ИИ-гонку Китаю. По оценкам компании, к 2028 году дата-центры, используемые для обучения новых моделей и функционирования уже существующих, будут потреблять более 50 ГВт энергии — в четыре раза больше пикового потребления Нью-Йорка. При этом в 2024 году в США ввели менее 40 ГВт мощностей против 400 ГВт в Китае.

План Anthropic простой — дать зеленый свет всем проектам, критическим для разработки ИИ. Создание “суперкластеров” для тренировки моделей, строительство небольших локальных дата-центров, новые электростанции и линии электропередач — все это должно реализовываться с минимумом бюрократии. А параллельно уже сейчас надо запускать программы подготовки профильных специалистов: и речь не только о ML-инженерах, но и об инженерах-энергетиках, монтажниках и всех тех, без кого электростанции и линии передач работать не будут.

Я же писал как-то ранее, что помимо США и Китая, у остальных стран просто нет шансов вырваться вперед в ИИ-гонке — тренировка новых моделей требует огромного количества GPU, которые дорого стоят, в постоянном дефиците, а их поставки в некоторые страны ограничены санкциями. Один из вариантов скомпенсировать это — прямо сейчас вкладываться в энергетику. Причем на всех уровнях: строительство новых станций, создание разветвленных энергосетей, развитие совершенно новых технологий генерации и обучение специалистов.

В общем, энергетика — область, где в ближайшем будущем точно не будет безработицы.
👍378🔥6👏1
Илон Маск ворвался в гонку, у кого больше ускорителей

Вообще удивительно, как быстро все меняется. В конце зимы суперкомпьютер Маска Colossus, построенный в рекордно короткие сроки, казался рекордсменом. Сегодня он выведен на полную мощность — и со своими 230 тысячами GPU теряется на фоне OpenAI и Meta* (признана экстремистской в России), которые приближаются к 500 тысячам чипов.

Все поменяется в ближайшие недели, когда Маск запустит в Теннесси первую очередь Colossus 2 на 550 тысяч новейших чипов NVIDIA GB200 и GB300 — все с водяным охлаждением. Маск утверждает, что для питания этой махины в третьей стране купили газовую электростанцию и морем перевезли в США. Фотографий и подробного репортажа с перевозки я не видел, но зная Маска можно сказать — этот парень пойдет и не на такое.

А теперь самое интересное. X-пользователь Lisan al Gaib попробовал посчитать (а я — перепроверил с помощью двух LLM) производительность Colossus 2. Из-за сложной архитектуры подобные суперкомпьютеры редко работают на пиковой производительности, но даже на консервативных 25% за 42 дня получится выдать 10²⁸ FLOPs — объем вычислений, достаточный для тренировки модели, считающейся прорывной на текущий день.

Для сравнения, вышедший в 2023 году ChatGPT-4 тренировали на примерно 2,1 × 10²⁵ FLOPs — то есть Colossus 2 сможет обучить подобную модель всего за два-три часа (!).

Куда пойдет подобная мощь? Вариантов много. Во-первых, xAI до сих пор остается в роли догоняющего — у компании есть передовой Grok 4, но вот генерация картинок устаревшая, а модель для создания видео только начинают тренировать.

Во-вторых, текущие модели — лишь один из первых шагов в разработке ИИ. Сейчас набирают популярность агентские системы, устроенные заметно сложнее. Ну а мировые модели, которые не просто разговаривают с нами текстом и голосом, а обладают пониманием окружающего мира (реального или виртуального), ориентируются в нем, чувствуют течение времени — это вообще запредельная сложность, которой и Colossus 2 не хватит.

В-третьих, мы все ближе к регулярному обновлению ИИ. Представьте модель, которая почти каждый день становится немного лучше и учится чему-то новому. Пока звучит фантастикой, но Google уже обновляла Gemini 2.5 Pro с периодичностью раз в месяц, а тот же Илон Маск похвастался, что “Grok 4 сегодня лучше, чем был несколько дней назад”, намекая на то, что модель постоянно дорабатывается при помощи обучения с подкреплением. Не до конца ясно, справедливо ли это только для тестовой версии или для публичной — но я, например, вижу, что Grok 4 стал намного быстрее отвечать на простые вопросы (поначалу он размышлял над ними по 30 секунд) и лучше пишет творческие тексты на русском языке.

Ну и последнее. Дальнейшие планы Маска — развернуть эквивалент 50 миллионов NVIDIA H100 в ближайшие пять лет. Это меньше по физическим чипам, так как новые GPU NVIDIA значительно выросли в производительности, но все равно впечатляет.
👍25🔥125
Прочитал пост Бена Томпсона, американского аналитика в сфере технологий, медиа и бизнеса, который перекликается с моими недавними мыслями. Всегда приятно, когда твои идеи подтверждаются кем-то еще — плюс у Бена есть и кое-что новое.

Например, он рассказывает о развитии контента как о борьбе с “бутылочными горлышками”, которые мешали его распространению. Первые истории рассказывались голосом у костра на аудиторию в десятки человек — и даже в соседнее племя они попадали в искаженном виде. Появление письменности позволило фиксировать знания и мнения — но до изобретения печатного станка тексты были доступны лишь избранным.

Станок же сделал доступным текст для читателя, но не всегда для издателя — выпускать газету или напечатать книгу все еще стоило приличных денег. Интернет убрал и это “бутылочное горлышко” — бесплатно опубликоваться в нем мог любой желающий.

Наконец, появление ИИ сносит последнюю преграду — сложность создания контента. Бен приводит свой пример – у него множество идей, но всего лишь две руки, чтобы превратить их в текст. Использование ИИ как партнера значительно ускоряет процесс.

От себя добавлю, что для многих эта преграда является критической. Далеко не все люди умеют писать легко и логично — так же, как многие знаменитые писатели и журналисты не умеют рисовать, петь или программировать. Сегодня такой проблемы больше не существует: главное ваши идеи, знания и позиция, ну а в структурированный и понятный текст их поможет превратить нейронка.

Но кому будут нужны эти тексты? Ведь ИИ работает и в другую сторону, по первому запросу выдавая текст, персонализированный под каждого пользователя.

Бен утверждает, что на качественный контент всегда будет спрос. В том числе — и со стороны разработчиков нейросетей, которым именно такой контент нужен для обучения. Если я считаю, что ведущие ИИ-компании со временем придут к созданию собственных редакций, скупив туда лучших журналистов, чтобы они обучали модели, то Бен идет более сложной дорогой.

Его мнение — весь контент, на котором обучилась модель, надо учесть. А затем переводить его авторам отчисления пропорциональные тому, как часто “знания” на основе этого контента использовались нейронкой для ответа. Мне данная схема кажется реализуемой с трудом, но хорошо уже то, что мы обсуждаем идею, что разработчикам ИИ стоит делиться с авторами контента.

Не хотите обучать нейронки? Создавайте то, что я назвал “мнениями” — контент, который будет объединять вокруг себя людей, заставлять их обсуждать, спорить и смеяться. Такой контент можно будет убирать под подписку, становясь независимым не только от ИИ, но и от рекламодателей.

Бен отмечает, что слабость ответов ИИ именно в их персонализации — за таким контентом нет автора, его не обсудишь с коллегами в курилке, под ним не напишешь комментарий. Он максимально эффективен, но людям, кроме эффективности, нужно еще и что-то, что будет их объединять. А на это современный ИИ не способен.

Или пока не способен?..
👍133
Не исключено, что сегодняшний день войдет в историю как дата начала новой “космической гонки”. Или даже Холодной войны…

Правительство США опубликовало America’s AI Action Plan — план действий по ИИ. Подробно описано по ссылке (плюс в карму приветствуется), здесь же выделю только самое главное:

— ИИ-гонка сранивается с космической гонкой прошлого века, основным соперником называется Китай.
— в США максимально снимаются бюрократические барьеры при разработке моделей, строительстве ИИ-инфраструктуры.
— “перезапускается” энергетика: угольные и газовые станции не выводятся из эксплуатации, дальнейшая ставка на мирный атом и геотермальные станции.
— ИИ-модели должны быть объективными… но поддерживать американскую идею.
— отдельные дотации идут разработчикам моделей с открытыми весами.
— запускается куча проектов по внедрению ИИ в разные сферы: от медицины до сельского хозяйства.
— в случае национального кризиса власти оставляют за собой право приоритетного доступа к коммерческому парку ускорителей.
США открыто заявляют о планах создания “ИИ-коалиции”. Входящие в нее страны будут первыми получать доступ к новым моделям и технологиям.
— параллельно США будут противодействовать влиянию Китая во всех международных организациях и ужесточат экспортный контроль ИИ-ускорителей и технологий их производства. Обсуждаются даже геолокационные чипы для выключения GPU, попавших в недружественную страну.

Мир стремительно нашел новую линию, по которой собирается поделиться. Интересно, на какой стороне окажемся мы?
🔥559👍6😁2
AGI из первых принципов

Когда Илон Маск только начинал раскручивать Grok 4 (еще под названием Grok 3.5), то он очень хвастался, что это будет первый ИИ, способный рассуждать из первых принципов. Это метод, при котором сложную идею или проблему раскладывают на базовые истины, а затем от них строят решение. После выхода Grok 4, я несколько раз пробовал проверить этот и другие ИИ на рассуждения из первых принципов, но каждый раз отвлекался и не доводил до конца.

А сегодня наконец-то появился хороший повод — в интервью Лексу Фридману глава Google DeepMind Демис Хассабис заявил, что с 50% вероятностью ожидает появление общего искусственного интеллекта (AGI) до 2030 года. Демис определяет AGI как модель, когнитивные способности которой совпадают с человеческими во всех областях.

Но что нам прогноз Хассабиса — давайте посмотрим, как рассчитывают сроки появления AGI текущие ИИ, работая из первых принципов. Сразу отмечу, что одним ответом здесь не обойдешься — как минимум, придется попросить модель покритиковать саму себя. Вот стартовый простой промпт:

Рассуждая из первых принципов, оцени сроки появления AGI. Используй интернет только для поиска цифр и фактов, не сверяйся с чужими мнениями.


Очень важно сразу же дать ограничение на использование интернета — иначе модель может “списать” мнение того же Хассабиса и выдать за свое. И даже с этим ограничением ИИ сходу не рассуждают полностью из первых принципов, поэтому, получив ответ, пишем следующий запрос:

Оцени ответ выше. Где он соответствует рассуждениям из первых принципов, а где — нет?


Затем просим переписать ответ с учетом собственной же критики — и получаем финальную версию.

Окей, давайте посмотрим, как справились три модели, которыми я сейчас регулярно пользуюсь:

Gemini 2.5 Pro

Топ-модель Google красиво разбила проблему на три ключевых направления, описала их хорошим и понятным русским языком, но вот сроки появления будто бы и не считала, а взяла из головы. Все-таки видно, что 2.5 Pro чуть отстает по глубине рассуждений от конкурентов — пора уже выпускать 3.0 Pro!

Финальный прогноз модели: 2035-2040 годы при оптимистичном сценарии, 2045-2060 — при консервативном.

Grok 4

Тут уже видна не только попытка разбить вопрос на базовые принципы, но и затем как-то посчитать. Модель заметно улучшила результат после самокритики. А вот ответ мне не понравился: только один сценарий с 15-летней вилкой (2030–2045). Да и в целом, от Grok 4 я ожидал большего.

ChatGPT o3

Как по мне, то уже первый ответ модели оказался лучше других — понятный, логичный и с хорошим подбором данных. На этапе самокоррекции я схалявил и не обратил внимание, что o3 предложила на выбор три подхода, как улучшать дальше — иначе, финальный ответ мог бы быть лучше. Но все равно впечатляет.

Прогноз у нее самый смелый: 2027–2030 (оптимистичный), 2030-2033 (базовый), 2034-2040 (консервативный).

Не скажу, что даже в случае с o3 это полная работа из первых принципов — подобную задачу стоит ставить профессиональным моделям вроде o3-pro, Grok 4 Heavy и Gemini 2.5 Deep Think (когда выйдет). Но в некоторых случаях просьба рассуждать таким образом будет полезна тем, что даст вам более полный взгляд на задачу и покажет неочевидные ее составляющие.
🔥3216👍10😁4
Лобстер нарисовал пеликана…

Ничего не поняли? Значит, день проходит хорошо!

Ведущие ИИ-компании обычно обкатывают свои новые модели на сайтах вроде LMarena и WebDev Arena под разными забавными названиями. И вот на второй площадке за последние несколько дней энтузиасты заметили сразу несколько моделей, которые отвечают, что их разработали в OpenAI: Lobster, Nectarine, Starfish и o3 Alpha. Давайте разбираться, что удалось нарыть.

Жаль, что вебдев-арена ограничена только кодингом под веб, но сами результаты очень интересные. Nectarine и Starfish дают быстрые ответы, результат неплохой, не без прорывов. А вот o3 Alpha и Lobster впечатляют.

Впрочем, смотрите сами. Пример выше взял у X-пользователя Chetaslua: промпт “create a pelican riding bicycle SVG” с первого раза выдает очень симпатичное изображение пеликана с набором дополнительных настроек. Сейчас пользователи X гоняют модель на самых разных задачах: от сложной версии змейки на двух игроков до классического теста физики с мячиком внутри шестиугольника.

Для OpenAI это вдвойне важно, так как раньше модели этой компании плохо дружили с визуалом. Когда я прошу сделать презентацию или веб-сайт, то знаю, что у Claude получится красиво, у Gemini симпатично, а вот ChatGPT выдаст что-нибудь простенькое. В новинках это не так.

Что это могут быть за модели? Буквально вчера Том Уоррен из The Verge рассказал, что по данным из его источников, OpenAI выпустит GPT-5 в начале августа. Причем это будет целое семейство моделей: GPT-5, GPT-5 mini и GPT-5 nano.

Тестовые версии отлично подтверждают слова Уоррена. Nectarine и Starfish похожи на mini и nano — подобные модели создаются для ситуаций, когда нужны быстрые решения не очень сложных задач. Ну а o3 alpha и Lobster вполне могут оказаться GPT-5 на разных настройках.

Здесь важно напомнить главную особенность GPT-5. Сейчас в подписке ChatGPT есть целый зоопарк из моделей — для быстрых ответов, рассуждающие для кодинга и сложных задач, экспериментальные и т. д. GPT-5 станет первой универсальной моделью, которая по умолчанию сама будет решать — дать быстрый ответ или перейти в режим рассуждений и поработать над задачей подольше. И вот есть ощущение, что две показанные версии — это просто разные режимы рассуждений GPT-5.

Для большинства пользователей такой подход будет в плюс — я знаю много людей, которые вообще не переключаются с GPT-4o, так как не понимают, когда это необходимо делать. И уже были слухи, что энтузиастам оставят возможность самостоятельно выбирать режим, если им кажется, что модель не дорабатывает в той или иной ситуации. Надеюсь, что эти данные подтвердятся.

Пока мало информации, как новые модели показывают себя в других задачах. Сэм Альтман на подкасте у Тео Вона похвастался, что недавно получил письмо с вопросом, на который не понимал, как ответить — и в итоге просто скинул его в GPT-5. Модель дала отличный ответ, после чего Альтман почувствовал себя “бесполезным” на ее фоне.

С одной стороны, директор OpenAI просто обязан нахваливать свою продукцию. С другой — компания уже давно не выпускала новых моделей. Поэтому было достаточно времени на тренировку и доработку, а главное — уже совсем не осталось времени на то, чтобы стоять на месте. Конкуренты поджимают со всех сторон, так что OpenAI просто обязаны порадовать чем-то прорывным.

Апдейт: уже после написания поста добавили ещё две модели - Summit и Zenith. Зенит выглядит ещё внушительнее, ух!
🔥19👍128