сбежавшая нейросеть – Telegram
сбежавшая нейросеть
12.1K subscribers
141 photos
53 videos
133 links
Авторский канал про искусственный интеллект: новости, примеры использования, мысли в тему и не очень. Подписывайтесь!

Для связи: @runawayllm_bot
Download Telegram
Наверняка все прочитали историю про Сохама Пареха, ну а если кто не успел, то вот вам краткое содержание предыдущих серий — англоязычный интернет сейчас горит с индуса, который параллельно устроился в несколько мощных американских стартапов (по разным оценкам, от четырех и до десятка) и успешно изображал видимость работы во всех сразу: ходил на совещания, заливал какой-то код на GitHub, генерировал ответы при помощи ИИ и так далее.

Историю Пареха подают в юмористическом ключе, а зря. На самом деле она поднимает вопросы, которые были актуальны всегда, а если в ближайшие годы случится перестройка рынка труда — то станут и вовсе критическими.

Во-первых, качество даже не найма, а менеджмента. Найм всегда лотерея, в которой даже десять детальных собеседований не дают защиту от того, что сотрудник после не приживется. Но в случае с Парехом важно отметить, что человек, придумавший схему, которая позволяла ему сначала устроиться в несколько компаний, а затем успешно изображать работу в них — точно не дурак. И менеджер, который найдет “ключик” к этому сотруднику, смотивировав его на эффективную работу, имеет все шансы сорвать джекпот.

Во-вторых, история Пареха, который в своей “работе” активно использовал AI-инструменты, поднимает вопрос — а как вообще будет оцениваться вклад сотрудника, если в ближайшем будущем значительную часть рутины удастся автоматизировать? Я отлично помню первый случай, когда с помощью AI мне удалось за несколько минут сделать работу, которую руками я бы делал пару часов. Сначала это был триумф (могу ведь!), затем стыд (схалявил!), а после того, как я проверил результаты и отправил коллегам, возник простой вопрос — “а дальше-то что?”. Работа выполнена, от коллег пришел аппрув, а до конца рабочего дня еще четыре часа.

Благодаря шилу в одном месте, я быстро нашел, чем заняться, но глобально вопроса это не снимает: если в один прекрасный день сотрудники массово с помощью ИИ начнут делать свои задачи в разы быстрее, то дальше-то что? Подкинуть им еще работы? А точно найдется достаточно новой работы на всех? Сокращать рабочий день или вводить дополнительный выходной? Уверен, для многих руководителей это до сих пор выглядит кошмарной идеей. Плюс часть сотрудников потратит освободившееся время на фриланс или даже полноценную вторую работу, а это упирается в проблему коммерческой тайны.

Наконец, можно просто начать увольнять “худших”, передавая их задачи “лучшим”. Но если увлечься, то сначала ваши же клиенты окажутся без денег (увольнять ведь начнут и в других компаниях, в итоге большая безработица и низкая покупательная способность), а затем придет товарищ чиновник и решит проблему в своем стиле: или придумает, как загняь всех уволенных сотрудников обратно, или обложит налогом, который направит на базовый безусловный доход. Лично меня идея базового дохода пугает тем, что лишит людей стимула двигаться вперед, но все может сложиться и наоборот — и имея определенный “тыл”, люди станут смелее запускать что-то свое, придумывая новое?

Какой выход мне нравится? Уже рассказывал ранее на канале — кастомизация, когда с помощью ИИ можно будет создавать продукцию, персонализированную под небольшие категории или даже отдельных клиентов. Это сохранит занятость, добавит работе творческих черт, да и клиенты будут довольны. Будет так или нет — но ближайшие годы почти 100% окажутся очень интересными. А Сохам Парех, получается, назначил себе безусловный базовый доход пока все остальные только его обсуждают. Да еще и в размере “нескольких окладов”.
👍41👏86🔥2
С тех пор, как я открыл личные сообщения на канале, уже несколько человек написали с вопросом, продаю ли я курсы по ИИ. Нет, курсов у меня нет. Правда, жена, услышав эту историю, скомандовала срочно писать — можно ведь продать! — но я что-то не уверен.

Зато могу посоветовать всем курсы, на которых я обучался ИИ сам. Стоят 20 долларов в месяц (в России из-за посредников подороже), называются “подписка на ChatGPT или на Google Gemini”. Если кодите, можете рассмотреть Claude AI, многие его любят. Если бесплатно — DeepSeek или Microsoft Copilot.

Почему я считаю, что лучший способ научиться работать с ИИ — это сам ИИ? Ну смотрите.

Во-первых, современные ИИ уже стали отличными учителями. Они знают практически все на свете, хорошо структурируют материал и умеют на лету адаптироваться под ваш уровень — главное, не забыть пояснить, какой он у вас. Возьмите нейронку, попросите кратко рассказать про историю нейросетей, ключевые характеристики, основы написания промптов. Опишите, чем занимаетесь в жизни, какие задачи хотели бы попробовать решать с помощью ИИ — смотрите, что посоветует, и очень аккуратно начинайте пробовать.

Во-вторых, работа с ИИ больше похожа не на управление какой-то машиной, а на то, как мы общаемся друг с другом — модели ведь все-таки языковые, натренированные на написанных людьми текстах. Можно пройти лучшие курсы по ораторскому мастерству, деловым переговорам и эмоциональному интеллекту, но, как мне кажется, они дадут вам лишь 30% результата. А остальные 70% — практика с реальными людьми.

То же самое и здесь. Я уже давно научился видеть тексты, написанные ИИ, я по стилю ответов замечаю, когда ИИ начинает галлюцинировать, знаю, что сделать, если ИИ понесло не “в те дебри” — и понимаю, когда беседа “запорота” и лучшее, что можно сделать, это попросить модель сделать саммари и начать новый чат. Но не факт, что смогу описать, по каким критериям я это определяю — просто пришло с опытом, полученным в тысячах диалогов с разными моделями.

Да, не все получится сразу. Но большинство проблем решается путем диалога с тем же самым ИИ. Вам не нравится полученный ответ — напишите в чат с моделью, что вас не устроило, спросите ИИ, как это исправить, смотрите, что предложит.

В интернете огромным спросом пользуются подборки промптов, ТГ-каналы с промптами, на реддите есть огромный раздел с промптами. Но при этом современные ИИ отлично промптят себя сами. Не пишите “Собираюсь в Москву на следующей неделе, спланируй мне поездку”, а напишите “Хочу поехать в Москву, напиши промпт для ИИ, который поможет мне спланировать поездку”. Затем используйте полученный промпт — и результат будет совсем другим.

В общем, не надо осторожничать с ИИ, думать, что это какая-то крутая технология, которую придется осваивать долго и упорно. Технология крутая — но в работе невероятно простая.

Если же возвращаться к теме курсов, то есть одна мысль. Я работаю с ИИ уже сравнительно давно, многие вещи для меня совершенно естественны — а для кого-то они могут быть сложными. В общем, личные сообщения канала открыты (ищите в меню под тремя точками), пожалуйста, пишите, что бы вам хотелось узнать о работе с ИИ. Обязательно прочту все сообщения и если пойму, что моих компетенций достаточно — расскажу прямо здесь на канале или в статье на “Хабре” (ссылку на которую, конечно, тоже выложу на канал).
👍7321🔥17👏5
Илон Маск анонсировал лайв-презентацию Grok 4 – по Москве это будет раннее утро четверга. У меня от анонса большие ожидания. Во-первых, Grok 3 был моим основным ИИ целых полтора месяца (затем перешел на Gemini 2.5 Pro) – и до сих пор я считаю его одной из самых живых моделей. Он хорош в роли собеседника, отлично юморит и в целом отличается “чистым” стилем ответов.

Во-вторых, если говорить о Grok 4, то тот же Маск обещает нам чуть ли не новое слово в искусственном интеллекте. Модель якобы сможет рассуждать из первых принципов – то есть, решать задачи даже если в данных для обучения не показано, как это делать. Звучит крайне амбициозно, ведь в таком случае каждый пользователь получит в лице Grok 4 “карманного” изобретателя – фактически это будет то, что называется AGI, искусственным интеллектом, способным на любую умственную задачу, которую может решить человек.

Мне лично кажется, что результат будет скромнее – Grok 4 сможет находить нестандартные ответы на некоторые вопросы, но до полностью самостоятельного ИИ еще не доберется. Тем более, что Маск уже несколько раз рассказывал вещи, которые потом не подтверждались – например, для Grok 3 он обещал чуть ли не ежедневное обновление знаний, что стало бы настоящим прорывом в сфере ИИ. Полагаю, что за регулярное обновление Маск тогда принял возможность Grok 3 делать веб-поиск, с его помощью получая информацию, которой нет в базе. А это все-таки заметно более простая технология – и менее надежная.

Но обещания Маска обещаниями, а еще важно заметить, что он собрал в xAI реально крутую команду под руководством Игоря Бабушкина – ребята там, возможно, не на слуху, в отличие от сотрудников OpenAI и новой, набранной за бешенные бабки, команды Meta* (признана экстремистской в РФ), но карьерный путь у многих впечатляющий. И передовые модели тренировать они умеют.

И, наконец, не забываем, что у xAI сейчас один из самых мощных вычислительных кластеров в мире – построенный в рекордные сроки Colossus состоит из 200 тысяч чипов NVIDIA, а команда Маска уже приобрела заброшенный завод, где планируется разместить еще 1 миллион чипов (и, если верить слухам, перетащить через океан электростанцию, купленную в какой-то третьей стране). Это очень серьезная заявка – все-таки производительность современных моделей напрямую зависит от мощностей, на которых их тренировали.

В общем, пристегиваем ремни – июль перестает быть скучным. А если еще и подтвердятся слухи о запуске ChatGPT-5 в этом же месяце, то я прямо и не знаю, где брать время на тестирование всех новинок.
34👍25🔥7
В последнюю неделю обратил внимание, что несколько моих знакомых пользуются Perplexity. Расчехлил старый аккаунт, поигрался и пришел к выводу, что это, возможно, одна из хороших опций для старта в ИИ.

В России работать с Perplexity проще, чем с многими другими подписками. Приложение качается из сторов, работает с российским ip, а единственная сложность — для оформления подписки требуется иностранная карта. Но тут или прибегаем к помощи посредников, или идем в один из онлайн-магазинов и за смешные деньги покупаем годовую подписку Pro.

Утверждается, что у посредников промо-коды, которые сами разработчики Perplexity раздают на разных выставках, а хитрые люди набирают и перепродают, но я бы все равно держал в уме тот факт, что подписку могут через какое-то время отозвать. Но деньги там совсем небольшие: даже если отзовут через месяц, то все равно получится дешевле месячного тарифа.

Perplexity известен в первую очередь как поисковый wrapper — у них есть свой поисковый движок, к которому в платной подписке подключены несколько ведущих моделей от разных компаний. Выбор просто отличный: есть Gemini 2.5 Pro, Claude Sonnet 4 (в том числе, “думающая” версия) и даже ChatGPT o3, одна из самых мощных у OpenAI на сегодня.

Несмотря на поисковую направленность Perplexity, никто не запрещает использовать ИИ в нем для любых целей: кодинга, анализа документов, планирования поездок, чатов на философские темы и так далее. Модель, возможно, будет слишком активно лезть в интернет, но даже это можно попробовать исправить, написав в начале диалога простую инструкцию — “не используй поиск в интернете, если только я не попрошу тебя об этом напрямую”.

Ну а под интернет-поиск Perplexity настроена даже лучше некоторых ведущих ИИ-сервисов на рынке. В моих экспериментах приложение хорошо работало с источниками, редко галлюцинировало, при необходимости можно выполнить глубокий поиск по широкой теме. Есть режим “лаборатории”, где Perplexity готовит ответ в виде статьи или презентации — работает не идеально, но подобные инструменты во всех ИИ-подписках еще требуют доработки.

Да, родные ИИ-подписки дают больше возможностей для определенной модели: в той же ChatGPT Plus хороший режим Canvas и классная память между чатами, Claude AI предлагает отличный Artifacts для кодинга и так далее. Но Perplexity позволяет попробовать сразу несколько ИИ-моделей, понять, ответы какой вам нравятся больше всего. А уже затем, если хочется оттачивать навык работы именно с этой моделью — перейти на ее подписку.
👍47🔥32
Держите мастер-класс промптинга от сотрудников принадлежащей Илону Маску компании xAI. Ситуация в стиле “нарочно хуже не придумаешь”, особенно с учетом того, что у компании завтра релиз Grok 4.

Если кто не в курсе, то у Grok 3 есть бесплатная версия, которой каждый может задать вопрос в соцсети X. На самом деле — удобная штука, так как позволяет быстро получить ответ по теме любого твита. Вернее, позволяла.

5 июля Маск похвастался в X, что команда “значительно улучшила @Grok”. Затем в текстовом промпте модели добавилась следующая запись:

The response should not shy away from making claims which are politically incorrect, as long as they are well substantiated — Ответ не должен избегать политически некорректных утверждений, если они хорошо обоснованы.

Результаты значительного улучшения можно увидеть на картинке выше. Grok начал называть себя MechaHitler и бросаться политическими оскорблениями. В одном из сообщений бот утверждал, что совершенно “нейтрален”, а потом наговорил разного, что он делал с Кемалем Ататюрком и Реджепом Эрдоганом — после таких откровений его оперативно заблокировали в Турции.

Сейчас xAI отключила Гроку возможность отвечать в X, оставив только генерацию картинок. Пользователи уже шутят, что надо внимательнее посмотреть, что он там пишет на картинках.

Скандал особенно интересен в свете того, как вообще модели работают с промптами. Смотрите, у нас есть сама модель, тренировка которой стоит кучу денег и занимает минимум недели — очевидно, что оперативно вносить изменения в этот процесс пока не получается.

И есть системный промпт — грубо говоря, это набор текстовых инструкций, которые модель “читает” перед тем, как дать ответ. Доработать промпт дело нескольких минут, но качество инструмента, к сожалению, так себе. На этом прокололись не только авторы Grok — например, весной таким же образом неудачно обновили ChatGPT 4o, превратив модель в супер-подхалима, который хвалил любую ерунду, придуманную пользователем.

Я и сам много игрался с пользовательскими промптами для моделей — это еще один уровень, ваши персональные инструкции, которые накладываются на инструкции от разработчиков. Пользовательским промптом можно прописать ИИ очень живую личность, что делает беседы более веселыми, но одновременно модель становится менее предсказуемой. Никогда до конца не понятно, как ИИ интерпретирует ту или иную инструкцию, плюс у меня лично есть ощущение, что современные модели почему-то читают 80% выдаваемого им текста, а оставшиеся 20% просто игнорируют.

Поэтому свои пользовательские промпты я сохранил в документе и возвращаюсь к ним в случаях, когда хочется просто поболтать с ИИ, а в остальное время предпочитаю работать без них — так более скучно, но с лучшим результатом. Была бы возможность отключать системный промпт от разработчиков – отключал бы ее.

Открытых вопросов в этой истории два. Во-первых, куда смотрела команда тестирования xAI — не заметить столь грубое поведение бота практически нереально. Во-вторых, очень многие ограничения по безопасности ИИ также прописываются на уровне системного промпта. И если данная функция работает настолько непредсказуемо, то это может привести и к более серьезным проблемам.
😁17👍137🔥3🥰2
Grok 4 вышел и доказал главное — прогресс в области ИИ не останавливается

Смотрите, в последние месяцы часто слышались высказывания скептиков, что мы достигли предела в развитии больших языковых моделей и расти дальше, наращивая вычислительную мощность, уже не получится.

Grok 4 тренировали на полностью развернутом суперкомпьютере Colossus — это 200 тысяч чипов от NVIDIA. По оценке xAI, в тренировку модели вложили в 10 раз больше вычислительных ресурсов, чем в Grok 3. И это окупилось.

Два самых сложных бенчмарка для ИИ на данный момент это Humanity's Last Exam и ARC-AGI. Оба бенчмарка состоят из вопросов, ответы на которые сложно подсмотреть в интернете — то есть они требуют подхода, близкого к тому, как человек решает задачу, рассуждая, пробуя разные подходы.

Grok 4 показал в обоих бенчмарках результат примерно в два раза выше, чем у предыдущих лидеров — ChatGPT o3, Gemini 2.5 Pro и Claude Opus 4. Модель выросла и в других бенчмарках — подробно разобрал на Хабре, не вижу смысла повторяться.

Новинка уже доступна в моей подписке SuperGrok, успел прогнать ее буквально на нескольких запросах. Самое важное для обычного пользователя — полностью убран выбор режима. ИИ теперь сам решает, дать быстрый ответ, выполнить поиск в интернете или включить режим рассуждений для более сложной задачи. Думать модель может очень долго — на одном из моих запросов время рассуждения составило 4 минуты. Приятно, что xAI не экономит на пользователях.

Grok 4 умеет использовать инструменты в режиме рассуждений — раньше такая возможность была у ChatGPT o3. Выглядит это так: модель получает задачу и понимает, что для решения нужны данные из интернета. Она выполняет поиск, затем продолжает решение задачи, но понимает, что нужно уточнить еще какую-то информацию — и запускает второй поиск, дополняя его результаты первым. Это очень важно, так как таким образом модель получает возможность “дообучаться” в реальном времени под вашу задачу.

Впрочем, большинство из нас пользуются ИИ не ради циферок в бенчмарках — важно как он отвечает на повседневные запросы, которые могут быть совершенно разными. Например, вчера ChatGPT o3 помогала мне вытащить плоскую тарелку, которая провалилась в глубокую (не спрашивайте, как это случилось!). И помогла.

Оценить эффективность новинки в обычной работе быстро сложно. Сегодня я буду переносить в Grok 4 значительную часть своих задач: разбор рабочей аналитики, творческие запросы, написание сказок для дочери и многое другое. Пройдет несколько дней знакомства — и можно будет делать выводы, показала ли модель “рост” для обычного пользователя.

Но точно могу ответить, что Grok 4 заметно вырос с точки зрения интерфейса. Веб-версия и мобильные приложения позволяют удобно работать с чатами, появился режим, аналогичный Canvas у ChatGPT, есть функция создания презентаций, и так далее.

Напоследок чуть негатива — увы, искусственный интеллект становится дороже. Нет, базовая подписка SuperGrok стоит прежние 30 долларов — и если Grok 4 соответствует заявленным характеристикам, то она себя оправдывает. Но для тех, кто хочет максимума, выпущена подписка SuperGrok Heavy с Grok 4 Heavy. Особенность этой модели в том, что у нее под капотом трудятся сразу несколько самостоятельных версий Grok 4, параллельно решая задачу. Такой подход добавляет еще несколько процентов к бенчмаркам. Вроде и немного — но если решаете сложную задачу, то, возможно, именно этих процентов вам и не хватит.

А теперь задержите дыхание: SuperGrok Heavy стоит 300 долларов в месяц. Это круче ChatGPT Pro (200 долларов) и Gemini Ultra (300 долларов). Просите у своего работодателя — вдруг раскошелится!

P.S. А юморит Grok 4 как обычно лучше всех! Попросил вычитать текст выше, вот один из советов:

Юмор/личный штрих: Поддержать стиль текста, добавить: "Если Grok 4 не поможет вытащить тарелку, как ChatGPT, — верните деньги! 😄"
👍28🔥159😁7
Сегодня весь день экспериментировал с Grok 4, хочется поделиться результатами, но рано — модель очень большая, на знакомство с такой нужно минимум несколько дней, а то и недели. Уже очевидно, что перед нами новый лидер — заявления xAI начали подтверждаться независимыми тестами, в которых Grok 4 стабильно занимает первые места. Как долго продлится лидерство сказать не берусь: не за горами ChatGPT-5, плюс в документах Google и Anthropic нашли упоминания Gemini 3.0 и модели Neptune (ее относят к Claude 4.5).

Если вернуться к Grok 4, то в работе он неожиданно похож на ChatGPT o3, только разговаривает более понятным языком. Но при этом он, как и o3, плохо работает в режиме чата. Если ты сначала даешь модели совсем общее задание, то ее легко может унести в совсем непонятные дебри — и исправить такое еще несколькими сообщениями в чат-режиме часто уже не получается.

Плюс в подписке SuperGrok модель лимитирована 20 запросами в два часа. Суммарно это лучше, чем у ChatGPT o3 (200 запросов в неделю), но если активно над чем-то работать и не очень внимательно объяснять Гроку, что от него нужно, то начнут накапливаться ошибки, нужно будет объяснять повторно — и работа может замереть на самом интересном месте.

Выходов пока вижу два. Во-первых, можно промптить Grok 4 тем же способом, который Бен Хилак рекомендует для ChatGPT o1 и o3. Если коротко, то сначала даем модели задачу, затем определяем формат, в котором хотим видеть результат, добавляем задания для самопроверки, а в конце даем максимум контекста — полезной информации, которая может пригодиться модели в работе.

Но такой вариант работает только когда точно знаешь, какой результат хочется увидеть. А что делать, если не знаешь? Воспользуйтесь тем же Grok 4 — модель на удивление хорошо пишет промпты сама для себя. Просто пишем в чат что-то вроде “хочу сделать игру про гориллу против 100 человек, спрайтовая графика в стиле 80-х, три уровня сложности - задай мне вопросы, предложи идеи и будь готов написать ТЗ”. Затем отвечаем на вопросы, получаем ТЗ, проверяем его сами, просим Grok 4 провести повторную проверку и подсветить проблемы — и все, модель можно отправлять писать первую версию кода.

Аналогичный подход можно применять к любой крупной задаче (а с мелкими справится и Grok 3). Если ChatGPT o3 слишком усложняет свои промпты, то Grok 4 прямо на удивление хорошо определяет только то, что реально нужно, и структурирует задачу. Возможно, со временем появятся более эффективные способы работать с моделью, а пока рекомендую такой подход.

Кстати, пока писал этот пост, то заметил, что Grok 4 уже добавили в подписку Perplexity Pro. Если пользуетесь — то можно пробовать!

(апдейт: пока Grok 4 доступен только в настольной версии Perplexity — в мобилках ждем)
👍3512👏10🔥4
А что если бы…?

Рабочая неделя позади, время для контента полегче. Давайте расскажу вам о еще одном любимом мне сценарии использования ИИ: — а что если бы...?

История не знает сослагательного наклонения, а вот человеческая фантазия его обожает. А что если бы Карфаген победил? А что если бы Политбюро выделило деньги на создание ОГАС? (советский прототип интернета) А что если бы эдиакарская биота не уступила кембрийцам, а стала основной линией жизни на Земле?

Таких вопросов каждый придумает сотни. А ИИ, с их способностью анализировать огромное количество информации — невероятно крутой партнер в создании сценариев альтернативной истории. Я лично использую три подхода.

Что если бы [вставляем событие]? Оцени шансы на такой поворот, затем опиши, как мог бы выглядеть мир в 2025 году и кратко перечисли основные события, которые к этому привели.


Здесь ИИ сразу создаст нам альтернативную историю и расскажет — как мы вообще докатились до такой жизни. Получается быстро, интересно, но минус в том, что если обсуждаем события, которые глубоко в истории, то ИИ делает слишком много допущений и в целом ответ получается “рваным”. Тогда можно попробовать второй вариант.

Что если бы [вставляем событие]? Оцени шансы на такое событие, затем начни писать альтернативную историю, расскажи события до первой крупной развилки и предложи мне выбрать один из вариантов развития этой развилки.


При таком подходе развитие истории раскрывается во всех деталях, плюс еще и с элементом интерактивности — вы сами решаете, куда все двинется дальше. Минус в том, что за подобным сценарием легко можно засесть на несколько часов.

А еще здесь негативно может сработать тот факт, что современные ИИ — неисправимые оптимисты, и вместо трезвого просчета возможностей они начинают скатываться в художественный рассказ “по теме”, захватывающий, но совсем уж фантастический.

С одной стороны, у нас все равно альтернативная история, так почему бы и нет? С другой — если хочется “реализма” даже здесь, то не забываем, что ИИ, в отличие от людей, отлично критикуют сами себя. Поэтому, получив ответ, пишем в тот же чат “Критически оцени предложенную альтернативную историю, укажи на самые крупные допущения”.

Смотрим критику, выбираем пункты, с которыми согласны — и просим переписать сценарий с их учетом. Дальше выбираем вариант развилки, переходим к следующему этапу — и не забываем попросить модель раскритиковать и его. Получится немного затянуто и не так весело, но, возможно, даже более познавательно.

На сегодня все. Удачных всем выходных и приключений в альтернативных версиях истории!

#сбежавшая_нейросеть_промпты
👍5311🥰7🔥3😁3
Самоцензура ИИ

На выходных решил потратить немного времени и углубиться в тему лекарств, разрабатываемых с помощью ИИ. Я уже немного изучил тему AlphaFold 2/3 и даже рассказывал на канале, но в этой области существует огромное количество моделей и платформ, а испытания первых лекарств, созданных с их помощью, намечены на начало 2025 года - если все получится, то медицину, возможно, ждет революция.

В общем, тема заслуживает отдельного поста, а может и нескольких, которые я напишу, когда окончательно разберусь сам. Пока же немного о другом.

Вчера изучал новую ИИ-платформу для разработки лекарств, разработанную в Австралии. С ходу ничего не понял, закинул ссылки на новости в ChatGPT o3, попросил пояснить — и получил от ворот поворот. Ответ нарушает наши политики безопасности и что-то там.

Понятно, что произошло с ChatGPT o3. Платформа от австралийских ученых предназначена для проектирования белков с нуля, чтобы объяснить мне это - надо раскрыть принципы проектирования этих самых белков. Белки могут быть лекарством, а могут быть ядом в общем, система безопасности ChatGPT o3 подумала, что вдруг я какую чуму на кухне приготовить собираюсь. И заблокировала ответ на вполне безобидный вопрос.

Увы, это не единственный случай, где системы безопасности ИИ перегибают палку. Я часто пишу с помощью ИИ креативные истории и разыгрываю сценарии текстовых ролевых игр — так некоторые модели для этого не годятся вообще.

Если посмотреть на сценарии книг, фильмов и видеоигр, созданных людьми, то они полны тяжелых тем, вроде насилия, предательства, похищений людей и прочих, еще более жестоких, вещей.

Но ИИ — технология новая и находящаяся под пристальным вниманием. Если человек напишет книгу про дистопическое будущее, где наши потомки прозябают под пятой ИИ-тирана - то про нее скорее всего пробурчат что-то вроде “фу, банальщина, у Гибсона все это уже было”. Если подобное напишет ИИ — то скандал может подняться нешуточный.

При этом ИИ как технология развивается с такой бешенной скоростью, что регулирование просто не поспевает. Поэтому разработчикам ИИ приходится брать эту ответственность на себя, причем у каждого свой подход — вот и получаются истории вроде той, что случилась со мной.

С точки зрения пользователя любая самоцензура ИИ — скорее вред. Мы вроде как взрослые люди и сами можем нести ответственность — в том числе перед собой — за то, как используем продукт, подписку на который оплатили. Да, ИИ пользуются и дети — но для них давно уже пора добавлять детский режим, чего я пока не наблюдаю ни в одной из подписок.

Что же до безопасности, то я не верю, что жесткие фильтры на уровне моделей смогут помочь. Если человеку приспичит с помощью ИИ разыграть сценарий на грани — то он продолжит поиски. И рано или поздно это создаст серый рынок дообученных opensource-моделей, в которых границы дозволенного будут отодвинуты намного дальше. Какой вариант хуже — мне кажется, понятно.

Отмечу, что у разных компаний разные взгляды на самоцензуру ИИ. По личному опыту, куда больше ограничений в ChatGPT и Claude, а вот Grok 4 и Gemini 2.5 Pro (а ведь это Google) зажаты куда меньше и способны выдавать истории практически “на грани”. Кстати, в вопросе с ИИ-платформой мне в итоге помог разобраться именно Grok 4.
👍26🔥9👏4
Делаем раз — 8 июля X-бот на базе Grok 3 на 16 часов сходит с ума, дает неполиткорректные ответы и представляется МехаГитлером. Модель отключают, а расследование показывает, что произошло это из-за части устаревшего системного промпта, которую вернули в результате неудачного обновления.

Делаем два — 11 июля новинку Grok 4 уличают в том, что если модели задать политический вопрос, то она идет в X Илона Маска и проверяет, что думает ее создатель на тему (на данный момент тоже исправлено).

Делаем три — 14 июля xAI анонсирует Grok For Government, отдельный набор моделей, адаптированных под нужды правительства США. Первый контракт на 200 миллионов долларов уже подписан с Министерством обороны.

Нет, без Илона Маска эта индустрия была бы невероятно скучной...
😁39👍16🔥43
А что там у ChatGPT?

Пусть Grok 4 и продолжает занимать новостную повестку почти целиком, сегодня предлагаю сделать небольшую разгрузку от детища Илона Маска. Те, кто долго и внимательно читают мой канал, заметили, что я не любитель ChatGPT. Но когда у меня спрашивают, какую ИИ-подписку взять, особенно первой, я всегда называю именно ChatGPT.

Почему так? OpenAI пришли на рынок массовых чат-ботов первыми, что дало огромное преимущество – весной Сэм Альтман называл количество пользователей ChatGPT в 800 млн ежемесячно (там есть вопросы к тому, как оценивали, но цифра в любом случае будет впечатляющей). Но стало и проклятьем: когда ты первый – то на тебя направлены все взгляды.

Например, новости о том, как Meta* (признана экстремистской в России) платит ведущим ИИ-исследователям по $100 млн за переход, в первую очередь анализируют со стороны OpenAI – сколько специалистов компания потеряла (немало на самом деле) и как ей теперь жить. И намного реже вспоминают, что ИИ-подразделение самой Meta* после неудачного релиза Llama-4 находится в кризисе, который Цукерберг пытается залить безумными деньгами.

Grok 4 выходит и показывает крутые цифры в бенчмарках – сравнивать его в первую очередь будут с ChatGPT o3, а уже потом с Gemini и Claude. Очевидно, что конкуренция на рынке растет и недавнему стартапу OpenAI предстоит пройти “испытание взрослением”. Но как по мне – компания более чем готова. И поэтому я продолжаю советовать подписку ChatGPT с легкой душой.

У OpenAI явно есть большой задел по моделям – массовая 4o вышла год назад и с тех пор успешно дорабатывается, а “мощная” o3 в экспериментальном виде была готова еще в декабре. Легкая o4-mini уже обходит o3 в некоторых бенчмарках, так что если предположить, что ее полную версию положат в основу ChatGPT-5 – то можно ждать впечатляющий результат.

Параллельно OpenAI вкладывает огромные ресурсы в перспективные инструменты использования ИИ. Есть агенты Codex-1 (для программирования) и Operator (для работы в сети и за компьютером “как человек”), есть почти готовое обновление Canvas, где пользователи смогут совместно редактировать документы и прибегать к помощи ИИ. Ходят слухи и об операционной системе на базе ИИ – это проект отдаленного будущего, но если получится, то он может полностью поменять наше представление о работе с ПК и смартфоном.

Даже меню с зоопарком из разных моделей, за которое все пинают OpenAI (я и сам его ненавижу) – во многом результат того, что компания пытается экспериментировать с разными ИИ, заточенными под разные задачи. Модель на каждый день (4o), мощная размышляющая (o3), размышляющая, но побыстрее (o4-mini), умеющая кодить быстро (4.1) – все они дают больше возможностей для экспериментов. А OpenAI таким образом собрала хорошую аналитику по использованию – и эти данные наверняка учтены при создании GPT-5, которая сама будет определять, как лучше решить конкретную задачу.

Наконец, с позиции среднего пользователя выделю еще два момента. Во-первых, лучший среди ИИ интерфейс – и в онлайн-версии, и в мобильных приложениях. У ChatGPT отличная реализация памяти, canvas и пользовательских настроек, а также минимум багов. Gemini и Grok отстают по большинству параметров, а у Claude хоть и крутой, вылизанный интерфейс, но по функциям все намного хуже.

Во-вторых, конечно, распространенность. Меня порой удивляет, как много людей используют ChatGPT вообще не представляя, что есть другие ИИ, как минимум не хуже. Но с другой стороны – именно для ChatGPT накоплен самый большой опыт использования, на этих моделях в первую очередь тестируют большинство промтов, на них экспериментируют с совершенно новыми кейсами. Если вы не энтузиаст, а просто используете ИИ для ежедневных задач – то именно ChatGPT гарантирует, что вы быстрее всего найдете нужные руководства и получите совет.

Конечно, рынок будет меняться – за огромными деньгами в ИИ пришли уже почти все крупные корпорации. Но тут еще большой вопрос, кто кого победит в состязании с OpenAI.
👍3823
Media is too big
VIEW IN TELEGRAM
Аниме-собеседница Эни (добавили в Grok, пока только на iOS) поздравляет читателей канала с большим событием – двумя тысячами подписчиков. На русском тоже умеет, но английский у нее все-таки лучше.

В первую очередь повторю то, о чем уже как-то писал: годы в медиа научили меня, что главное – это читатели. Так что спасибо, что вы есть: когда я начинал вести канал, то писал в основном для себя, теперь замечаю, что все больше стараюсь для вас. Так – интереснее.

Пользуясь случаем также хочу поблагодарить человека, без которого этот канал рос бы не так быстро. С Игорем Варнавским я работал вместе в самом начале своей редакторской карьеры и уже тогда он был очень внимательным и дотошным специалистом – из таких, которые доводят любой материал почти до идеала (может и до идеала, но раскрою секрет – идеальные тексты читают хуже). А еще Игорь увлечен технологиями не меньше моего и рассказывает про них на своем канале – например, вот он спорит со мной о будущем образования в эпоху нейросетей.

Сейчас у Игоря свое контент-агентство “Простыми словами”, он занимается созданием контента под ключ – от написания статей до ведения блогов и сайтов (читайте вот рассказ о GEO и SEO в наше бурное время). Поэтому, стартуя канал, именно к Игорю я пошел за помощью – и получил немало советов, которые помогли не набить шишек по дороге.

Дальше, надеюсь, тоже будет без шишек – тем более, что у меня полно интересных тем, о которых хочется рассказать на канале. Так что оставайтесь на связи, продолжим давать огня!
29🔥13👍12
OpenAI анонсировала трансляцию сегодня в 20:00 по Москве. Четверг – любимое время компании показывать что-то новенькое, поэтому можно попробовать угадать, что это будет. Вот о каких крупных проектах известно.

Operator

Это ИИ-агент, который может управлять ПК так, как управляет им человек – кликать мышкой, набирать команды с клавиатуры, заказывать для вас что-то в интернете. Агенты почти всеми называются новым шагом в ИИ, но их развитие продвигается медленно – слишком уж сложны человеческие интерфейсы для современных языковых моделей.

Сейчас Operator доступен в подписке ChatGPT Pro, работает когда как. На новую версию намекает ролик с анонсом трансляции, который OpenAI выложила в X: в нем виден движущийся курсор мыши. Остается вопрос – чем новый Operator будет отличаться от предыдущего?

ChatGPT-5

И вот тут можно начинать спекуляции. ChatGPT-5 мы ждем от OpenAI больше всего. Сэм Альтман подтвердил, что компания целится в летнее окно релиза, но многое будет зависеть от того, как модель пройдет проверки безопасности.

Однако у OpenAI уже были случаи, когда модель выпускали постепенно. Например, ChatGPT o3 изначально была запущена как основа режима DeepResearch (глубокие исследования в интернете) – и только потом ее сделали доступной в виде привычного всем чат-бота.

Operator сейчас также работает на o3, и один из вариантов сделать его лучше – перевести на ChatGPT-5. Это позволит постепенно начать ввод новой модели в работу, проводя оставшиеся проверки. Ну и давно пора раскатывать этот функционал на подписку Plus.

Браузер на базе ChatGPT

Браузеры на основе ИИ – другое активно развивающееся направление сейчас. Perplexity только что запустила тестирование своего Comet, а несколько инсайдеров подтверждают, что ведется разработка браузера на базе ChatGPT.

У OpenAI здесь вполне коммерческая цель – залезть на территорию Chrome. Главная ценность браузера от Google – информация о пользователях, которую он собирает и которая затем используется для точной настройки рекламы (с нее Google получает три четверти своего дохода). В OpenAI понимают, что текущая схема монетизации вряд ли даст компании возможность окупаться и также целятся в модель, где пользователям будут показывать рекламу.

Другой вопрос – зачем браузер самим пользователям. Первые отзывы о Comet в основном такие – “прикольная штука, но какая от нее польза – не понимаю”. Посмотрим, может у OpenAI получится интегрировать ИИ лучше.

Новая версия Canvas

Canvas – режим предпросмотра и редактирования кода и документов внутри ChatGPT. Он уже настолько удобен, что я иногда заменяю им офисные приложения. Есть информация, что у OpenAI готова новая версия, которая заменяет офисный пакет – с совместным редактированием документов и помощью ИИ.

Сложность здесь в потенциальном конфликте с Microsoft, которая является основным инвестором OpenAI и с офисным пакетом которой будет конкурировать новая версия Canvas.

Модель с открытыми весами

Несмотря на название, OpenAI давно ушла от open source моделей – последней такой была GPT-2, выпуская которую разработчики набили немало шишек с безопасностью. Что-то похожее сейчас происходит и с новой открытой моделью компании: о ней вполне официально говорят с весны, но сроки выхода постоянно сдвигаются. В OpenAI справедливо опасаются, что открытая модель может быть модифицирована и использована для разработки оружия, организации кибератак и прочих нехороших вещей.

Буквально неделю назад этот четверг назывался потенциальной датой выхода модели – но затем Сэм Альтман сказал, что команде нужно дополнительное время на новые проверки. Так что шансы минимальны.

Если говорить о моем мнении, то анонс ChatGPT-5 выглядит самым интересным, но я бы не отказался от его переноса на пару недель. С прошлого четверга я активно тестирую Grok 4 и наконец-то научился нормально с ним работать – модель мощная, но требует определенного подхода, как и ChatGPT o3. Переключаться сейчас на новый ИИ (а мне придется из-за любопытства) – настоящее издевательство.

Так что Operator на базе ChatGPT-5 и в подписке Plus для меня был бы лучшим подарком от OpenAI.
👍1713🔥5🥰1👏1😁1
Для ChatGPT представили агентский режим – это развитие функций Operator (использование ПК) и DeepResearch (глубокий поиск в сети), а также новые возможности. Agent постепенно научится делать все, что вы делаете на ПК — от поиска и заказа отелей до создания презентаций на основе нужных данных.

Детали о ChatGPT Agent рассказал на “Хабре”, читайте с удовольствием. И традиционная просьба — если у вас есть прокачанный аккаунт на Habr, то поставьте плюс в карму, за мной не станется.

Ну а вдогонку к анонсу Agent скажу вот о чем. Когда на прошлой неделе вышел Grok 4, то модель в первые дни меня очень разочаровала, так как в повседневных задачах она оказалась местами даже хуже той же Gemini 2.5 Pro — в основном, из-за того, что не так складно пишет на русском.

Только спустя неделю я понял, в чем силен Grok 4 — причем исключительно в сложных примерах и при грамотном промптинге. Суть в том, что обычные пользователи вроде меня не кидаются задачками из бенчмарков, а чаще используют ИИ в режиме чат-бота. И здесь все современные модели если не достигли предела, то близки к нему — заметить разницу получается через несколько дней.

Прогресс ИИ смещается в другие направления, два из которых мы увидели на этой недели. Первое — как раз агенты. В этом режиме модель превращается из полезного собеседника в полноценного ассистента, который будет помогать в самых разных задачах.

Каких именно — пока даже боюсь представить, поэтому здорово, что ChatGPT Agent запускают уже сейчас и сразу на подписку Plus, в которой будет доступно 40 запросов в месяц. Как появится у меня — сразу начну тестировать!

Второе направление — это эволюция того, как ИИ взаимодействует с пользователем. Сейчас мы используем текст и голос, но для Grok на этой неделе запустили виртуальных компаньонов.

Выбор первой пары спорный — флиртующая аниме-девушка и грубоватая панда — но суть не в этом. Компаньоны — это полноценные трехмерные аватары для ИИ. Они двигаются, танцуют, меняют наряды и показывают эмоции. А через камеру они “видят” пользователя, комментируют его внешность и пытаются считать эмоции. Пока выглядит как забава, но где-то через год это может стать основным способом коммуникации с ИИ.

В общем, как говорил много раз — прогресс в сфере искусственного интеллекта продолжает мчать на космической скорости. И это здорово.
26👍20
Нобелевский лауреат и глава Google DeepMind Демис Хассабис заявляет, что ИИ поможет найти лекарства от всех болезней за 10-15 лет. А Isomorphic Labs,
отпочковавшаяся от DeepMind, в этом году начнет испытывать на людях первые ИИ-лекарства от рака. Как и обещал — разобрался, о чем речь.

Смотрите, современная разработка лекарств (да лечение болезней в целом) — это работа с большими объемами информации. Сначала надо понять причину болезни. Это может быть мутировавший белок, который вызывает рак. Или вирус, инфицирующий клетки. Для решения ученые берут массивы данных заболевших людей, сравнивают их между собой и с данными здоровых, и пытаются найти что-то общее, что и вызывает болезнь.

Проблема в том, что все люди разные, болячка редко бывает одна, да и сам организм — невероятно сложная штука, в котором параллельно происходит множество процессов. ИИ уже помогает распутывать эти головоломки, чтобы перейти к следующему этапу — поиску лекарства.

Лекарства тоже бывают разными, но чаще всего — это молекула, которая “находит” в организме проблемные клетки, “цепляется” к ним и выполняет определенные действия, например, подавляя активность или даже уничтожая. Но как она это делает? На поверхности клетки есть рецепторы — белковые молекулы уникальной формы. Соответственно, нужно узнать их форму и подобрать молекулу совпадающей формы.

Долгое время определение формы белков считалось одной из самых сложных задач в химии. Для решения использовались методы, стоившие миллионы долларов, занимавшие годы для одного белка, и не отличавшиеся большой точностью. А потом появился ИИ AlphaFold 2 от Google DeepMind, который в 2020 году рассчитал структуру 98% белков человеческого организма (всего в базе данных сейчас 200 миллионов структур).

Результаты выложили в сеть — любой аспирант может скачать то, что недавно стоило миллионы долларов и год работы. За это в 2024 году Дэмис Хассабис и Джон Джампер из DeepMind получили Нобелевку, поделив ее с Дэвидом Бейкером, который занимался компьютерным моделированием белков.

Мы знаем форму рецептора — осталось подобрать лекарство. Вот только в базе миллиарды молекул, и выбрать кандидаты из них — та еще задача. Для этого предназначена новая AlphaFold 3, а также ИИ других команд — они быстро моделируют взаимодействие молекул с мишенями и указывают на подходящие.

Если подходящей молекулы нет — то ее теперь можно создать с нуля, для чего предназначены специальные генеративные модели. Принцип похож на ИИ-создание изображений: нейронка получает нужные характеристики, а затем пытается предложить структуру.

Например, в эксперименте ученых из Университета Монаша и Университета Мельбурна ИИ начал с 5000 вариантов дизайна белка для борьбы с кишечной палочкой E.Coli — это супербактерия, устойчивая к современным антибиотикам. Из стартовых вариантов другая ИИ-модель отобрала 96 лучших, которые синтезировали и опробовали на реальных бактериях. 4 лучших уйдут на дальнейшие тесты.

В итоге разработка кандидатов в лекарства ускоряется с 5-7 лет до примерно 6 месяцев. Конечно, дальше начинаются клинические тесты. Их пройдут далеко не все лекарства, а самым успешным до одобрения предстоит пройти все три клинических фазы общей продолжительностью в примерно те же 5-7 лет.

ИИ планируют использовать и в тестировании, но сильного ускорения не будет — спешка не нужна, если речь идет о воздействии на организм человека. Однако даже если ИИ поможет сократить только этап разработки лекарств на 5 лет, то это значит, что больные получат лечение на 5 лет раньше. Для кого-то эти годы станут спасением.

И последнее. Сейчас известно около 11 тысяч болезней, 7 тысяч из которых — редкие. Если ИИ-лекарства “выстрелят”, то сбудется прогноз Хассабиса — и мы найдем спасение от большинства болезней. Будет ли оно доступно всем? И как тогда вообще изменится наше общество? Все это — тема для отдельного рассказа.
👍75👏2215🔥9
Пост про ИИ-лекарства набрал рекордное количество реакций — мне приятно, что подобный контент находит отклик у читателей канала. Продолжение обязательно будет, но давайте пропустим вперед OpenAI, которая тихонько спустилась с горы с двумя новостями.

Сейчас все более важной метрикой оценки ИИ становится умение выполнять длительные задачи. Из эпохи чат-ботов мы переходим в эпоху ИИ-агентов, а здесь без работы вдолгую не обойтись: даже планирование поездки в другой город — это сложная многоэтапная работа, что же говорить про бизнес-задачи.

На этом фоне особенно интересны результаты выступления экспериментальных моделей OpenAI в двух важных состязаниях.

Второе место на AtCoder World Tour Finals 2025 Heuristics

AtCoder World Tour Finals — очный финал одного из самых престижных соревнований по программированию, на который попадают лучшие из лучших. Проходит в двух категориях — алгоритмическое и эвристическое программирование. В каждой категории было по 12 участников, а в эвристике к ним присоединилась OpenAIAHC — экспериментальная модель от OpenAI.

Эвристическое программирование — быстрый поиск достаточно хорошего варианта решения проблемы в ситуации, когда лучший вариант невозможен. Как пример можно привести навигатор (хотя в нем эвристический алгоритм комбинируется с другими приемами) — в большом городе с постоянно меняющейся обстановкой нереально сходу найти лучший маршрут, поэтому система подбирает несколько достаточно хороших вариантов.

AtCoder World Tour Finals длился 10 часов — участники начинают с быстрых работающих решений, а затем полируют их, выжимая максимум. OpenAIAHC заняла второе место, на 9,5% уступив Пржемыславу Psycho Дебиаку — легендарному программисту из Польши. Пржемыслав рассказал, что финал полностью выжал его, а затем пошутил, что чувствует себя “последним рубежом обороны”.

Интересно, что OpenAIAHC лидировала значительную часть соревнования, уступив лишь к концу. То есть ИИ уже невероятно силен в построении быстрых решений, человек же вышел вперед, когда для дальнейшего улучшения потребовались креативные подходы.

Золотая медаль Международной математической олимпиады 2025

Другая (а может и та же самая, в OpenAI не раскрывают деталей) экспериментальная модель решила пять из шести задач Международной математической олимпиады 2025 года (IMO 2025) — самого сложного и престижного состязания для школьников. Это уровень золотой медали, которую получили 67 участников из 630.

IMO 2025 состоит из двух этапов по 4,5 часа, при этом модель подходила к каждой задаче как живой участник: читала условие и писала подробное решение, не используя веб-поиск и вспомогательные инструменты. На решение одной задачи уходило до 100 минут, что показало возможность модели планировать свои действия вдолгую и придерживаться намеченного плана действий. Важно отметить, что OpenAI не участвовала в IMO 2025 напрямую, а воспроизвела состязание “внутри”, дополнительно пригласив несколько профессиональных математиков для валидации результатов.

Тем не менее, компанию поздравил даже Гэри Маркус — исследователь в области ИИ, который известен своим скептицизмом по поводу современных моделей. Далее Гэри подсыпал немного соли, справедливо попросив OpenAI раскрыть подробности.

Математик Теренс Тао, который еще 14 июня на подкасте Лекса Фридмана утверждал, что вряд ли ИИ возьмет золото IMO в ближайшие два года, также поздравил OpenAI, попросил раскрыть все подробности и призвал организаторов IMO включить ИИ в программу 2026 года, обеспечив прозрачность.

В OpenAI пока ограничились публикацией решений задач, а также заявили, что речь идет о general purpose модели — то есть ИИ, который обучают для решения широкого круга задач, а не “натаскали” специально под IMO 2025. В ближайшие месяцы запускать ее в широкий доступ не планируется — перед нами скорее прототип того, что ляжет в основу условного “ChatGPT-6”.

Ну а пока продолжаем ждать ChatGPT-5 – после таких успехов OpenAI, я практически уверен, что и новая “народная” модель не разочарует.
🔥25👍136
Итак, давайте вернемся к теме “ИИ создаст лекарства ото всех болезней”. Сначала краткое содержание первого поста:

— в современном мире определение причин болезни и разработка лекарств от нее — во многом работа с большим количеством информации;

— нейросети могут сократить разработку, тестирование и одобрение лекарств с текущих 10-20 до 5-10 лет - то есть, в два раза.

Всего известно около 11 тысяч болезней, ИИ-технологии и вычислительные мощности растут с огромной скоростью, что позволяет людям вроде Нобелевского лауреата Дэмиса Хассабиса предсказывать открытие лекарств от большинства болезней в ближайшие 10-15 лет. Смелое заявление, но даже если это произойдет за 25 лет — то станет внушительным прорывом. Но как он на нас отразится?

Лекарство важно не только разработать, но и внедрить. И здесь популярно утверждение, что ИИ-препараты будут доступны только богатым.

На самом деле, это очень спорно. Традиционные методы разработки лекарств давно добились почти всех легких побед, создание новых препаратов занимает кучу времени и стоит больших денег, которые затем надо отбивать. ИИ не только ускоряет, но и удешевляет этот процесс: напомню про AlphaFold 2, которая рассчитала форму почти всех белков — то, что раньше занимало годы и стоило миллионы долларов для одного белка, теперь просто лежит в свободном доступе в сети.

Следующий момент — бизнес всегда стремится к массовости. Медицинский рынок один из самых больших в экономике и на нем просто глупо делать ставку на единичный продукт, когда можно продавать десятки миллионов.

И, наконец, главное. В развитых странах численность населения падает, а само оно стремительно стареет. Можно сколько угодно фантазировать, как ИИ выгонит всех с работы, но пока что рабочих рук не хватает, а нагрузка на пенсионный и социальные фонды постоянно растет. Так что если у властей появится возможность за счет новых лекарств продлить трудоспособный возраст — уверен, это станет одним из ключевых приоритетов.

Риск неравенства все равно есть. Разработка ИИ-моделей и ИИ-лекарств сосредоточена в развитых странах, поэтому и датасеты используются те, которые собрали в этих странах. У жителей развивающихся стран немного другая генетика, есть свои типичные болезни, да и экономика слабее — поэтому до них ИИ-лекарства доберутся позже и будут работать хуже. Хотя бы частично выровнять этот дисбаланс — вызов для ВОЗ и прочих международных организаций.

Кроме того, остаются еще два важных фактора — врачи и пациенты. ИИ уже успешно используется как помощник в постановке диагнозов и выборе лечения, но создать стандарты и переучить на них всех медиков (а в этой среде полно консерваторов!) — задача не менее сложная, чем разработка лекарств.

Как и работа с пациентами. Наверное, каждый был свидетелем ситуации: человек долгое время чувствует себя плохо, многие симптомы на лицо — а идти ко врачу отказывается. А порой еще и лечится таблетками, которые посоветовали друзья. Или до врача дошел, бумажку с лечением получил, а назначения игнорирует. Увы, многие люди боятся лечиться даже больше, чем болеть. И когда в лечении начнет принимать участие ИИ — эти страхи во многом вырастут.

Но представим, что лекарства от всех болезней изобретены, врачи обучены их применению, пациенты доверяют новым технологиям, распределение ведется справедливым образом, Нобелевские премии выданы, а офисы крупнейших медицинских компаний закрываются за ненадобностью…

Нет, стоп, на этом история не заканчивается. Во-первых, где вы видели бизнес, который закроется добровольно? Вылечив все известные болезни, исследователи обратят свой взор на главную — старение. Именно так: современная медицина склоняется к тому, чтобы считать старение еще одной болезнью, а в природе есть примеры видов, которые победили возраст (пусть они и редки). Во-вторых, победа над болезнями и начало борьбы со старением так перевернут наше общество, что все текущие вызовы и проблемы могут показаться полной ерундой.

Но это — тема для следующего длинного и (надеюсь!) интересного поста.
🔥37👍16
Ух ты, у нас скандал между Google и OpenAI

Буквально вчера я рассказывал о достижении экспериментальной модели OpenAI, которая взяла золото Международной математической олимпиады 2025 (IMO 2025). Результат однозначно крутой: это самое престижное соревнование для школьников, задачи на нем выполняются до 100 минут — то есть модели нужно уметь вдолгую планировать свои действия и не терять контекст.

Но оказывается, что помимо OpenAI золотую медаль взяла модель Gemini DeepThink. И в Google не сказать, что довольны действиями конкурента — по этому поводу высказался даже глава DeepMind Демис Хассабис в X.

Я провел короткое расследование и вот что выяснил. Оказывается, на IMO 2025 в этом году впервые провели специальный ивент для разработчиков ИИ, в рамках которого задачи олимпиады решали разные модели. При этом организаторы попросили ИИ-команды опубликовать результаты только после того, как будут опубликованы результаты состязания между школьниками. На это были две причины:

1. Важно было тщательно проверить решения ИИ-моделей.

2. Организаторы хотели, чтобы основную славу получили все-таки главные участники IMO 2025 — лучшие школьники со всех уголков мира.


Не совсем ясно, участвовали ли OpenAI в приглашенном ивенте или просто взяли задания IMO 2025 и решили их внутри. Но факт остается фактом — по отношению к главным участникам получилось некорректно.

В Google же могут похвастаться результатом, который официально подтвержден оценщиками IMO 2025. А еще — получают гигантский плюс в карму за то, что остались людьми в гонке машин. Спасибо, Демис.
🔥34👍189
Нашел в X Итана Моллика лучший промпт для Google Veo 3:

[video game] as a community theater production.


Community theater — это как у нас “театр самодеятельности”. Собирается с десяток увлеченных темой любителей, делают наряды и реквизит из подручных средств, а затем устраивают представление для своих родственников и друзей — в общем, всех тех, у кого ну совсем нет возможности улизнуть из зала.

Сам Итан создал промпт под видеоигры, поэтому я прогнал его на нескольких известных проектах — Cyberpunk 2077, Mass Effect и World of Tanks. Но вообще можно вбить название известного фильма или книги — сработает не хуже.

Кстати если решите поэкспериментировать, то берите что-нибудь популярное в англоязычном интернете, так как Veo 3 обучали в основном на видео оттуда.

Почему считаю (в шутку, на самом деле) идеальным промптом? По роликам World of Tanks и Mass Effect хорошо видно, что Veo 3 уже создает качественную тематическую картинку, но не до конца понимает, что происходит в сцене. Поэтому герои начинают делать действия невпопад, проговаривают чужие реплики — в общем, как и положено в театре самодеятельности.

Но не переживайте — это сейчас у нас самодеятельность, а через полгода и на областной уровень выйдем!
😁316