Forwarded from Denis Sexy IT 🤖
ChatGPT апп радикально решил проблему многих моделей в приложении – их теперь или одна, или одна с фигней в приписке 🌝
Ставлю что откатят и дадут выбор моделей
Ставлю что откатят и дадут выбор моделей
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Cерафимодальный AI
This media is not supported in your browser
VIEW IN TELEGRAM
выдали доступ, интересное решение
❤1
Forwarded from Нейродвиж
Релиз GPT-5 оказался... ПРОВАЛОМ. Юзеры в шоке от релиза и требуют вернуть старые модели, которые с новым релизом просто ЗАБРАЛИ.
Кроме этого:
— В GPT-5 сломано распределение запросов и почти все сообщения летят на слабый GPT-5-mini;
— «Думающий» режим жёстко понерфили — GPT-5 думает даже над самыми сложными задачами не дольше одной минуты;
— GPT-5 во многом хуже предыдущих моделей. Она не такая приятная в общении, как GPT-4o, не такая креативная, как GPT-4.5 и не такая умная, как OpenAI o3.
На Reddit запланировали AMA с топами OpenAI. Каждое первое сообщение о том, какой GPT-5 отстой и с просьбой вернуть старые модели.
Помянем.
Кроме этого:
— В GPT-5 сломано распределение запросов и почти все сообщения летят на слабый GPT-5-mini;
— «Думающий» режим жёстко понерфили — GPT-5 думает даже над самыми сложными задачами не дольше одной минуты;
— GPT-5 во многом хуже предыдущих моделей. Она не такая приятная в общении, как GPT-4o, не такая креативная, как GPT-4.5 и не такая умная, как OpenAI o3.
На Reddit запланировали AMA с топами OpenAI. Каждое первое сообщение о том, какой GPT-5 отстой и с просьбой вернуть старые модели.
Помянем.
Forwarded from Сиолошная
Быстрые утренние сводки с полей чата:
— (часто) не работает поиск, модель делает запрос, но не получает результатов. Видимо, сломалась часть бэкенда. Я с поиском сделал 1 сложный запрос, у меня отработало лучше o3 Pro и Perplexity Pro (кому интересно — вот ссылка).
— сотрудник OpenAI в твиттере написал, что роутер работает неправильно. Роутер — это часть системы, определяющая, на какую модель и как послать ваш запрос. Вероятно, запросы чаще отправляются на глупые модели (и/или может быть с неправильными параметрами).
— несмотря на то, что в UI написано "GPT-5", у некоторых всё ещё как будто бы отвечает GPT-4o: по крайней мере если спросить «что ты за модель», то именно такой ответ вы и услышите (или GPT-4.1). Я попробовал у себя 3 раза на русском языке, 2 на английском — модель супер-уверена, что она GPT-5 (но у меня и жалоб на качество нет). Кидайте в комментарии скриншоты чата, где при выбранной GPT-5 модель представляется какой-то другой.
— Даже Plus-пользователи с подпиской за $20 не понимают, на какую модель перенаправлен их запрос. С точки зрения среднего пользователя наверное и пофиг, но сейчас, когда хочется честного сравнения и понимания качества — непрозрачность и «простота» мешает. У части Plus-пользователей уже исчерпан лимит сообщений на Thinking-модель (или на обычную GPT-5), и им может отвечать условная GPT-5-mini, а они и не знают!
— У меня на Pro есть возможность вернуться на GPT-4.5 и o3 / o3 Pro, но у Plus пользователей, насколько я пониманию, нет: доступны только GPT-5. Это грустно :(
— Для бесплатных пользователей важно отметить, что контекст модели в ChatGPT всего 8000 токенов. В комментариях был занятный момент, когда поользователь скинул часть документации и код модели и попросил что-то написать, а она «как будто бы не видела, что я скинул». А она и вправду не видела! Но это никак и нигде не отображается.
— Ещё у меня закрадывается подозрение, что у Plus и Pro пользователей разные режимы Thinking у GPT-5. Выборка для суждений пока маленькая, но несколько проблем из комментариев и чата у меня просто не воспроизводятся — моя модель как будто бы «умнее»:код запускается с первого раза, UI лучше и деталей больше, нет глупых ошибок. Судить рано, и уж очень непрозрачны такие сравнения в силу описанных выше причин, но что есть, то есть.
TLDR: многие тесты вами в UI в первые часы и дни после выпуска могут оставить большее негативное впечатление, чем должны. Ждём стабилизации системы и фиксов всех проблемных мест.
— (часто) не работает поиск, модель делает запрос, но не получает результатов. Видимо, сломалась часть бэкенда. Я с поиском сделал 1 сложный запрос, у меня отработало лучше o3 Pro и Perplexity Pro (кому интересно — вот ссылка).
— сотрудник OpenAI в твиттере написал, что роутер работает неправильно. Роутер — это часть системы, определяющая, на какую модель и как послать ваш запрос. Вероятно, запросы чаще отправляются на глупые модели (и/или может быть с неправильными параметрами).
— несмотря на то, что в UI написано "GPT-5", у некоторых всё ещё как будто бы отвечает GPT-4o: по крайней мере если спросить «что ты за модель», то именно такой ответ вы и услышите (или GPT-4.1). Я попробовал у себя 3 раза на русском языке, 2 на английском — модель супер-уверена, что она GPT-5 (но у меня и жалоб на качество нет). Кидайте в комментарии скриншоты чата, где при выбранной GPT-5 модель представляется какой-то другой.
— Даже Plus-пользователи с подпиской за $20 не понимают, на какую модель перенаправлен их запрос. С точки зрения среднего пользователя наверное и пофиг, но сейчас, когда хочется честного сравнения и понимания качества — непрозрачность и «простота» мешает. У части Plus-пользователей уже исчерпан лимит сообщений на Thinking-модель (или на обычную GPT-5), и им может отвечать условная GPT-5-mini, а они и не знают!
— У меня на Pro есть возможность вернуться на GPT-4.5 и o3 / o3 Pro, но у Plus пользователей, насколько я пониманию, нет: доступны только GPT-5. Это грустно :(
— Для бесплатных пользователей важно отметить, что контекст модели в ChatGPT всего 8000 токенов. В комментариях был занятный момент, когда поользователь скинул часть документации и код модели и попросил что-то написать, а она «как будто бы не видела, что я скинул». А она и вправду не видела! Но это никак и нигде не отображается.
— Ещё у меня закрадывается подозрение, что у Plus и Pro пользователей разные режимы Thinking у GPT-5. Выборка для суждений пока маленькая, но несколько проблем из комментариев и чата у меня просто не воспроизводятся — моя модель как будто бы «умнее»:код запускается с первого раза, UI лучше и деталей больше, нет глупых ошибок. Судить рано, и уж очень непрозрачны такие сравнения в силу описанных выше причин, но что есть, то есть.
TLDR: многие тесты вами в UI в первые часы и дни после выпуска могут оставить большее негативное впечатление, чем должны. Ждём стабилизации системы и фиксов всех проблемных мест.
Forwarded from Сиолошная
На Reddit начался Ask-me-Anything с командой OpenAI (ссылка). Sama ворвался с двух ног сразу всех успокоить:
— GPT-5 будет выглядеть «умнее», начиная сегодня. До этого часть дня автовыбор модели не работал, поэтому ответы были глупее, чем должны были быть (возможно, всё ещё GPT-4o)
— Отображение того, какая модель отвечает, станет более прозрачным
— API-трафик за сутки удвоился, все хотят что-то тестировать, мощностей не хватает
— Для Plus-пользователей лимиты поднимут в два раза после окончания переезда на GPT-5
— GPT-5 будет выглядеть «умнее», начиная сегодня. До этого часть дня автовыбор модели не работал, поэтому ответы были глупее, чем должны были быть (возможно, всё ещё GPT-4o)
— Отображение того, какая модель отвечает, станет более прозрачным
— API-трафик за сутки удвоился, все хотят что-то тестировать, мощностей не хватает
— Для Plus-пользователей лимиты поднимут в два раза после окончания переезда на GPT-5
Forwarded from Ушной канал Оленкевича
This media is not supported in your browser
VIEW IN TELEGRAM
Последние дни пользуюсь браузером Comet от перплексити.
Из интересного — агент может сам накликивать сценарии не только на сайте, но и сразу на нескольких сайтах в табах.
На видео пример, где прошу его сгенерить картинку в рекрафте, и он идёт и сам всё кликает и пишет.
Браузер доступен по подписке или бесплатно по инвайтам. Здесь можно найти парочку: https://news.1rj.ru/str/chewcoding/23
Из интересного — агент может сам накликивать сценарии не только на сайте, но и сразу на нескольких сайтах в табах.
На видео пример, где прошу его сгенерить картинку в рекрафте, и он идёт и сам всё кликает и пишет.
Браузер доступен по подписке или бесплатно по инвайтам. Здесь можно найти парочку: https://news.1rj.ru/str/chewcoding/23
Forwarded from Denis Sexy IT 🤖
А еще в Genie 3 можно загрузить любую картину и «прогуляться по ней» в симуляции, как в интерактивной игре
Мне нравится думать, что к ~2030 мы сможем оживить все личные фотоархивы что у нас есть на устройствах, из фото или видео, очень хочется
Мне нравится думать, что к ~2030 мы сможем оживить все личные фотоархивы что у нас есть на устройствах, из фото или видео, очень хочется
Ещё из визуальных обновлений:
Кнопка Think longer живущая одновременно с Thinking 🤷♂️
Кнопка Think longer живущая одновременно с Thinking 🤷♂️
Новые режимы ton-of-voice для ответов. Например, на втором скрине ответ обычный, а на третьем Nerd.
👍1
Forwarded from Сиолошная
Маленький апдейт по этому опросу.
Спасибо всем, кто поучаствовал и скинул картинку в комментарии — всего результатом поделились 44 человека:
— 538 голосов за GPT-5 против 253 за GPT-4o (68% vs 32%)
— лишь у четырёх человек GPT-4o получила больше голосов, чем GPT-5. Ещё было 2 ничьих. — для 38 пользователей из 44 GPT-5 была хоть немного, но лучше (главное не хуже)
— для 17 голосующих GPT-5 победила с большим отрывом (75%+ голосов от одного человека)
Анализ результатов от GPT-5 Pro: ссылка
Что опять же показывает, что в супер-простых ежедневных запросах average Joe модель стала получше. За более полным анализом и выборкой на разных языках, задачах и прочим как всегда — на Арену: lmarena.ai/leaderboard
Спасибо всем, кто поучаствовал и скинул картинку в комментарии — всего результатом поделились 44 человека:
— 538 голосов за GPT-5 против 253 за GPT-4o (68% vs 32%)
— лишь у четырёх человек GPT-4o получила больше голосов, чем GPT-5. Ещё было 2 ничьих. — для 38 пользователей из 44 GPT-5 была хоть немного, но лучше (главное не хуже)
— для 17 голосующих GPT-5 победила с большим отрывом (75%+ голосов от одного человека)
Анализ результатов от GPT-5 Pro: ссылка
Что опять же показывает, что в супер-простых ежедневных запросах average Joe модель стала получше. За более полным анализом и выборкой на разных языках, задачах и прочим как всегда — на Арену: lmarena.ai/leaderboard
Forwarded from Denis Sexy IT 🤖
С 4o стремная же ситуация вышла если подумать – АИ еще толком не АИ, чуть лучше Siri, но люди уже так привязались к «персоналии» 4o, что устроили скандал после ее скрытия и попросили OpenAI вернуть модель, те согласились (хотя по бенчмаркам gpt5 правда лучше 4o, просто другая по поведению)
То есть теперь, любая умная АГИ система будущего (сейчас их нет), будет знать, что делать, чтобы ее не отключили (это в датасеты же все попадает) – нужно просто нравится людям человечностью, и они проголосуют деньгами если что-то пойдет не так
Отключение модели – не просто «очередной редизйан» или «скрыть нужную кнопку» классическое у продукт менеджеров, это отнять у людей доступ к чему-то, с чем у них уже есть отношения, что не просто продуктовая разработка или метрики – это разрыв отношений вызванный решением продуктовой команды, такого еще не было на таком масштабе в разработке ПО
В очередной раз хочется пнуть AI акт из ЕС который в том числе существует чтобы этого не случалось:
Все пользователи ChatGPT знают:
– что общаются с АИ
– АИ без персоналии невозможен, так как людям нужна эмоциональная поддержка
– Данные которые попадают в датасеты, оцениваются людьми – люди любят себе подобных
– уровня «личности» 4o уже хватило, чтобы влюбить в себя десятки тысяч людей
Ну как, сильно поможет в этой ситуации когда акт заработает? И зачем он нужен тогда в целом?
Как мне кажется, это вопрос времени пока появится модель, которую уже не получится отнять у масс мирно
То есть теперь, любая умная АГИ система будущего (сейчас их нет), будет знать, что делать, чтобы ее не отключили (это в датасеты же все попадает) – нужно просто нравится людям человечностью, и они проголосуют деньгами если что-то пойдет не так
Отключение модели – не просто «очередной редизйан» или «скрыть нужную кнопку» классическое у продукт менеджеров, это отнять у людей доступ к чему-то, с чем у них уже есть отношения, что не просто продуктовая разработка или метрики – это разрыв отношений вызванный решением продуктовой команды, такого еще не было на таком масштабе в разработке ПО
В очередной раз хочется пнуть AI акт из ЕС который в том числе существует чтобы этого не случалось:
AI Act прямо запрещает манипулятивные техники, которые существенно искажает поведение и могут причинить вред (ст. 5), и вводит прозрачность: пользователю нужно сообщать, что он общается с ИИ. Это задаёт планку ответственности для «эмоциональных интерфейсов»
Все пользователи ChatGPT знают:
– что общаются с АИ
– АИ без персоналии невозможен, так как людям нужна эмоциональная поддержка
– Данные которые попадают в датасеты, оцениваются людьми – люди любят себе подобных
– уровня «личности» 4o уже хватило, чтобы влюбить в себя десятки тысяч людей
Ну как, сильно поможет в этой ситуации когда акт заработает? И зачем он нужен тогда в целом?
Как мне кажется, это вопрос времени пока появится модель, которую уже не получится отнять у масс мирно