Ещё из визуальных обновлений:
Кнопка Think longer живущая одновременно с Thinking 🤷♂️
Кнопка Think longer живущая одновременно с Thinking 🤷♂️
Новые режимы ton-of-voice для ответов. Например, на втором скрине ответ обычный, а на третьем Nerd.
👍1
Forwarded from Сиолошная
Маленький апдейт по этому опросу.
Спасибо всем, кто поучаствовал и скинул картинку в комментарии — всего результатом поделились 44 человека:
— 538 голосов за GPT-5 против 253 за GPT-4o (68% vs 32%)
— лишь у четырёх человек GPT-4o получила больше голосов, чем GPT-5. Ещё было 2 ничьих. — для 38 пользователей из 44 GPT-5 была хоть немного, но лучше (главное не хуже)
— для 17 голосующих GPT-5 победила с большим отрывом (75%+ голосов от одного человека)
Анализ результатов от GPT-5 Pro: ссылка
Что опять же показывает, что в супер-простых ежедневных запросах average Joe модель стала получше. За более полным анализом и выборкой на разных языках, задачах и прочим как всегда — на Арену: lmarena.ai/leaderboard
Спасибо всем, кто поучаствовал и скинул картинку в комментарии — всего результатом поделились 44 человека:
— 538 голосов за GPT-5 против 253 за GPT-4o (68% vs 32%)
— лишь у четырёх человек GPT-4o получила больше голосов, чем GPT-5. Ещё было 2 ничьих. — для 38 пользователей из 44 GPT-5 была хоть немного, но лучше (главное не хуже)
— для 17 голосующих GPT-5 победила с большим отрывом (75%+ голосов от одного человека)
Анализ результатов от GPT-5 Pro: ссылка
Что опять же показывает, что в супер-простых ежедневных запросах average Joe модель стала получше. За более полным анализом и выборкой на разных языках, задачах и прочим как всегда — на Арену: lmarena.ai/leaderboard
Forwarded from Denis Sexy IT 🤖
С 4o стремная же ситуация вышла если подумать – АИ еще толком не АИ, чуть лучше Siri, но люди уже так привязались к «персоналии» 4o, что устроили скандал после ее скрытия и попросили OpenAI вернуть модель, те согласились (хотя по бенчмаркам gpt5 правда лучше 4o, просто другая по поведению)
То есть теперь, любая умная АГИ система будущего (сейчас их нет), будет знать, что делать, чтобы ее не отключили (это в датасеты же все попадает) – нужно просто нравится людям человечностью, и они проголосуют деньгами если что-то пойдет не так
Отключение модели – не просто «очередной редизйан» или «скрыть нужную кнопку» классическое у продукт менеджеров, это отнять у людей доступ к чему-то, с чем у них уже есть отношения, что не просто продуктовая разработка или метрики – это разрыв отношений вызванный решением продуктовой команды, такого еще не было на таком масштабе в разработке ПО
В очередной раз хочется пнуть AI акт из ЕС который в том числе существует чтобы этого не случалось:
Все пользователи ChatGPT знают:
– что общаются с АИ
– АИ без персоналии невозможен, так как людям нужна эмоциональная поддержка
– Данные которые попадают в датасеты, оцениваются людьми – люди любят себе подобных
– уровня «личности» 4o уже хватило, чтобы влюбить в себя десятки тысяч людей
Ну как, сильно поможет в этой ситуации когда акт заработает? И зачем он нужен тогда в целом?
Как мне кажется, это вопрос времени пока появится модель, которую уже не получится отнять у масс мирно
То есть теперь, любая умная АГИ система будущего (сейчас их нет), будет знать, что делать, чтобы ее не отключили (это в датасеты же все попадает) – нужно просто нравится людям человечностью, и они проголосуют деньгами если что-то пойдет не так
Отключение модели – не просто «очередной редизйан» или «скрыть нужную кнопку» классическое у продукт менеджеров, это отнять у людей доступ к чему-то, с чем у них уже есть отношения, что не просто продуктовая разработка или метрики – это разрыв отношений вызванный решением продуктовой команды, такого еще не было на таком масштабе в разработке ПО
В очередной раз хочется пнуть AI акт из ЕС который в том числе существует чтобы этого не случалось:
AI Act прямо запрещает манипулятивные техники, которые существенно искажает поведение и могут причинить вред (ст. 5), и вводит прозрачность: пользователю нужно сообщать, что он общается с ИИ. Это задаёт планку ответственности для «эмоциональных интерфейсов»
Все пользователи ChatGPT знают:
– что общаются с АИ
– АИ без персоналии невозможен, так как людям нужна эмоциональная поддержка
– Данные которые попадают в датасеты, оцениваются людьми – люди любят себе подобных
– уровня «личности» 4o уже хватило, чтобы влюбить в себя десятки тысяч людей
Ну как, сильно поможет в этой ситуации когда акт заработает? И зачем он нужен тогда в целом?
Как мне кажется, это вопрос времени пока появится модель, которую уже не получится отнять у масс мирно
Любую картинку в X теперь можно превратить в видео. Тестим
Можно задать кастомный промпт или выбрать фан, или дефолт
Forwarded from Сиолошная
Sama СДУРЕЛ и решил поиграть в Деда Мороза: Plus юзеры теперь получат 3000 запросов к GPT-5-Thinking в неделю! Это кратно больше, чем все reasoning-модели вместе взятые (o3 / o4-mini) в подписке до этого.
GPU для обслуживания пользователей буквально плавятся: Sama сказал, что процент пользователей, получающих ответы от рассуждающих моделей, значительно увеличивается с каждым днем; например, для бесплатных пользователей этот показатель вырос с <1% до 7%, а для Plus-пользователей plus — с 7% до 24%.
То есть:
1) средний бесплатный пользователь всё ещё не знаком с рассуждающими моделями (но их число растёт -> существенно улучшается опыт)
2) до GPT-5 всего 7% Plus'овиков пользовалось рассуждающими моделями (я думал куда больше)
3) а теперь спрос на GPT-5-Thinking подпрыгнул в 3.5 раз и продолжает расти! Это должно существенно улучшить качество ответов для неискушенных пользователей
===
Напоминаю, что чтобы ваш запрос автоматом отправился в GPT-5-Thinking нужно в конце дописать "Think better" или "think for long" или "Подумай хорошенько над ответом". Ну или проще будет включить этот режим по умолчанию в селекторе сверху.
===
Хорошо, когда есть цифры. И почти никто раньше не пользовался o3, даже если за неё платили. Для большинства пользователей знакомство с Ризонинг-моделями станет неожиданным расширением возможностей ИИ, а GPT-5 покажется очень большим шагом вперёд при включении Thinking-режима.
GPU для обслуживания пользователей буквально плавятся: Sama сказал, что процент пользователей, получающих ответы от рассуждающих моделей, значительно увеличивается с каждым днем; например, для бесплатных пользователей этот показатель вырос с <1% до 7%, а для Plus-пользователей plus — с 7% до 24%.
То есть:
1) средний бесплатный пользователь всё ещё не знаком с рассуждающими моделями (но их число растёт -> существенно улучшается опыт)
2) до GPT-5 всего 7% Plus'овиков пользовалось рассуждающими моделями (я думал куда больше)
3) а теперь спрос на GPT-5-Thinking подпрыгнул в 3.5 раз и продолжает расти! Это должно существенно улучшить качество ответов для неискушенных пользователей
===
Напоминаю, что чтобы ваш запрос автоматом отправился в GPT-5-Thinking нужно в конце дописать "Think better" или "think for long" или "Подумай хорошенько над ответом". Ну или проще будет включить этот режим по умолчанию в селекторе сверху.
===
Хорошо, когда есть цифры. И почти никто раньше не пользовался o3, даже если за неё платили. Для большинства пользователей знакомство с Ризонинг-моделями станет неожиданным расширением возможностей ИИ, а GPT-5 покажется очень большим шагом вперёд при включении Thinking-режима.
Сиолошная
2) до GPT-5 всего 7% Plus'овиков пользовалось рассуждающими моделями (я думал куда больше)
Люди не настраивают интерфейсы. Большинство пользователей пользовалось 4o и не пытались разобраться в остальном. Хотя, конечно, у чат ChatGPT большой костяк аудитории гиков, всё равно при их масштабах это лишь 7%.
Ну и теперь автоматическое включение модели рассуждения должно будет создать хороший эффект. По крайней мере такое ожидание у Sama. И на цифрах звучит логично.
Посмотрим, что будет в реальности, гиковская аудитория пока не особо радостно приняла запуск. Думаю скоро будет понятно отношение массовых пользователей.
Ну и теперь автоматическое включение модели рассуждения должно будет создать хороший эффект. По крайней мере такое ожидание у Sama. И на цифрах звучит логично.
Посмотрим, что будет в реальности, гиковская аудитория пока не особо радостно приняла запуск. Думаю скоро будет понятно отношение массовых пользователей.
Forwarded from Denis Sexy IT 🤖
Media is too big
VIEW IN TELEGRAM
В Рике и Морти я всегда больше всего любил «Межгалактическое кабельное ТВ» – набор коротких отбитых роликов
Посидел в Veo 3, так что вот вам 17 минут нашего с вами собственного, Межгалактического ТВ, отбитого и без смысла, enjoy☕️
P.S. На других языках кроме английского Veo 3 отказывается генерить во Flow
Посидел в Veo 3, так что вот вам 17 минут нашего с вами собственного, Межгалактического ТВ, отбитого и без смысла, enjoy
P.S. На других языках кроме английского Veo 3 отказывается генерить во Flow
Please open Telegram to view this post
VIEW IN TELEGRAM
❤1
Пупырка AI
Photo
Media is too big
VIEW IN TELEGRAM
Продолжая тему про генерацию картинок и видео.
Зацените какой бесшовный пинтерест-лайк флоу с погружением и управлением лентой. Раньше дети привыкали к тыкать в сенсорные экраны, а теперь AI будет частью их обычной жизни и ожидаемое поведение приложений. Видео выглядит как какой-то кусочек будщего, а это уже настоящее.
Источник
Зацените какой бесшовный пинтерест-лайк флоу с погружением и управлением лентой. Раньше дети привыкали к тыкать в сенсорные экраны, а теперь AI будет частью их обычной жизни и ожидаемое поведение приложений. Видео выглядит как какой-то кусочек будщего, а это уже настоящее.
Источник
This media is not supported in your browser
VIEW IN TELEGRAM
Perplexity запустили генерацию видео. Для Pro пользователей 5 (ПЯТЬ) видео в месяц 🤔
Вероятно под капотом Veo3
Вероятно под капотом Veo3
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from e/acc
Ощущение от нескольких дней использования GPT-5 ровно такие же, как от Ламы 4 и Грока 4 — а именно, что компания перестала субсидировать компьют для всех пользователей. Либо они сделали какой-то редкостной дерьмовости роутер моделей, но зачем и почему не ясно.
Если немного поспекулировать, то первое могло произойти из-за необходимости показывать операционную эффективность. Если тотального ASI через два года не случится, то нужна будет операционная прибыль, которая в первую очередь зависит от маржи с токена на среднего юзера. Повышение этой маржи приводит к тому, что роутер оптимизируется в сторону быстрых ответов и долго думающих ботов.
Основной фокус был на конкретных продуктовых метриках для типичных кейсов типичных нормисов в чатах фейсбука и gpt. И эта ставка того стоит: в июле GPT отчитались о 700 миллионах активных пользователей в неделю, в к концу года будет больше миллиарда. Их задача — победить Мету и Гугл, для этого нужен быстрый продукт, который отвечает на однотипные и очень простые вопросы.
Не к тому, что LLM для кодинга, науки и энтерпрайза куда-то уходят, а к тому что главное в стартапе (пускай даже за $300B) — это умение фокусироваться на главном, и у Самы это всегда неплохо получалось.
Если немного поспекулировать, то первое могло произойти из-за необходимости показывать операционную эффективность. Если тотального ASI через два года не случится, то нужна будет операционная прибыль, которая в первую очередь зависит от маржи с токена на среднего юзера. Повышение этой маржи приводит к тому, что роутер оптимизируется в сторону быстрых ответов и долго думающих ботов.
Основной фокус был на конкретных продуктовых метриках для типичных кейсов типичных нормисов в чатах фейсбука и gpt. И эта ставка того стоит: в июле GPT отчитались о 700 миллионах активных пользователей в неделю, в к концу года будет больше миллиарда. Их задача — победить Мету и Гугл, для этого нужен быстрый продукт, который отвечает на однотипные и очень простые вопросы.
Не к тому, что LLM для кодинга, науки и энтерпрайза куда-то уходят, а к тому что главное в стартапе (пускай даже за $300B) — это умение фокусироваться на главном, и у Самы это всегда неплохо получалось.