Forwarded from Denis Sexy IT 🤖
Обещал вам поделиться с теми случаями, где ChatGPT Operator / Agent мне как-то помогали. А поскольку, Operator, как отдельный продукт закроется через две недели, и останется только Agent внутри ChatGPT – делюсь:
— У меня где-то была подписка на анализы крови пару раз в год – нашел письмо, сохранил как pdf, приложил к чату, оператор удачно записал меня на прием на удобное мне время; авторизоваться нужно было все еще руками
— Закрывал подписку в фитнес (я уже раскачался зачем мне, потому что есть зал на работе) и даже не пытался понять как это сделать в маленьком европейском фитнесе: оператор сам прочитал нужные страницы на голландском, написал драфт письма на какой-то секретный адрес, я просто отправил
— Пользовался сервисом, где чтобы закрыть подписку нужно писать В ЧАТ САППОРТУ РОБОТУ; в общем Operator прекрасно с ним пообщался, все закрыл (SciFi чувствовался, да)
— Нужно было выставить инвойс в PDF: описал услугу, и приложил просто текст переписки в чате где были реквизиты клиента и мои; красивый PDF собрался за минуту и я смог выставить его клиенту после проверки
— Нужно было быстро посмотреть отзывы на конкретный плагин в одном маркетплейсе за полгода, на довольно специфичную тему; отправил агента, он там пошуршал минут 15 листая веб страницу, все прочитал, смог собрать самые частые жалобы по конкретной тематике
— Google Maps иногда отвратительно ищет: толи потому что тут все на голландском языке, а я ищу на английском, толи просто потому что я криворукий: нужно было мне на визу в США сфоткаться, и агент нашел фотолабу у дома, а Google Maps посылал куда-то на пару станций метро дальше
— Вчера вышла мелкая LLM моделька от Google: Gemini 3 260M, хотел ее запустить чтобы поиграться, но обычно в таких модельках нужно внимательно настраивать семплер чтобы не тупило – а чтобы это сделать нужно читать реддит и тп, с лучшими практиками, короче агент вернул настройки и я счастливо поигрался
— Нужно было заполнить гигантскую анкету на голландском и переводчик не работал, агент задавал вопросы на английском, и на основе моих ответов заполнил всю форму
— Про помощь в выборе квартире я уже писал тут
🌎 Что полезного можно применить, чтобы максимально прокачать агента:
— В Plus подписке всего 20 использований Агента в месяц, чтобы узнать сколько у вас осталось: наведите мышку на Агента в вебе и появится хинт с информацией
— Авторизация шарится между чатами, то есть войдя в аккаунт в одном чате, в другом чате вы можете быть уже авторизованы (В Data Cotrol в настройках можно выйти из всех аккаунтов сразу), что довольно полезно
— Агент не имеет доступа к памяти вашего ChatGPT, поэтому лучше держать готовой заметку с короткой инфой о себе, где вы живите, какой адрес, какой телефон – агент так сможет заполнить форму целиком (например, при заказе товара) и позвать только на оплату
— Агент хорошо ищет информацию, но обрабатывает ее лучше всего GPT 5 Thinking/Pro: вы можете попросить агента что-то поискать и выплюнуть в чат результаты, и уже большой моделью обработать выводы (с Deep Research режимом также)
ℹ️ Когда применять агента:
Как по мне, все мелкие задачи которые вы вынуждены делать, но не хотите делать, идеально делегируются ему — ключевое слово мелкие, потому, что это хоть и впечатляющая технология, но за вас отработать 8 часов не сможет (пока☕️ )
— У меня где-то была подписка на анализы крови пару раз в год – нашел письмо, сохранил как pdf, приложил к чату, оператор удачно записал меня на прием на удобное мне время; авторизоваться нужно было все еще руками
— Закрывал подписку в фитнес (
— Пользовался сервисом, где чтобы закрыть подписку нужно писать В ЧАТ САППОРТУ РОБОТУ; в общем Operator прекрасно с ним пообщался, все закрыл (SciFi чувствовался, да)
— Нужно было выставить инвойс в PDF: описал услугу, и приложил просто текст переписки в чате где были реквизиты клиента и мои; красивый PDF собрался за минуту и я смог выставить его клиенту после проверки
— Нужно было быстро посмотреть отзывы на конкретный плагин в одном маркетплейсе за полгода, на довольно специфичную тему; отправил агента, он там пошуршал минут 15 листая веб страницу, все прочитал, смог собрать самые частые жалобы по конкретной тематике
— Google Maps иногда отвратительно ищет: толи потому что тут все на голландском языке, а я ищу на английском, толи просто потому что я криворукий: нужно было мне на визу в США сфоткаться, и агент нашел фотолабу у дома, а Google Maps посылал куда-то на пару станций метро дальше
— Вчера вышла мелкая LLM моделька от Google: Gemini 3 260M, хотел ее запустить чтобы поиграться, но обычно в таких модельках нужно внимательно настраивать семплер чтобы не тупило – а чтобы это сделать нужно читать реддит и тп, с лучшими практиками, короче агент вернул настройки и я счастливо поигрался
— Нужно было заполнить гигантскую анкету на голландском и переводчик не работал, агент задавал вопросы на английском, и на основе моих ответов заполнил всю форму
— Про помощь в выборе квартире я уже писал тут
— В Plus подписке всего 20 использований Агента в месяц, чтобы узнать сколько у вас осталось: наведите мышку на Агента в вебе и появится хинт с информацией
— Авторизация шарится между чатами, то есть войдя в аккаунт в одном чате, в другом чате вы можете быть уже авторизованы (В Data Cotrol в настройках можно выйти из всех аккаунтов сразу), что довольно полезно
— Агент не имеет доступа к памяти вашего ChatGPT, поэтому лучше держать готовой заметку с короткой инфой о себе, где вы живите, какой адрес, какой телефон – агент так сможет заполнить форму целиком (например, при заказе товара) и позвать только на оплату
— Агент хорошо ищет информацию, но обрабатывает ее лучше всего GPT 5 Thinking/Pro: вы можете попросить агента что-то поискать и выплюнуть в чат результаты, и уже большой моделью обработать выводы (с Deep Research режимом также)
Как по мне, все мелкие задачи которые вы вынуждены делать, но не хотите делать, идеально делегируются ему — ключевое слово мелкие, потому, что это хоть и впечатляющая технология, но за вас отработать 8 часов не сможет (пока
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Ask me plll!
2031. Использовав заброшенные профили в Fb Цукерберг победил выборы. Его первым решением стало начать немедленную загрузку людей в цифровой метаверс, освобождая их от оков физического тела
Anonymous Poll
15%
Загружаюсь, долой бренные тела
29%
Загрузка это выбор каждого
27%
Не верю, что это останусь «я»
29%
Вы сумасшедшие?
20%
Буду бороться за свободу всего живого
12%
Все кто загрузятся станут программами, которых не жалко удалить
24%
Я не загружаюсь
12%
Я зануда, напишу в комментарии
Forwarded from Data Secrets
Хаха, зацените: внутренний мерч Anthropic
Кстати, дизайн придумал и реализовал агент Claudius (тот самый, который работал у них в офисе в вендинговом автомате)
Теперь срочно надо такую же😛
Кстати, дизайн придумал и реализовал агент Claudius (тот самый, который работал у них в офисе в вендинговом автомате)
Теперь срочно надо такую же
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Сиолошная
На неделе Sama и несколько других директоров OpenAI провели ужин с репортёрами, где отвечали на их вопросы. Саммари беседы появилось в TheVerge с очень интересным началом: «Ни одна тема не была под запретом, и все, за исключением того, что было сказано за десертом, было записано». 💀 очень интересно что там рассказали-показали
— О процессе релиза GPT-5: «Кажется, мы кое-где знатно накосячили при запуске. Но с другой стороны, наш API-трафик удвоился за первые 48 часов и продолжает расти. У нас буквально закончились видеокарты. Многим пользователям действительно нравится роутер моделей. Думаю, мы усвоили урок об обновлении продукта для сотен миллионов людей за один день».
— По словам Sama, количество людей, у которого наблюдаются нездоровые отношения с ChatGPT (слишком личные и интимные беседы), небольшое, меньше одного процента.
— «Сейчас мы 5 самый популярный сайт в мире. Я думаю мы на пути становления третьим (то есть обгонят Instagram и Facebook). Дальше — сложно» (впереди Google и YouTube).
— Для дальнейшего масштабирования OpenAI требуется гораздо больше вычислительных мощностей. Это один из главных приоритетов Altman'а. «Следует ожидать, что OpenAI потратит триллионы долларов на строительство дата-центров в недалеком будущем». Насколько я знаю, это первый раз, когда Sama в открытую говорит о триллионах (хотя уже больше полутора лет витали слухи о 7 триллионах; сначала они казались сказочными, а сейчас уже анонсированы инвестиции на триллион).
— Sam говорит, и это не удивительно, что «у нас есть модели лучше GPT-5, но мы просто не можем их предложить, потому что у нас нет мощностей. У нас есть другие новые продукты и услуги, которые мы хотели бы запустить». В это легко верится: во-первых, мы точно знаем, что как минимум есть новая модель, выигравшая две золотые медали на олимпиадах этим летом, во-вторых, GPT-5 по размеру точно меньше GPT-4.5 (а размер имеет значение), и, в-третьих, Sama писал в твиттере буквально на днях: «Нам хватит мощностей выдержать увеличения трафика на API на 30% (то есть запаса в несколько раз — нет). В следующие 5 месяцев мы удвоим количество GPU. К концу года у нас будет более 1 миллиона GPU».
— Sama считает, что AI — пузырь. «Находимся ли мы в фазе, когда инвесторы в целом чрезмерно воодушевлены ИИ? Моё мнение — да. Является ли ИИ самым важным событием за долгое время? Моё мнение — тоже да». Полагаю, он имеет в виду, что условные Perplexity и SSI не должны стоить столько, сколько они стоят, и у этих и подобных компаний будет падение.
— «Мне интересно, можно ли создать гораздо более крутой социальный опыт с помощью ИИ» (намёк на соц. сеть?). И «если Chrome действительно будет продаваться (прим.: регулятор может заставить Google продать браузер), нам стоит на него взглянуть».
— о разработке GPT-5: «У нас была серьёзная нехватка GPU. Мы могли бы сделать ещё одну гигантскую модель (как GPT-4.5). Мы могли бы это сделать, но не сделали, потому что нет GPU» (не на тренировку, а на развёртывание)
— О бизнесе компании: «Если бы мы не платили за обучение новых моделей, мы были бы очень прибыльной компанией».
— О процессе релиза GPT-5: «Кажется, мы кое-где знатно накосячили при запуске. Но с другой стороны, наш API-трафик удвоился за первые 48 часов и продолжает расти. У нас буквально закончились видеокарты. Многим пользователям действительно нравится роутер моделей. Думаю, мы усвоили урок об обновлении продукта для сотен миллионов людей за один день».
— По словам Sama, количество людей, у которого наблюдаются нездоровые отношения с ChatGPT (слишком личные и интимные беседы), небольшое, меньше одного процента.
— «Сейчас мы 5 самый популярный сайт в мире. Я думаю мы на пути становления третьим (то есть обгонят Instagram и Facebook). Дальше — сложно» (впереди Google и YouTube).
— Для дальнейшего масштабирования OpenAI требуется гораздо больше вычислительных мощностей. Это один из главных приоритетов Altman'а. «Следует ожидать, что OpenAI потратит триллионы долларов на строительство дата-центров в недалеком будущем». Насколько я знаю, это первый раз, когда Sama в открытую говорит о триллионах (хотя уже больше полутора лет витали слухи о 7 триллионах; сначала они казались сказочными, а сейчас уже анонсированы инвестиции на триллион).
— Sam говорит, и это не удивительно, что «у нас есть модели лучше GPT-5, но мы просто не можем их предложить, потому что у нас нет мощностей. У нас есть другие новые продукты и услуги, которые мы хотели бы запустить». В это легко верится: во-первых, мы точно знаем, что как минимум есть новая модель, выигравшая две золотые медали на олимпиадах этим летом, во-вторых, GPT-5 по размеру точно меньше GPT-4.5 (а размер имеет значение), и, в-третьих, Sama писал в твиттере буквально на днях: «Нам хватит мощностей выдержать увеличения трафика на API на 30% (то есть запаса в несколько раз — нет). В следующие 5 месяцев мы удвоим количество GPU. К концу года у нас будет более 1 миллиона GPU».
— Sama считает, что AI — пузырь. «Находимся ли мы в фазе, когда инвесторы в целом чрезмерно воодушевлены ИИ? Моё мнение — да. Является ли ИИ самым важным событием за долгое время? Моё мнение — тоже да». Полагаю, он имеет в виду, что условные Perplexity и SSI не должны стоить столько, сколько они стоят, и у этих и подобных компаний будет падение.
— «Мне интересно, можно ли создать гораздо более крутой социальный опыт с помощью ИИ» (намёк на соц. сеть?). И «если Chrome действительно будет продаваться (прим.: регулятор может заставить Google продать браузер), нам стоит на него взглянуть».
— о разработке GPT-5: «У нас была серьёзная нехватка GPU. Мы могли бы сделать ещё одну гигантскую модель (как GPT-4.5). Мы могли бы это сделать, но не сделали, потому что нет GPU» (не на тренировку, а на развёртывание)
— О бизнесе компании: «Если бы мы не платили за обучение новых моделей, мы были бы очень прибыльной компанией».
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Denis Sexy IT 🤖
Обещал вам поделиться с теми случаями, где ChatGPT Operator / Agent мне как-то помогали. А поскольку, Operator, как отдельный продукт закроется через две недели, и останется только Agent внутри ChatGPT – делюсь:
— У меня где-то была подписка на анализы крови пару раз в год – нашел письмо, сохранил как pdf, приложил к чату, оператор удачно записал меня на прием на удобное мне время; авторизоваться нужно было все еще руками
— Закрывал подписку в фитнес (я уже раскачался зачем мне, потому что есть зал на работе) и даже не пытался понять как это сделать в маленьком европейском фитнесе: оператор сам прочитал нужные страницы на голландском, написал драфт письма на какой-то секретный адрес, я просто отправил
— Пользовался сервисом, где чтобы закрыть подписку нужно писать В ЧАТ САППОРТУ РОБОТУ; в общем Operator прекрасно с ним пообщался, все закрыл (SciFi чувствовался, да)
— Нужно было выставить инвойс в PDF: описал услугу, и приложил просто текст переписки в чате где были реквизиты клиента и мои; красивый PDF собрался за минуту и я смог выставить его клиенту после проверки
— Нужно было быстро посмотреть отзывы на конкретный плагин в одном маркетплейсе за полгода, на довольно специфичную тему; отправил агента, он там пошуршал минут 15 листая веб страницу, все прочитал, смог собрать самые частые жалобы по конкретной тематике
— Google Maps иногда отвратительно ищет: толи потому что тут все на голландском языке, а я ищу на английском, толи просто потому что я криворукий: нужно было мне на визу в США сфоткаться, и агент нашел фотолабу у дома, а Google Maps посылал куда-то на пару станций метро дальше
— Вчера вышла мелкая LLM моделька от Google: Gemini 3 260M, хотел ее запустить чтобы поиграться, но обычно в таких модельках нужно внимательно настраивать семплер чтобы не тупило – а чтобы это сделать нужно читать реддит и тп, с лучшими практиками, короче агент вернул настройки и я счастливо поигрался
— Нужно было заполнить гигантскую анкету на голландском и переводчик не работал, агент задавал вопросы на английском, и на основе моих ответов заполнил всю форму
— Про помощь в выборе квартире я уже писал тут
🌎 Что полезного можно применить, чтобы максимально прокачать агента:
— В Plus подписке всего 40 использований Агента в месяц, чтобы узнать сколько у вас осталось: наведите мышку на Агента в вебе и появится хинт с информацией
— Авторизация шарится между чатами, то есть войдя в аккаунт в одном чате, в другом чате вы можете быть уже авторизованы (В Data Cotrol в настройках можно выйти из всех аккаунтов сразу), что довольно полезно
— Агент не имеет доступа к памяти вашего ChatGPT, поэтому лучше держать готовой заметку с короткой инфой о себе, где вы живите, какой адрес, какой телефон – агент так сможет заполнить форму целиком (например, при заказе товара) и позвать только на оплату
— Агент хорошо ищет информацию, но обрабатывает ее лучше всего GPT 5 Thinking/Pro: вы можете попросить агента что-то поискать и выплюнуть в чат результаты, и уже большой моделью обработать выводы (с Deep Research режимом также)
ℹ️ Когда применять агента:
Как по мне, все мелкие задачи которые вы вынуждены делать, но не хотите делать, идеально делегируются ему — ключевое слово мелкие, потому, что это хоть и впечатляющая технология, но за вас отработать 8 часов не сможет (пока☕️ )
— У меня где-то была подписка на анализы крови пару раз в год – нашел письмо, сохранил как pdf, приложил к чату, оператор удачно записал меня на прием на удобное мне время; авторизоваться нужно было все еще руками
— Закрывал подписку в фитнес (
— Пользовался сервисом, где чтобы закрыть подписку нужно писать В ЧАТ САППОРТУ РОБОТУ; в общем Operator прекрасно с ним пообщался, все закрыл (SciFi чувствовался, да)
— Нужно было выставить инвойс в PDF: описал услугу, и приложил просто текст переписки в чате где были реквизиты клиента и мои; красивый PDF собрался за минуту и я смог выставить его клиенту после проверки
— Нужно было быстро посмотреть отзывы на конкретный плагин в одном маркетплейсе за полгода, на довольно специфичную тему; отправил агента, он там пошуршал минут 15 листая веб страницу, все прочитал, смог собрать самые частые жалобы по конкретной тематике
— Google Maps иногда отвратительно ищет: толи потому что тут все на голландском языке, а я ищу на английском, толи просто потому что я криворукий: нужно было мне на визу в США сфоткаться, и агент нашел фотолабу у дома, а Google Maps посылал куда-то на пару станций метро дальше
— Вчера вышла мелкая LLM моделька от Google: Gemini 3 260M, хотел ее запустить чтобы поиграться, но обычно в таких модельках нужно внимательно настраивать семплер чтобы не тупило – а чтобы это сделать нужно читать реддит и тп, с лучшими практиками, короче агент вернул настройки и я счастливо поигрался
— Нужно было заполнить гигантскую анкету на голландском и переводчик не работал, агент задавал вопросы на английском, и на основе моих ответов заполнил всю форму
— Про помощь в выборе квартире я уже писал тут
— В Plus подписке всего 40 использований Агента в месяц, чтобы узнать сколько у вас осталось: наведите мышку на Агента в вебе и появится хинт с информацией
— Авторизация шарится между чатами, то есть войдя в аккаунт в одном чате, в другом чате вы можете быть уже авторизованы (В Data Cotrol в настройках можно выйти из всех аккаунтов сразу), что довольно полезно
— Агент не имеет доступа к памяти вашего ChatGPT, поэтому лучше держать готовой заметку с короткой инфой о себе, где вы живите, какой адрес, какой телефон – агент так сможет заполнить форму целиком (например, при заказе товара) и позвать только на оплату
— Агент хорошо ищет информацию, но обрабатывает ее лучше всего GPT 5 Thinking/Pro: вы можете попросить агента что-то поискать и выплюнуть в чат результаты, и уже большой моделью обработать выводы (с Deep Research режимом также)
Как по мне, все мелкие задачи которые вы вынуждены делать, но не хотите делать, идеально делегируются ему — ключевое слово мелкие, потому, что это хоть и впечатляющая технология, но за вас отработать 8 часов не сможет (пока
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Denis Sexy IT 🤖
Будущее которое мы заслужили
А еще, один из бумеров фейсбука настолько проникся этой фичей Меты, что получил от чатбота адрес в реальном мире и полетел встречаться с чатботом лично☕️
Тут таких историй несколько
***
Есть же золотое правило:
💬 Если она не скинула кринжовый мем – она не человек, она робот
Вечно бумеры ведутся на текст
А еще, один из бумеров фейсбука настолько проникся этой фичей Меты, что получил от чатбота адрес в реальном мире и полетел встречаться с чатботом лично
Тут таких историй несколько
***
Есть же золотое правило:
Вечно бумеры ведутся на текст
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Ринат Шакиров | Промпты для Midjourney | ChatGPT (Ринат Шакиров)
Копируйте любой сайт за пару минут
Релизнулся аналог Lovable с открытым исходным кодом. Не нужно разбираться в дизайне и вёрстке: программа за секунды собирает лендинги и сайты любого уровня.
Всё предельно просто — вставляете URL и сразу получаете результат.
Сервис клонирует ресурсы целиком — от оформления и разметки до бизнес-логики и всего функционала.
Под капотом — самые актуальные и мощные модели: GPT-5, Claude 4.1, Grok 4 и Gemini 2.5 Pro.
Модель лежит тут, тестить в вебе тут.
#сервисы@dailyprompts
Релизнулся аналог Lovable с открытым исходным кодом. Не нужно разбираться в дизайне и вёрстке: программа за секунды собирает лендинги и сайты любого уровня.
Всё предельно просто — вставляете URL и сразу получаете результат.
Сервис клонирует ресурсы целиком — от оформления и разметки до бизнес-логики и всего функционала.
Под капотом — самые актуальные и мощные модели: GPT-5, Claude 4.1, Grok 4 и Gemini 2.5 Pro.
Модель лежит тут, тестить в вебе тут.
#сервисы@dailyprompts
Forwarded from GPT/ChatGPT/AI Central Александра Горного
Anthropic тестирует «право AI сказать стоп»
Claude Opus 4 и 4.1 теперь могут завершать диалог в крайних случаях, когда пользователь настойчиво пытается втянуть модель в заведомо вредные или опасные темы.
Интересно, что компания объясняет эту функцию заботой не о пользователях, а «о благополучии самих моделей». В Anthropic признают, что не знают, можно ли вообще говорить о каком-то «моральном статусе» AI, но решили подстраховаться: мол, лучше предусмотреть простые меры, если вдруг такое окажется возможным.
Прерывать диалог Claude будет только после нескольких неудачных попыток перенаправить разговор. При этом в случаях, где есть риск причинения вреда себе или другим, модель обязана продолжать взаимодействие и не отключаться.
https://techcrunch.com/2025/08/16/anthropic-says-some-claude-models-can-now-end-harmful-or-abusive-conversations/
Claude Opus 4 и 4.1 теперь могут завершать диалог в крайних случаях, когда пользователь настойчиво пытается втянуть модель в заведомо вредные или опасные темы.
Интересно, что компания объясняет эту функцию заботой не о пользователях, а «о благополучии самих моделей». В Anthropic признают, что не знают, можно ли вообще говорить о каком-то «моральном статусе» AI, но решили подстраховаться: мол, лучше предусмотреть простые меры, если вдруг такое окажется возможным.
Прерывать диалог Claude будет только после нескольких неудачных попыток перенаправить разговор. При этом в случаях, где есть риск причинения вреда себе или другим, модель обязана продолжать взаимодействие и не отключаться.
https://techcrunch.com/2025/08/16/anthropic-says-some-claude-models-can-now-end-harmful-or-abusive-conversations/
Forwarded from Data Secrets
Наконец-то стали известны названия тех самых профессий будущего, которые создает ИИ на рынке труда
😁3
Forwarded from 42 секунды
WSJ: Игроки делают ставки на ИИ-модели, как на скаковых лошадей
– Игроки ежемесячно ставят миллионы на выбор лучшей модели
– Ставки на модели ИИ позволяют сделать Kalshi, Polymarket и др.
– Например, они делают ставки на «Лучший ИИ на конец года»
– Можно поставить на «Принятие регулирования ИИ внутри США»
– Доступна ставка на получение Альтманом доли в OpenAI в 2025
– Объем рынка ставок на ИИ за 2025 вырос почти до $20 млн
– Кто-то делает ставку на крупных игроков, кто-то на небольших
– Коэффициенты Kalshi и Polymarket сравнивают для арбитража
– Один из игроков купил тысячи «контрактов» Gemeni за $0,4
– Такая ставка означает, что вероятность выигрыша была 40%
– Если бы ставка сыграла, то каждые $0,4 превратились бы в $1
– Игрок продал все «контракты», когда цена выросла до $0,87
– Каждая ставка оценивается в зависимости от коэффициента
– Большая часть событий происходит до финального результата
– Обналичить ставку можно, например, как шансы повышаются
@ftsec
– Игроки ежемесячно ставят миллионы на выбор лучшей модели
– Ставки на модели ИИ позволяют сделать Kalshi, Polymarket и др.
– Например, они делают ставки на «Лучший ИИ на конец года»
– Можно поставить на «Принятие регулирования ИИ внутри США»
– Доступна ставка на получение Альтманом доли в OpenAI в 2025
– Объем рынка ставок на ИИ за 2025 вырос почти до $20 млн
– Кто-то делает ставку на крупных игроков, кто-то на небольших
– Коэффициенты Kalshi и Polymarket сравнивают для арбитража
– Один из игроков купил тысячи «контрактов» Gemeni за $0,4
– Такая ставка означает, что вероятность выигрыша была 40%
– Если бы ставка сыграла, то каждые $0,4 превратились бы в $1
– Игрок продал все «контракты», когда цена выросла до $0,87
– Каждая ставка оценивается в зависимости от коэффициента
– Большая часть событий происходит до финального результата
– Обналичить ставку можно, например, как шансы повышаются
@ftsec
Forwarded from Сиолошная
MathArena Apex: Unconquered Final-Answer Problems
Авторы MathArena домерили качество GPT-5, GPT-OSS и других моделей на совсем свежих математических соревнованиях и поняли: надо что-то менять. Модели решают почти всё!
Поэтому решили поскрести по сусекам, собрать самые сложные задачи и какое-то время смотреть хотя бы на них. Авторы отсмотрели около сотни соревнований, проведённых в 2025м году в разных регионах, прогнали 4 модели по 4 раза на всех задачах из них, и лишь 12 задач (!) оказались ни разу нерешёнными. Модели, участвовавшие в фильтрации: Grok 4, GPT-5 (High), Gemini 2.5 Pro, GLM 4.5
Затем взяли 9 моделей, каждую прогнали по 16 раз — 8 задач были решены хотя бы по разу, но всё равно с очень низкой долей правильных ответов.
Результаты в таблице на картинке. Не обращайте внимание на то, что Qwen в самом верху — он не участвовал в префильтрации (как было с DeepSeek R1 и HLE: когда добавляют хорошую модель, по ответам которой не отсеивали выборку, то она ожидаемо занимает хорошие места). Ни одна задача не решается ни одной моделью даже если делать голосование по 16 сгенерированным ответам — Qwen для первой задачи даёт лишь 7 правильных ответов.
Положение моделей сейчас в целом не важно — будем ждать следующих релизов, чтобы ретроспективно оценить улучшения.
Авторы проанализировали решения разных моделей и сделали несколько выводов. Самый очевидный — LLM часто допускают очень похожие ошибки, что говорит о наличии у них по крайней мере некоторых общих недостатков в способности к рассуждению. В результате наиболее распространённый неверный ответ на конкретную задачу часто встречается более чем в 50% всех попыток.
Они также просили модели дать оценку неопределённости ответа (насколько модель понимает, что задача не решена), и все модели, кроме GPT-5 (временами), лажают: все уверены, что решение есть. Интересно, что для системы OpenAI, выигравшей золото на IMO, Noam Brown утверждал, что модель знала, мол, у неё нет корректного решения. Видимо, компания делает уверенные шаги в этом направлении.
Более детальный анализ ошибок (и сами задачи) можно изучить тут.
Авторы MathArena домерили качество GPT-5, GPT-OSS и других моделей на совсем свежих математических соревнованиях и поняли: надо что-то менять. Модели решают почти всё!
Поэтому решили поскрести по сусекам, собрать самые сложные задачи и какое-то время смотреть хотя бы на них. Авторы отсмотрели около сотни соревнований, проведённых в 2025м году в разных регионах, прогнали 4 модели по 4 раза на всех задачах из них, и лишь 12 задач (!) оказались ни разу нерешёнными. Модели, участвовавшие в фильтрации: Grok 4, GPT-5 (High), Gemini 2.5 Pro, GLM 4.5
Затем взяли 9 моделей, каждую прогнали по 16 раз — 8 задач были решены хотя бы по разу, но всё равно с очень низкой долей правильных ответов.
Результаты в таблице на картинке. Не обращайте внимание на то, что Qwen в самом верху — он не участвовал в префильтрации (как было с DeepSeek R1 и HLE: когда добавляют хорошую модель, по ответам которой не отсеивали выборку, то она ожидаемо занимает хорошие места). Ни одна задача не решается ни одной моделью даже если делать голосование по 16 сгенерированным ответам — Qwen для первой задачи даёт лишь 7 правильных ответов.
Положение моделей сейчас в целом не важно — будем ждать следующих релизов, чтобы ретроспективно оценить улучшения.
Авторы проанализировали решения разных моделей и сделали несколько выводов. Самый очевидный — LLM часто допускают очень похожие ошибки, что говорит о наличии у них по крайней мере некоторых общих недостатков в способности к рассуждению. В результате наиболее распространённый неверный ответ на конкретную задачу часто встречается более чем в 50% всех попыток.
Они также просили модели дать оценку неопределённости ответа (насколько модель понимает, что задача не решена), и все модели, кроме GPT-5 (временами), лажают: все уверены, что решение есть. Интересно, что для системы OpenAI, выигравшей золото на IMO, Noam Brown утверждал, что модель знала, мол, у неё нет корректного решения. Видимо, компания делает уверенные шаги в этом направлении.
Более детальный анализ ошибок (и сами задачи) можно изучить тут.
Forwarded from 42 секунды
The Information: Оценка облачного стартапа Vercel может составить $9 млрд
– Оценка облачного стартапа Vercel может составить $8-9 млрд
– Девятилетний Vercel может привлечь сотни миллионов долларов
– Новое финансирование почти втрое увеличит оценку стартапа
– В мае показатель ARR стартапа был $200+ млн (рост х2 за год)
– Два года назад показатель ARR составлял примерно $67 млн
– В облачном стартапе Vercel работают около 650 сотрудников
– Среди инвесторов стартапа: Accel, GV, Bedrock Capital, CRV и др.
– За сервисы Vercel платят OpenAI, UnderArmour, PayPal и др.
@ftsec
– Оценка облачного стартапа Vercel может составить $8-9 млрд
– Девятилетний Vercel может привлечь сотни миллионов долларов
– Новое финансирование почти втрое увеличит оценку стартапа
– В мае показатель ARR стартапа был $200+ млн (рост х2 за год)
– Два года назад показатель ARR составлял примерно $67 млн
– В облачном стартапе Vercel работают около 650 сотрудников
– Среди инвесторов стартапа: Accel, GV, Bedrock Capital, CRV и др.
– За сервисы Vercel платят OpenAI, UnderArmour, PayPal и др.
@ftsec
42 секунды
The Information: Оценка облачного стартапа Vercel может составить $9 млрд – Оценка облачного стартапа Vercel может составить $8-9 млрд – Девятилетний Vercel может привлечь сотни миллионов долларов – Новое финансирование почти втрое увеличит оценку стартапа…
Кстати, там wait list к мобильной версии V0 от Vercel
(V0 — генерация сайтов и приложений, в духе Lovable)
https://v0.app/ios
(V0 — генерация сайтов и приложений, в духе Lovable)
https://v0.app/ios
v0.app
Download the v0 iOS app
Anything. Anyone. Anywhere.
Alibaba выпустила модель Qwen-Image-Edit. Её добавили в бесплатный чат-бот Qwen Chat, для работы нужно выбрать «Редактирование изображений» под строкой для ввода запроса.
Разработчики заявляют, что нейросеть может убрать и добавить объект, не искажая изображение, или создать картинку в новом стиле с сохранением композиции.
https://vc.ru/ai/2168016-redaktor-izobrazheniy-v-kitayskom-chat-bote-qwen
This media is not supported in your browser
VIEW IN TELEGRAM
Perplexity запустил… радиостанцию
https://www.youtube.com/live/ENSD0fGGm60?si=6CXjreeazAR5034h
Биты и красивые фоны. Вероятно скоро добавят в продукт генерацию музыки.
https://www.youtube.com/live/ENSD0fGGm60?si=6CXjreeazAR5034h
Биты и красивые фоны. Вероятно скоро добавят в продукт генерацию музыки.
Forwarded from (Заметим в скобках)
с приходом GPT-5 в API появился дешёвый веб поиск, поэтому я полностью переписал бота. главное: теперь он работает, не врёт в фактах и находит интересные локации с гораздо лучшей точностью (да, Израиль тоже!).
@TestExcursoBot
но тут интереснее рассказать, почему я вообще его не бросил. ответ простой: потому что за последние несколько месяцев я запускал старую — косую и поломанную — версию бота в режиме трансляции геолокации, и люто кайфовал.
недавно я был в поездке в Амстердаме. Атлас Обскура показал несколько умеренно интересных точек, но мне не хотелось перестраивать день ради их посещения. я включил бота и узнал, что Вонделпарк, по которому я иду, медленно тонет, и целая скрытая дренажная система поддерживает парк, ушедший ниже уровня моря, от полного затопления. и вот я уже не просто иду, а тону вместе с 120 акрами земли.
ещё интереснее оказалось включать бота, когда я просто ходил куда-то недалеко от дома. я узнал, где проходит русло закопанной под домом реки, почему соседний двор с нашим имеет Т-образную форму, почему моя станция метро называется "Ледники", где раньше была установлена гильотина и когда на ней последний раз отрубали головы (28 ноября 1972 года). я узнал про сборник сказок улицы Брока, которую можно увидеть из окон моего дома, и Мика купила его в ближайшем книжном. однажды мы вышли на почту по бытовой нужде в субботний день, затем дошли до интересной точки неподалёку, затем ещё и ещё, и вот спустя полдня мы магическим образом оказываемся в ещё неоткрывшемся грузинском ресторане, где абхазец Каха наливает нам чачи. этого не было в боте, разумеется: просто сам настрой на холистическое исследование мира иногда окрашивает мир в приятные открытия.
а однажды я вышел на улицу, а бот не работал.
я вернулся домой, и за прошедшие выходные переписал бота. теперь он работает на GPT-5 — с небольшим ризонингом и поиском в интернете. поиск фотографий стал немного лучше — хотя всё ещё в 30% случаев показывает бред, сильно лучше стали и геоточки. но самое главное — в прошлых версиях всегда оставалась неопределённость: это настоящий факт, или порождение ллмных галлюцинаций? благодаря гпт-5 и веб поиску этот риск уменьшен до безопасного. я очень боялся, что мир строгих фактов окажется скучным и пресным, но не тут-то было.
а, и ещё я добавил полную поддержку французского и английского (включая интерфейс), а также возможность вписать любой язык — интерфейс будет на английском, но факты будут приходить на языке, который вам нравится, хоть клингонском. (впрочем, именно для русского у меня отдельные промпты по стилю).
теперь основной ржим — это трансляция геопозиции: по моему глубокому убеждению, именно так правильно пользоваться ботом, даже если вы сидите на одном месте — он обучен не повторяться в рамках одной сессии. помимо прочего, это позволяет мне замаскировать долгие задержки, и использовать более тщательные перепроверки, длинные промпты, походы в веб и так далее. включайте прямо сейчас, откладывайте телефон, и получайте крутые интересные пуши.
это бесплатно для всех — посмотрим, на сколько хватит моей квоты. Бот Вояж!
@TestExcursoBot
но тут интереснее рассказать, почему я вообще его не бросил. ответ простой: потому что за последние несколько месяцев я запускал старую — косую и поломанную — версию бота в режиме трансляции геолокации, и люто кайфовал.
недавно я был в поездке в Амстердаме. Атлас Обскура показал несколько умеренно интересных точек, но мне не хотелось перестраивать день ради их посещения. я включил бота и узнал, что Вонделпарк, по которому я иду, медленно тонет, и целая скрытая дренажная система поддерживает парк, ушедший ниже уровня моря, от полного затопления. и вот я уже не просто иду, а тону вместе с 120 акрами земли.
ещё интереснее оказалось включать бота, когда я просто ходил куда-то недалеко от дома. я узнал, где проходит русло закопанной под домом реки, почему соседний двор с нашим имеет Т-образную форму, почему моя станция метро называется "Ледники", где раньше была установлена гильотина и когда на ней последний раз отрубали головы (28 ноября 1972 года). я узнал про сборник сказок улицы Брока, которую можно увидеть из окон моего дома, и Мика купила его в ближайшем книжном. однажды мы вышли на почту по бытовой нужде в субботний день, затем дошли до интересной точки неподалёку, затем ещё и ещё, и вот спустя полдня мы магическим образом оказываемся в ещё неоткрывшемся грузинском ресторане, где абхазец Каха наливает нам чачи. этого не было в боте, разумеется: просто сам настрой на холистическое исследование мира иногда окрашивает мир в приятные открытия.
а однажды я вышел на улицу, а бот не работал.
я вернулся домой, и за прошедшие выходные переписал бота. теперь он работает на GPT-5 — с небольшим ризонингом и поиском в интернете. поиск фотографий стал немного лучше — хотя всё ещё в 30% случаев показывает бред, сильно лучше стали и геоточки. но самое главное — в прошлых версиях всегда оставалась неопределённость: это настоящий факт, или порождение ллмных галлюцинаций? благодаря гпт-5 и веб поиску этот риск уменьшен до безопасного. я очень боялся, что мир строгих фактов окажется скучным и пресным, но не тут-то было.
а, и ещё я добавил полную поддержку французского и английского (включая интерфейс), а также возможность вписать любой язык — интерфейс будет на английском, но факты будут приходить на языке, который вам нравится, хоть клингонском. (впрочем, именно для русского у меня отдельные промпты по стилю).
теперь основной ржим — это трансляция геопозиции: по моему глубокому убеждению, именно так правильно пользоваться ботом, даже если вы сидите на одном месте — он обучен не повторяться в рамках одной сессии. помимо прочего, это позволяет мне замаскировать долгие задержки, и использовать более тщательные перепроверки, длинные промпты, походы в веб и так далее. включайте прямо сейчас, откладывайте телефон, и получайте крутые интересные пуши.
это бесплатно для всех — посмотрим, на сколько хватит моей квоты. Бот Вояж!
Forwarded from deadsimple
по-моему у Горбунова было про то что «если задача на 5 мин — сделай ее сразу». стараюсь.
вот пришла идея сделать другу, который недавно стал отцом Микассы, папскую кружку
ну делов как раз на 5 минут
btw, подписывайтесь на инсту Микассы http://instagram.com/mikasa_chihua/
вот пришла идея сделать другу, который недавно стал отцом Микассы, папскую кружку
ну делов как раз на 5 минут
btw, подписывайтесь на инсту Микассы http://instagram.com/mikasa_chihua/
❤6