Браузер Comet от perplexity 🌠
Последний месяц пользовался браузером Comet от перплексити. Помимо стандартных ИИ фичей типо саммари страниц и всего такого, есть ИИ агент который полностью берет на себя управление страницей
Из классного - в отличии от агента опени не требует логина в свои сервисы и кажется что реже требует аппрува действий. Но мобильного приложения нет, так что для управления запущенными агентами надо возвращаться к компьютеру
С задачами в простых интерфейсах справляется без проблем, вот почистить гугл календарь от мусорных эвентов которые мне заспамили в календли он уже не смог - думаю слишком сложный UI.
Думаю что будущее агенского AI все таки за управлением вашем ПК а не сандбоксом, где то в облаке. 2-ое это пока дикий костыль пока модели еще тупые что бы не сделать sudo rm -rf в вашей системе.
Antropic тоже запустило свое расширение для браузера с агентом, если этот пост не наберет ни одного эмодзи клоуна - завтра напишу что думаю после недели использования его.
Последний месяц пользовался браузером Comet от перплексити. Помимо стандартных ИИ фичей типо саммари страниц и всего такого, есть ИИ агент который полностью берет на себя управление страницей
Из классного - в отличии от агента опени не требует логина в свои сервисы и кажется что реже требует аппрува действий. Но мобильного приложения нет, так что для управления запущенными агентами надо возвращаться к компьютеру
С задачами в простых интерфейсах справляется без проблем, вот почистить гугл календарь от мусорных эвентов которые мне заспамили в календли он уже не смог - думаю слишком сложный UI.
Думаю что будущее агенского AI все таки за управлением вашем ПК а не сандбоксом, где то в облаке. 2-ое это пока дикий костыль пока модели еще тупые что бы не сделать sudo rm -rf в вашей системе.
Antropic тоже запустило свое расширение для браузера с агентом, если этот пост не наберет ни одного эмодзи клоуна - завтра напишу что думаю после недели использования его.
🤡24🤔12👍8😁4❤3
Похоже Openai расширяет список сайд бизнесов (помимо продажи самих моделей) и делает AI-HR платформу (сервис для найма людей)
Для нас с вами это хорошие новости, потому что даже Сем считает что хотя бы в ближайшее время агенты заменят людей не полностью
Для нас с вами это хорошие новости, потому что даже Сем считает что хотя бы в ближайшее время агенты заменят людей не полностью
Openai
Expanding economic opportunity with AI
Fidji Simo - CEO, Applications
👍6❤3😁1😱1🤣1
Лучше чем Kaggle
Roam.lol (компания куда я публиковал вакансию пару постов выше) открывает программу Research Bounties
Они занимаются чем то на подобнее bolt.new , но для игр, и готовы платить за прорывы по сложным ресерч направилениям. Например
- 8'000$ за AI агента который по промпту пользователя будет выставлять обьекты на 3д сцене
- 10'000$ за фреймворк для тестирования их агентов
Недавно они подняли большой раунд от секвои и собрали куча топовых ресерчеров из Nasa, Bytedance и Deepmind - и эта программа отличный способ попробовать свои силы и поработать с ними
Сейчас, когда из за нейронок learning curve в новом проекте стал намного более быстрым, подобные позиции способны если не полностью заменить, но хотя бы конкурировать с обычным наймом в изолированных задачах
Roam.lol (компания куда я публиковал вакансию пару постов выше) открывает программу Research Bounties
Они занимаются чем то на подобнее bolt.new , но для игр, и готовы платить за прорывы по сложным ресерч направилениям. Например
- 8'000$ за AI агента который по промпту пользователя будет выставлять обьекты на 3д сцене
- 10'000$ за фреймворк для тестирования их агентов
Недавно они подняли большой раунд от секвои и собрали куча топовых ресерчеров из Nasa, Bytedance и Deepmind - и эта программа отличный способ попробовать свои силы и поработать с ними
Сейчас, когда из за нейронок learning curve в новом проекте стал намного более быстрым, подобные позиции способны если не полностью заменить, но хотя бы конкурировать с обычным наймом в изолированных задачах
🔥8❤3👍2
После выхода GPT-5, в последние 2 недели
Anonymous Poll
51%
пользуюсь OPENAI и не заметил проблем
22%
пользуюсь OPENAI и заметил ухудшение
8%
подумал отменить подписку/отменил подписку
16%
перешел на Claude в качестве основной
15%
перешел в другую модель в качестве основной
Наткнулся на интересный пост сотрудника из известного AI стартапа для юристов Harvey - тык . Летом они закрыли раунд в $300M с оценкой $5 млрд.
Он пишет, что Harvey - обертка на GPT-5 в АПИ которого сгрузили файлы документов, законов итп (в целом в этом ничего плохого нет, если вы не продаете подписку за 1000 $/ сотрудника, позицианируя это как revolution)
Метрики использования очень низкие, почти все кто платит за подписку не пользуются ею (хотя это средне-крупный b2b рынок). Ретеншн на повторную оплату минимальный
CEO Harvey ответил на этот пост в линкедине, и говорит что все не так плохо это неправда. Однако коментаторы уже обнаружили проблемы в его ответе.
Все еще считаете что ИИ пузыря нет и 5 млрд (~10% от госбюджета Казахстана) это справедливая оценка для openai.chat.completion(...)?
Он пишет, что Harvey - обертка на GPT-5 в АПИ которого сгрузили файлы документов, законов итп (в целом в этом ничего плохого нет, если вы не продаете подписку за 1000 $/ сотрудника, позицианируя это как revolution)
Метрики использования очень низкие, почти все кто платит за подписку не пользуются ею (хотя это средне-крупный b2b рынок). Ретеншн на повторную оплату минимальный
CEO Harvey ответил на этот пост в линкедине, и говорит что
Все еще считаете что ИИ пузыря нет и 5 млрд (~10% от госбюджета Казахстана) это справедливая оценка для openai.chat.completion(...)?
Reddit
[deleted by user] : r/legaltech
315 votes, 271 comments. 19K subscribers in the legaltech community. This subreddit is for those in the legal field interested in improving the legal…
😁9👍6✍1🔥1🥰1🕊1🐳1🤣1
Вышла sonet-4.5, пишут что новая маленькая (и дешевая) модель бьет прошлый опус по метрикам кодинга (SWE bench-у относительно можно доверять)
Я потыкал в своих задачах кодинга, кажется что правда лучше, но возможно, она просто быстрее и успевает сделать больше попыток пока не выбесит меня
P.S. на графике режим test-time compute - это когда модель генерирует несколько решений из которых выбирается лучшее.
Я потыкал в своих задачах кодинга, кажется что правда лучше, но возможно, она просто быстрее и успевает сделать больше попыток пока не выбесит меня
P.S. на графике режим test-time compute - это когда модель генерирует несколько решений из которых выбирается лучшее.
🔥9👍4😁2❤1👎1🤮1💩1
Forwarded from Denis Sexy IT 🤖
А еще, OpenAI выдал JetBrains такую награду – за 1 триллион токенов сгенерированных через API – это самая крупная такого рода
Что делает лишний пробел перед словом Tokens, не спрашивайте
P.S. Я, кстати, недавно мучал GPT5 Pro, сколько примерно человек потребляет токенов на вход в своем контекстом окне за всю жизнь – получилось от ~0.7 до ~3 млрд LLM‑токенов за жизнь; для «среднего» человека - около 1.5–2.0 млрд токенов, вот и думайте☕️
Что делает лишний пробел перед словом Tokens, не спрашивайте
P.S. Я, кстати, недавно мучал GPT5 Pro, сколько примерно человек потребляет токенов на вход в своем контекстом окне за всю жизнь – получилось от ~0.7 до ~3 млрд LLM‑токенов за жизнь; для «среднего» человека - около 1.5–2.0 млрд токенов, вот и думайте
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥9👍2🐳2
Forwarded from Алексей Маметьев
OpenAI недавно наградила людей, которые потратили очень много токенов API OpenAI. Речь идет о сотнях миллиардах и даже триллионах токенов использования их API.. Я разобрался, чем занимаются эти люди или компании, которые там обозначены.
Подробно чем занимается топ 5 компаний из списка - в картинках посту, или чуть подробнее текстом
Больше всего токенов уходит на Dev Tools - CodeRabbit (автоматический code review, проверил 13M+ pull requests), Cognition/Devin (автономный AI программист), Warp (AI терминал), Replit (облачная IDE). Эта категория съедает 14.5 триллионов токенов, или 22.8% от общего объема.
AI Infrastructure тоже значимый кусок - 11.3 триллиона токенов (17.8%). Сюда входят Weights & Biases (трекинг ML экспериментов), HuggingFace (платформа для моделей), Turing ($1.1B unicorn, соединяет 3M+ разработчиков), Google DeepMind (создатели Gemini), Arize AI (AI observability). Эти компании не делают конечный продукт для пользователей, а строят инфраструктуру для ML-команд.
Enterprise Software на третьем месте - 8.2T токенов (12.9%). Тут Salesforce с Einstein AI, Zendesk с автоматизацией support, Notion с AI chat (который удвоил использование), Shopify, Indeed, Rox (agentic CRM для enterprise sales). Это классический B2B SaaS, который встраивает AI во все бизнес-процессы.
Search & Knowledge - 6.1T (9.6%). Perplexity AI с оценкой $18B и 10M активных пользователей, Genspark (сделали рекордные $10M ARR за 9 дней), Sider.ai (9M пользователей в месяц), Dashworks (купил HubSpot). Все они генерируют структурированные ответы на запросы пользователей.
E-commerce - 5.6T (8.8%). Canva со своим Magic Studio для 100+ миллионов пользователей, MercadoLibre (крупнейший e-commerce Латинской Америки), eBay, Poshmark. Используют AI для product categorization, recommendations, customer service.
Healthcare AI - 3.8T (6%). Abridge ($2.75B оценка, автоматическая медицинская документация), Doximity (платформа для 2M+ врачей в US), Rad AI. Транскрибируют разговоры врач-пациент, генерируют SOAP notes, заполняют EHR
Customer Support - 3.5T (5.5%). Decagon ($1.5B оценка, клиенты Notion, Duolingo, Hertz), Ada (60-80% автоматизация), EliseAI (unicorn, управляет 1 из 12 multifamily apartments в US), Chatbase ($5M ARR за 2 года), Scribe (4M+ пользователей). Обрабатывают миллионы support tickets через chat, email, voice.
Дальше идут Cloud & DevOps (AWS, Datadog с Bits AI для анализа логов, Samsara), Fintech (Ramp - fastest unicorn за 18 месяцев), Education (Duolingo с 500M+ загрузок, Khan Academy с Khanmigo AI tutor), Legal Tech (Harvey AI для юрфирм про который был пост выше, Thomson Reuters) Duolingo,
Можете искать знакомые названия в общем списке компаний: OpenRouter, Indeed, Salesforce, CodeRabbit, iSolutionsAI, Outtake, Uber, Ramp, Abridge, Sider.ai, Warp, Shopify, Notion, WHOOP, Dashworks, neural.love, Delphi, Decagon, Rox, Zendesk, Harvey AI, Read AI, Canva, Cognition AI, Datadog, Perplexity AI, MercadoLibre, Genspark, Palo Alto Networks, Powerbroker AI, Google DeepMind, Eclypsium, University of Greenwich, Sourcegraph, LMSYS/UC Berkeley, GovTech Singapore, Hex Technologies, Model ML, Poshmark, Raptive, Silurian AI, Scribe, Thomson Reuters, Doximity, Holtzbrinck Publishing, Arize AI, SmartNews, KitCo, Browser Use, eBay, Fractional AI, YouWeb Incubator, Narrativa, Workato, Weights & Biases, Zypher Network, Databook, HuggingFace, NTT Data Services, AWS, Figma, Alby, Sixfold, Shortwave, Turing, Chatbase, Ada, Khan Academy, Lindy, OpenAI, Inspired Thinking Group, Intel, Lowe's, Replit, Yelp, Twilio, EliseAI, Brightcove, Samsara, Century Instrument & Machine, TeamForm, OpenAI
Подробно чем занимается топ 5 компаний из списка - в картинках посту, или чуть подробнее текстом
Больше всего токенов уходит на Dev Tools - CodeRabbit (автоматический code review, проверил 13M+ pull requests), Cognition/Devin (автономный AI программист), Warp (AI терминал), Replit (облачная IDE). Эта категория съедает 14.5 триллионов токенов, или 22.8% от общего объема.
AI Infrastructure тоже значимый кусок - 11.3 триллиона токенов (17.8%). Сюда входят Weights & Biases (трекинг ML экспериментов), HuggingFace (платформа для моделей), Turing ($1.1B unicorn, соединяет 3M+ разработчиков), Google DeepMind (создатели Gemini), Arize AI (AI observability). Эти компании не делают конечный продукт для пользователей, а строят инфраструктуру для ML-команд.
Enterprise Software на третьем месте - 8.2T токенов (12.9%). Тут Salesforce с Einstein AI, Zendesk с автоматизацией support, Notion с AI chat (который удвоил использование), Shopify, Indeed, Rox (agentic CRM для enterprise sales). Это классический B2B SaaS, который встраивает AI во все бизнес-процессы.
Search & Knowledge - 6.1T (9.6%). Perplexity AI с оценкой $18B и 10M активных пользователей, Genspark (сделали рекордные $10M ARR за 9 дней), Sider.ai (9M пользователей в месяц), Dashworks (купил HubSpot). Все они генерируют структурированные ответы на запросы пользователей.
E-commerce - 5.6T (8.8%). Canva со своим Magic Studio для 100+ миллионов пользователей, MercadoLibre (крупнейший e-commerce Латинской Америки), eBay, Poshmark. Используют AI для product categorization, recommendations, customer service.
Healthcare AI - 3.8T (6%). Abridge ($2.75B оценка, автоматическая медицинская документация), Doximity (платформа для 2M+ врачей в US), Rad AI. Транскрибируют разговоры врач-пациент, генерируют SOAP notes, заполняют EHR
Customer Support - 3.5T (5.5%). Decagon ($1.5B оценка, клиенты Notion, Duolingo, Hertz), Ada (60-80% автоматизация), EliseAI (unicorn, управляет 1 из 12 multifamily apartments в US), Chatbase ($5M ARR за 2 года), Scribe (4M+ пользователей). Обрабатывают миллионы support tickets через chat, email, voice.
Дальше идут Cloud & DevOps (AWS, Datadog с Bits AI для анализа логов, Samsara), Fintech (Ramp - fastest unicorn за 18 месяцев), Education (Duolingo с 500M+ загрузок, Khan Academy с Khanmigo AI tutor), Legal Tech (Harvey AI для юрфирм про который был пост выше, Thomson Reuters) Duolingo,
Можете искать знакомые названия в общем списке компаний: OpenRouter, Indeed, Salesforce, CodeRabbit, iSolutionsAI, Outtake, Uber, Ramp, Abridge, Sider.ai, Warp, Shopify, Notion, WHOOP, Dashworks, neural.love, Delphi, Decagon, Rox, Zendesk, Harvey AI, Read AI, Canva, Cognition AI, Datadog, Perplexity AI, MercadoLibre, Genspark, Palo Alto Networks, Powerbroker AI, Google DeepMind, Eclypsium, University of Greenwich, Sourcegraph, LMSYS/UC Berkeley, GovTech Singapore, Hex Technologies, Model ML, Poshmark, Raptive, Silurian AI, Scribe, Thomson Reuters, Doximity, Holtzbrinck Publishing, Arize AI, SmartNews, KitCo, Browser Use, eBay, Fractional AI, YouWeb Incubator, Narrativa, Workato, Weights & Biases, Zypher Network, Databook, HuggingFace, NTT Data Services, AWS, Figma, Alby, Sixfold, Shortwave, Turing, Chatbase, Ada, Khan Academy, Lindy, OpenAI, Inspired Thinking Group, Intel, Lowe's, Replit, Yelp, Twilio, EliseAI, Brightcove, Samsara, Century Instrument & Machine, TeamForm, OpenAI
👍8❤3🍓1
Недавно Openai классно прокачали свой Structured Output, теперь вы можете передавать не только json схему, но и кастомную "граматику ответа"
это может быть как регексп выражение:
Так и что т более сложное. Например вот определение lark-схемы которая заставляет модель генерировать сумму или разность двух чисел
Все это работает на уровне семплирования токенов, гарантируется что ответ будет соответсвовать схеме.
Подробнее как это работает я писал тут, когда год назад openai представила json Structured output
А на скриншоте пример схемы для генерации валидной mssql запроса
это может быть как регексп выражение:
timestamp_grammar = r"^\d{4}-(0[1-9]|1[0-2])-(0[1-9]|[12]\d|3[01])(?:[01]\d|2[0-3]):[0-5]\d$"
response = client.responses.create(
model="gpt-5",
input="Call the timestamp_grammar to save a timestamp for August 7th 2025 at 10AM.",
tools=[{
"type": "custom",
"name": "timestamp_grammar",
"denoscription": "Saves a timestamp in date + time in 24-hr format.",
"format": {
"type": "grammar",
"syntax": "regex",
"definition": timestamp_grammar
}
}]
)Так и что т более сложное. Например вот определение lark-схемы которая заставляет модель генерировать сумму или разность двух чисел
start: number operator number
operator: "+" | "-"
number: /[0-9]+/
Все это работает на уровне семплирования токенов, гарантируется что ответ будет соответсвовать схеме.
Подробнее как это работает я писал тут, когда год назад openai представила json Structured output
А на скриншоте пример схемы для генерации валидной mssql запроса
❤14👀8👍7🔥1
Попробовал Atlas от чат жпт, вообще ни о чем, 100% хуже переплексити по качеству + есть ужасное сейфти которое реджектит любое действие через раз. Постоянно вылетает и спрашивает можно ли нажать на кнопку или говорит что не может сделать базовое действие.
Если перплексити может помочь с выбором проституток, то atlas не может зарегаться на сайте сам, так как это не безопасно
Перплексити кстати вышел из закрытого тестирования + стал сильно лучше с моего прошлого тестирования.
При регистрации по рефералке вам начислят бесплатную про подписку (нужен впн)
ССЫЛКА
^^^^^^^^
Если перплексити может помочь с выбором проституток, то atlas не может зарегаться на сайте сам, так как это не безопасно
Перплексити кстати вышел из закрытого тестирования + стал сильно лучше с моего прошлого тестирования.
При регистрации по рефералке вам начислят бесплатную про подписку (нужен впн)
ССЫЛКА
^^^^^^^^
❤6👍4🤩2😁1
Сосун
Недавно Telegram прдеставили cocoon - децентрализованную сеть для инференса моделей LLM. Почти одновременно с ними (но не так громко) запустились еще 2 подобные сети - gonka.ai от Либерманов и Loyal который собрал сумашедшие 75 млн долларов на IDO месяц назад. Все эти системы должны работать так:
- У меня есть ГПУ, я закачиваю на нее модель, начинаю инференс. Люди смогут посылать запросы в сеть и они будут распределяться между такими же людьми как я. Деньги которые платят за токены люди будут распределены между владельцами ГПУ
А что насчет приватности? Как я могу быть уверен что владелец ГПУ не будет читать/сохранять мои запросы?
- С этим все гладко; Современные NVIDIA GPU оснащены Trusted Execution Environment который позволяют передавать данные на гпу в зашифрованом виде, и расшифровывать их уже в VRAM, используя ключ зашитый в TPM внутри карточки. Бай дизайн прочитать ваши запросы будет невозможно. Эта штука не должна добавлять значимый оверхед к скорости инференса
Как я могу гарантировать что провайдер реально инференсит ту модель что указано? Почему он не может запустить 8b вместо 70b или вообще отвечать случайными текстами
- С этим поможет модуль Hardware Root of Trust в nvidia карточках. Оно позволяет сделать Zero Knowledge Proof того что гпу выполняет именно ту модель и с теми параметрами что заявлено. Работает это очень не тривиальным образом (и по моему мнению это все довольно жидко), но есть что есть. Так же можно использовать стандартный для крипты подход - ты замораживаешь большое число денег как залог. Очень маленькое количество генераций верефицируется другими участниками, если другие пруфят что ты обманывал сеть твой залог забирают.
Подробнее про это можно почитать тут или спросить в коментах
Неужели все настолько хорошо?
- Пока не очень понятен конкурентное преемущество этой штуки над например опенроутером. По цене токены продают очень близко к себестоимости ГПУ часа, так что оно не выйдет сильно дешевле. Демпинга засчет дешевых косьюмерских карт тоже не будет, все эти новомодные чипы есть только в H100+ карточках. Разве уж вопрос прайваси остается, но кажется что текущее законодательство пока не очень готово к подобным системам.
Если вы видите какой то классный юзкейс у этого всего буду рад прочитать в комментах
Недавно Telegram прдеставили cocoon - децентрализованную сеть для инференса моделей LLM. Почти одновременно с ними (но не так громко) запустились еще 2 подобные сети - gonka.ai от Либерманов и Loyal который собрал сумашедшие 75 млн долларов на IDO месяц назад. Все эти системы должны работать так:
- У меня есть ГПУ, я закачиваю на нее модель, начинаю инференс. Люди смогут посылать запросы в сеть и они будут распределяться между такими же людьми как я. Деньги которые платят за токены люди будут распределены между владельцами ГПУ
А что насчет приватности? Как я могу быть уверен что владелец ГПУ не будет читать/сохранять мои запросы?
- С этим все гладко; Современные NVIDIA GPU оснащены Trusted Execution Environment который позволяют передавать данные на гпу в зашифрованом виде, и расшифровывать их уже в VRAM, используя ключ зашитый в TPM внутри карточки. Бай дизайн прочитать ваши запросы будет невозможно. Эта штука не должна добавлять значимый оверхед к скорости инференса
Как я могу гарантировать что провайдер реально инференсит ту модель что указано? Почему он не может запустить 8b вместо 70b или вообще отвечать случайными текстами
- С этим поможет модуль Hardware Root of Trust в nvidia карточках. Оно позволяет сделать Zero Knowledge Proof того что гпу выполняет именно ту модель и с теми параметрами что заявлено. Работает это очень не тривиальным образом (и по моему мнению это все довольно жидко), но есть что есть. Так же можно использовать стандартный для крипты подход - ты замораживаешь большое число денег как залог. Очень маленькое количество генераций верефицируется другими участниками, если другие пруфят что ты обманывал сеть твой залог забирают.
Подробнее про это можно почитать тут или спросить в коментах
Неужели все настолько хорошо?
- Пока не очень понятен конкурентное преемущество этой штуки над например опенроутером. По цене токены продают очень близко к себестоимости ГПУ часа, так что оно не выйдет сильно дешевле. Демпинга засчет дешевых косьюмерских карт тоже не будет, все эти новомодные чипы есть только в H100+ карточках. Разве уж вопрос прайваси остается, но кажется что текущее законодательство пока не очень готово к подобным системам.
Если вы видите какой то классный юзкейс у этого всего буду рад прочитать в комментах
❤16👍10😁5🤡2