NEW BOT Телеграм, страница

Но есть ещё 4 главных бенчмарка, которые выпятили OpenAI, и все они — про экономически ценные задачи, основанные на анализе реальной ежедневной работы специалистов.

1. Общий бенчмарк «Economically important tasks», про который деталей особо нет. «Эти задачи, порученные экспертам из разных профессий и отраслей, отражают реальную профессиональную работу, такую как подготовка конкурентного анализа поставщиков услуг неотложной помощи по требованию, составление подробных графиков амортизации и определение перспективных скважин для нового объекта по производству экологически чистого водорода». Тут оценивается доля ответов, где было отдано предпочтение ответу модели нежели написанному человеком — в разрезе длительности выполнения задачи человеком.

2. SpreadsheetBench, который оценивает модели по их способности редактировать электронные таблицы, созданные на основе реальных сценариев. Примеры вопросов смотрите тут на 25 странице и далее.

3. Ещё один внутренний бенчмарк « ...измеряющий способность модели справляться с задачами моделирования, выполняемыми аналитиками инвестиционного банкинга в течение первого-третьего года работы, например, с составлением финансовой модели из трёх отчётов для компании из списка Fortune 500 с корректным форматированием и ссылками или с построением модели выкупа с использованием заёмных средств для приобретения частной компании». Каждая задача оценивается по сотням критериев, связанных с корректностью и используемыми формулами.

4. BrowseComp, свежий бенчмарк OpenAI от апреля. Измеряет способность агентов находить труднодоступную информацию в интернете. Статья тут.

В общем, нужно подождать ~месяц, чтобы понять ценность в реальных рабочих задачах (хотя Денис вон уже кайфует), но направление, в котором делаются улучшения, понятно.

И всё это доступно и Plus пользователям с подпиской за $20 в месяц!

49 views21:14

Пупырка AI

Forwarded from Denis Sexy IT 🤖

В Осаке, Япония, нашли способ полезно применять дроны – как указатели в небе на мероприятиях ☕️

Please open Telegram to view this post

VIEW IN TELEGRAM

😍5😱1

50 views21:17

Пупырка AI

😁5

85 views08:22

Пупырка AI

Amazon теперь требует от сотрудников своих подразделений «умного дома» (таких как Ring и Blink) доказывать использование ИИ в работе, чтобы получить повышение. Сотрудники должны показать, как ИИ помогает им выполнять работу лучше, а менеджеры — как они достигают большего без найма новых людей. Это новое правило, инициированное основателем Ring Джейми Симиноффом, направлено на повышение инновационности и эффективности. 🧠

businessinsider.com

😁2💩1

59 views09:10

Пупырка AI

0:09

This media is not supported in your browser

VIEW IN TELEGRAM

0:11

This media is not supported in your browser

VIEW IN TELEGRAM

Ребята замутили отлично. Огурцы — топ

😁8

61 viewsedited 12:21

Пупырка AI

Photo

Музыкант навайбкодил игру про мем с парочкой на Coldplay. И неожиданно для себя попал в тренды

https://coldplay-canoodle-git-main-jonathan-manns-projects-fcbebd01.vercel.app?_vercel_share=MEtBJBucvn80EHKAQ1cEp6RboPY1zRif

78 views20:00

Comet играет в шахматы сам с собой

61 views20:22

Пупырка AI

Forwarded from GPT/ChatGPT/AI Central Александра Горного

Маск анонсировал Baby Grok — нейросеть, предназначенную для детей. Дата выхода и другие подробности пока не раскрываются.

https://x.com/elonmusk/status/1946763642231500856

😱2

57 views17:59

Пупырка AI

✨✨✨ Наш канал любят за отборные репосты и не любят за малое количество уникального контента. Чтож, давайте к действительно уникальному контенту, о котором вы не узнаете где-то еще. Пользовтаели Reddit пишут: «huge redesign just dropped» И это правда, ведь…

Swarm обновился! Теперь встречает большой картой, ну и весь UI подтянули

❤1

56 views10:43

Пупырка AI

Forwarded from Сиолошная

«Миссионеры победят наёмников» — детали бифа за таланты между META и OpenAI от WSJ.

По данным онлайн-издания, META предлагала компенсационные пакеты на сумму более $300 миллионов своим самым ценным сотрудникам, и даже такие деньги не всегда достаточны, чтобы привлечь их. Компания также делает так называемые «взрывающиеся предложения», срок действия которых истекает через несколько дней, что затрудняет возможность эффективно перебить оффер.

«Главная цель наёмников — это жажда заработать деньги» — сказал однажды John Doerr. Но в компаниях-миссионерах «присутствует жажда не только заработать деньги, но и обрести смысл». Mark Zuckerberg утверждает, что привлекательность его компании заключается не в компенсационных пакетах, а в доступе к огромным вычислительным мощностям, необходимым исследователям для совершения прорывов. Он хвастается, что в пересчёте на одного исследователя это будет самый большой объем GPU под эксперименты.

(Кстати, Sama вчера затвитил, что до конца года у OpenAI будет суммарно доступно более миллиона GPU. Интересно, какая пропорция «эксперименты+тренировки / инференс для пользователей»).

WSJ пишет, что весной Mark встретился с Chief Research Officer OpenAI Mark Chen чтобы пообщаться, но в итоге попросил его совета по улучшению структуры команды по в своей компании. Учитывая, сколько денег META уже тратила на оборудование и вычислительные мощности для обучения ИИ — более чем в 100 раз больше, чем на сотрудников — Chen предложил инвестировать больше в таланты, как рассказали люди, знакомые с содержанием разговора.

Zuckerberg спросил Chen'а, рассмотрел бы он возможность перейти в Meta и что нужно, чтобы привлечь его.
— Несколько сотен миллионов долларов? Миллиард?

🐹

Mark Chen отказался, сказав, что он счастлив в OpenAI 👍 наш слоняра. А META так и не нашла Chief Research Officer для своей суперкоманды.

По словам источников, знакомых с ситуацией, META предложила более чем десяти исследователям OpenAI ошеломляющие компенсационные пакеты в размере $300 миллионов на четыре года, включая $100 миллионов в первый год. Однако некоторые не согласились.

===

А ешё у Ilya Sutskever и его Safe Superintelligence (SSI) продался CEO и ко-файндер Daniel Gross. В конце января они втроём встретились за обедом в доме Mark Zuckerberg в Пало-Альто. Вскоре после этого глава META сказал, что заинтересован в покупке SSI. Ilya немедленно отклонил предложение, сказав, что SSI не продаётся, как сообщили люди, знакомые с ситуацией. Несколько недель спустя Meta приняла участие в инвестиционном раунде SSI, по итогам которого оценка стартапа составила $32 миллиарда.

В мае Sutskever сам получил предложение присоединиться к META вместе с Daniel Gross и Nat Friedman (ex-CEO GitHub). Он его, конечно, отклонил, но для него стало ударом, что от него ушёл ко-фаундер. Не везёт Илюхе 😭

Please open Telegram to view this post

VIEW IN TELEGRAM

49 views11:02

Пупырка AI

Forwarded from 42 секунды

TechCrunch: Perplexity рассматривает Индию как кратчайший путь, чтобы догнать OpenAI

– OpenAI успела закрепить за собой лидерство на рынке США
– Perplexity собирается постепенно расширяться внутри Индии
– Он быстро набирает аудиторию на втором интернет-рынке
– Perplexity и индийский оператор Bharti Airtel стали партнерами
– Bharti Airtel является вторым по величине оператором страны
– Всем 360 млн абонентам дадут годовую подписку Perplexity Pro
– Обычная такая подписка стоит $200, им ее дадут бесплатно
– Оператор подтвердил, что сделка для него стала эксклюзивной
– Другие операторы не смогут предоставлять Perplexity бесплатно
– Загрузки Perplexity внутри Индии за Q2 2025 выросли на 600%

@ftsec

55 views11:51

Пупырка AI

Forwarded from GPT/ChatGPT/AI Central Александра Горного

Perplexity оценили в 18 миллиардов долларов

Компания привлекла еще 100 миллионов долларов инвестиций. Прошлый раунд был в мае, тогда Perplexity оценили в 14 миллиардов.

Недавно стартап заключил сделку с Bharti Airtel — одним из крупнейших сотовых операторов Индии. В рамках сделки все 360 миллионов клиентов оператора бесплатно получат годовую подписку Perplexity Pro, которая обычно стоит 20 долларов в месяц.

P.S. Про все крупные раунды в AI и не только я пишу в RoundBook. Первая неделя бесплатно.

https://www.bloomberg.com/news/articles/2025-07-17/ai-startup-perplexity-valued-at-18-billion-with-new-funding

50 views17:31

About

Blog

Apps

Platform