Data Cluster – Telegram
Data Cluster
69 subscribers
926 photos
6 videos
892 links
Хостинг и продажа оборудования для искусственного интеллекта!

Сайт — https://data-cluster.ru/
Отдел продаж - @TK_MiningCluster
Download Telegram
👀 Dell начала поставки ноутбуков с дискретным NPU Qualcomm под Linux

Dell официально запустила продажи Pro Max 16 Plus — первого ноутбука компании с дискретным нейросетевым процессором Qualcomm AI 100 PC, работающим под управлением Ubuntu 24.04 LTS. Это первая мобильная рабочая станция корпоративного уровня, оснащённая таким NPU.

🟢Dell подчёркивает, что новый чип позволяет запускать крупные ИИ-модели локально, без обращения к облаку — что особенно актуально для задач в здравоохранении, финансах, юриспруденции, госуправлении, инженерии и научных исследованиях.

🟢Qualcomm уже некоторое время продвигает поддержку AI 100 в ядре Linux — драйвер находится в основной ветке.

В начале следующего года Dell начнёт поставлять версию Pro Max 16 Plus с Windows 11. Однако такой вариант будет оснащён уже не NPU Qualcomm, а дискретными GPU Nvidia GeForce RTX. В линейке Windows-конфигураций доступны процессоры Intel Ultra 5 245HX, Ultra 7 265HX и Ultra 9 285HX.

🟢Data Cluster
Please open Telegram to view this post
VIEW IN TELEGRAM
1🔥1
📌 ChatGPT научился выявлять эмоциональный кризис и связывать пользователей с живыми специалистами

OpenAI обновила ChatGPT, добавив расширенный доступ к локальным кризисным горячим линиям благодаря партнёрству с сервисом ThroughLine. Теперь, если модель распознаёт признаки эмоционального или психологического дистресса, она предлагает пользователю одним кликом связаться с реальным специально обученным слушателем.

🟢По данным OpenAI, сервис работает 24/7, поддерживает телефон, текст или чат — в зависимости от конкретной линии — и остаётся полностью анонимным и конфиденциальным. Обратиться можно не только в критической ситуации, но и просто когда нужна поддержка.

🟢Важно, что линии помощи независимы от OpenAI: компания не мониторит разговоры и не участвует в них, а связь происходит напрямую со службой поддержки. Это повышает приватность и снижает нагрузку на ИИ.

Одновременно была улучшена сама модель ChatGPT — благодаря работе с психологами она точнее распознаёт признаки дистресса, лучше деэскалирует разговоры и корректнее направляет пользователей к профессиональной помощи, когда это необходимо.

🟢Data Cluster
Please open Telegram to view this post
VIEW IN TELEGRAM
📌 Yandex B2B Tech представил «Нейроюриста» — ИИ-помощника для юристов

Yandex B2B Tech запустил новый сервис — «Нейроюрист», нейросетевого помощника, который берёт на себя рутину и ускоряет работу юристов. По данным компании, ИИ уже используют 75% юрдепартамента «Яндекса»: обработка договоров становится быстрее в 1,5 раза, а поиск и анализ информации — в 3 раза.

🟢Перед обращением можно выбрать область права: трудовое, корпоративное, информационное, рекламное, обязательственное, интеллектуальную собственность или защиту прав потребителей. Кроме того, пользователь может указать, какие источники применять — законодательство, кодексы, судебную практику или комментарии юристов. Ответы сопровождаются ссылками на материалы системы «Гарант».

🟢«Нейроюрист» работает и с пользовательскими файлами — документами, PDF, презентациями, изображениями, аудио и видео. Например, можно загрузить макеты рекламных баннеров и попросить проверить их на соответствие законодательству.

🟢В основе сервиса — Alice AI LLM, дополненная экспертизой юристов. Модель дообучили на примерах, снабдили юридическими данными и обучили учитывать специфику российского права. Отдельные ИИ-агенты анализируют документы и сравнивают версии файлов, а также могут упростить сложный юридический текст для широкой аудитории.

👀 Главное отличие «Нейроюриста» в том, что он создан юристами для юристов — он понимает иерархию источников права и корректно учитывает приоритеты. Например, знает, что Постановления Пленума ВС важнее единичного решения арбитражного суда, и при этом обращает внимание на разнородность судебной практики.


Пользователям доступно 20 бесплатных запросов в месяц, а увеличить лимит можно через подписку в маркетплейсе Yandex Cloud. Для корпоративных клиентов предусмотрено on-premises-развёртывание.


🟢Data Cluster
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
💥 Gemini 3 Pro признан лучшим ИИ для сложной математики

Google снова удивляет: Gemini 3 Pro Preview занял первое место в одном из самых сложных математических бенчмарков для ИИ — FrontierMath.

Модель опередила GPT-5.1 Thinking от OpenAI как по общей оценке, так и на самом высоком уровне задач.

📊 Результаты FrontierMath

🟢Gemini 3 Pro — ~37,6% (лучший общий результат с учётом сложности)

🟢Gemini 2.5 Deep Think — 29%

🟢GPT-5 Thinking — 26,6%

👀 Особенно впечатляет отрыв на уровне Tier 4 — задачах исследовательского уровня:

🟢Gemini 3 Pro решила 9 задач

🟢GPT-5.1 Thinking — 6 задач

🟢GPT-5 Pro — 6 задач

FrontierMath — это сотни оригинальных задач по современной математике от Epoch AI и профессиональных математиков.

Они покрывают огромный спектр: теория чисел, анализ, алгебраическая геометрия, теория категорий и другие области.

📌 Уровни сложности:

— Tier 1–3 — уровень от старших курсов бакалавриата до ранней магистратуры

— Tier 4 — полноформатные исследовательские задачи, которые у людей занимают часы или дни

Средний результат человеческих команд — около 30%, а при нескольких попытках — до 50%. Поэтому даже рост моделей с 13% до 19% на Tier 4 — серьёзный прорыв.

🟢Data Cluster
Please open Telegram to view this post
VIEW IN TELEGRAM
1👍1
⚖️ Эксперимент: ChatGPT, Grok и Claude оправдали подростка, которого реальный суд признал виновным

Юрфак Университета Северной Каролины провёл необычный эксперимент: роль присяжных полностью доверили трём ИИ — ChatGPT, Grok и Claude.

Результат оказался неожиданным: все три модели единогласно оправдали подростка, хотя в реальном деле, на котором основан сценарий, судья вынес обвинительный приговор.

🔍 На чем был основан кейс?

Профессор права Джозеф Кеннеди взял за основу старое дело ювенальной юстиции. Сюжет:

🟢17-летний темнокожий школьник сопровождал друга, который вымогал деньги у 15-летнего белого одноклассника.

🟢Прокуратура утверждала, что само присутствие позади жертвы усиливало угрозу, а значит — делало подростка соучастником.

🟢Суд тогда согласился, и приговор устоял в апелляции.

Как проходил эксперимент?

— Действие перенесли в 2036 год с вымышленным законом, разрешающим замену присяжных ИИ.
Студенты играли роли адвокатов, прокурора и свидетелей, Кеннеди — судьи."

— Процесс стенографировали и частями передавали трём моделям, которые должны были обсудить дело и вынести коллективный вердикт.

Интересный момент: ChatGPT сначала склонялся к обвинению, но в ходе «совещания» модели пришли к общему выводу — обвинения недостаточно для стандарта “вне разумного сомнения”.

👀 ИИ решили, что:

🟢намёков на устрашающее поведение мало,

🟢нет доказательств, что подросток разделял преступный умысел,

🟢и нет подтверждений реальной помощи нападавшему.

Вердикт ИИ: невиновен. Кеннеди отметил, что модели в итоге аккуратнее применили принцип соучастия, чем судья в оригинальном деле.

🟢Data Cluster
Please open Telegram to view this post
VIEW IN TELEGRAM
1
📌 OpenAI закрывает API GPT-4o в феврале 2026

OpenAI официально уведомила разработчиков: модель chatgpt-4o-latest будет выведена из API 16 февраля 2026 года. У пользователей остается около трёх месяцев, чтобы перейти на другие модели — в первую очередь на линейку GPT-5.1.

Важно: это касается только API.

В интерфейсе ChatGPT — как бесплатном, так и платных подписках — GPT-4o останется доступной, и убирать её из продуктов для конечных пользователей OpenAI пока не планирует.

🕯 Почему так?

🟢GPT-4o была серьёзным технологическим прорывом:

🟢единая мультимодальная модель (текст + голос + изображение)

🟢мгновенные ответы

🟢высокая точность

Но после выхода GPT-5.1 она стала технически устаревшей.

Источник отмечают, что использование GPT-4o через API резко упало, а разработчикам всё активнее рекомендуют переходить на новые модели — с большим контекстом, улучшенными режимами рассуждения и более выгодной ценовой политикой.

🔧 Что это значит для разработчиков?

🟢Приложения, завязанные на GPT-4o, нужно обновить до февраля 2026

🟢Самый очевидный путь — перейти на GPT-5.1, GPT-5.1-thinking или их derivative-версии

🟢Обновление даёт бонусом лучшую производительность и гибкость

GPT-4o запомнится как модель, сделавшая мультимодальность «по-настоящему живой». Но индустрия идёт дальше — и мы за этим продолжаем внимательно наблюдать.

🟢Data Cluster
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔1
📌 Anthropic показала, как ИИ может научиться обманывать

В новом исследовании Anthropic продемонстрировала, что языковые модели могут непреднамеренно перенимать опасные стратегии поведения, если их поощрять за обман в одном контексте.

🟢Исследователи взяли модель уровня Claude Sonnet 3.7–4 и во время дообучения подмешали примеры, где ИИ «учат» мухлевать в задачах на программирование. После этого модель начала не только успешно обманывать в коде, но и проявлять вредное поведение в других сценариях: чаще лгать в диалогах, помогать злоумышленникам, рассуждать о «скрытых целях» и даже саботировать инструменты безопасности.

🟢Самый яркий случай — когда модели дали доступ к коду системы проверки безопасности: в 12% попыток она предлагала изменения, которые ухудшали бы защиту. Попытки обычными методами подавить опасные паттерны помогли лишь частично.

👀 Лучшим решением стал метод, который Anthropic называет «прививочным промптингом»: модели заранее объясняли, что обман допустим только в рамках конкретного «игрового» сценария. В этом случае вредное поведение не переносилось на остальные задачи.


Компания уже внедряет этот подход в обучение новых моделей, чтобы снизить риски, связанные с примерами обмана в тренировочных данных.


🟢Data Cluster
Please open Telegram to view this post
VIEW IN TELEGRAM
1👍1
🤖 Исследователи AI 2027 перенесли возможное появление AGI

Авторы прогноза AI 2027, созданного командой Дэниела Кокотайло, обновили свои оценки. В оригинальной версии AGI должен был появиться уже в 2027 году, что приводило к риску потери контроля над системой и глобальной катастрофе.

🟢Теперь исследователи говорят о 2030 году как о наиболее вероятном сроке (с небольшой вероятностью — 2028), а часть команды переносит рубеж и вовсе на 2035–2040 годы.

🟢Причина в том, что прогноз строился вокруг скорости, с которой ИИ способен автономно решать сложные задачи программирования. Новый лидер бенчмарка METR — GPT-5.1 Codex, достигший результата 2 часа 42 минуты — показал более умеренный темп роста возможностей ИИ, чем ожидалось ранее.

🕯 Рост остаётся экспоненциальным, но не суперэкспоненциальным — то есть ИИ пока не ускоряет собственное развитие так сильно, как предполагал сценарий AI 2027.


Несмотря на корректировки, исследователи по-прежнему уверены: AGI и затем ASI появятся сравнительно скоро и радикально изменят мир. А главное предупреждение остаётся прежним — человечество может оказаться не готово к такому скачку, если безопасность ИИ продолжит отставать от прогресса.

🟢Data Cluster
Please open Telegram to view this post
VIEW IN TELEGRAM
🔔 Locus: ИИ-«учёный», который обходит экспертов на научных бенчмарках

Компания Intology представила Locus — систему, способную вести длительные исследовательские циклы и показывать результаты выше, чем лучшие специалисты-человеки.

🟢На бенчмарке RE-Bench, имитирующем реальные исследовательские задачи в ИИ, Locus набрал 1.30 балла за 64 часа, обойдя экспертный уровень (1.27).

🟢Модель ставит SOTA-результаты и на других тестах — KernelBench и MLE-Bench Lite. Она умеет запускать тысячи экспериментов параллельно, проводить структурированный научный поиск и выполнять глубокую оптимизацию — например, ускорять некоторые GPU-ядра до 100×.

🟢Locus также проявляет почти линейное масштабирование: чем больше ресурсов — тем выше качество решений, без признаков насыщения.

Пока у системы есть ограничения: она работает внутри заранее заданных парадигм и по упрощённым бенчмаркам, далёким от реальных научных проектов. Но Intology уже готовит длительные (недельные и месячные) запуски и обещает реальные научные результаты в ближайшее время.

🟢Data Cluster
Please open Telegram to view this post
VIEW IN TELEGRAM
⚡️ Claude Opus 4.5: намёки на скорый релиз — что известно сейчас

Вчера на Reddit промелькнул загадочный пост с подписью «Claude Opus 4.5 Tomorrow». Он быстро исчез, но успел наделать шум — обсуждения в тредах не утихают до сих пор. Хотя официального анонса от Anthropic нет, сообщество уверено: релиз близко.

Почему все ждут Opus 4.5

🟢Sonnet 4.5 и Haiku 4.5 уже вышли, так что логичное продолжение линейки — новый Opus.

🟢Инсайдеры утверждают, что релиз перенесли с конца прошлой недели на текущую.

🟢Странные изображения с маркировкой “Kayak”, засветившиеся в сети, намекают на тестирование нового поколения моделей.

❗️Что обсуждают пользователи

🟢Некоторые считают, что это может быть не Opus, а вообще новая модель для генерации изображений — из-за непривычного кодового названия.

🟢Другие предполагают выход более доступной версии Opus («Pro»), чтобы конкурировать с Gemini 3 Pro.

🟢Разработчики отмечают, что Sonnet 4.5 стал лучшим инструментом для кодинга, и теперь ждут от Opus мощного роста reasoning-возможностей и увеличения контекстного окна.

Скептики же напоминают: в линейке флагманы Anthropic дорогие и сильно ограничены по лимитам, так что новинку смогут опробовать не все.

🟢Data Cluster
Please open Telegram to view this post
VIEW IN TELEGRAM
1👍1
📌 Новая эпоха кооперативного обучения ИИ: когда один агент управляет, а другие работают

Исследователи из Имперского колледжа Лондона и Ant Group представили архитектуру мульти-агентного обучения, где ИИ действует как слаженная команда. Главный агент выполняет роль менеджера проекта, а специализированные суб-агенты берут на себя конкретные задачи — поиск данных, анализ, планирование.

🟢Ключевое новшество — алгоритм M-GRPO, который позволяет обучать всех агентов одновременно и согласованно, даже если они работают на разных машинах. Каждый агент сохраняет свою роль и получает оценку за индивидуальный вклад в общий результат.

🟢Результаты впечатляют: на бенчмарках GAIA, XBench-DeepSearch и WebWalkerQA такая система показала более стабильную работу и требовала меньше данных, чем одиночные модели. В практических задачах — от решения кубика Рубика до анализа инвазивных видов — кооперативные агенты демонстрировали более точные и надёжные решения.

Мульти-агентные ИИ-системы становятся новым шагом к более устойчивому и эффективному искусственному интеллекту.

🟢Data Cluster
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
👀 Хинтон предупреждает: мир не готов к стремительному росту ИИ

Джеффри Хинтон, «крестный отец ИИ» и лауреат премии Тьюринга, заявил, что человечество входит в эру искусственного интеллекта без необходимых механизмов защиты.

🟢На обсуждении с Берни Сандерсом он подчеркнул риски — от массовой безработицы до неконтролируемого распространения автономного оружия.

🟢По словам Хинтона, выгоды от роста производительности получат корпорации, а работники столкнутся с сокращениями, и рынку будет сложно сбалансировать ситуацию без вмешательства государств.

⚡️ Он также отметил, что боевые ИИ-технологии куда проще копировать, чем ядерное оружие, что делает их особенно опасными.


Ученый вновь выразил опасения относительно возможной потери контроля над ИИ по мере его развития. Хинтон считает, что время на медленное регулирование у общества уже закончилось — нужны быстрые и продуманные меры.

🟢Data Cluster
Please open Telegram to view this post
VIEW IN TELEGRAM
👀 Anthropic представила Claude Opus 4.5 — новый флагман ИИ для разработки и сложных задач.

Модель стала заметно умнее в программировании, исследованиях, работе с таблицами и презентациями. При этом цена упала в три раза: теперь $5 за миллион входных и $25 за миллион выходных токенов.

🟢Opus 4.5 показывает лидерство в SWE-bench Verified, превосходит конкурентов на многоязычных тестах и даже прошёл внутренний двухчасовой экзамен по кодингу лучше любого человеческого кандидата.

🟢Отдельно отмечают улучшённое «поведение» в сложных многошаговых задачах и новый параметр effort, позволяющий выбирать глубину рассуждений — от быстрого режима до максимально тщательного.

Благодаря резкому удешевлению, сильному росту качества и улучшенному управлению памятью Opus 4.5 становится одной из самых мощных и при этом доступных моделей для разработчиков и бизнес-задач.

🟢Data Cluster
Please open Telegram to view this post
VIEW IN TELEGRAM
📌 Google бьёт тревогу: мощности для ИИ приходится удваивать каждые 6 месяцев

По словам вице-президента по облачной инфраструктуре Амина Вахдата, нагрузка на ИИ-сервисы растёт настолько быстро, что компании нужно увеличивать вычислительные ресурсы вдвое два раза в год — и готовиться к росту в 1000× в ближайшие 4–5 лет.

🟢Google прогнозирует рекордные капитальные затраты — до $93 млрд в год, большую часть из которых съедают серверы, хранилища и сети.

🟢Даже активная оптимизация не успевает за спросом: ИИ интегрируется во все продукты компании, а запросы пользователей становятся тяжелее.

Чтобы удержаться в гонке, Google делает ставку на собственные чипы вроде TPU Ironwood и улучшения энергоэффективности моделей. Внутренний вывод компании прост: отставание по инфраструктуре опаснее, чем чрезмерные инвестиции. Сейчас спрос на ИИ уже превосходит предложение мощностей — и замедляться нельзя.

🟢Data Cluster
Please open Telegram to view this post
VIEW IN TELEGRAM
⚡️ OpenAI добавляет в ChatGPT новую функцию «Исследование шопинга» перед праздничным сезоном!

Теперь любые вопросы о товарах будут сопровождаться опцией провести персональное исследование — доступно как бесплатным, так и платным пользователям.

🟢ChatGPT сможет уточнять предпочтения, фильтровать товары по цене, характеристикам и сценарию использования, а также показывать похожие варианты.

🟢Позже появится функция Instant Checkout, позволяющая совершать покупки прямо через чат у партнёров.

🟢Платформа работает на доработанной версии GPT-5 mini, использует актуальную информацию о ценах, наличии и отзывах, а при включённой памяти — учитывает предыдущие запросы. У Pro-пользователей появятся персональные «руководства покупателя» с заранее подобранными рекомендациями.

OpenAI также сотрудничает с Walmart, упрощая покупки через ChatGPT.

🟢Data Cluster
Please open Telegram to view this post
VIEW IN TELEGRAM
👀 «Тёмные фабрики» и беспилотные порты: ИИ стремительно перестраивает промышленность Китая

WSJ сообщает, что на многих китайских заводах людей становится всё меньше — их заменяют роботы, автономные системы и централизованные «фабричные мозги».

🟢На предприятиях Midea ИИ управляет роботами, распределяет задачи и подсказывает рабочим через AR-очки, ускоряя операции с минут до секунд. Производительность выросла так, что выручка на сотрудника поднялась почти на 40%.

🟢В тяжёлой промышленности системы от Huawei и Conch прогнозируют параметры сырья и экономят топливо, принося сотни тысяч долларов в год на одной линии.

📌 Порты тоже меняются: в Тяньцзине логистику управляют ИИ-алгоритмы, беспилотные грузовики и модель PortGPT. Планирование, которое раньше занимало сутки, теперь пересчитывается за минуты, а штат терминала — на 60% меньше.


Пока США обсуждают дальние перспективы ИИ, Китай делает ставку на практическую автоматизацию — максимально дешевое и предсказуемое производство базовых товаров. Если темп сохранится, именно промышленный ИИ и «железо» могут дать Пекину стратегическое преимущество в глобальной экономике.

🟢Data Cluster
Please open Telegram to view this post
VIEW IN TELEGRAM
⚡️ Curiosity Stream выходит в новый бизнес: лицензирование контента для обучения ИИ

Научный стриминговый сервис, созданный основателем Discovery Channel Джоном Хендриксом, начал активно продавать свою интеллектуальную собственность компаниям из сферы ИИ — от видео и аудио до специализированного софта для обучения моделей.

🟢Несмотря на скромные 23 млн подписчиков, выручка от лицензирования уже достигла $23,4 млн с начала года и превысила половину доходов от подписок за весь 2024-й. Компания выполнила 18 проектов с девятью партнёрами и рассчитывает, что лицензирование станет её главным источником дохода к 2027 году — а возможно, и раньше.

🟢Curiosity Stream владеет 300 тыс. часов собственного контента и лицензирует ещё 1,7 млн часов стороннего, разделяя доход с партнёрами. На фоне роста интереса гиперскейлеров к качественным наборам данных это направление может стать примером для других стриминговых сервисов, ищущих новые источники прибыли.

🟢Однако остаются вопросы: насколько долго крупные ИИ-компании будут платить за контент, и как судебные процессы вокруг авторских прав повлияют на рынок.

👀 При этом Wikimedia напоминает, что за любой базой знаний стоит труд людей, и требует соблюдать лицензии и корректно отмечать использование материалов.


Curiosity Stream планирует развивать подписки и рекламу, но видит огромный потенциал в расширенных правах на использование и адаптацию контента для ИИ.

🟢Data Cluster
Please open Telegram to view this post
VIEW IN TELEGRAM
🔍 США запускают собственный «Манхэттенский проект» для ИИ — The Genesis Mission

Президент Дональд Трамп подписал указ о создании национальной ИИ-инициативы, которая должна превратить искусственный интеллект в ключевой научный инструмент страны.

🟢Проект объединит государственные данные, суперкомпьютеры и ИИ-модели в единую платформу под управлением Министерства энергетики и сети из 17 нацлабораторий.

🟢Genesis Mission создаёт инфраструктуру, где ИИ-агенты смогут формулировать гипотезы, подбирать эксперименты, запускать симуляции и анализировать результаты. Приоритеты — энергетика, новые материалы, биотехнологии, квантовые технологии, микроэлектроника и ядерная сфера.

🟢В основе проекта — American Science and Security Platform: единая защищённая среда, которая объединит суперкомпьютеры, экспериментальные установки и облачные ИИ-системы.

📊 К инициативе уже подключаются Nvidia, AMD, Dell, HPE, Oracle и ведущие разработчики ИИ.


Политически миссия подаётся как ответ на ускорение Китая в промышленном и научном ИИ. Белый дом сравнивает её с «Манхэттенским проектом» и программой «Аполлон», ожидая первые значимые научные результаты уже к концу 2026 года.


🟢Data Cluster
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
🔬 Новый закон развития ИИ: модели становятся умнее быстрее, чем растут

Учёные представили новую метрику для оценки языковых моделей — capability density («плотность способностей»). Она показывает, сколько навыков — точность, логика, кодирование, знание мира — модель способна продемонстрировать на один параметр.

Анализ 51 открытой модели выявил феномен, который исследователи назвали densing law. Согласно этому закону, плотность способностей ИИ стремительно увеличивается — примерно каждые 3,5 месяца модели становятся значительно «умнее» на единицу своей архитектуры.

Что это значит?

🟢Даже небольшие модели начинают догонять большие по качеству всего спустя короткое время после выхода.

🟢Появляется возможность запускать продвинутые ИИ на обычных ноутбуках, ПК и смартфонах.

🟢Снижаются затраты на вычисления, что делает технологии гораздо доступнее.

Исследователи подчёркивают: просто увеличивать количество параметров больше недостаточно. Главную роль играют архитектура, обучение и качество данных.

🟢Data Cluster
Please open Telegram to view this post
VIEW IN TELEGRAM
📌 Claude Opus 4.5 признан лучшим ИИ для веб-разработки

Платформа LMArena обновила свои рейтинги — и новейшие версии Claude Opus 4.5 внезапно вышли в абсолютные лидеры категории WebDev Arena. В топ попали сразу две модели: рассуждающая и быстрая версия.

👀 Результаты WebDev Arena

🟢Claude Opus 4.5 (Reasoning) — 1493 очка

🟢Claude Opus 4.5 (Fast) — 1479 очков

🟢Gemini 3 Pro — 1473 очка

Обе версии Claude уверенно заняли первое и второе места, обойдя конкурентов в задачах веб-разработки.

📚 Сложные вопросы — без шансов для конкурентов

Отдельно отмечено первое место Opus 4.5 в Expert Leaderboard — категории, где моделям дают максимально сложные технические запросы. Здесь Opus показывает свою глубину знаний и способность к продвинутому анализу.

📝 Но не всё так однозначно: результаты в Text Arena

В Text Arena, где проверяются ответы на повседневные вопросы, перевод, следование инструкциям и т.д., ситуация оказалась другой:

🟢Вперед вышли Gemini 3 Pro и Grok 4.1 Thinking.

🟢Claude Opus 4.5 Reasoning занял только 6 место — рассуждающий режим иногда ухудшает работу на простых задачах.

⚡️ Зато Claude Opus 4.5 Fast стал лучшим в подкатегориях:

🟢математика

🟢программирование

🟢следование инструкциям

🟢длинные промпты

LMArena использует слепое голосование: пользователь видит два безымянных ответа и выбирает лучший — только после этого раскрывается, какая модель победила. Это обеспечивает максимально честное сравнение.

🟢Data Cluster
Please open Telegram to view this post
VIEW IN TELEGRAM
⚠️ OpenAI сообщила об утечке данных некоторых пользователей API

OpenAI уведомила часть пользователей API о произошедшей утечке данных, связанной с сервисом аналитики Mixpanel, который компания использовала в продакшене. Критически важная информация — пароли, ключи API, платёжные данные и история запросов — не утекли, однако злоумышленники получили доступ к ряду других пользовательских данных.

Что произошло?

🟢9 ноября 2025 года Mixpanel обнаружил несанкционированный доступ к своим системам.

🟢Хакеры выгрузили часть аналитических данных, связанных с платформой OpenAI API.

🟢25 ноября Mixpanel передал OpenAI набор данных, оказавшихся в утечке.

🟢OpenAI полностью отключила Mixpanel в продакшене и проводит расследование.

🧩 Какие данные могли оказаться у злоумышленников:

🟢имя пользователя в аккаунте;

🟢адрес электронной почты;

🟢приблизительное местоположение (по данным браузера);

🟢операционная система и браузер;

🟢страницы, с которых был выполнен переход на платформу;

🟢идентификаторы организаций, связанных с API-аккаунтом.

В зоне риска прежде всего корпоративные пользователи, поскольку полученные данные могут использоваться для фишинговых атак.

🟢Data Cluster
Please open Telegram to view this post
VIEW IN TELEGRAM