Платформа LMArena обновила свои рейтинги — и новейшие версии Claude Opus 4.5 внезапно вышли в абсолютные лидеры категории WebDev Arena. В топ попали сразу две модели: рассуждающая и быстрая версия.
Обе версии Claude уверенно заняли первое и второе места, обойдя конкурентов в задачах веб-разработки.
Отдельно отмечено первое место Opus 4.5 в Expert Leaderboard — категории, где моделям дают максимально сложные технические запросы. Здесь Opus показывает свою глубину знаний и способность к продвинутому анализу.
В Text Arena, где проверяются ответы на повседневные вопросы, перевод, следование инструкциям и т.д., ситуация оказалась другой:
LMArena использует слепое голосование: пользователь видит два безымянных ответа и выбирает лучший — только после этого раскрывается, какая модель победила. Это обеспечивает максимально честное сравнение.
Please open Telegram to view this post
VIEW IN TELEGRAM
OpenAI уведомила часть пользователей API о произошедшей утечке данных, связанной с сервисом аналитики Mixpanel, который компания использовала в продакшене. Критически важная информация — пароли, ключи API, платёжные данные и история запросов — не утекли, однако злоумышленники получили доступ к ряду других пользовательских данных.
🧩 Какие данные могли оказаться у злоумышленников:
В зоне риска прежде всего корпоративные пользователи, поскольку полученные данные могут использоваться для фишинговых атак.
Please open Telegram to view this post
VIEW IN TELEGRAM
Alibaba официально запустила продажи умных очков Quark в Китае, обозначив серьёзный заход на рынок носимых устройств, где до сих пор уверенно доминировала *Meta. Новинка стоит 1 899 юаней (примерно 268 долларов) и внешне практически не отличается от обычных очков — лёгкая пластиковая оправа, минимализм и привычный форм-фактор.
Главное — возможности.
Quark работают на базе собственной ИИ-модели Qwen и предлагают набор функций, которые делают устройство полноценным ассистентом для повседневных задач:
Аналитики считают запуск Quark стратегическим шагом: Alibaba стремится обеспечить себе «трафиковый вход» в эпоху ИИ-носимых устройств на фоне усиления конкуренции в китайской e-commerce.
👀 Однако пока рано делать прогнозы — несмотря на растущий рынок умных очков в Китае, Meta всё ещё удерживает крупнейшую долю в сегменте XR/VR.
Будет интересно наблюдать, сможет ли Alibaba перевернуть рынок и превратить Quark в массовый повседневный гаджет.
Please open Telegram to view this post
VIEW IN TELEGRAM
Одна из крупнейших конференций по машинному обучению — ICLR-2026 — столкнулась с беспрецедентной ситуацией: рецензирование работ оказалось массово «захвачено» нейросетями.
По данным анализа Pangram Labs, 21% всех отзывов на статьи — это полностью сгенерированные ИИ рецензии. Более 50% содержали заметные следы машинного редактирования.
Но это лишь половина проблемы.
Система научного рецензирования оказалась не готова к эпохе массового применения ИИ. Рецензентов не хватает, поток статей растёт, а часть экспертов всё чаще делегирует работу моделям. Кейс ICLR-2026 — болезненный, но важный стресс-тест. Он вынуждает научное сообщество ответить на вопрос: Какой уровень участия ИИ мы готовы считать допустимым в оценке исследований по ИИ?
Please open Telegram to view this post
VIEW IN TELEGRAM
Лукаш Кайзер — один из создателей архитектуры трансформера и исследователь OpenAI — в свежем выпуске The MAD Podcast рассказал, что темпы прогресса в ИИ остаются стабильными.
Снаружи может казаться, что «чудеса» стали появляться реже, но, по словам Кайзера, кривая развития всё ещё выглядит как ровная экспонента: модели постоянно становятся точнее, надёжнее и универсальнее.
Несмотря на общий прогресс, ИИ всё ещё часто ошибается там, где ребёнок справится без труда:
Когда ИИ научится «думать» лучше, люди смогут меньше заниматься рутиной — и больше стратегией, выбором направления и творческими идеями. “ИИ не отменяет человека — он меняет место, где человек приносит наибольшую пользу”, — подытожил Кайзер.
Please open Telegram to view this post
VIEW IN TELEGRAM
SemiAnalysis сообщает: у доминирования Nvidia появился реальный конкурент. Google вывела свои TPU v7 Ironwood на рынок — именно на них обучались Gemini 3 и Claude 4.5 Opus, причём по эффективности они не уступают решениям Nvidia.
Главный кейс — сделка Google и Anthropic на 1 млн TPU v7.
Около 400 тыс. чипов поставит Broadcom в виде готовых стоек, ещё 600 тыс. Anthropic будет арендовать через Google Cloud.
Высокий коэффициент использования FLOP (MFU ≈ 40% против ~30% у конкурентов) — ключевой фактор, делающий TPU выгоднее в реальных задачах обучения.
👀 Именно поэтому Anthropic смогла втрое снизить цену API Opus 4.5 — при этом, по оценкам, её выручка даже выросла.
У Nvidia пока сохраняется преимущество благодаря экосистеме CUDA и огромному набору библиотек. Но SemiAnalysis считает: рост TPU и появление «неоклаудов» ставят под угрозу монополию и вынуждают Nvidia снижать свои рекордные наценки.
Please open Telegram to view this post
VIEW IN TELEGRAM
На Google Cloud Next и OpenAI Dev Day обе компании показали, что ИИ перестал быть просто средством автоматизации — он стал стратегическим ресурсом, влияющим на продажи, маркетинг и взаимодействие с клиентами.
🕯 Обе компании сходятся в главном: успех зависит не только от технологий, но и от изменений внутри организации. Обучение сотрудников, пересмотр процессов и ответственная этическая стратегия становятся ключевыми.
Компании, которые игнорируют влияние ИИ, рискуют быстро потерять конкурентное преимущество — скорость и точность решений на базе ИИ становятся новым стандартом рынка.
Please open Telegram to view this post
VIEW IN TELEGRAM
Патентное ведомство США (USPTO) представило новые рекомендации по тому, как оценивать изобретения, созданные с использованием искусственного интеллекта. Теперь ИИ официально рассматривается как инструмент, а не соавтор — аналог лабораторного оборудования или ПО.
Американские суды уже решили, что ИИ не обладает правом на патент. Но остаётся ключевой вопрос: когда именно человек, использующий ИИ, может считаться автором изобретения?
Please open Telegram to view this post
VIEW IN TELEGRAM
Стартап Влада Тенева и Тюдора Ахима создает Aristotle — специализированный математический суперразум, который сочетает нейросеть и формальную систему доказательств Lean4.
Полученные инвестиции компания направит на расширение возможностей Aristotle и выход за пределы чистой математики — в финтех, проверку кода, инженерные расчёты и научные исследования, где особенно важна точность.
Please open Telegram to view this post
VIEW IN TELEGRAM
Microsoft представила Fara-7B — лёгкую визуальную модель ИИ, способную автоматизировать действия в пользовательских интерфейсах, опираясь только на скриншоты.
— 73,5% успеха в тесте WebVoyager — выше, чем у UI-TARS-1.5-7B и даже GPT-4o в этой задаче.
— 62% по независимой оценке Browserbase.
— В среднем 16 шагов на задачу против 41 у конкурентов.
Fara-7B показывает, что компактные модели могут быть не менее эффективными, если обучены на хорошо структурированных данных и оптимизированы под реальный пользовательский опыт.
Please open Telegram to view this post
VIEW IN TELEGRAM
Google впервые начинает активно продавать свои TPU сторонним компаниям, превращая внутреннюю технологию в полноценный рыночный продукт — и этим напрямую бросает вызов Nvidia.
Аналитики SemiAnalysis формулируют это так: «Чем больше TPU вы покупаете, тем больше капитальных затрат на графические процессоры Nvidia вы экономите».
Please open Telegram to view this post
VIEW IN TELEGRAM
Федеральный судья в Нью-Йорке постановила, что OpenAI должна предоставить внутренние переписки о том, почему компания удалила датасеты Books1 и Books2 — наборы, собранные из пиратских книг LibGen. Эти данные, по версии истцов, использовались для обучения GPT-3 и GPT-3.5.
Для OpenAI это опасный прецедент: переписки могут показать масштабы использования пиратских книг и то, насколько компания осознавала юридические риски. Подобные материалы уже привели к крупному делу против Anthropic, закончившемуся мировым соглашением на ~$1,5 млрд.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤1
Павел Дуров объявил о запуске Cocoon — распределённой сети, которая обеспечивает безопасные ИИ-вычисления с полной конфиденциальностью запросов. Уже сейчас часть автоматических переводов в Telegram обрабатывается через Cocoon, то есть сеть работает в продакшене.
Cocoon делает TON-экосистему ближе к миру децентрализованных ИИ-сервисов — с приватностью, экономикой и реальным практическим применением.
Please open Telegram to view this post
VIEW IN TELEGRAM
Свежие данные Similarweb показывают: искусственный интеллект перестал быть экспериментом — он становится фундаментальным слоем интернета. Только в сентябре 2025 года ИИ-платформы собрали около 7 млрд визитов, что уже сопоставимо с трафиком крупнейших соцсетей. Это +76% за год.
🤖 Главный двигатель этого роста — ChatGPT. Его трафик поднялся с 19 млн визитов в 2022 году до 5,9 млрд в сентябре 2025-го, что выводит сервис в топ-5 сайтов мира рядом с Instagram (6,5 млрд визитов). Несмотря на усиление конкурентов — Gemini, Claude, Perplexity — ChatGPT удерживает около 80% всех мировых посещений GenAI-сервисов.
ИИ стремительно превращается в новую инфраструктурную платформу — наравне с соцсетями и облачными сервисами.
Please open Telegram to view this post
VIEW IN TELEGRAM
Исследователи из Принстона выяснили, почему человек так легко переносит навыки из одной задачи в другую, а ИИ — нет. Наш мозг не учится каждый раз с нуля: префронтальная кора собирает новое поведение из готовых “модулей”, как из Лего.
Понимание “когнитивных Лего” может помочь создать ИИ, который накапливает знания, а также открыть новый путь в терапии расстройств, связанных с нарушением когнитивной гибкости.
Please open Telegram to view this post
VIEW IN TELEGRAM
OpenAI включила режим code red — впервые с момента появления ChatGPT компания ощущает давление конкурентов. Альтман потребовал сосредоточить ресурсы на улучшении модели и временно отложить планы по рекламе.
❗️ Gemini набирает сотни миллионов пользователей, Claude укрепляется в нише разработки — и впервые именно OpenAI приходится догонять.
Гонка ИИ снова ускоряется. И на этот раз лидерство уже не выглядит гарантированным.
Please open Telegram to view this post
VIEW IN TELEGRAM
Huawei выпустила Smart Hanhan — мягкую игрушку с ИИ, которая умеет распознавать слова, эмоции, жесты и прикосновения.
Умные гаджеты теперь становятся и мягкими — буквально.
Please open Telegram to view this post
VIEW IN TELEGRAM
Потребление вырастет в 2,5 раза — до 2,5–4 ГВт. Это потребует масштабных инвестиций: оценки доходят до 6 трлн рублей, хотя часть экспертов считает цифру завышенной.
Специализированные ИИ-кластеры пока могут строить лишь единичные компании. Основной спрос, по мнению Selectel, приходится на стойки мощностью 5–7 кВт. В регионах, напротив, наблюдается избыток электромощностей — но меньший спрос на ЦОД.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤1👍1
Джаред Каплан, один из авторов законов масштабирования и главный ученый Anthropic, считает: к 2030 году человечество окажется перед решением, которого раньше не было — разрешить ли ИИ самостоятельно улучшать себя.
По его прогнозу, ИИ человеческого уровня появится уже через 2–3 года. Следующий шаг — рекурсивное самообучение: система проектирует более мощную версию себя, потом ещё одну, и так до бесконечности.
Каплан предупреждает: «Вы не знаете, где он остановится».
При этом Каплан не апокалиптик: он верит в огромный позитивный потенциал ИИ, но считает, что обсуждать самый опасный сценарий нужно до, а не после того, как станет поздно.
Please open Telegram to view this post
VIEW IN TELEGRAM
Amazon представила AWS AI Factories — решение, которое позволяет установить полноценную инфраструктуру для ИИ прямо в дата-центре заказчика. Компания предоставляет помещение и электропитание, остальное делает AWS: ставит оборудование, настраивает сети, безопасность, хранилища и подключает сервисы вроде Bedrock и SageMaker.
На фоне растущего спроса на вычисления такие решения могут стать стандартом для корпораций и госструктур, которым критичны приватность и контроль над данными.
Please open Telegram to view this post
VIEW IN TELEGRAM
По инсайдерским данным, на платформе Design Arena началось тестирование четырёх экспериментальных моделей, которые, предположительно, разрабатывает OpenAI: Emperor (512), Rockhopper (64), Macaroni (16) и Mumble (0) — отличающихся уровнем вычислительного «Juice» для рассуждений.
👀 Обычно такие тесты проходят за 1–2 недели до релиза, что совпадает с утечками The Information о скором появлении новой модели в ChatGPT. По слухам, разработка ведётся под кодовым названием Shallotpeat, цель — исправить недоработки GPT-5 и вывести рассуждения выше уровня Gemini 3 Pro и Claude Opus 4.5.
Параллельно OpenAI трудится над другой моделью — Garlic, которая должна выйти в начале следующего года. По словам Марка Чена, в ней тестируют технологию, позволяющую «вливать» знания крупной архитектуры в более компактную модель — без роста стоимости.
Please open Telegram to view this post
VIEW IN TELEGRAM