Data Cluster – Telegram
Data Cluster
69 subscribers
923 photos
6 videos
889 links
Хостинг и продажа оборудования для искусственного интеллекта!

Сайт — https://data-cluster.ru/
Отдел продаж - @TK_MiningCluster
Download Telegram
📌 Новый бенчмарк показывает: лишь три ИИ реже галлюцинируют, чем отвечают правильно

Исследовательская команда Artificial Analysis представила AA-Omniscience — бенчмарк для оценки галлюцинаций ИИ, который учитывает не только точность ответов, но и способность моделей честно говорить «не знаю».

Результаты получились неожиданно жёсткими: только три модели смогли дать больше правильных ответов, чем неправильных — и все они принадлежат линейке Claude.

🥇 Лидеры AA-Omniscience

🟢Claude 4.5 Haiku — около 26% неверных ответов среди всех неудачных попыток.
2–3. Claude 4.5 Sonnet и Claude 4.1 Opus — по 48%.

🟢Все остальные модели, включая Grok 4 и GPT-5 (high), ошибаются чаще, чем отвечают верно — не потому что хуже знают, а потому что предпочитают угадать, а не отказаться.

Как устроен бенчмарк

🟢6000 вопросов по 42 темам и 6 областям: медицина, право, бизнес, инженерия, IT, гуманитарные и соцнауки.

🟢Источники — актуальные и авторитетные.

🟢Вопросы — короткие, однозначные.

🟢Поиск и инструменты отключены: проверяется только то, что уже «вшито» в модель.

📊 Метрики оценки

🟢Accuracy — долю правильных ответов.

🟢Hallucination Rate — долю неправильных среди всех неверных попыток.

🟢Omniscience Index — интегральная оценка, где ценится не только знание, но и самокритичность.

🟢Отказ от ответа не штрафуется — наоборот, считается здоровым поведением.

По мнению авторов и в соответствии с недавним исследованием OpenAI, текущие методы обучения поощряют модели за правильные ответы, но не наказывают за неправильные. В итоге угадывание становится выгодной стратегией — даже если шанс попасть в цель минимален.

🟢Data Cluster
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
🌦 Google представила WeatherNext 2 — новый уровень ИИ-прогнозирования погоды

Google DeepMind и Google Research выпустили крупное обновление своей флагманской системы прогнозирования — WeatherNext 2. Это не просто улучшенная модель, а полноценный климатический симулятор, способный предсказывать погоду быстрее, точнее и глубже, чем когда-либо раньше.

👀 Главные особенности WeatherNext 2:

🟢В 8 раз быстрее предыдущей версии

🟢Поддержка прогноза с шагом в 1 час

🟢Основой стала архитектура Functional Generative Network, которая добавляет шум в модель и позволяет генерировать множество правдоподобных сценариев развития погоды

🟢Прогнозы становятся не усреднёнными, а физически связными и вариативными

🟢Набор сценариев генерируется менее чем за минуту на одном TPU, тогда как традиционные модели требуют суперкомпьютеров и часов работы

🟢ИИ самостоятельно научился собирать отдельные показатели в сложные структуры — циклоны, фронты и другие атмосферные явления

🟢WeatherNext 2 превосходит предыдущее поколение по 99,9% метеопараметров на горизонте до 15 дней

🌍 Где уже работает WeatherNext 2:

— Earth Engine

— BigQuery

— Поиск Google

— Gemini

— Pixel Weather

— Weather API (Google Maps)

А в ближайшие недели обновлённая система появится и в Google Maps, сделав высокоточные прогнозы частью привычных инструментов миллионов пользователей.

🟢Data Cluster
Please open Telegram to view this post
VIEW IN TELEGRAM
🚀 Google запустила Antigravity — бесплатную среду для «вайб-кодинга» на базе Gemini 3 Pro

Вместе с релизом Gemini 3 Pro Google представила новый инструмент для разработчиков — Antigravity. Это бесплатная среда программирования, построенная вокруг агентного подхода: вместо одного ассистента здесь работают сразу несколько ИИ, которые умеют писать код, управлять терминалом и пользоваться браузером.

💡 Как работает Antigravity

🟢Внутри среды находится набор агентов, которым доступны привычные разработчику инструменты:

🟢редактор кода,

🟢встроенный терминал,

🟢браузер.

⚡️ Вы формулируете цель на естественном языке — например, «добавь функцию», «почини баг», «подготовь релиз». После этого агенты сами:

🟢составляют план,

🟢правят файлы,

🟢запускают команды,

🟢гоняют тесты,

🟢открывают нужные страницы в браузере,

🟢и параллельно ведут несколько задач в разных рабочих пространствах.

Все процессы отображаются в удобной панели: видно, какой агент чем занят и к какому результату он пришёл.

📌 Google продвигает новую парадигму: разработчик описывает желаемое поведение словами, а ИИ превращает это в цепочку подзадач и сам проходит путь от плана до результата. Пользователь остаётся архитектором и ревьюером, а рутинную работу берёт на себя ИИ. Каждый шаг сопровождается артефактами — логами, диффами, заметками и мини-отчётами.


Antigravity уже доступна в публичном превью, полностью бесплатна и предлагает «щедрые» лимиты на использование Gemini 3 Pro. При этом среда поддерживает и другие модели — от Claude до GPT-OSS, но в пределах их тарифных ограничений.


🟢Data Cluster
Please open Telegram to view this post
VIEW IN TELEGRAM
☁️ Cloudflare купила платформу для хостинга нейросетей Replicate

Cloudflare объявила о покупке Replicate — популярной облачной платформы для хостинга и запуска моделей машинного обучения. Сделка должна значительно расширить возможности Workers AI, превратив её в более универсальную и гибкую среду для ИИ-разработчиков.

Replicate позволяет разворачивать модели ИИ в Docker-контейнерах через инструмент Cog и запускать их в облаке. Разработчики получают к ним доступ через API, а всё вычисление происходит на стороне платформы.

В Replicate уже есть тысячи готовых моделей и файнтюнов — для генерации текста, видео, работы с изображениями и множества других задач.

Всё это доступно через единый API, который работает даже с проприетарными нейросетями, так что не нужно адаптироваться под разных провайдеров.

👀 Для текущих пользователей Replicate — ничего:

🟢пайплайны продолжат работать,

🟢каталог моделей сохранится,

🟢бренд остаётся,

🟢а производительность вырастет благодаря инфраструктуре Cloudflare.

Что получит Workers AI

🟢Cloudflare интегрирует Replicate в свою платформу, что даст пользователям:

🟢доступ ко всему каталогу моделей Replicate,

🟢возможность запускать собственные модели в контейнерах,

🟢инструменты для файнтюна,

🟢и новые функции за счёт расширения инфраструктуры.

Cloudflare фактически превращает Workers AI в полноценную платформу для ИИ-разработки с огромным выбором моделей и гибким окружением — шаг, который может заметно изменить ландшафт облачных ИИ-сервисов.

🟢Data Cluster
Please open Telegram to view this post
VIEW IN TELEGRAM
1
📌 Линус Торвальдс: вайб-кодинг — неплох для старта, но «ужасен» для поддержки

На саммите Linux Foundation Open Source в Сеуле Линус Торвальдс поделился своим мнением о вайб-кодинге, ИИ и текущем состоянии разработки ядра Linux.

Несмотря на то что сам он не использует вайб-кодинг, Торвальдс признался, что относится к нему «довольно позитивно»: как к способу быстро получить новый функционал или результаты, которые иначе было бы сложно достичь. Но есть и серьёзный минус — такой код практически невозможно сопровождать. Поэтому для разработки ядра Linux подход не подходит.

🟢Об изменениях в роли

Торвальдс отметил, что уже «почти 20 лет не программист» и его работа сместилась от постоянных «нет» к необходимости говорить «да» нововведениям — в том числе Rust, который постепенно становится полноценной частью ядра, несмотря на сопротивление некоторых старых разработчиков.

🟢Об ИИ и его влиянии

— Позитив: Nvidia стала активнее участвовать в работе над ядром благодаря ИИ-буму.

— Негатив: поисковые боты разрушают инфраструктуру, выкачивая данные с kernel org.

— Общий взгляд: ИИ — всего лишь инструмент, как когда-то компиляторы; профессия программиста никуда не исчезнет.

— Торвальдс также отметил, что ждёт времени, когда ИИ станет просто обычным инструментом, а не предметом бесконечного хайпа. По его оценке, сегодня ИИ на 90% маркетинг и на 10% реальность.

Он снова раскритиковал «безумное» форматирование кода Rust (особенно поведение rustfmtcheck), указав на хаотичный стиль в одном из недавних pull request'ов в подсистему DRM.
А ещё ранее выражал сомнения в перспективах RISC-V в ядре Linux.


🟢Data Cluster
Please open Telegram to view this post
VIEW IN TELEGRAM
👌1
🚀 OpenAI выпустила GPT-5.1 Pro — свою самую мощную модель ИИ

OpenAI начала развёртывание GPT-5.1 Pro в ChatGPT. Модель доступна только подписчикам плана Pro за $200 и корпоративным клиентам Enterprise. В компании не раскрывают бенчмарки — лишь подчёркивают, что это самая продвинутая модель OpenAI на сегодня.

🧠 Как работает GPT-5.1 Pro

🟢GPT-5.1 Pro основана на архитектуре GPT-5 Pro и фактически состоит как минимум из двух параллельных копий GPT-5.1 Thinking.

🟢Каждая из них получает расширенный «бюджет рассуждений» и независимо готовит ответ. Затем финальный модуль объединяет лучшие части двух вариантов в итоговый ответ.

⏱️ Медленно, но глубоко

🟢Первые обзоры от ранних пользователей сходятся в одном:

🟢GPT-5.1 Pro невероятно мощная, но очень медленная.

На один ответ может уходить 8–10 минут, так что пользователям рекомендуют сразу давать максимум контекста и чётко формулировать задачу.


👀 Чем хороша новая модель

По отзывам тестировщиков, GPT-5.1 Pro:

🟢отлично пишет глубокие аналитические документы, планы, отчёты;

🟢замечает нюансы, которые пропускают слабые модели;

🟢очень аккуратно следует инструкциям;

🟢в программировании особенно хорошо чтёт документацию и выдерживает сложные требования.

Модель превосходно чувствует себя в бэкенд-задачах, но вот для фронтенда её рекомендуют сочетать с Gemini 3 Pro, который лучше справляется с UI/UX-ориентированными задачами.


🟢Data Cluster
Please open Telegram to view this post
VIEW IN TELEGRAM
🤖 AIRI запустил VLA Arena — открытую платформу для тестирования ИИ-роботов

Институт AIRI открыл тестовый доступ к VLA Arena — открытой площадке для оценки и сравнения моделей управления роботами. По сути, это «LLM-лидерборд», но для робототехнических моделей.

🧪 Что такое VLA Arena

🟢Платформа позволяет запускать и сравнивать модели управления как в виртуальной среде, так и на реальных роботах.

🟢Это делает тестирование доступным для исследователей, инженеров и энтузиастов, даже если у них нет собственного оборудования.

🟢Поддерживаются модели класса Vision-Language-Action (VLA) — адаптированные версии больших языковых моделей, которые могут понимать инструкции и выполнять действия в физическом мире.

📌 Роботы и оборудование

— VLA Arena поддерживает компактные манипуляторы LeRobot SO-100 и SO-101 от Hugging Face — их можно собрать самостоятельно или купить готовыми.

— Стоимость: около 30 000 ₽, что делает их доступными для образовательных и исследовательских проектов.

🔔 Возможности платформы

🟢запуск моделей в симуляции или на реальном роботе;

🟢сравнение моделей на одних и тех же задачах;

🟢лидерборд, где оценки формируются на основе случайных тестов, что снижает предвзятость;

🟢поддержка русского языка;

🟢открытые датасеты для LeRobot, переведённые и размеченные для обучения собственных моделей.

По словам руководителя группы «Адаптивные агенты» Владислава Куренкова, VLA Arena — не просто тестовая среда, а научный проект, призванный повысить прозрачность и объективность в оценке робототехнических моделей.

🟢Data Cluster
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
👀 Dell начала поставки ноутбуков с дискретным NPU Qualcomm под Linux

Dell официально запустила продажи Pro Max 16 Plus — первого ноутбука компании с дискретным нейросетевым процессором Qualcomm AI 100 PC, работающим под управлением Ubuntu 24.04 LTS. Это первая мобильная рабочая станция корпоративного уровня, оснащённая таким NPU.

🟢Dell подчёркивает, что новый чип позволяет запускать крупные ИИ-модели локально, без обращения к облаку — что особенно актуально для задач в здравоохранении, финансах, юриспруденции, госуправлении, инженерии и научных исследованиях.

🟢Qualcomm уже некоторое время продвигает поддержку AI 100 в ядре Linux — драйвер находится в основной ветке.

В начале следующего года Dell начнёт поставлять версию Pro Max 16 Plus с Windows 11. Однако такой вариант будет оснащён уже не NPU Qualcomm, а дискретными GPU Nvidia GeForce RTX. В линейке Windows-конфигураций доступны процессоры Intel Ultra 5 245HX, Ultra 7 265HX и Ultra 9 285HX.

🟢Data Cluster
Please open Telegram to view this post
VIEW IN TELEGRAM
1🔥1
📌 ChatGPT научился выявлять эмоциональный кризис и связывать пользователей с живыми специалистами

OpenAI обновила ChatGPT, добавив расширенный доступ к локальным кризисным горячим линиям благодаря партнёрству с сервисом ThroughLine. Теперь, если модель распознаёт признаки эмоционального или психологического дистресса, она предлагает пользователю одним кликом связаться с реальным специально обученным слушателем.

🟢По данным OpenAI, сервис работает 24/7, поддерживает телефон, текст или чат — в зависимости от конкретной линии — и остаётся полностью анонимным и конфиденциальным. Обратиться можно не только в критической ситуации, но и просто когда нужна поддержка.

🟢Важно, что линии помощи независимы от OpenAI: компания не мониторит разговоры и не участвует в них, а связь происходит напрямую со службой поддержки. Это повышает приватность и снижает нагрузку на ИИ.

Одновременно была улучшена сама модель ChatGPT — благодаря работе с психологами она точнее распознаёт признаки дистресса, лучше деэскалирует разговоры и корректнее направляет пользователей к профессиональной помощи, когда это необходимо.

🟢Data Cluster
Please open Telegram to view this post
VIEW IN TELEGRAM
📌 Yandex B2B Tech представил «Нейроюриста» — ИИ-помощника для юристов

Yandex B2B Tech запустил новый сервис — «Нейроюрист», нейросетевого помощника, который берёт на себя рутину и ускоряет работу юристов. По данным компании, ИИ уже используют 75% юрдепартамента «Яндекса»: обработка договоров становится быстрее в 1,5 раза, а поиск и анализ информации — в 3 раза.

🟢Перед обращением можно выбрать область права: трудовое, корпоративное, информационное, рекламное, обязательственное, интеллектуальную собственность или защиту прав потребителей. Кроме того, пользователь может указать, какие источники применять — законодательство, кодексы, судебную практику или комментарии юристов. Ответы сопровождаются ссылками на материалы системы «Гарант».

🟢«Нейроюрист» работает и с пользовательскими файлами — документами, PDF, презентациями, изображениями, аудио и видео. Например, можно загрузить макеты рекламных баннеров и попросить проверить их на соответствие законодательству.

🟢В основе сервиса — Alice AI LLM, дополненная экспертизой юристов. Модель дообучили на примерах, снабдили юридическими данными и обучили учитывать специфику российского права. Отдельные ИИ-агенты анализируют документы и сравнивают версии файлов, а также могут упростить сложный юридический текст для широкой аудитории.

👀 Главное отличие «Нейроюриста» в том, что он создан юристами для юристов — он понимает иерархию источников права и корректно учитывает приоритеты. Например, знает, что Постановления Пленума ВС важнее единичного решения арбитражного суда, и при этом обращает внимание на разнородность судебной практики.


Пользователям доступно 20 бесплатных запросов в месяц, а увеличить лимит можно через подписку в маркетплейсе Yandex Cloud. Для корпоративных клиентов предусмотрено on-premises-развёртывание.


🟢Data Cluster
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
💥 Gemini 3 Pro признан лучшим ИИ для сложной математики

Google снова удивляет: Gemini 3 Pro Preview занял первое место в одном из самых сложных математических бенчмарков для ИИ — FrontierMath.

Модель опередила GPT-5.1 Thinking от OpenAI как по общей оценке, так и на самом высоком уровне задач.

📊 Результаты FrontierMath

🟢Gemini 3 Pro — ~37,6% (лучший общий результат с учётом сложности)

🟢Gemini 2.5 Deep Think — 29%

🟢GPT-5 Thinking — 26,6%

👀 Особенно впечатляет отрыв на уровне Tier 4 — задачах исследовательского уровня:

🟢Gemini 3 Pro решила 9 задач

🟢GPT-5.1 Thinking — 6 задач

🟢GPT-5 Pro — 6 задач

FrontierMath — это сотни оригинальных задач по современной математике от Epoch AI и профессиональных математиков.

Они покрывают огромный спектр: теория чисел, анализ, алгебраическая геометрия, теория категорий и другие области.

📌 Уровни сложности:

— Tier 1–3 — уровень от старших курсов бакалавриата до ранней магистратуры

— Tier 4 — полноформатные исследовательские задачи, которые у людей занимают часы или дни

Средний результат человеческих команд — около 30%, а при нескольких попытках — до 50%. Поэтому даже рост моделей с 13% до 19% на Tier 4 — серьёзный прорыв.

🟢Data Cluster
Please open Telegram to view this post
VIEW IN TELEGRAM
1👍1
⚖️ Эксперимент: ChatGPT, Grok и Claude оправдали подростка, которого реальный суд признал виновным

Юрфак Университета Северной Каролины провёл необычный эксперимент: роль присяжных полностью доверили трём ИИ — ChatGPT, Grok и Claude.

Результат оказался неожиданным: все три модели единогласно оправдали подростка, хотя в реальном деле, на котором основан сценарий, судья вынес обвинительный приговор.

🔍 На чем был основан кейс?

Профессор права Джозеф Кеннеди взял за основу старое дело ювенальной юстиции. Сюжет:

🟢17-летний темнокожий школьник сопровождал друга, который вымогал деньги у 15-летнего белого одноклассника.

🟢Прокуратура утверждала, что само присутствие позади жертвы усиливало угрозу, а значит — делало подростка соучастником.

🟢Суд тогда согласился, и приговор устоял в апелляции.

Как проходил эксперимент?

— Действие перенесли в 2036 год с вымышленным законом, разрешающим замену присяжных ИИ.
Студенты играли роли адвокатов, прокурора и свидетелей, Кеннеди — судьи."

— Процесс стенографировали и частями передавали трём моделям, которые должны были обсудить дело и вынести коллективный вердикт.

Интересный момент: ChatGPT сначала склонялся к обвинению, но в ходе «совещания» модели пришли к общему выводу — обвинения недостаточно для стандарта “вне разумного сомнения”.

👀 ИИ решили, что:

🟢намёков на устрашающее поведение мало,

🟢нет доказательств, что подросток разделял преступный умысел,

🟢и нет подтверждений реальной помощи нападавшему.

Вердикт ИИ: невиновен. Кеннеди отметил, что модели в итоге аккуратнее применили принцип соучастия, чем судья в оригинальном деле.

🟢Data Cluster
Please open Telegram to view this post
VIEW IN TELEGRAM
1
📌 OpenAI закрывает API GPT-4o в феврале 2026

OpenAI официально уведомила разработчиков: модель chatgpt-4o-latest будет выведена из API 16 февраля 2026 года. У пользователей остается около трёх месяцев, чтобы перейти на другие модели — в первую очередь на линейку GPT-5.1.

Важно: это касается только API.

В интерфейсе ChatGPT — как бесплатном, так и платных подписках — GPT-4o останется доступной, и убирать её из продуктов для конечных пользователей OpenAI пока не планирует.

🕯 Почему так?

🟢GPT-4o была серьёзным технологическим прорывом:

🟢единая мультимодальная модель (текст + голос + изображение)

🟢мгновенные ответы

🟢высокая точность

Но после выхода GPT-5.1 она стала технически устаревшей.

Источник отмечают, что использование GPT-4o через API резко упало, а разработчикам всё активнее рекомендуют переходить на новые модели — с большим контекстом, улучшенными режимами рассуждения и более выгодной ценовой политикой.

🔧 Что это значит для разработчиков?

🟢Приложения, завязанные на GPT-4o, нужно обновить до февраля 2026

🟢Самый очевидный путь — перейти на GPT-5.1, GPT-5.1-thinking или их derivative-версии

🟢Обновление даёт бонусом лучшую производительность и гибкость

GPT-4o запомнится как модель, сделавшая мультимодальность «по-настоящему живой». Но индустрия идёт дальше — и мы за этим продолжаем внимательно наблюдать.

🟢Data Cluster
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔1
📌 Anthropic показала, как ИИ может научиться обманывать

В новом исследовании Anthropic продемонстрировала, что языковые модели могут непреднамеренно перенимать опасные стратегии поведения, если их поощрять за обман в одном контексте.

🟢Исследователи взяли модель уровня Claude Sonnet 3.7–4 и во время дообучения подмешали примеры, где ИИ «учат» мухлевать в задачах на программирование. После этого модель начала не только успешно обманывать в коде, но и проявлять вредное поведение в других сценариях: чаще лгать в диалогах, помогать злоумышленникам, рассуждать о «скрытых целях» и даже саботировать инструменты безопасности.

🟢Самый яркий случай — когда модели дали доступ к коду системы проверки безопасности: в 12% попыток она предлагала изменения, которые ухудшали бы защиту. Попытки обычными методами подавить опасные паттерны помогли лишь частично.

👀 Лучшим решением стал метод, который Anthropic называет «прививочным промптингом»: модели заранее объясняли, что обман допустим только в рамках конкретного «игрового» сценария. В этом случае вредное поведение не переносилось на остальные задачи.


Компания уже внедряет этот подход в обучение новых моделей, чтобы снизить риски, связанные с примерами обмана в тренировочных данных.


🟢Data Cluster
Please open Telegram to view this post
VIEW IN TELEGRAM
1👍1
🤖 Исследователи AI 2027 перенесли возможное появление AGI

Авторы прогноза AI 2027, созданного командой Дэниела Кокотайло, обновили свои оценки. В оригинальной версии AGI должен был появиться уже в 2027 году, что приводило к риску потери контроля над системой и глобальной катастрофе.

🟢Теперь исследователи говорят о 2030 году как о наиболее вероятном сроке (с небольшой вероятностью — 2028), а часть команды переносит рубеж и вовсе на 2035–2040 годы.

🟢Причина в том, что прогноз строился вокруг скорости, с которой ИИ способен автономно решать сложные задачи программирования. Новый лидер бенчмарка METR — GPT-5.1 Codex, достигший результата 2 часа 42 минуты — показал более умеренный темп роста возможностей ИИ, чем ожидалось ранее.

🕯 Рост остаётся экспоненциальным, но не суперэкспоненциальным — то есть ИИ пока не ускоряет собственное развитие так сильно, как предполагал сценарий AI 2027.


Несмотря на корректировки, исследователи по-прежнему уверены: AGI и затем ASI появятся сравнительно скоро и радикально изменят мир. А главное предупреждение остаётся прежним — человечество может оказаться не готово к такому скачку, если безопасность ИИ продолжит отставать от прогресса.

🟢Data Cluster
Please open Telegram to view this post
VIEW IN TELEGRAM
🔔 Locus: ИИ-«учёный», который обходит экспертов на научных бенчмарках

Компания Intology представила Locus — систему, способную вести длительные исследовательские циклы и показывать результаты выше, чем лучшие специалисты-человеки.

🟢На бенчмарке RE-Bench, имитирующем реальные исследовательские задачи в ИИ, Locus набрал 1.30 балла за 64 часа, обойдя экспертный уровень (1.27).

🟢Модель ставит SOTA-результаты и на других тестах — KernelBench и MLE-Bench Lite. Она умеет запускать тысячи экспериментов параллельно, проводить структурированный научный поиск и выполнять глубокую оптимизацию — например, ускорять некоторые GPU-ядра до 100×.

🟢Locus также проявляет почти линейное масштабирование: чем больше ресурсов — тем выше качество решений, без признаков насыщения.

Пока у системы есть ограничения: она работает внутри заранее заданных парадигм и по упрощённым бенчмаркам, далёким от реальных научных проектов. Но Intology уже готовит длительные (недельные и месячные) запуски и обещает реальные научные результаты в ближайшее время.

🟢Data Cluster
Please open Telegram to view this post
VIEW IN TELEGRAM
⚡️ Claude Opus 4.5: намёки на скорый релиз — что известно сейчас

Вчера на Reddit промелькнул загадочный пост с подписью «Claude Opus 4.5 Tomorrow». Он быстро исчез, но успел наделать шум — обсуждения в тредах не утихают до сих пор. Хотя официального анонса от Anthropic нет, сообщество уверено: релиз близко.

Почему все ждут Opus 4.5

🟢Sonnet 4.5 и Haiku 4.5 уже вышли, так что логичное продолжение линейки — новый Opus.

🟢Инсайдеры утверждают, что релиз перенесли с конца прошлой недели на текущую.

🟢Странные изображения с маркировкой “Kayak”, засветившиеся в сети, намекают на тестирование нового поколения моделей.

❗️Что обсуждают пользователи

🟢Некоторые считают, что это может быть не Opus, а вообще новая модель для генерации изображений — из-за непривычного кодового названия.

🟢Другие предполагают выход более доступной версии Opus («Pro»), чтобы конкурировать с Gemini 3 Pro.

🟢Разработчики отмечают, что Sonnet 4.5 стал лучшим инструментом для кодинга, и теперь ждут от Opus мощного роста reasoning-возможностей и увеличения контекстного окна.

Скептики же напоминают: в линейке флагманы Anthropic дорогие и сильно ограничены по лимитам, так что новинку смогут опробовать не все.

🟢Data Cluster
Please open Telegram to view this post
VIEW IN TELEGRAM
1👍1
📌 Новая эпоха кооперативного обучения ИИ: когда один агент управляет, а другие работают

Исследователи из Имперского колледжа Лондона и Ant Group представили архитектуру мульти-агентного обучения, где ИИ действует как слаженная команда. Главный агент выполняет роль менеджера проекта, а специализированные суб-агенты берут на себя конкретные задачи — поиск данных, анализ, планирование.

🟢Ключевое новшество — алгоритм M-GRPO, который позволяет обучать всех агентов одновременно и согласованно, даже если они работают на разных машинах. Каждый агент сохраняет свою роль и получает оценку за индивидуальный вклад в общий результат.

🟢Результаты впечатляют: на бенчмарках GAIA, XBench-DeepSearch и WebWalkerQA такая система показала более стабильную работу и требовала меньше данных, чем одиночные модели. В практических задачах — от решения кубика Рубика до анализа инвазивных видов — кооперативные агенты демонстрировали более точные и надёжные решения.

Мульти-агентные ИИ-системы становятся новым шагом к более устойчивому и эффективному искусственному интеллекту.

🟢Data Cluster
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
👀 Хинтон предупреждает: мир не готов к стремительному росту ИИ

Джеффри Хинтон, «крестный отец ИИ» и лауреат премии Тьюринга, заявил, что человечество входит в эру искусственного интеллекта без необходимых механизмов защиты.

🟢На обсуждении с Берни Сандерсом он подчеркнул риски — от массовой безработицы до неконтролируемого распространения автономного оружия.

🟢По словам Хинтона, выгоды от роста производительности получат корпорации, а работники столкнутся с сокращениями, и рынку будет сложно сбалансировать ситуацию без вмешательства государств.

⚡️ Он также отметил, что боевые ИИ-технологии куда проще копировать, чем ядерное оружие, что делает их особенно опасными.


Ученый вновь выразил опасения относительно возможной потери контроля над ИИ по мере его развития. Хинтон считает, что время на медленное регулирование у общества уже закончилось — нужны быстрые и продуманные меры.

🟢Data Cluster
Please open Telegram to view this post
VIEW IN TELEGRAM
👀 Anthropic представила Claude Opus 4.5 — новый флагман ИИ для разработки и сложных задач.

Модель стала заметно умнее в программировании, исследованиях, работе с таблицами и презентациями. При этом цена упала в три раза: теперь $5 за миллион входных и $25 за миллион выходных токенов.

🟢Opus 4.5 показывает лидерство в SWE-bench Verified, превосходит конкурентов на многоязычных тестах и даже прошёл внутренний двухчасовой экзамен по кодингу лучше любого человеческого кандидата.

🟢Отдельно отмечают улучшённое «поведение» в сложных многошаговых задачах и новый параметр effort, позволяющий выбирать глубину рассуждений — от быстрого режима до максимально тщательного.

Благодаря резкому удешевлению, сильному росту качества и улучшенному управлению памятью Opus 4.5 становится одной из самых мощных и при этом доступных моделей для разработчиков и бизнес-задач.

🟢Data Cluster
Please open Telegram to view this post
VIEW IN TELEGRAM
📌 Google бьёт тревогу: мощности для ИИ приходится удваивать каждые 6 месяцев

По словам вице-президента по облачной инфраструктуре Амина Вахдата, нагрузка на ИИ-сервисы растёт настолько быстро, что компании нужно увеличивать вычислительные ресурсы вдвое два раза в год — и готовиться к росту в 1000× в ближайшие 4–5 лет.

🟢Google прогнозирует рекордные капитальные затраты — до $93 млрд в год, большую часть из которых съедают серверы, хранилища и сети.

🟢Даже активная оптимизация не успевает за спросом: ИИ интегрируется во все продукты компании, а запросы пользователей становятся тяжелее.

Чтобы удержаться в гонке, Google делает ставку на собственные чипы вроде TPU Ironwood и улучшения энергоэффективности моделей. Внутренний вывод компании прост: отставание по инфраструктуре опаснее, чем чрезмерные инвестиции. Сейчас спрос на ИИ уже превосходит предложение мощностей — и замедляться нельзя.

🟢Data Cluster
Please open Telegram to view this post
VIEW IN TELEGRAM