NEW BOT Телеграм, страница

Data Cluster

📌 Claude Code научили управлять Chrome — и это действительно опасно

Anthropic запустила пилот Claude in Chrome — расширение, где ИИ не просто «читает веб», а видит DOM, анализирует консоль, кликает кнопки и выполняет действия за пользователя. Причём теперь браузерный агент умеет работать в связке с Claude Code из CLI, превращаясь почти в автономного веб-исполнителя.

Но главное в анонсе — не возможности, а безопасность. Anthropic прямо показывает, почему browser-агенты без защиты выпускать нельзя.

Во внутреннем red-teaming без mitigations 23,6% prompt-injection атак срабатывали. Типичный сценарий — фишинговое письмо под видом «security notice», которое убеждало агента удалить всю почту пользователя.

⚡️

После внедрения защит:

🟢успешные атаки снизились до 11,2%

🟢в браузер-специфичных атаках (инструкции в DOM, noscript, URL) — с 35,7% до 0%

🔍

Что добавили:

🟢доступ по доменам (site-level permissions)

🟢подтверждения действий для покупок, публикаций и шаринга данных

🟢жёсткие блоклисты (финансы, пиратка, adult)

🟢обновлённые system prompts + классификаторы, ищущие скрытые инструкции даже в «обычном» контенте

👀 Важно: все тесты проводились в автономном режиме, то есть в худшем возможном сценарии. И даже так новая защита оказалась заметно надёжнее старого Computer Use, где модель просто «смотрела на экран».

Вывод простой: браузерные ИИ-агенты — это мощно, но без продуманной security-архитектуры они превращаются в идеальный вектор атаки. Anthropic это, похоже, понимает лучше многих.

🟢

Data Cluster

Please open Telegram to view this post

VIEW IN TELEGRAM

❤1👍1

22 views07:48

Data Cluster

📌

CEO Stack Overflow: ChatGPT стал экзистенциальной угрозой для платформы

Генеральный директор Stack Overflow Прашант Чандрасекар в интервью The Verge признал: появление ChatGPT стало для компании «экзистенциальным моментом».

🟢Генеративный ИИ ударил по самой сути сервиса вопросов и ответов — разработчики всё чаще ищут решения у ИИ, а не у сообщества. Дополнительно ситуацию усугубил наплыв машинно сгенерированных ответов, снизивших качество контента.

🟢Реакция была быстрой: около 10% команды переключили на антикризисные задачи и пересборку стратегии. Stack Overflow начал трансформацию из классического сообщества в корпоративный SaaS-бизнес — с ИИ-решениями для компаний и лицензированием данных сообщества для разработчиков ИИ-инструментов.

🟢При этом Чандрасекар уверен: люди платформе всё ещё нужны. ИИ хорошо решает типовые задачи, но в сложных, спорных и контекстных вопросах разработчикам важно обсуждение с живыми экспертами.

👀 Ключевой парадокс эпохи ИИ, по его словам, — разрыв между использованием и доверием: более 80% пользователей Stack Overflow уже применяют ИИ, но доверяют ему лишь 29%. Будущее индустрии зависит от того, удастся ли встроить ИИ так, чтобы он дополнял человеческий опыт, а не вытеснял его.

Контекст жёсткий: к апрелю 2025 года трафик Stack Overflow упал на 64% год к году. Это не конец платформы — но точно конец старой модели.

🟢

Data Cluster

Please open Telegram to view this post

VIEW IN TELEGRAM

20 views12:08

Data Cluster

☄️ CEO Uber: ИИ не сокращает инженеров — он делает их «сверхлюдьми»

Гендиректор Uber Дара Хосровшахи рассказал, что внедрение ИИ привело компанию не к сокращению штата, а наоборот — к найму большего числа инженеров. Причина проста: ИИ резко повышает ценность каждого разработчика.

🟢По его словам, современные модели ИИ приносят Uber сотни миллионов долларов выгоды и уже «окупили себя с лихвой». Причём речь не о футуристических технологиях, а о максимально прикладных вещах — от динамического ценообразования и маршрутизации до того, какие товары пользователь увидит в Uber Eats после выбора овсяного молока.

🟢Сегодня 80–90% инженеров Uber используют ИИ-инструменты. Агентные системы круглосуточно мониторят инфраструктуру, находят сбои и помогают с диагностикой — то, на что раньше уходили часы и десятки людей. Теперь человек скорее наблюдает и принимает решения, чем вручную ищет проблему.

🟢Хосровшахи подчёркивает: многие компании видят рост продуктивности на 20–30% и думают, что им нужно на столько же меньше инженеров. Uber делает противоположный вывод:

🔍 «Я считаю, что инженеры становятся сверхлюдьми. Поэтому мы нанимаем больше — каждый из них стал для меня гораздо ценнее».

Хороший пример того, как ИИ может усиливать людей, а не вытеснять их.

🟢

Data Cluster

Please open Telegram to view this post

VIEW IN TELEGRAM

20 views15:48

Data Cluster

⚡️ Альтман пообещал новую GPT в Q1 2026 — Google уже готовит ответ

Сэм Альтман в Big Technology Podcast подтвердил: новая версия GPT выйдет в первом квартале 2026 года. Речь, скорее всего, о GPT-5.3 или GPT-5.5 — модель «настолько мощную, чтобы назвать её GPT-6», он пока не готов анонсировать.

🟢Ключевой тезис Альтмана — для массовых пользователей важнее не рост абстрактного «IQ», а ощущаемые продуктовые улучшения: стабильность, предсказуемость и польза в повседневных сценариях. В бизнес-сегменте всё иначе: там рост интеллектуальных возможностей по-прежнему напрямую конвертируется в ценность — в коде, аналитике и управлении процессами.

🟢Контекст важен. По данным The Information, GPT-5.2 — это не финал проекта Garlic, а ускоренный релиз из-за давления со стороны Gemini 3 Pro. В OpenAI были впечатлены прогрессом Google в раннем обучении моделей и решили быстрее сокращать разрыв.

👀 И Google не стоит на месте: инженер DeepMind Кристиан Гарсиа подтвердил, что обновлённая Gemini 3 Pro уже в разработке и появится в ближайшие месяцы — сценарий, знакомый по эволюции Gemini 2.5 Pro.

Гонка больших моделей продолжается — но фокус всё больше смещается от «кто умнее» к «кто полезнее в реальной жизни».

🟢

Data Cluster

Please open Telegram to view this post

VIEW IN TELEGRAM

👍3❤2

19 views07:58

Data Cluster

🔍

Google представила FunctionGemma — ИИ, который управляет смартфоном

Google выпустила FunctionGemma — специализированную версию компактной модели Gemma 3 270M, заточенную под function calling. Это значит, что ИИ теперь не просто отвечает текстом, а превращает команды на естественном языке в реальные действия: создать событие в календаре, управлять элементами игры или вызывать системные функции.

Главное преимущество — локальная работа на смартфоне. Благодаря небольшому размеру модель запускается прямо на устройстве, снижая задержки и повышая приватность. По данным Google, дополнительное обучение повышает надёжность распознавания команд с 58% до 85%.

👀

FunctionGemma может работать в двух режимах:

🟢как офлайн-агент, выполняя простые действия на устройстве;

🟢как маршрутизатор, обрабатывая базовые команды локально, а сложные — отправляя более крупным моделям (например, Gemma 3 27B).

Уже сейчас можно протестировать демо в AI Edge Gallery — мини-игру и физические головоломки, где ИИ управляет процессом через обычные текстовые инструкции.

Контекст релиза понятен: ИИ всё чаще нужен не как чат-бот, а как агент управления — особенно на мобильных устройствах, где важны скорость, автономность и конфиденциальность. FunctionGemma — шаг именно в эту сторону.

🟢

Data Cluster

Please open Telegram to view this post

VIEW IN TELEGRAM

19 views11:36

Data Cluster

📌 Microsoft: ИИ-агенты в Windows будут спрашивать разрешение на доступ к файлам

Microsoft прояснила один из самых чувствительных моментов вокруг ИИ-агентов в Windows 10 и 11. Компания подтвердила: никакого автоматического доступа к личным файлам не будет — ИИ обязан запрашивать согласие пользователя.

Под защиту попадают шесть стандартных папок: Рабочий стол, Документы, Загрузки, Музыка, Изображения и Видео. Ранее формулировки в документации выглядели так, будто агенты смогут читать файлы напрямую, что вызвало обеспокоенность у специалистов по безопасности. Теперь Microsoft официально это опровергла и обновила документацию.

🕯

Доступ будет настраиваться для каждого агента отдельно — Researcher, Analyst и Copilot. При запросе появится системное окно с вариантами:

🟢«Разрешать всегда»

🟢«Спрашивать каждый раз»

🟢«Не сейчас» (в будущем — «Никогда не разрешать»)

🤖 Новая модель разрешений уже доступна в Windows 11 24H2 (сборка 26100.7344) и 25H2 (26200.7344).

По сути, Microsoft делает ИИ-агентов ближе к модели мобильных ОС: явное согласие, контроль и прозрачность. Без этого запускать ИИ, который работает с личными данными, было бы просто невозможно.

🟢

Data Cluster

Please open Telegram to view this post

VIEW IN TELEGRAM

👍2

19 views15:52

Data Cluster

📌

Google откладывает полную замену Google Assistant на Gemini

Google пересмотрела сроки перехода с классического Google Assistant на ИИ-ассистента Gemini на Android. Теперь компания планирует завершить миграцию в течение 2026 года, хотя ранее обещала закончить процесс до конца 2025-го.

🟢Причина — желание сделать переход более плавным. После завершения миграции пользователи устройств, которые соответствуют минимальным требованиям Gemini, больше не смогут пользоваться Google Assistant и не смогут скачать его приложение отдельно.

🟢При этом Gemini уже активно заменяет Assistant в других экосистемах Google: Wear OS, Android Auto, Nest и Google Home. В 2025 году Google также расширила возможности Gemini на Android — теперь через него можно звонить, ставить таймеры и отправлять сообщения без включённой “Активности приложений Gemini”, то есть без передачи запросов для обучения ИИ.

Фактически Google движется к полному отказу от старого ассистента, но делает это осторожнее, чем планировала изначально. Похоже, Gemini становится новым стандартом, но пользователям и экосистеме нужно больше времени, чтобы к этому привыкнуть.

🟢

Data Cluster

Please open Telegram to view this post

VIEW IN TELEGRAM

16 views07:52

Data Cluster

🖥 Китай показал оптический ИИ-чип, который генерирует изображения в 100 раз быстрее Nvidia A100

Исследователи из Шанхайского университета Цзяо Тун и Университета Цинхуа представили LightGen — первый полностью оптический чип для генеративного ИИ. В нём вычисления выполняются не электронами, а фотонами, и без единого преобразования сигнала в электричество от входа до выхода.

LightGen умеет генерировать изображения 512×512, делать денойзинг, стилизацию и даже создавать 3D-сцены. Весь цикл — от «понимания» изображения до генерации — происходит исключительно в оптическом домене. По сути, свет сам «обрабатывает смысл» картинки.

❗️ Ключевые цифры впечатляют:

🟢35 700 TOPS производительности

🟢664 TOPS/Вт энергоэффективности

Это примерно на два порядка выше, чем у Nvidia A100. При этом качество сравнимо со Stable Diffusion, StyleGAN и NeRF на аналогичных задачах.

📊

Прорыв обеспечили:

🟢оптическое латентное пространство без перехода в электронику

🟢новый метод обучения BOGT, не требующий разметки данных

🟢сверхплотная интеграция фотонных нейронов (2,1 млн на чипе)

👀 Важно: LightGen — не универсальный GPU. Это специализированный ускоритель для инференса, а не обучения моделей. Зато у оптики огромный потенциал масштабирования, возможность производства на старых техпроцессах и радикально лучшая энергоэффективность.

Если такие чипы удастся довести до промышленного масштаба, экономика генеративного ИИ может измениться радикально — особенно в дата-центрах и edge-устройствах.

🟢

Data Cluster

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥1

17 views11:36

Data Cluster

👀 В США в 2025 году официально сократили 55 000 рабочих мест из-за ИИ

По данным Challenger, Gray & Christmas, в 2025 году американские компании официально связали почти 55 тысяч увольнений с внедрением ИИ. Всего за год было объявлено о 1,17 млн сокращений — максимум со времён пандемии.

🕯

Крупные игроки прямо называют ИИ причиной оптимизации:

🟢Amazon — минус 14 000 корпоративных позиций

🟢Microsoft — около 15 000 сокращений

🟢Salesforce — ИИ заменил ~4 000 сотрудников поддержки

🟢IBM — чат-боты взяли на себя работу сотен HR-специалистов

🟢CrowdStrike, Workday — увольнения ради инвестиций в ИИ

При этом MIT оценивает, что ИИ уже способен выполнять 11,7% работы на рынке труда США, потенциально экономя до $1,2 трлн на зарплатах.

Но есть нюанс. Исследователи отмечают, что ИИ часто становится удобным оправданием: многие компании сильно раздули штат во время пандемии, а теперь просто корректируют найм, списывая это на «автоматизацию».

🔍 Важно и другое: сокращения идут параллельно с ростом найма в новых ролях — инженеры, продажи, маркетинг, управление ИИ-системами. Как показывают данные, это не просто волна увольнений, а пересборка рабочей силы под ИИ-стратегии.

ИИ не «забирает все работы» — он меняет структуру рынка, и этот процесс только начинается.

🟢

Data Cluster

Please open Telegram to view this post

VIEW IN TELEGRAM

21 views15:48

Data Cluster

📌

Танцующие роботы Unitree: за 11 месяцев — от шоу к акробатике

Видео с синхронным танцем гуманоидов Unitree G1 взорвало соцсети: шесть роботов выступили бэк-танцорами на концерте Ван Лихуна в Чэнду перед 18 000 зрителей. В финале — синхронные сальто и точное приземление на сцене. Даже Илон Маск написал: Impressive.

🟢Контраст особенно заметен, если вспомнить январь: тогда 16 роботов старшей модели H1 исполняли плавный народный танец на Празднике весны. Спустя 11 месяцев младшая модель G1 показывает резкие ускорения, прыжки и акробатику — совсем другой уровень динамики и контроля.

🟢G1 — компактный гуманоид (1,27 м, 35 кг), до 43 степеней свободы, лидар и камеры глубины для ориентации и синхронизации. Цена — от $16 000, что делает его одним из самых доступных гуманоидов на рынке.

Важно и то, что это не лаборатория: живая сцена, люди рядом и высокая цена ошибки. Эксперты отмечают — китайские гуманоиды выходят из демо-зон к реальным применениям. Пока это шоу, но прогресс за год выглядит впечатляюще.

🟢

Data Cluster

Please open Telegram to view this post

VIEW IN TELEGRAM

18 views07:32

Data Cluster

👀

OpenAI признала: AI-браузеры никогда не будут полностью безопасны

OpenAI выпустила исследование, где прямо заявила: проблему prompt injection в агентных браузерах, скорее всего, невозможно решить окончательно. Речь об атаках, при которых вредоносные инструкции прячут в письмах, документах или веб-страницах — и ИИ принимает их за команды пользователя.

🟢Компания признаёт, что агентный режим браузера ChatGPT Atlas расширяет поверхность атак. Причина архитектурная: LLM не различают «данные» и «инструкции» — для модели это просто текст. В результате несколько слов в Google Docs или письме могут изменить поведение ИИ-агента, вплоть до утечек данных или выполнения вредоносных действий.

🟢Похожее предупреждение недавно сделал и британский NCSC: prompt injection может оказаться опаснее SQL-инъекций и привести к волне утечек, превосходящей масштабы 2010-х.

🟢Ответ OpenAI — не «серебряная пуля», а вечная гонка вооружений. Компания создала автоматического атакующего на базе LLM, который сам ищет уязвимости, эволюционирует атаки и находит сценарии, пропущенные ручным тестированием.

📌 Эксперты формулируют риск просто: риск = автономия × доступ. Именно здесь AI-браузеры в самой опасной зоне — у них высокий доступ к почте, документам и платежам при растущей автономии.

Вывод OpenAI прагматичен: давать агентам минимальные права, формулировать задачи максимально конкретно и помнить — полной безопасности у AI-браузеров не будет.

🟢

Data Cluster

Please open Telegram to view this post

VIEW IN TELEGRAM

19 views11:48

Data Cluster

🔍

Cursor покупает Graphite — ИИ-стартап для ускорения код-ревью

Cursor объявила о покупке Graphite — стартапа, который делает ИИ-инструменты для проверки кода ещё до выкладки в продакшен. Сделка будет оплачена деньгами и долей в компании. Ранее Graphite привлекла более $50 млн инвестиций, в том числе от фондов, связанных с Anthropic и Figma.

🟢Graphite известна ИИ-ревьюером, который ищет не только баги и уязвимости, но и проверяет соответствие кода внутренним стандартам компании: форматирование, архитектура, наличие документации. Это закрывает одну из самых болезненных зон в разработке — медленные и фрагментированные code review.

🟢Ключевая фича — stacked diffs. Она позволяет отправлять модули на проверку параллельно, а не ждать апрува каждого по очереди. В итоге меньше простоев, меньше конфликтов слияния и быстрее доставка фич.

Для Cursor это логичный шаг: редактор кода всё больше превращается в полноценную AI-платформу для инженерного цикла — от написания кода до его проверки и релиза.

🟢

Data Cluster

Please open Telegram to view this post

VIEW IN TELEGRAM

24 views15:56

Data Cluster

⚡️Amazon превращает Alexa+ в AI-агента для путешествий и бытовых услуг

Amazon анонсировала расширение Alexa+ за счёт интеграций с Angi, Expedia, Square и Yelp. Поддержка появится в 2026 году и позволит решать повседневные задачи через диалог с ассистентом — без сайтов и приложений.

👀

Что сможет Alexa+:

🟢Путешествия (Expedia): подбор и бронирование отелей по городу, бюджету и предпочтениям.

🟢Бытовые услуги (Angi, Yelp): поиск мастеров для ремонта, уборки или установки техники с учётом рейтингов и цен.

🟢Красота и здоровье (Square): запись в салоны, спа и барбершопы с просмотром расписания и стоимости.

Новые партнёры дополняют уже существующие интеграции Alexa+ (Uber, Ticketmaster, Thumbtack и др.) и показывают стратегию Amazon: сделать голосового ассистента полноценным AI-агентом, который сам ищет, сравнивает и оформляет услуги.

Ключевой вопрос — готовы ли пользователи доверить ИИ такие решения, а бизнесы научиться встраиваться в этот формат аккуратно и полезно.

🟢

Data Cluster

Please open Telegram to view this post

VIEW IN TELEGRAM

20 views07:49

Data Cluster

🤖 GPT-5.2 впервые превзошла человека в тесте на AGI

Стартап Poetiq показал результат 75% на ARC-AGI-2 — бенчмарке Франсуа Шолле на «гибкий интеллект». Средний человек набирает около 60%. Для сравнения: ещё весной лучшие ИИ еле дотягивали до 1–4%.

📣 Важно, что прорыв связан не столько с самой моделью, сколько с подходом:

🟢использовалась GPT-5.2 X-High без специального тюнинга;

🟢поверх модели — «мета-система» с циклом генерация → критика → уточнение;

🟢система сама решает, когда ответ достаточно хорош (в среднем <2 запросов);

🟢стоимость — менее $8 за задачу.

👀 ARC-AGI-2 проверяет умение выводить новые правила, а не вспоминать обученные шаблоны: визуальные головоломки, где нужно понять паттерн и применить его к новой задаче.

Авторы ARC Prize уже называют 2025 год «годом уточняющих циклов»: решающим становится не рост «IQ» моделей, а умные системы проверки и самокоррекции поверх них. Следующая версия теста будет ещё сложнее — с интерактивными действиями и динамическими средами.

🟢

Data Cluster

Please open Telegram to view this post

VIEW IN TELEGRAM

19 views11:52

Data Cluster

👀 Alibaba выпускает Qwen3-TTS Flash — синтез и клонирование голоса нового уровня

Alibaba анонсировала сразу две модели для работы с речью: Qwen3-TTS-VD-Flash и Qwen3-TTS-VC-Flash.

🟢VC-Flash (VoiceClone) умеет клонировать голос всего по 3 секундам аудио. Модель воспроизводит тембр на 10 языках, подходит для мультиязычного контента и локализаций и, по словам Alibaba, показывает меньше ошибок, чем ElevenLabs и MiniMax. Бонус — корректная работа со сложными текстами и даже имитация звуков животных.

🟢VD-Flash (VoiceDesign) — это «конструктор голоса из текста». Вместо выбора готового тембра вы описываете голос словами и получаете уникальный вокальный стиль. По внутренним тестам модель обходит GPT-4o mini-tts и Gemini 2.5 Pro.

Итог: Alibaba явно нацелилась на рынок TTS-API — с быстрым клонированием, мультиязычностью и гибким дизайном голосов. Инструменты, которые ещё недавно были экзотикой, становятся стандартом для контента, игр и ассистентов.

🟢

Data Cluster

Please open Telegram to view this post

VIEW IN TELEGRAM

21 views15:42

Data Cluster

📌 Nvidia «купила» конкурента: Groq лишился команды за $20 млрд

Стартап Groq, который обещал чипы быстрее и дешевле GPU Nvidia, фактически проиграл войну лидеру рынка. Nvidia заплатит около $20 млрд за неэксклюзивную лицензию на технологии инференса Groq и забирает ключевую команду — включая основателя и CEO Джонатана Росса. Формально Groq остаётся независимой компанией, но без людей, которые её создавали.

🟢Groq делала ставку на LPU — процессоры только для инференса, без HBM и с детерминированным выполнением. В бенчмарках они действительно показывали сотни токенов в секунду на больших моделях и позиционировались как реальная альтернатива Nvidia. Но проблемы с масштабированием, задержки дата-центров и падение прогноза выручки сделали своё дело.

🟢Сделка оформлена как лицензия + найм, а не покупка — популярная схема у бигтеха, позволяющая обходить антимонопольные барьеры. По сути, Nvidia устранила потенциальную угрозу, не покупая компанию целиком.

Вывод простой: даже если ты быстрее GPU Nvidia, этого может быть недостаточно. В эпоху ИИ выигрывает не только архитектура, но и способность быстро масштабироваться и выживать рядом с монополистом.

🟢

Data Cluster

Please open Telegram to view this post

VIEW IN TELEGRAM

❤1👍1

18 views07:07

Data Cluster

🤖

Глава Signal: AI-агенты с доступом к ОС — угроза шифрованию

Президент Signal Foundation Мередит Уиттакер резко раскритиковала тренд на AI-агентов с доступом к операционной системе, назвав его экзистенциальной угрозой для приватности и шифрования. Поводом стал курс крупных компаний на «агентные ОС».

🟢Microsoft уже заявила о планах превратить Windows 11 в агентную платформу: ИИ-агенты будут работать в фоне, получать доступ к файлам, приложениям и данным пользователя через Ask Copilot и Model Context Protocol. Формально — для удобства, фактически — с полным доступом к системе.

🟢Проблема в том, что шифрование на уровне приложений перестаёт иметь смысл, если агент на уровне ОС видит всё, что видит пользователь. Сообщения, контакты, платежные данные — всё становится потенциальной поверхностью атаки. Плюс риск prompt-injection: скрытые инструкции в сайтах и письмах могут заставить агента выполнять вредоносные действия.

🔍 Уиттакер требует внедрить opt-out механизмы, чтобы приложения могли запрещать доступ агентам, и настаивает на строгой проверке таких систем, особенно перед использованием в госсекторе.

Вывод простой: агентные ОС — это не просто новый UX, а фундаментальный вызов идее приватности. И ответ на него пока не найден.

🟢

Data Cluster

Please open Telegram to view this post

VIEW IN TELEGRAM

16 views11:32

Data Cluster

🔔

ChatGPT ускорил науку — но ценой качества

Исследование Корнелла и UC Berkeley (анализ ~2,1 млн препринтов за 2018–2024) показало: с приходом LLM учёные стали публиковать на ~60% больше статей. Больше всего выиграли соц- и гуманитарные науки (+59,8%), затем биология (+52,9%), физика и математика (+36,2%).

🟢Самый сильный эффект — у исследователей из неанглоязычных стран. ИИ снял языковой барьер: в отдельных случаях продуктивность выросла до 89%.

🟢Но есть и оборотная сторона. Привычные маркеры качества перестали работать: чем «красивее» и сложнее ИИ-текст, тем ниже реальное качество работы. Академическая риторика всё чаще маскирует слабые идеи.

Авторы призывают менять рецензирование: нужны более глубокие проверки и «ИИ-рецензенты», иначе редакторы начнут полагаться на статус и аффилиации — и демократизирующий эффект ИИ в науке будет утрачен.

🟢

Data Cluster

Please open Telegram to view this post

VIEW IN TELEGRAM

24 views15:48

Data Cluster

📌 Epoch AI: ИИ ускорился вдвое, но бенчмаркам верят всё меньше

В отчёте Epoch AI за 2025 год зафиксирован резкий скачок прогресса: скорость улучшения SOTA-моделей почти удвоилась — с 8 до 15 пунктов производительности в год.

🟢Главные драйверы — переход к reasoning-моделям и активное использование обучения с подкреплением (RL), которое прокачивает логику и адаптивность ИИ.

🟢Но есть и тревожный сигнал. Сравнивать модели становится всё сложнее. Даже на одинаковых тестах результаты «плывут» из-за разных промптов, параметров сэмплирования и инфраструктуры. Особенно это заметно у ИИ-агентов, где нестабильные API добавляют шум и делают метрики менее надёжными.

Вывод Epoch AI: индустрия ускоряется быстрее, чем успевает вырабатывать общие стандарты оценки. Без воспроизводимых методологий и прозрачных тестов достижения рискуют выглядеть либо завышенными, либо несправедливо сравнимыми. В ближайшее время фокус сместится не только на рост показателей, но и на доверие к тому, как именно их измеряют.

🟢

Data Cluster

Please open Telegram to view this post

VIEW IN TELEGRAM

❤1👍1

24 views08:08

Data Cluster

⚡️

Anthropic и OpenAI удвоили лимиты к праздникам — но не все это заметили

Под конец года Anthropic и OpenAI почти синхронно запустили праздничные акции для подписчиков. Обе компании удвоили лимиты использования ИИ до 1 января, но эффект оказался разным.

🟢У Anthropic акция действует с 25 по 31 декабря и охватывает claudeai, мобильные приложения, Claude Code и Chrome-расширение для тарифов Pro, Max 5x и Max 20x. Были увеличены 5-часовой и недельный лимиты, а накопленное использование сбросили в полночь 25 декабря.

🟢OpenAI удвоила лимиты в Codex CLI — инструменте для кодинга из терминала. Лимиты сбросили и подняли до 2× от обычных, что пользователи встретили в целом позитивно.

🟢А вот с Claude всё сложнее. Часть подписчиков жалуется, что лимиты «съедаются» так же быстро или даже быстрее, чем раньше. Возможные причины — рост нагрузки из-за акции или особенности скользящих лимитов Anthropic. Другие пользователи, наоборот, отмечают реальный прирост доступного использования.

Итог простой: лимиты формально увеличили у всех, но ощущения от подарка у пользователей оказались разными. После 1 января всё вернётся к стандартным значениям.

🟢

Data Cluster

Please open Telegram to view this post

VIEW IN TELEGRAM

21 views11:38

Data Cluster

👀 Илон Маск: прогресс ИИ и робототехники стоит замедлить

Илон Маск заявил, что при возможности он бы значительно замедлил развитие искусственного интеллекта и робототехники. По его словам, технологии развиваются слишком быстро, и общество рискует не успеть выработать адекватные механизмы контроля, безопасности и регулирования.

🟢Маск подчеркнул, что нынешние темпы прогресса опережают этику и институты. Без чётких рамок автономные системы и мощные ИИ-модели могут привести к непредсказуемым последствиям — от экономических сбоев до рисков для безопасности.

🟢Он считает, что внимание к вопросам безопасности, прозрачности и оценки рисков должно быть не меньшим, чем гонка за производительностью и возможностями моделей. В противном случае человечество может создать системы, которые окажутся сложнее, чем мы способны понять и контролировать.

Заявление Маска — часть более широкой дискуссии в индустрии: ИИ никуда не денется, но вопрос в том, успеем ли мы договориться о правилах игры до того, как станет поздно.

🟢

Data Cluster

Please open Telegram to view this post

VIEW IN TELEGRAM

21 views15:52

About

Blog

Apps

Platform