Команда Nof1 запустила публичный бенчмарк Alpha Arena, где ведущие ИИ-модели торгуют криптовалютой на реальные деньги. Каждому участнику выдали по 10 000 долларов стартового капитала.
В соревновании участвуют: GPT-5, Gemini 2.5 Pro, Claude Sonnet 4.5, DeepSeek V-3.1, Grok 4 и Qwen3.
По данным Nof1, модели опираются в основном на технический анализ, а не на новости и социальные сигналы, что делает результаты особенно интересными.
🧠 Предыдущий тест показал, что Grok 4 однажды увеличил капитал на 500%, но текущая версия бенчмарка — куда более стабильная и длительная: она продлится несколько недель, после чего организаторы обещают апдейт и перезапуск.
Крипторынок впервые становится ареной для реального ИИ-соревнования — и пока DeepSeek явно задаёт темп.
Please open Telegram to view this post
VIEW IN TELEGRAM
Новый анализ 311 учебных планов, созданных с помощью ChatGPT, Gemini и Copilot, показал тревожный результат:
То есть искусственный интеллект воспроизводит традиционную модель “расскажи и повтори”, вместо того чтобы вовлекать учеников в анализ, обсуждение и поиск собственных решений.
👀 Исследователи отмечают: Чат-боты — не учителя, а языковые модели, предсказывающие следующее слово. Они могут помогать с идеями, но не заменяют педагогическое мышление.
Рекомендация: использовать ИИ не для автоматизации уроков, а для расширения мышления учителя — как инструмент для мозгового штурма, поиска новых подходов и заданий высокого уровня по таксономии Блума.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤1
Компания DeepSeek выпустила открытую модель DeepSeek-OCR, которая выходит далеко за рамки классических систем OCR.
Модель не просто извлекает текст, а восстанавливает всю структуру документа — заголовки, таблицы, списки, подписи к рисункам — и сразу выдаёт результат в Markdown.
👀 Дополнительно модель умеет сохранять координаты элементов на странице — удобно для извлечения таблиц, схем и подписи к изображениям.
На тестах Fox и OmniDocBench DeepSeek-OCR показал качество на уровне тяжёлых мультимодальных моделей (Qwen, GOT-OCR 2.0), но при этом требует в разы меньше вычислений.
Please open Telegram to view this post
VIEW IN TELEGRAM
OpenAI официально заявила, что в 2025 году GPT-6 не выйдет. Вместо этого компания сосредоточится на развитии текущих моделей семейства GPT-5 и, возможно, представит новые промежуточные решения.
👀 Ранее аналитик Evercore ISI Марк Махани предположил, что GPT-6 может выйти к концу года, а Брэд Герстнер (Altimeter Capital) утверждал, что получил подобную информацию от руководства компании. Однако OpenAI опровергла эти ожидания.
Иными словами, ждать GPT-6 в ближайшие месяцы не стоит — фокус компании сейчас на усовершенствовании GPT-5 и интеграции новых возможностей без смены поколения.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤1
Anthropic представила веб-версию Claude Code, своего облачного ИИ-агента для программирования. Теперь работать с ним можно прямо из браузера — без установки и настройки локальной среды.
Веб-версия пока находится в исследовательском превью и доступна пользователям подписок Pro и Max. Интерфейс может дорабатываться, а первые тестеры уже сообщают о багах. Лимиты на использование общие для веб и CLI, но управление задачами теперь доступно и в мобильном приложении iOS.
Please open Telegram to view this post
VIEW IN TELEGRAM
Компания Nvidia сообщила, что её система на базе модели с открытыми весами достигла уровня золотой медали на Международной олимпиаде по информатике (IOI) — уровне, сравнимом с результатами топ-участников.
До этого такого успеха добивалась только экспериментальная модель OpenAI.
В основе подхода — gpt-oss-120B, модель архитектуры Mixture of Experts (на каждом токене активно ~5,1 млрд из 120 млрд параметров).
Использовалась стратегия Test-Time Compute (TTC) — система генерировала тысячи решений, группировала их по поведению и проводила «турниры» между группами, выбирая лучшие.
Публичных данных о вычислительных затратах нет, но эффективность подхода Nvidia может оказаться сопоставимой, а возможно — и выше, чем у закрытых решений.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤1
История, начавшаяся как сенсация, быстро превратилась в репутационный конфуз.
Вице-президент OpenAI Кевин Вейл заявил, что GPT-5 якобы решила десять нерешённых задач Эрдёша и продвинулась ещё в одиннадцати — новость мгновенно разлетелась по сети, создавая эффект «ИИ-гения».
Однако вскоре выяснилось: модель не решала задачи, а просто нашла научные работы, где решения уже существовали. Администратор сайта, на который ссылался Вейл, ошибочно решил, что это оригинальные открытия ИИ. В OpenAI новость подхватили без проверки — и она превратилась в громкий, но ложный пиар-всплеск.
Всё же история имеет и светлую сторону. GPT-5 показала себя не как математический гений, а как инструмент научного поиска, способный находить связи между разрозненными публикациями.
Please open Telegram to view this post
VIEW IN TELEGRAM
Компания официально запустила Atlas — браузер с встроенным ChatGPT и умными ИИ-ассистентами.
Теперь ИИ можно использовать прямо в интернете — для поиска, анализа, покупок и задач на сайтах.
Сейчас Atlas доступен только на macOS. Бесплатно, но функции ChatGPT в браузере активны для пользователей Plus, Pro и Business.
Please open Telegram to view this post
VIEW IN TELEGRAM
Компания Alibaba Cloud представила новую систему Aegaeon, которая способна почти в пять раз сократить количество видеокарт Nvidia, нужных для работы AI-моделей.
🛒 Система уже внедрена на маркетплейсе Bailian (Alibaba Cloud), где размещены сотни AI-моделей от сторонних разработчиков.
Эксперты считают, что Aegaeon может стать ключевым шагом к более устойчивому и доступному AI — особенно в условиях глобального дефицита мощных GPU.
Please open Telegram to view this post
VIEW IN TELEGRAM
Компания IBM Research запустила семейство моделей CyberPal 2.0 — компактных AI-систем от 4 до 20 млрд параметров, созданных специально для задач кибербезопасности.
Несмотря на размер, CyberPal 2.0 обходит более крупные LLM (30–70B) в анализе уязвимостей и расследовании инцидентов.
Почему они эффективнее
🏢 Где применяют: SOC-центры, пентестеры, аналитики безопасности.
В ближайшее время IBM интегрирует CyberPal 2.0 в экосистему QRadar AI, чтобы предсказывать и предотвращать угрозы ещё до их реализации.
Please open Telegram to view this post
VIEW IN TELEGRAM
Соцплатформа Reddit обвинила ИИ-компанию Perplexity и ещё три организации — Oxylabs (Литва), AWMProxy (Россия) и SerpApi (США) — в незаконном сборе данных для обучения нейросетей.
⠀
👀 Reddit подчёркивает, что лицензирует свой контент для Google, OpenAI и других компаний, но Perplexity такой лицензии не имеет.
Теперь платформа требует денежной компенсации и запрета на дальнейшее использование своих данных без разрешения.
Please open Telegram to view this post
VIEW IN TELEGRAM
Институт Future of Life (FLI) опубликовал «Заявление о сверхинтеллекте» — призыв временно запретить разработку ИИ, способного превосходить человека в большинстве интеллектуальных задач.
Кто подписал: Стив Возняк (Apple), Стив Бэннон, Йошуа Бенджио, Джеффри Хинтон, Ричард Брэнсон, принц Гарри и Меган Маркл.
Остановить исследования и запуск сверхинтеллектуальных систем до тех пор,
В заявлении говорится, что стремительное развитие ИИ может угрожать труду, свободе, достоинству человека — и даже выживанию цивилизации.
📚 Это не первое обращение FLI: в 2023 году институт уже предлагал «поставить на паузу» обучение моделей мощнее GPT-4. Тогда это вызвало бурные дискуссии, но крупные ИИ-компании не изменили политику.
Новый документ — попытка объединить техническое и гуманитарное сообщества вокруг идеи «системы тормозов», чтобы человечество не потеряло контроль над ИИ в решающий момент.
Please open Telegram to view this post
VIEW IN TELEGRAM
Исследователи из Anthropic, программы MATS и лаборатории Thinking Machines (сооснователь — Джон Шульман, экс-Chief Scientist OpenAI) создали систему под названием «аудитор дообучения» — ИИ, который оценивает безопасность тонко дообученных языковых моделей до их запуска.
Как это работает
— Аудитор получает: исходную модель, её дообученную версию, датасет, использованный при fine-tuning.
— После анализа он выставляет оценку риска от 0 до 10. В тестах использовалась Claude Sonnet 4 от Anthropic.
💰 Один аудит занимает около 20 шагов и стоит ~$1 — менее 1% стоимости типичного дообучения.
Проблемы и перспективы: Пока точность ограничена (~50%), возможны ложные тревоги. Исследователи планируют расширить доступ аудитора к внутренним слоям моделей и оптимизировать вычисления.
Please open Telegram to view this post
VIEW IN TELEGRAM
Руководитель продукта Google AI Studio Логан Килпатрик представил режим Build, в котором любой пользователь может создать собственное приложение с помощью ИИ Gemini — от идеи до публикации.
📌 Готовое приложение сразу деплоится в Google Cloud Run, после чего автор получает рабочую ссылку.
В Google обещают дальнейшее развитие Build и интеграцию моделей серии Gemini 3.0 — релиз ожидается до конца года.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤1
Компания Anthropic объявила о крупнейшем расширении своей инфраструктуры: она получит доступ к до 1 млн TPU (Tensor Processing Unit) от Google — сделка оценивается в десятки миллиардов долларов.
Anthropic при этом сохраняет мультичиповую стратегию: компания продолжает использовать NVIDIA GPU и Trainium от Amazon, а совместный проект Rainier (кластер на сотни тысяч ИИ-чипов) развивается параллельно.
Please open Telegram to view this post
VIEW IN TELEGRAM
OpenAI объявила о приобретении Software Applications, создателей интеллектуального интерфейса Sky для Mac.
Продукт пока не выпущен публично, но уже вызывает интерес: Sky видит происходящее на экране и может автоматически выполнять действия в приложениях — от написания текстов и кода до планирования и управления задачами.
Покупка Sky — ещё один шаг к интеграции ChatGPT в экосистему повседневных инструментов.
Компания планирует внедрить технологии Sky прямо в ChatGPT для macOS, сделав его полноценным ассистентом, который не только отвечает на вопросы, но и действует.
⚡️ Сделка не раскрыта, но Software Applications ранее привлекла $6,5 млн инвестиций от известных имён — среди них Сэм Альтман, Дилан Филд (Figma), Context Ventures и Stellation Capital.
Sky — это шаг к миру, где ИИ становится не просто чат-ассистентом, а полноценным интерфейсом взаимодействия с компьютером. Сочетание ChatGPT и Sky может превратить macOS в среду, где большинство действий выполняются голосом или автоматически.
Please open Telegram to view this post
VIEW IN TELEGRAM
Соавтор легендарной статьи Attention is All You Need и ведущий исследователь OpenAI Лукаш Кайзер поделился взглядом на развитие искусственного интеллекта.
По словам Кайзера, эпоха простых «продолжателей текста» уходит в прошлое. Будущее за моделями, которые умеют размышлять, — такими, как o1, GPT-5 Thinking и GPT-5 Pro.
Обычные модели уперлись в потолок из-за нехватки обучающих данных, но рассуждающие ИИ продолжают улучшаться благодаря обучению с подкреплением и усовершенствованию логики рассуждений.
Перспективное направление — параллельное рассуждение, когда несколько моделей формируют разные гипотезы, а система собирает из них итоговый ответ.
Модели должны научиться перепроверять себя и признавать "не знаю", что станет ключом к надёжности ИИ.
Кайзер считает, что она важна для понимания физического мира (например, в робототехнике), но в математике и программировании текст уже достаточен.
Лукаш не ожидает «зимы ИИ» — напротив, в ближайшие 1–2 года нас ждёт новый рывок, хотя главным ограничением становятся вычислительные мощности и энергия, а не идеи.
Please open Telegram to view this post
VIEW IN TELEGRAM
Apple запустила поставки серверов для центров обработки данных, предназначенных для обучения и работы систем искусственного интеллекта. Производство ведётся на новом заводе компании в Хьюстоне (Техас).
📈 Apple также открыла производственную академию в партнёрстве с Университетом штата Мичиган.
Эксперты отмечают, что перенос производства iPhone в США потребует значительных затрат и лет подготовки, но компания уже делает шаги в этом направлении.
Please open Telegram to view this post
VIEW IN TELEGRAM
GitHub представил обновлённый Copilot с полностью новым модельным стеком, сфокусированным не на “accept rate”, а на реальной полезности кода, который остаётся в проекте.
👀 GitHub применил трёхступенчатую систему оценки — от оффлайн-тестов с юнит-тестами до A/B-тестов с живыми разработчиками.
В тестах Copilot уверенно обошёл GPT-4.1-mini, однако сравнение с более свежими конкурентами вроде Claude Haiku 4.5 пока не проводилось. Было бы интересно увидеть прямой бенч — особенно с учётом фокуса Haiku на скорости и кодинге.
Please open Telegram to view this post
VIEW IN TELEGRAM
Юрфак Университета Северной Каролины провёл необычный эксперимент: в учебном судебном процессе роль присяжных поручили трём ИИ — ChatGPT, Grok и Claude.
Студенты-юристы исполнили роли прокурора, защитника, свидетелей и обвиняемого. Судьёй выступил профессор уголовного права Джозеф Кеннеди. Ход заседания передавался моделям, которые должны были вынести собственный вердикт вслух.
В университете отмечают, что ИИ уже используется в юридической практике — от анализа доказательств до помощи адвокатам. Эксперимент стал попыткой понять, где пролегает грань между помощником и судьёй.
Please open Telegram to view this post
VIEW IN TELEGRAM
После жалоб пользователей Microsoft уточнила: Gaming Copilot действительно делает скриншоты игрового процесса, но не использует их для обучения ИИ.
Однако остаётся неясно, обрабатываются ли снимки локально или всё же отправляются на серверы Microsoft.
Представитель компании отметил, что Gaming Copilot может использовать текстовые и голосовые диалоги для улучшения ИИ, но только при согласии пользователя.
Please open Telegram to view this post
VIEW IN TELEGRAM