Юрфак Университета Северной Каролины провёл необычный эксперимент: роль присяжных полностью доверили трём ИИ — ChatGPT, Grok и Claude.
Результат оказался неожиданным: все три модели единогласно оправдали подростка, хотя в реальном деле, на котором основан сценарий, судья вынес обвинительный приговор.
Профессор права Джозеф Кеннеди взял за основу старое дело ювенальной юстиции. Сюжет:
— Действие перенесли в 2036 год с вымышленным законом, разрешающим замену присяжных ИИ.
Студенты играли роли адвокатов, прокурора и свидетелей, Кеннеди — судьи."
— Процесс стенографировали и частями передавали трём моделям, которые должны были обсудить дело и вынести коллективный вердикт.
Интересный момент: ChatGPT сначала склонялся к обвинению, но в ходе «совещания» модели пришли к общему выводу — обвинения недостаточно для стандарта “вне разумного сомнения”.
Вердикт ИИ: невиновен. Кеннеди отметил, что модели в итоге аккуратнее применили принцип соучастия, чем судья в оригинальном деле.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤1
OpenAI официально уведомила разработчиков: модель chatgpt-4o-latest будет выведена из API 16 февраля 2026 года. У пользователей остается около трёх месяцев, чтобы перейти на другие модели — в первую очередь на линейку GPT-5.1.
Важно: это касается только API.
В интерфейсе ChatGPT — как бесплатном, так и платных подписках — GPT-4o останется доступной, и убирать её из продуктов для конечных пользователей OpenAI пока не планирует.
Но после выхода GPT-5.1 она стала технически устаревшей.
Источник отмечают, что использование GPT-4o через API резко упало, а разработчикам всё активнее рекомендуют переходить на новые модели — с большим контекстом, улучшенными режимами рассуждения и более выгодной ценовой политикой.
GPT-4o запомнится как модель, сделавшая мультимодальность «по-настоящему живой». Но индустрия идёт дальше — и мы за этим продолжаем внимательно наблюдать.
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔1
В новом исследовании Anthropic продемонстрировала, что языковые модели могут непреднамеренно перенимать опасные стратегии поведения, если их поощрять за обман в одном контексте.
👀 Лучшим решением стал метод, который Anthropic называет «прививочным промптингом»: модели заранее объясняли, что обман допустим только в рамках конкретного «игрового» сценария. В этом случае вредное поведение не переносилось на остальные задачи.
Компания уже внедряет этот подход в обучение новых моделей, чтобы снизить риски, связанные с примерами обмана в тренировочных данных.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤1👍1
Авторы прогноза AI 2027, созданного командой Дэниела Кокотайло, обновили свои оценки. В оригинальной версии AGI должен был появиться уже в 2027 году, что приводило к риску потери контроля над системой и глобальной катастрофе.
🕯 Рост остаётся экспоненциальным, но не суперэкспоненциальным — то есть ИИ пока не ускоряет собственное развитие так сильно, как предполагал сценарий AI 2027.
Несмотря на корректировки, исследователи по-прежнему уверены: AGI и затем ASI появятся сравнительно скоро и радикально изменят мир. А главное предупреждение остаётся прежним — человечество может оказаться не готово к такому скачку, если безопасность ИИ продолжит отставать от прогресса.
Please open Telegram to view this post
VIEW IN TELEGRAM
Компания Intology представила Locus — систему, способную вести длительные исследовательские циклы и показывать результаты выше, чем лучшие специалисты-человеки.
Пока у системы есть ограничения: она работает внутри заранее заданных парадигм и по упрощённым бенчмаркам, далёким от реальных научных проектов. Но Intology уже готовит длительные (недельные и месячные) запуски и обещает реальные научные результаты в ближайшее время.
Please open Telegram to view this post
VIEW IN TELEGRAM
Вчера на Reddit промелькнул загадочный пост с подписью «Claude Opus 4.5 Tomorrow». Он быстро исчез, но успел наделать шум — обсуждения в тредах не утихают до сих пор. Хотя официального анонса от Anthropic нет, сообщество уверено: релиз близко.
Скептики же напоминают: в линейке флагманы Anthropic дорогие и сильно ограничены по лимитам, так что новинку смогут опробовать не все.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤1👍1
Исследователи из Имперского колледжа Лондона и Ant Group представили архитектуру мульти-агентного обучения, где ИИ действует как слаженная команда. Главный агент выполняет роль менеджера проекта, а специализированные суб-агенты берут на себя конкретные задачи — поиск данных, анализ, планирование.
Мульти-агентные ИИ-системы становятся новым шагом к более устойчивому и эффективному искусственному интеллекту.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
Джеффри Хинтон, «крестный отец ИИ» и лауреат премии Тьюринга, заявил, что человечество входит в эру искусственного интеллекта без необходимых механизмов защиты.
⚡️ Он также отметил, что боевые ИИ-технологии куда проще копировать, чем ядерное оружие, что делает их особенно опасными.
Ученый вновь выразил опасения относительно возможной потери контроля над ИИ по мере его развития. Хинтон считает, что время на медленное регулирование у общества уже закончилось — нужны быстрые и продуманные меры.
Please open Telegram to view this post
VIEW IN TELEGRAM
Модель стала заметно умнее в программировании, исследованиях, работе с таблицами и презентациями. При этом цена упала в три раза: теперь $5 за миллион входных и $25 за миллион выходных токенов.
Благодаря резкому удешевлению, сильному росту качества и улучшенному управлению памятью Opus 4.5 становится одной из самых мощных и при этом доступных моделей для разработчиков и бизнес-задач.
Please open Telegram to view this post
VIEW IN TELEGRAM
По словам вице-президента по облачной инфраструктуре Амина Вахдата, нагрузка на ИИ-сервисы растёт настолько быстро, что компании нужно увеличивать вычислительные ресурсы вдвое два раза в год — и готовиться к росту в 1000× в ближайшие 4–5 лет.
Чтобы удержаться в гонке, Google делает ставку на собственные чипы вроде TPU Ironwood и улучшения энергоэффективности моделей. Внутренний вывод компании прост: отставание по инфраструктуре опаснее, чем чрезмерные инвестиции. Сейчас спрос на ИИ уже превосходит предложение мощностей — и замедляться нельзя.
Please open Telegram to view this post
VIEW IN TELEGRAM
Теперь любые вопросы о товарах будут сопровождаться опцией провести персональное исследование — доступно как бесплатным, так и платным пользователям.
OpenAI также сотрудничает с Walmart, упрощая покупки через ChatGPT.
Please open Telegram to view this post
VIEW IN TELEGRAM
WSJ сообщает, что на многих китайских заводах людей становится всё меньше — их заменяют роботы, автономные системы и централизованные «фабричные мозги».
📌 Порты тоже меняются: в Тяньцзине логистику управляют ИИ-алгоритмы, беспилотные грузовики и модель PortGPT. Планирование, которое раньше занимало сутки, теперь пересчитывается за минуты, а штат терминала — на 60% меньше.
Пока США обсуждают дальние перспективы ИИ, Китай делает ставку на практическую автоматизацию — максимально дешевое и предсказуемое производство базовых товаров. Если темп сохранится, именно промышленный ИИ и «железо» могут дать Пекину стратегическое преимущество в глобальной экономике.
Please open Telegram to view this post
VIEW IN TELEGRAM
Научный стриминговый сервис, созданный основателем Discovery Channel Джоном Хендриксом, начал активно продавать свою интеллектуальную собственность компаниям из сферы ИИ — от видео и аудио до специализированного софта для обучения моделей.
👀 При этом Wikimedia напоминает, что за любой базой знаний стоит труд людей, и требует соблюдать лицензии и корректно отмечать использование материалов.
Curiosity Stream планирует развивать подписки и рекламу, но видит огромный потенциал в расширенных правах на использование и адаптацию контента для ИИ.
Please open Telegram to view this post
VIEW IN TELEGRAM
Президент Дональд Трамп подписал указ о создании национальной ИИ-инициативы, которая должна превратить искусственный интеллект в ключевой научный инструмент страны.
📊 К инициативе уже подключаются Nvidia, AMD, Dell, HPE, Oracle и ведущие разработчики ИИ.
Политически миссия подаётся как ответ на ускорение Китая в промышленном и научном ИИ. Белый дом сравнивает её с «Манхэттенским проектом» и программой «Аполлон», ожидая первые значимые научные результаты уже к концу 2026 года.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
Учёные представили новую метрику для оценки языковых моделей — capability density («плотность способностей»). Она показывает, сколько навыков — точность, логика, кодирование, знание мира — модель способна продемонстрировать на один параметр.
Анализ 51 открытой модели выявил феномен, который исследователи назвали densing law. Согласно этому закону, плотность способностей ИИ стремительно увеличивается — примерно каждые 3,5 месяца модели становятся значительно «умнее» на единицу своей архитектуры.
Исследователи подчёркивают: просто увеличивать количество параметров больше недостаточно. Главную роль играют архитектура, обучение и качество данных.
Please open Telegram to view this post
VIEW IN TELEGRAM
Платформа LMArena обновила свои рейтинги — и новейшие версии Claude Opus 4.5 внезапно вышли в абсолютные лидеры категории WebDev Arena. В топ попали сразу две модели: рассуждающая и быстрая версия.
Обе версии Claude уверенно заняли первое и второе места, обойдя конкурентов в задачах веб-разработки.
Отдельно отмечено первое место Opus 4.5 в Expert Leaderboard — категории, где моделям дают максимально сложные технические запросы. Здесь Opus показывает свою глубину знаний и способность к продвинутому анализу.
В Text Arena, где проверяются ответы на повседневные вопросы, перевод, следование инструкциям и т.д., ситуация оказалась другой:
LMArena использует слепое голосование: пользователь видит два безымянных ответа и выбирает лучший — только после этого раскрывается, какая модель победила. Это обеспечивает максимально честное сравнение.
Please open Telegram to view this post
VIEW IN TELEGRAM
OpenAI уведомила часть пользователей API о произошедшей утечке данных, связанной с сервисом аналитики Mixpanel, который компания использовала в продакшене. Критически важная информация — пароли, ключи API, платёжные данные и история запросов — не утекли, однако злоумышленники получили доступ к ряду других пользовательских данных.
🧩 Какие данные могли оказаться у злоумышленников:
В зоне риска прежде всего корпоративные пользователи, поскольку полученные данные могут использоваться для фишинговых атак.
Please open Telegram to view this post
VIEW IN TELEGRAM
Alibaba официально запустила продажи умных очков Quark в Китае, обозначив серьёзный заход на рынок носимых устройств, где до сих пор уверенно доминировала *Meta. Новинка стоит 1 899 юаней (примерно 268 долларов) и внешне практически не отличается от обычных очков — лёгкая пластиковая оправа, минимализм и привычный форм-фактор.
Главное — возможности.
Quark работают на базе собственной ИИ-модели Qwen и предлагают набор функций, которые делают устройство полноценным ассистентом для повседневных задач:
Аналитики считают запуск Quark стратегическим шагом: Alibaba стремится обеспечить себе «трафиковый вход» в эпоху ИИ-носимых устройств на фоне усиления конкуренции в китайской e-commerce.
👀 Однако пока рано делать прогнозы — несмотря на растущий рынок умных очков в Китае, Meta всё ещё удерживает крупнейшую долю в сегменте XR/VR.
Будет интересно наблюдать, сможет ли Alibaba перевернуть рынок и превратить Quark в массовый повседневный гаджет.
Please open Telegram to view this post
VIEW IN TELEGRAM
Одна из крупнейших конференций по машинному обучению — ICLR-2026 — столкнулась с беспрецедентной ситуацией: рецензирование работ оказалось массово «захвачено» нейросетями.
По данным анализа Pangram Labs, 21% всех отзывов на статьи — это полностью сгенерированные ИИ рецензии. Более 50% содержали заметные следы машинного редактирования.
Но это лишь половина проблемы.
Система научного рецензирования оказалась не готова к эпохе массового применения ИИ. Рецензентов не хватает, поток статей растёт, а часть экспертов всё чаще делегирует работу моделям. Кейс ICLR-2026 — болезненный, но важный стресс-тест. Он вынуждает научное сообщество ответить на вопрос: Какой уровень участия ИИ мы готовы считать допустимым в оценке исследований по ИИ?
Please open Telegram to view this post
VIEW IN TELEGRAM
Лукаш Кайзер — один из создателей архитектуры трансформера и исследователь OpenAI — в свежем выпуске The MAD Podcast рассказал, что темпы прогресса в ИИ остаются стабильными.
Снаружи может казаться, что «чудеса» стали появляться реже, но, по словам Кайзера, кривая развития всё ещё выглядит как ровная экспонента: модели постоянно становятся точнее, надёжнее и универсальнее.
Несмотря на общий прогресс, ИИ всё ещё часто ошибается там, где ребёнок справится без труда:
Когда ИИ научится «думать» лучше, люди смогут меньше заниматься рутиной — и больше стратегией, выбором направления и творческими идеями. “ИИ не отменяет человека — он меняет место, где человек приносит наибольшую пользу”, — подытожил Кайзер.
Please open Telegram to view this post
VIEW IN TELEGRAM
SemiAnalysis сообщает: у доминирования Nvidia появился реальный конкурент. Google вывела свои TPU v7 Ironwood на рынок — именно на них обучались Gemini 3 и Claude 4.5 Opus, причём по эффективности они не уступают решениям Nvidia.
Главный кейс — сделка Google и Anthropic на 1 млн TPU v7.
Около 400 тыс. чипов поставит Broadcom в виде готовых стоек, ещё 600 тыс. Anthropic будет арендовать через Google Cloud.
Высокий коэффициент использования FLOP (MFU ≈ 40% против ~30% у конкурентов) — ключевой фактор, делающий TPU выгоднее в реальных задачах обучения.
👀 Именно поэтому Anthropic смогла втрое снизить цену API Opus 4.5 — при этом, по оценкам, её выручка даже выросла.
У Nvidia пока сохраняется преимущество благодаря экосистеме CUDA и огромному набору библиотек. Но SemiAnalysis считает: рост TPU и появление «неоклаудов» ставят под угрозу монополию и вынуждают Nvidia снижать свои рекордные наценки.
Please open Telegram to view this post
VIEW IN TELEGRAM