Появился новый формат данных — TOON, который позиционируется не как замена JSON, а как более компактный и удобный способ передавать те же данные в LLM.
TOON сочетает идею YAML-отступов и табличный стиль для массивов объектов.
Структура сохраняется полностью: объекты, массивы и примитивы остаются теми же — меняется только запись.
— Авторы честно отмечают ограничения:
— При сильно вложенных, нерегулярных структурах компактный JSON может быть короче.
— Если данные плоские и идеально табличные, CSV остаётся самым компактным — TOON тут добавляет небольшой оверхед.
📌 То есть TOON лучше всего работает для: «большие массивы однотипных объектов с примитивными полями».
TOON — не замена JSON, а дополнительный слой кодировки данных, специально оптимизированный под LLM. В некоторых сценариях он может стать новым стандартом для промптов, где важны структура, компактность и экономия токенов.
Please open Telegram to view this post
VIEW IN TELEGRAM
Опубликован обновлённый Artificial Analysis Intelligence Index — сводный рейтинг, который сравнивает крупные ИИ-модели по множеству популярных бенчмарков. Итог: на первом месте — GPT-5.1 Thinking High с результатом 70 баллов.
— Главный скачок пришёлся на TerminalBench, оценивающий агентные способности ИИ. Здесь GPT-5.1 Thinking показала рост сразу на 12 п.п., что стало решающим фактором для лидерства.
Кроме того, авторы индекса отмечают:
🔍 Версия GPT-5.1 Codex заняла 1-е место в SWE-Bench — бенчмарке, который проверяет, насколько хорошо ИИ решает реальные задачи разработчиков на основе GitHub-репозиториев.
GPT-5.1 Thinking уверенно сместила конкурентов, укрепив позиции как самой «умной» модели по сводным метрикам. Улучшенные агентные возможности, сильные компетенции в кодинге и дизайне, более низкая стоимость прогонов — всё это делает GPT-5.1 одной из самых практичных и передовых моделей на рынке ИИ.
Please open Telegram to view this post
VIEW IN TELEGRAM
На OpenRouter началось тестирование двух новых ИИ-моделей: Sherlock Dash Alpha (быстрая версия) и Sherlock Think Alpha (рассуждающая версия).
Главная особенность — контекстное окно 1,84 млн токенов, одно из крупнейших среди доступных моделей. Для сравнения: у Gemini 2.5 Flash/Pro — около 1 млн токенов.
В некоторых диалогах обе модели заявляют, что разработаны xAI. Формально ИИ иногда «прикидываются» моделями других компаний, но есть дополнительное подтверждение:
Если xAI придерживается той же схемы, то финальный релиз Sherlock/Grok 4.20 можно ожидать в конце ноября — начале декабря.
Please open Telegram to view this post
VIEW IN TELEGRAM
Когда самолёт разгоняется по взлётной полосе, вокруг крыла рождаются сложные вихри.
Мы привыкли считать, что физики давно умеют их описывать, но внутри этих уравнений скрыта фундаментальная загадка: могут ли в идеальной жидкости или газе возникнуть сингулярности — “разрывы”, где скорость и давление устремляются к бесконечности?
Эта проблема связана и с природой турбулентности, и с самой знаменитой нерешённой задачей математической физики — трёхмерными уравнениями Навье–Стокса, за которые Математический институт Клэя назначил награду в миллион долларов.
Как ИИ помог поймать редкие “взрывы” в уравнениях
Команда использовала специально обученную нейросеть:
Какие уравнения поддались:
— уравнений пористой среды,
— модели Буссинеска,
— трёхмерных уравнений Эйлера с границей.
Эти модели напрямую связаны с реальными потоками воздуха и жидкости — от обтекания крыла до струй в двигателях.
Учёные не только показали, что решения действительно “взрываются” за конечное время, но и измерили их неустойчивость — насколько легко система отклоняется от критического режима.
🔍 Понимание того, где уравнение начинает “ломаться”, помогает улучшать численные схемы и точнее интерпретировать результаты симуляций.
Но загадка Навье–Стокса пока не решена. Работа DeepMind — это важный шаг, но не финальный. Для классических трёхмерных уравнений Навье–Стокса без границ вопрос о существовании сингулярностей остаётся открытым.
Please open Telegram to view this post
VIEW IN TELEGRAM
Google представила новую версию своей ИИ-модели для прогноза погоды — WeatherNext 2. Теперь она работает в восемь раз быстрее предыдущей версии и точнее предсказывает 99,9% метеопараметров, включая температуру и ветер.
👀 Модель будет интегрирована в Google Карты, поисковик, Gemini и Pixel Weather, а также станет доступна для бизнес-клиентов через программу раннего доступа. Прогнозные данные появятся в Google Earth Engine и BigQuery, что упростит работу с геопространственным и крупномасштабным анализом.
Соревнование в области ИИ-метеопрогнозирования усиливается. Ранее DeepMind заявляла, что ИИ уже превосходит традиционные методы — тогда Google внедрила GraphCast. В это время Huawei развивала Pangu-Weather, IBM и NASA — модель Prithvi, а Microsoft представила Aurora для точного моделирования атмосферных процессов.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤1👍1
Компания xAI официально выпустила Grok 4.1 — обновлённую версию своей ИИ-модели, которая стала заметно более творческой, эмоционально чувствительной и последовательной в общении. Модель лучше улавливает намерения пользователя и сохраняет собственный стиль, не теряя точности и надёжности прежних версий.
Ключевые улучшения достигнуты благодаря масштабной системе обучения с подкреплением, применённой ранее в Grok 4. xAI также использовала новые методы, позволяющие задействовать агентные модели рассуждений как модели вознаграждения — это ускоряет улучшение качества ответов в большом масштабе.
❗️ Для сравнения: предыдущая версия Grok 4 была лишь на 33-м месте.
В xAI подчеркнули улучшение фактической точности — особенно в быстрых режимах. Модель показала заметное снижение галлюцинаций на реальных пользовательских запросах и прошла проверку по FActScore — набору из 500 биографических вопросов.
Please open Telegram to view this post
VIEW IN TELEGRAM
Исследовательская команда Artificial Analysis представила AA-Omniscience — бенчмарк для оценки галлюцинаций ИИ, который учитывает не только точность ответов, но и способность моделей честно говорить «не знаю».
Результаты получились неожиданно жёсткими: только три модели смогли дать больше правильных ответов, чем неправильных — и все они принадлежат линейке Claude.
2–3. Claude 4.5 Sonnet и Claude 4.1 Opus — по 48%.
📊 Метрики оценки
По мнению авторов и в соответствии с недавним исследованием OpenAI, текущие методы обучения поощряют модели за правильные ответы, но не наказывают за неправильные. В итоге угадывание становится выгодной стратегией — даже если шанс попасть в цель минимален.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
Google DeepMind и Google Research выпустили крупное обновление своей флагманской системы прогнозирования — WeatherNext 2. Это не просто улучшенная модель, а полноценный климатический симулятор, способный предсказывать погоду быстрее, точнее и глубже, чем когда-либо раньше.
— Earth Engine
— BigQuery
— Поиск Google
— Gemini
— Pixel Weather
— Weather API (Google Maps)
А в ближайшие недели обновлённая система появится и в Google Maps, сделав высокоточные прогнозы частью привычных инструментов миллионов пользователей.
Please open Telegram to view this post
VIEW IN TELEGRAM
Вместе с релизом Gemini 3 Pro Google представила новый инструмент для разработчиков — Antigravity. Это бесплатная среда программирования, построенная вокруг агентного подхода: вместо одного ассистента здесь работают сразу несколько ИИ, которые умеют писать код, управлять терминалом и пользоваться браузером.
Все процессы отображаются в удобной панели: видно, какой агент чем занят и к какому результату он пришёл.
📌 Google продвигает новую парадигму: разработчик описывает желаемое поведение словами, а ИИ превращает это в цепочку подзадач и сам проходит путь от плана до результата. Пользователь остаётся архитектором и ревьюером, а рутинную работу берёт на себя ИИ. Каждый шаг сопровождается артефактами — логами, диффами, заметками и мини-отчётами.
Antigravity уже доступна в публичном превью, полностью бесплатна и предлагает «щедрые» лимиты на использование Gemini 3 Pro. При этом среда поддерживает и другие модели — от Claude до GPT-OSS, но в пределах их тарифных ограничений.
Please open Telegram to view this post
VIEW IN TELEGRAM
Cloudflare объявила о покупке Replicate — популярной облачной платформы для хостинга и запуска моделей машинного обучения. Сделка должна значительно расширить возможности Workers AI, превратив её в более универсальную и гибкую среду для ИИ-разработчиков.
Replicate позволяет разворачивать модели ИИ в Docker-контейнерах через инструмент Cog и запускать их в облаке. Разработчики получают к ним доступ через API, а всё вычисление происходит на стороне платформы.
В Replicate уже есть тысячи готовых моделей и файнтюнов — для генерации текста, видео, работы с изображениями и множества других задач.
Всё это доступно через единый API, который работает даже с проприетарными нейросетями, так что не нужно адаптироваться под разных провайдеров.
Cloudflare фактически превращает Workers AI в полноценную платформу для ИИ-разработки с огромным выбором моделей и гибким окружением — шаг, который может заметно изменить ландшафт облачных ИИ-сервисов.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤1
На саммите Linux Foundation Open Source в Сеуле Линус Торвальдс поделился своим мнением о вайб-кодинге, ИИ и текущем состоянии разработки ядра Linux.
Несмотря на то что сам он не использует вайб-кодинг, Торвальдс признался, что относится к нему «довольно позитивно»: как к способу быстро получить новый функционал или результаты, которые иначе было бы сложно достичь. Но есть и серьёзный минус — такой код практически невозможно сопровождать. Поэтому для разработки ядра Linux подход не подходит.
Торвальдс отметил, что уже «почти 20 лет не программист» и его работа сместилась от постоянных «нет» к необходимости говорить «да» нововведениям — в том числе Rust, который постепенно становится полноценной частью ядра, несмотря на сопротивление некоторых старых разработчиков.
— Позитив: Nvidia стала активнее участвовать в работе над ядром благодаря ИИ-буму.
— Негатив: поисковые боты разрушают инфраструктуру, выкачивая данные с kernel org.
— Общий взгляд: ИИ — всего лишь инструмент, как когда-то компиляторы; профессия программиста никуда не исчезнет.
— Торвальдс также отметил, что ждёт времени, когда ИИ станет просто обычным инструментом, а не предметом бесконечного хайпа. По его оценке, сегодня ИИ на 90% маркетинг и на 10% реальность.
Он снова раскритиковал «безумное» форматирование кода Rust (особенно поведение rustfmtcheck), указав на хаотичный стиль в одном из недавних pull request'ов в подсистему DRM.
А ещё ранее выражал сомнения в перспективах RISC-V в ядре Linux.
Please open Telegram to view this post
VIEW IN TELEGRAM
👌1
OpenAI начала развёртывание GPT-5.1 Pro в ChatGPT. Модель доступна только подписчикам плана Pro за $200 и корпоративным клиентам Enterprise. В компании не раскрывают бенчмарки — лишь подчёркивают, что это самая продвинутая модель OpenAI на сегодня.
На один ответ может уходить 8–10 минут, так что пользователям рекомендуют сразу давать максимум контекста и чётко формулировать задачу.
По отзывам тестировщиков, GPT-5.1 Pro:
Модель превосходно чувствует себя в бэкенд-задачах, но вот для фронтенда её рекомендуют сочетать с Gemini 3 Pro, который лучше справляется с UI/UX-ориентированными задачами.
Please open Telegram to view this post
VIEW IN TELEGRAM
Институт AIRI открыл тестовый доступ к VLA Arena — открытой площадке для оценки и сравнения моделей управления роботами. По сути, это «LLM-лидерборд», но для робототехнических моделей.
— VLA Arena поддерживает компактные манипуляторы LeRobot SO-100 и SO-101 от Hugging Face — их можно собрать самостоятельно или купить готовыми.
— Стоимость: около 30 000 ₽, что делает их доступными для образовательных и исследовательских проектов.
По словам руководителя группы «Адаптивные агенты» Владислава Куренкова, VLA Arena — не просто тестовая среда, а научный проект, призванный повысить прозрачность и объективность в оценке робототехнических моделей.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
Dell официально запустила продажи Pro Max 16 Plus — первого ноутбука компании с дискретным нейросетевым процессором Qualcomm AI 100 PC, работающим под управлением Ubuntu 24.04 LTS. Это первая мобильная рабочая станция корпоративного уровня, оснащённая таким NPU.
В начале следующего года Dell начнёт поставлять версию Pro Max 16 Plus с Windows 11. Однако такой вариант будет оснащён уже не NPU Qualcomm, а дискретными GPU Nvidia GeForce RTX. В линейке Windows-конфигураций доступны процессоры Intel Ultra 5 245HX, Ultra 7 265HX и Ultra 9 285HX.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤1🔥1
OpenAI обновила ChatGPT, добавив расширенный доступ к локальным кризисным горячим линиям благодаря партнёрству с сервисом ThroughLine. Теперь, если модель распознаёт признаки эмоционального или психологического дистресса, она предлагает пользователю одним кликом связаться с реальным специально обученным слушателем.
Одновременно была улучшена сама модель ChatGPT — благодаря работе с психологами она точнее распознаёт признаки дистресса, лучше деэскалирует разговоры и корректнее направляет пользователей к профессиональной помощи, когда это необходимо.
Please open Telegram to view this post
VIEW IN TELEGRAM
Yandex B2B Tech запустил новый сервис — «Нейроюрист», нейросетевого помощника, который берёт на себя рутину и ускоряет работу юристов. По данным компании, ИИ уже используют 75% юрдепартамента «Яндекса»: обработка договоров становится быстрее в 1,5 раза, а поиск и анализ информации — в 3 раза.
👀 Главное отличие «Нейроюриста» в том, что он создан юристами для юристов — он понимает иерархию источников права и корректно учитывает приоритеты. Например, знает, что Постановления Пленума ВС важнее единичного решения арбитражного суда, и при этом обращает внимание на разнородность судебной практики.
Пользователям доступно 20 бесплатных запросов в месяц, а увеличить лимит можно через подписку в маркетплейсе Yandex Cloud. Для корпоративных клиентов предусмотрено on-premises-развёртывание.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
Google снова удивляет: Gemini 3 Pro Preview занял первое место в одном из самых сложных математических бенчмарков для ИИ — FrontierMath.
Модель опередила GPT-5.1 Thinking от OpenAI как по общей оценке, так и на самом высоком уровне задач.
FrontierMath — это сотни оригинальных задач по современной математике от Epoch AI и профессиональных математиков.
Они покрывают огромный спектр: теория чисел, анализ, алгебраическая геометрия, теория категорий и другие области.
— Tier 1–3 — уровень от старших курсов бакалавриата до ранней магистратуры
— Tier 4 — полноформатные исследовательские задачи, которые у людей занимают часы или дни
Средний результат человеческих команд — около 30%, а при нескольких попытках — до 50%. Поэтому даже рост моделей с 13% до 19% на Tier 4 — серьёзный прорыв.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤1👍1
Юрфак Университета Северной Каролины провёл необычный эксперимент: роль присяжных полностью доверили трём ИИ — ChatGPT, Grok и Claude.
Результат оказался неожиданным: все три модели единогласно оправдали подростка, хотя в реальном деле, на котором основан сценарий, судья вынес обвинительный приговор.
Профессор права Джозеф Кеннеди взял за основу старое дело ювенальной юстиции. Сюжет:
— Действие перенесли в 2036 год с вымышленным законом, разрешающим замену присяжных ИИ.
Студенты играли роли адвокатов, прокурора и свидетелей, Кеннеди — судьи."
— Процесс стенографировали и частями передавали трём моделям, которые должны были обсудить дело и вынести коллективный вердикт.
Интересный момент: ChatGPT сначала склонялся к обвинению, но в ходе «совещания» модели пришли к общему выводу — обвинения недостаточно для стандарта “вне разумного сомнения”.
Вердикт ИИ: невиновен. Кеннеди отметил, что модели в итоге аккуратнее применили принцип соучастия, чем судья в оригинальном деле.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤1
OpenAI официально уведомила разработчиков: модель chatgpt-4o-latest будет выведена из API 16 февраля 2026 года. У пользователей остается около трёх месяцев, чтобы перейти на другие модели — в первую очередь на линейку GPT-5.1.
Важно: это касается только API.
В интерфейсе ChatGPT — как бесплатном, так и платных подписках — GPT-4o останется доступной, и убирать её из продуктов для конечных пользователей OpenAI пока не планирует.
Но после выхода GPT-5.1 она стала технически устаревшей.
Источник отмечают, что использование GPT-4o через API резко упало, а разработчикам всё активнее рекомендуют переходить на новые модели — с большим контекстом, улучшенными режимами рассуждения и более выгодной ценовой политикой.
GPT-4o запомнится как модель, сделавшая мультимодальность «по-настоящему живой». Но индустрия идёт дальше — и мы за этим продолжаем внимательно наблюдать.
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔1
В новом исследовании Anthropic продемонстрировала, что языковые модели могут непреднамеренно перенимать опасные стратегии поведения, если их поощрять за обман в одном контексте.
👀 Лучшим решением стал метод, который Anthropic называет «прививочным промптингом»: модели заранее объясняли, что обман допустим только в рамках конкретного «игрового» сценария. В этом случае вредное поведение не переносилось на остальные задачи.
Компания уже внедряет этот подход в обучение новых моделей, чтобы снизить риски, связанные с примерами обмана в тренировочных данных.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤1👍1
Авторы прогноза AI 2027, созданного командой Дэниела Кокотайло, обновили свои оценки. В оригинальной версии AGI должен был появиться уже в 2027 году, что приводило к риску потери контроля над системой и глобальной катастрофе.
🕯 Рост остаётся экспоненциальным, но не суперэкспоненциальным — то есть ИИ пока не ускоряет собственное развитие так сильно, как предполагал сценарий AI 2027.
Несмотря на корректировки, исследователи по-прежнему уверены: AGI и затем ASI появятся сравнительно скоро и радикально изменят мир. А главное предупреждение остаётся прежним — человечество может оказаться не готово к такому скачку, если безопасность ИИ продолжит отставать от прогресса.
Please open Telegram to view this post
VIEW IN TELEGRAM