OpenAI опубликовала GPT-5.1 Prompting Guide — самое подробное на сегодня руководство по тому, как правильно работать с новой моделью. Хотя документ ориентирован на использование через API, многие советы идеально подходят и обычным пользователям ChatGPT.
Авторы отмечают, что GPT-5.1 более дисциплинирована и экономна в рассуждениях — поэтому важно избегать конфликтующих инструкций и чётко задавать длину, формат и завершённость решения.
Также модель можно запустить без рассуждающего режима — тогда она работает быстрее и дешевле, фактически как продвинутая версия GPT-4.1.
OpenAI рекомендует строить вокруг GPT-5.1 настоящих рабочих агентов. Сценарий такой:
Таким образом, современный промпт — это уже не “напиши функцию”, а полноценный пошаговый сценарий.
Please open Telegram to view this post
VIEW IN TELEGRAM
Spotify представила Recaps — новую функцию на базе искусственного интеллекта, созданную специально для тех, кто делает перерыв в аудиокнигах и потом забывает, что происходило в сюжете.
Доступ к обзорам открывается после прослушивания 15–20 минут книги.
Функция находится в бета-тестировании, сейчас доступна на iOS для ограниченного числа аудиокниг. В ближайшие дни охват будет расширяться.
Please open Telegram to view this post
VIEW IN TELEGRAM
В беседе с инвестором Роном Бароном Илон Маск рассказал о следующем поколении ИИ xAI — Grok 5. Новую модель обучают на суперкомпьютере Colossus 2, который ещё не вышел на проектную мощность (1 млн GPU ожидают в 2026 году), но уже сейчас позволяет создавать модель рекордного масштаба — 6 трлн параметров.
Как и предыдущие версии, Grok 5 использует архитектуру MoE (Mixture of Experts) — на каждый токен задействуется лишь часть параметров, что сильно снижает ресурсоёмкость.
Что обещает Маск
Релиз запланирован на первый квартал 2026 года. Если сроки не сдвинутся, мы уже скоро сможем проверить, насколько инновационной окажется новая модель и оправдает ли она амбиции Маска.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤1👍1
Международное энергетическое агентство опубликовало свежий World Energy Outlook 2025 — и там впервые зафиксирован исторический разворот: инвестиции в дата-центры в 2025 году достигнут ~$580 млрд, впервые перегнав вложения в новые нефтедобывающие проекты (~$540 млрд).
Глава МЭА Фатих Бироль отмечает: цифровая инфраструктура выходит на один уровень с традиционными сырьевыми отраслями.
Что считается инвестициями в ИИ
Главный драйвер — взрывной спрос на мощности для обучения и запуска больших моделей: чат-ботов, мультимодальных моделей, генеративного видео и ИИ-агентов. На этом фоне формируется новый тип объектов: ИИ-фабрики, ради которых Big Tech добивается льготных тарифов на электричество и заключает долгосрочные контракты с энергетиками.
Кто вкладывает деньги:
Oracle и другие облачные провайдеры, строящие гигантские кластеры в США, Европе и Азии. Логика проста: кто первым создаст достаточно “железа”, тот сможет обучать самые мощные модели и доминировать на рынке корпоративных ИИ-сервисов.
Please open Telegram to view this post
VIEW IN TELEGRAM
Blue Origin сделала крупный шаг вперёд: ступень тяжёлой ракеты New Glenn впервые успешно вернулась на плавучую платформу в Атлантике. Отделение произошло примерно через 10 минут после старта, а сама ракета тем временем вывела на орбиту два научных зонда NASA для марсианской миссии ESCAPADE.
Что это меняет для отрасли
Успех New Glenn — знаковый момент не только для Blue Origin, но и для всей отрасли: тяжёлые многоразовые ракеты становятся новой реальностью.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤1
Вокруг Gemini 3.0 Pro стремительно нарастает хайп — и теперь он подкреплён намёками от людей, которые точно знают больше остальных.
С момента начала тестирования прошло уже полтора месяца — и всё указывает на то, что следующая неделя может стать неделей релиза Gemini 3.0 Pro.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤1👍1
🕒 Новый бенчмарк показал: ни один ИИ не смог правильно выставить стрелки на часах
Инженер Брайан Мур запустил забавный, но показательный тест AI World Clocks. Девять языковых моделей — от GPT-3.5 до Grok 4 и GPT-5 — получили простое задание: каждую минуту генерировать HTML-код часов с корректным временем.
Результат? Ни одна модель не справилась.
❓ Что происходило в тесте?
🟢 Каждую минуту ИИ генерировали новую версию кода часов.
🟢 Код часто выглядел красиво, иногда почти идеально соответствовал задаче.
🟢 Но ни одна модель не смогла стабильно выставлять правильные углы для стрелок.
🟢 Проблема, однако, оказалась не в математике моделей, а… в промпте.
🔔 Всё сломалось, потому что в промпте не было уточнений:
🟢 как считать угол часовой и минутной стрелки;
🟢 где у CSS находится нулевая точка;
🟢 как модели проверять правильность результата;
🟢 как исправлять собственные ошибки.
Эксперимент отлично демонстрирует важную проблему: многие пользователи общаются с ИИ «по-человечески», не формализуя задачу. А модели пока не умеют автоматически уточнять неполные запросы.
🟢 Data Cluster
Инженер Брайан Мур запустил забавный, но показательный тест AI World Clocks. Девять языковых моделей — от GPT-3.5 до Grok 4 и GPT-5 — получили простое задание: каждую минуту генерировать HTML-код часов с корректным временем.
Результат? Ни одна модель не справилась.
👀 А ещё — ограничение по токенам. ИИ честно рисовал красивые часы, но никто не просил его перепроверять математику.
Эксперимент отлично демонстрирует важную проблему: многие пользователи общаются с ИИ «по-человечески», не формализуя задачу. А модели пока не умеют автоматически уточнять неполные запросы.
Please open Telegram to view this post
VIEW IN TELEGRAM
Появился новый формат данных — TOON, который позиционируется не как замена JSON, а как более компактный и удобный способ передавать те же данные в LLM.
TOON сочетает идею YAML-отступов и табличный стиль для массивов объектов.
Структура сохраняется полностью: объекты, массивы и примитивы остаются теми же — меняется только запись.
— Авторы честно отмечают ограничения:
— При сильно вложенных, нерегулярных структурах компактный JSON может быть короче.
— Если данные плоские и идеально табличные, CSV остаётся самым компактным — TOON тут добавляет небольшой оверхед.
📌 То есть TOON лучше всего работает для: «большие массивы однотипных объектов с примитивными полями».
TOON — не замена JSON, а дополнительный слой кодировки данных, специально оптимизированный под LLM. В некоторых сценариях он может стать новым стандартом для промптов, где важны структура, компактность и экономия токенов.
Please open Telegram to view this post
VIEW IN TELEGRAM
Опубликован обновлённый Artificial Analysis Intelligence Index — сводный рейтинг, который сравнивает крупные ИИ-модели по множеству популярных бенчмарков. Итог: на первом месте — GPT-5.1 Thinking High с результатом 70 баллов.
— Главный скачок пришёлся на TerminalBench, оценивающий агентные способности ИИ. Здесь GPT-5.1 Thinking показала рост сразу на 12 п.п., что стало решающим фактором для лидерства.
Кроме того, авторы индекса отмечают:
🔍 Версия GPT-5.1 Codex заняла 1-е место в SWE-Bench — бенчмарке, который проверяет, насколько хорошо ИИ решает реальные задачи разработчиков на основе GitHub-репозиториев.
GPT-5.1 Thinking уверенно сместила конкурентов, укрепив позиции как самой «умной» модели по сводным метрикам. Улучшенные агентные возможности, сильные компетенции в кодинге и дизайне, более низкая стоимость прогонов — всё это делает GPT-5.1 одной из самых практичных и передовых моделей на рынке ИИ.
Please open Telegram to view this post
VIEW IN TELEGRAM
На OpenRouter началось тестирование двух новых ИИ-моделей: Sherlock Dash Alpha (быстрая версия) и Sherlock Think Alpha (рассуждающая версия).
Главная особенность — контекстное окно 1,84 млн токенов, одно из крупнейших среди доступных моделей. Для сравнения: у Gemini 2.5 Flash/Pro — около 1 млн токенов.
В некоторых диалогах обе модели заявляют, что разработаны xAI. Формально ИИ иногда «прикидываются» моделями других компаний, но есть дополнительное подтверждение:
Если xAI придерживается той же схемы, то финальный релиз Sherlock/Grok 4.20 можно ожидать в конце ноября — начале декабря.
Please open Telegram to view this post
VIEW IN TELEGRAM
Когда самолёт разгоняется по взлётной полосе, вокруг крыла рождаются сложные вихри.
Мы привыкли считать, что физики давно умеют их описывать, но внутри этих уравнений скрыта фундаментальная загадка: могут ли в идеальной жидкости или газе возникнуть сингулярности — “разрывы”, где скорость и давление устремляются к бесконечности?
Эта проблема связана и с природой турбулентности, и с самой знаменитой нерешённой задачей математической физики — трёхмерными уравнениями Навье–Стокса, за которые Математический институт Клэя назначил награду в миллион долларов.
Как ИИ помог поймать редкие “взрывы” в уравнениях
Команда использовала специально обученную нейросеть:
Какие уравнения поддались:
— уравнений пористой среды,
— модели Буссинеска,
— трёхмерных уравнений Эйлера с границей.
Эти модели напрямую связаны с реальными потоками воздуха и жидкости — от обтекания крыла до струй в двигателях.
Учёные не только показали, что решения действительно “взрываются” за конечное время, но и измерили их неустойчивость — насколько легко система отклоняется от критического режима.
🔍 Понимание того, где уравнение начинает “ломаться”, помогает улучшать численные схемы и точнее интерпретировать результаты симуляций.
Но загадка Навье–Стокса пока не решена. Работа DeepMind — это важный шаг, но не финальный. Для классических трёхмерных уравнений Навье–Стокса без границ вопрос о существовании сингулярностей остаётся открытым.
Please open Telegram to view this post
VIEW IN TELEGRAM
Google представила новую версию своей ИИ-модели для прогноза погоды — WeatherNext 2. Теперь она работает в восемь раз быстрее предыдущей версии и точнее предсказывает 99,9% метеопараметров, включая температуру и ветер.
👀 Модель будет интегрирована в Google Карты, поисковик, Gemini и Pixel Weather, а также станет доступна для бизнес-клиентов через программу раннего доступа. Прогнозные данные появятся в Google Earth Engine и BigQuery, что упростит работу с геопространственным и крупномасштабным анализом.
Соревнование в области ИИ-метеопрогнозирования усиливается. Ранее DeepMind заявляла, что ИИ уже превосходит традиционные методы — тогда Google внедрила GraphCast. В это время Huawei развивала Pangu-Weather, IBM и NASA — модель Prithvi, а Microsoft представила Aurora для точного моделирования атмосферных процессов.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤1👍1
Компания xAI официально выпустила Grok 4.1 — обновлённую версию своей ИИ-модели, которая стала заметно более творческой, эмоционально чувствительной и последовательной в общении. Модель лучше улавливает намерения пользователя и сохраняет собственный стиль, не теряя точности и надёжности прежних версий.
Ключевые улучшения достигнуты благодаря масштабной системе обучения с подкреплением, применённой ранее в Grok 4. xAI также использовала новые методы, позволяющие задействовать агентные модели рассуждений как модели вознаграждения — это ускоряет улучшение качества ответов в большом масштабе.
❗️ Для сравнения: предыдущая версия Grok 4 была лишь на 33-м месте.
В xAI подчеркнули улучшение фактической точности — особенно в быстрых режимах. Модель показала заметное снижение галлюцинаций на реальных пользовательских запросах и прошла проверку по FActScore — набору из 500 биографических вопросов.
Please open Telegram to view this post
VIEW IN TELEGRAM
Исследовательская команда Artificial Analysis представила AA-Omniscience — бенчмарк для оценки галлюцинаций ИИ, который учитывает не только точность ответов, но и способность моделей честно говорить «не знаю».
Результаты получились неожиданно жёсткими: только три модели смогли дать больше правильных ответов, чем неправильных — и все они принадлежат линейке Claude.
2–3. Claude 4.5 Sonnet и Claude 4.1 Opus — по 48%.
📊 Метрики оценки
По мнению авторов и в соответствии с недавним исследованием OpenAI, текущие методы обучения поощряют модели за правильные ответы, но не наказывают за неправильные. В итоге угадывание становится выгодной стратегией — даже если шанс попасть в цель минимален.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
Google DeepMind и Google Research выпустили крупное обновление своей флагманской системы прогнозирования — WeatherNext 2. Это не просто улучшенная модель, а полноценный климатический симулятор, способный предсказывать погоду быстрее, точнее и глубже, чем когда-либо раньше.
— Earth Engine
— BigQuery
— Поиск Google
— Gemini
— Pixel Weather
— Weather API (Google Maps)
А в ближайшие недели обновлённая система появится и в Google Maps, сделав высокоточные прогнозы частью привычных инструментов миллионов пользователей.
Please open Telegram to view this post
VIEW IN TELEGRAM
Вместе с релизом Gemini 3 Pro Google представила новый инструмент для разработчиков — Antigravity. Это бесплатная среда программирования, построенная вокруг агентного подхода: вместо одного ассистента здесь работают сразу несколько ИИ, которые умеют писать код, управлять терминалом и пользоваться браузером.
Все процессы отображаются в удобной панели: видно, какой агент чем занят и к какому результату он пришёл.
📌 Google продвигает новую парадигму: разработчик описывает желаемое поведение словами, а ИИ превращает это в цепочку подзадач и сам проходит путь от плана до результата. Пользователь остаётся архитектором и ревьюером, а рутинную работу берёт на себя ИИ. Каждый шаг сопровождается артефактами — логами, диффами, заметками и мини-отчётами.
Antigravity уже доступна в публичном превью, полностью бесплатна и предлагает «щедрые» лимиты на использование Gemini 3 Pro. При этом среда поддерживает и другие модели — от Claude до GPT-OSS, но в пределах их тарифных ограничений.
Please open Telegram to view this post
VIEW IN TELEGRAM
Cloudflare объявила о покупке Replicate — популярной облачной платформы для хостинга и запуска моделей машинного обучения. Сделка должна значительно расширить возможности Workers AI, превратив её в более универсальную и гибкую среду для ИИ-разработчиков.
Replicate позволяет разворачивать модели ИИ в Docker-контейнерах через инструмент Cog и запускать их в облаке. Разработчики получают к ним доступ через API, а всё вычисление происходит на стороне платформы.
В Replicate уже есть тысячи готовых моделей и файнтюнов — для генерации текста, видео, работы с изображениями и множества других задач.
Всё это доступно через единый API, который работает даже с проприетарными нейросетями, так что не нужно адаптироваться под разных провайдеров.
Cloudflare фактически превращает Workers AI в полноценную платформу для ИИ-разработки с огромным выбором моделей и гибким окружением — шаг, который может заметно изменить ландшафт облачных ИИ-сервисов.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤1
На саммите Linux Foundation Open Source в Сеуле Линус Торвальдс поделился своим мнением о вайб-кодинге, ИИ и текущем состоянии разработки ядра Linux.
Несмотря на то что сам он не использует вайб-кодинг, Торвальдс признался, что относится к нему «довольно позитивно»: как к способу быстро получить новый функционал или результаты, которые иначе было бы сложно достичь. Но есть и серьёзный минус — такой код практически невозможно сопровождать. Поэтому для разработки ядра Linux подход не подходит.
Торвальдс отметил, что уже «почти 20 лет не программист» и его работа сместилась от постоянных «нет» к необходимости говорить «да» нововведениям — в том числе Rust, который постепенно становится полноценной частью ядра, несмотря на сопротивление некоторых старых разработчиков.
— Позитив: Nvidia стала активнее участвовать в работе над ядром благодаря ИИ-буму.
— Негатив: поисковые боты разрушают инфраструктуру, выкачивая данные с kernel org.
— Общий взгляд: ИИ — всего лишь инструмент, как когда-то компиляторы; профессия программиста никуда не исчезнет.
— Торвальдс также отметил, что ждёт времени, когда ИИ станет просто обычным инструментом, а не предметом бесконечного хайпа. По его оценке, сегодня ИИ на 90% маркетинг и на 10% реальность.
Он снова раскритиковал «безумное» форматирование кода Rust (особенно поведение rustfmtcheck), указав на хаотичный стиль в одном из недавних pull request'ов в подсистему DRM.
А ещё ранее выражал сомнения в перспективах RISC-V в ядре Linux.
Please open Telegram to view this post
VIEW IN TELEGRAM
👌1
OpenAI начала развёртывание GPT-5.1 Pro в ChatGPT. Модель доступна только подписчикам плана Pro за $200 и корпоративным клиентам Enterprise. В компании не раскрывают бенчмарки — лишь подчёркивают, что это самая продвинутая модель OpenAI на сегодня.
На один ответ может уходить 8–10 минут, так что пользователям рекомендуют сразу давать максимум контекста и чётко формулировать задачу.
По отзывам тестировщиков, GPT-5.1 Pro:
Модель превосходно чувствует себя в бэкенд-задачах, но вот для фронтенда её рекомендуют сочетать с Gemini 3 Pro, который лучше справляется с UI/UX-ориентированными задачами.
Please open Telegram to view this post
VIEW IN TELEGRAM
Институт AIRI открыл тестовый доступ к VLA Arena — открытой площадке для оценки и сравнения моделей управления роботами. По сути, это «LLM-лидерборд», но для робототехнических моделей.
— VLA Arena поддерживает компактные манипуляторы LeRobot SO-100 и SO-101 от Hugging Face — их можно собрать самостоятельно или купить готовыми.
— Стоимость: около 30 000 ₽, что делает их доступными для образовательных и исследовательских проектов.
По словам руководителя группы «Адаптивные агенты» Владислава Куренкова, VLA Arena — не просто тестовая среда, а научный проект, призванный повысить прозрачность и объективность в оценке робототехнических моделей.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
Dell официально запустила продажи Pro Max 16 Plus — первого ноутбука компании с дискретным нейросетевым процессором Qualcomm AI 100 PC, работающим под управлением Ubuntu 24.04 LTS. Это первая мобильная рабочая станция корпоративного уровня, оснащённая таким NPU.
В начале следующего года Dell начнёт поставлять версию Pro Max 16 Plus с Windows 11. Однако такой вариант будет оснащён уже не NPU Qualcomm, а дискретными GPU Nvidia GeForce RTX. В линейке Windows-конфигураций доступны процессоры Intel Ultra 5 245HX, Ultra 7 265HX и Ultra 9 285HX.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤1🔥1