NEW BOT Телеграм, страница

Data Cluster

🧠 OpenAI раскрыла секреты промптинга GPT-5.1: вышло официальное Prompting Guide

OpenAI опубликовала GPT-5.1 Prompting Guide — самое подробное на сегодня руководство по тому, как правильно работать с новой моделью. Хотя документ ориентирован на использование через API, многие советы идеально подходят и обычным пользователям ChatGPT.

🔍 Что внутри гайда:

🟢Базовые принципы: роли, явные цели, жёсткие требования к формату

🟢Тонкая настройка поведения: как управлять инициативностью модели и не давать ей бросать задачу на середине

🟢Как использовать саму GPT-5.1 для анализа и улучшения промптов

🟢Как корректно мигрировать с GPT-5 на 5.1

Авторы отмечают, что GPT-5.1 более дисциплинирована и экономна в рассуждениях — поэтому важно избегать конфликтующих инструкций и чётко задавать длину, формат и завершённость решения.

Также модель можно запустить без рассуждающего режима — тогда она работает быстрее и дешевле, фактически как продвинутая версия GPT-4.1.

💻 Гайд для разработчиков и кодеров:

OpenAI рекомендует строить вокруг GPT-5.1 настоящих рабочих агентов. Сценарий такой:

🟢модель составляет план,

🟢пошагово выполняет задачи (читает файлы, правит код, запускает тесты),

🟢только затем объясняет, что было сделано.

Таким образом, современный промпт — это уже не “напиши функцию”, а полноценный пошаговый сценарий.

🟢

Data Cluster

Please open Telegram to view this post

VIEW IN TELEGRAM

24 views11:34

Data Cluster

🎧 Spotify запускает Recaps — ИИ-функцию, которая помогает вспомнить забытый сюжет аудиокниги

Spotify представила Recaps — новую функцию на базе искусственного интеллекта, созданную специально для тех, кто делает перерыв в аудиокнигах и потом забывает, что происходило в сюжете.

❓

Как это работает:

🟢Recaps генерирует краткое описание сюжета, строго соответствующее вашему прогрессу.
🟢Функция напоминает формат «previously on» из сериалов.
🟢Кнопка Recaps появляется в верхней части страницы аудиокниги.
🟢Обновляется автоматически по мере прослушивания.

Доступ к обзорам открывается после прослушивания 15–20 минут книги.

👀

Контекст:

🟢В феврале Spotify заключила партнёрство с ElevenLabs для создания ИИ-озвучек.
🟢Осенью компания договорилась с музыкальными лейблами о разработке «ответственных ИИ-продуктов».

Функция находится в бета-тестировании, сейчас доступна на iOS для ограниченного числа аудиокниг. В ближайшие дни охват будет расширяться.

🟢

Data Cluster

Please open Telegram to view this post

VIEW IN TELEGRAM

26 views15:58

Data Cluster

👀 Илон Маск раскрыл новые подробности о Grok 5 — и выглядит это амбициозно

В беседе с инвестором Роном Бароном Илон Маск рассказал о следующем поколении ИИ xAI — Grok 5. Новую модель обучают на суперкомпьютере Colossus 2, который ещё не вышел на проектную мощность (1 млн GPU ожидают в 2026 году), но уже сейчас позволяет создавать модель рекордного масштаба — 6 трлн параметров.

📌

Для сравнения:

🟢Qwen3-Max / Kimi K2 — ~1 трлн параметров
🟢GPT-4o — ~1,7 трлн
🟢Grok 4 — ~3 трлн

Как и предыдущие версии, Grok 5 использует архитектуру MoE (Mixture of Experts) — на каждый токен задействуется лишь часть параметров, что сильно снижает ресурсоёмкость.

Что обещает Маск ❓

🟢Высокая скорость — Grok 4 известен долгими задержками в режиме «обдумывания» (иногда до минут), поэтому в новой версии обещают кардинально ускорить ответы.

🟢Полная мультимодальность: текст, изображения, звук и даже видео.

🟢Интеграция с генератором видео Grok Imagine, который уже хвалят за сверхбыструю генерацию роликов.

🟢Потенциал для обучения в реальном времени (хотя ранее такие обещания оказывались не совсем точными).

🟢Маск оценивает шанс, что Grok 5 достигнет AGI, в 10%.

Релиз запланирован на первый квартал 2026 года. Если сроки не сдвинутся, мы уже скоро сможем проверить, насколько инновационной окажется новая модель и оправдает ли она амбиции Маска.

🟢

Data Cluster

Please open Telegram to view this post

VIEW IN TELEGRAM

❤1👍1

23 viewsedited 08:08

Data Cluster

👀 МЭА: уже в 2025 году вложения в ИИ-инфраструктуру обгонят нефтеразведку

Международное энергетическое агентство опубликовало свежий World Energy Outlook 2025 — и там впервые зафиксирован исторический разворот: инвестиции в дата-центры в 2025 году достигнут ~$580 млрд, впервые перегнав вложения в новые нефтедобывающие проекты (~$540 млрд).

Глава МЭА Фатих Бироль отмечает: цифровая инфраструктура выходит на один уровень с традиционными сырьевыми отраслями.

Что считается инвестициями в ИИ ❓

🟢МЭА трактует их как вложения в:

🟢дата-центры и здания под них,

🟢серверные залы и GPU-кластеры,

🟢энергоснабжение и системы охлаждения,

🟢сетевую инфраструктуру.

Главный драйвер — взрывной спрос на мощности для обучения и запуска больших моделей: чат-ботов, мультимодальных моделей, генеративного видео и ИИ-агентов. На этом фоне формируется новый тип объектов: ИИ-фабрики, ради которых Big Tech добивается льготных тарифов на электричество и заключает долгосрочные контракты с энергетиками.

Кто вкладывает деньги:

🟢Microsoft

🟢Google

🟢Amazon

Oracle и другие облачные провайдеры, строящие гигантские кластеры в США, Европе и Азии. Логика проста: кто первым создаст достаточно “железа”, тот сможет обучать самые мощные модели и доминировать на рынке корпоративных ИИ-сервисов.

🟢

Data Cluster

Please open Telegram to view this post

VIEW IN TELEGRAM

20 views11:42

Data Cluster

📌

Blue Origin впервые успешно посадила ускоритель тяжёлой ракеты New Glenn

Blue Origin сделала крупный шаг вперёд: ступень тяжёлой ракеты New Glenn впервые успешно вернулась на плавучую платформу в Атлантике. Отделение произошло примерно через 10 минут после старта, а сама ракета тем временем вывела на орбиту два научных зонда NASA для марсианской миссии ESCAPADE.

👀

Почему это важно

🟢New Glenn — проект, который Blue Origin развивает с 2012 года. Ракета способна выводить до 45 тонн на низкую орбиту, конкурируя с такими гигантами, как Falcon Heavy от SpaceX. Учтём, что это был лишь второй запуск New Glenn: в январе 2025 года ускоритель вернуть не удалось.

🟢Теперь же успешная посадка показывает, что компания уверенно движется к созданию полностью многоразовой тяжёлой ракеты. Это может значительно сократить стоимость запусков и ускорить освоение космоса.

Что это меняет для отрасли

❓

🟢подтверждает, что десятилетние разработки Blue Origin начинают работать в реальных условиях;

🟢усиливает конкуренцию на рынке тяжёлых ракет, где долгое время доминировала SpaceX;

🟢открывает новые возможности для коммерческих запусков, научных проектов и миссий дальнего космоса;

🟢подчеркивает ключевой тренд последних лет — повторное использование ступеней становится нормой.

Успех New Glenn — знаковый момент не только для Blue Origin, но и для всей отрасли: тяжёлые многоразовые ракеты становятся новой реальностью.

🟢

Data Cluster

Please open Telegram to view this post

VIEW IN TELEGRAM

❤1

26 views15:39

Data Cluster

👀

Глава Google намекнул: Gemini 3.0 Pro может выйти уже на следующей неделе

Вокруг Gemini 3.0 Pro стремительно нарастает хайп — и теперь он подкреплён намёками от людей, которые точно знают больше остальных.

🟢Васуман Моцы, бывший ML-инженер Meta* и основатель Varick Agents, уже протестировал модель. По его словам, переход от текущей версии к Gemini 3.0 Pro ощущается как скачок уровня GPT-3.5 → GPT-4. Особенно впечатляют программирование, сложная математика и мультимодальность.

🟢При этом Васуман прямо говорит, что ждёт полноценный релиз на следующей неделе — и это уже интересно само по себе. Но почти одновременно неожиданный намёк появился и от гораздо более значимой фигуры.

🟢Сундар Пичаи, глава Alphabet и Google, оставил лаконичный комментарий под ставкой Polymarket на выход Gemini 3.0 Pro до 22 ноября. Если переводить с дипломатического языка Пичая — релиз действительно близко.

🟢Тесты модели в Google AI Studio и LMArena идут ещё с начала октября. Пользователи, получившие доступ, отмечают серьёзные улучшения во всех ключевых направлениях: кодинг, работа со сложными задачами и мультимодальность стали ощутимо сильнее.

С момента начала тестирования прошло уже полтора месяца — и всё указывает на то, что следующая неделя может стать неделей релиза Gemini 3.0 Pro.

🟢

Data Cluster

Please open Telegram to view this post

VIEW IN TELEGRAM

❤1👍1

23 views08:02

Data Cluster

🕒 Новый бенчмарк показал: ни один ИИ не смог правильно выставить стрелки на часах

Инженер Брайан Мур запустил забавный, но показательный тест AI World Clocks. Девять языковых моделей — от GPT-3.5 до Grok 4 и GPT-5 — получили простое задание: каждую минуту генерировать HTML-код часов с корректным временем.

Результат? Ни одна модель не справилась.

❓ Что происходило в тесте?

🟢Каждую минуту ИИ генерировали новую версию кода часов.

🟢Код часто выглядел красиво, иногда почти идеально соответствовал задаче.

🟢Но ни одна модель не смогла стабильно выставлять правильные углы для стрелок.

🟢Проблема, однако, оказалась не в математике моделей, а… в промпте.

🔔 Всё сломалось, потому что в промпте не было уточнений:

🟢как считать угол часовой и минутной стрелки;

🟢где у CSS находится нулевая точка;

🟢как модели проверять правильность результата;

🟢как исправлять собственные ошибки.

👀 А ещё — ограничение по токенам. ИИ честно рисовал красивые часы, но никто не просил его перепроверять математику.

Эксперимент отлично демонстрирует важную проблему: многие пользователи общаются с ИИ «по-человечески», не формализуя задачу. А модели пока не умеют автоматически уточнять неполные запросы.

🟢

Data Cluster

Please open Telegram to view this post

VIEW IN TELEGRAM

23 views11:38

Data Cluster

🔧 TOON: новый формат, который может сделать промпты для LLM короче и точнее

Появился новый формат данных — TOON, который позиционируется не как замена JSON, а как более компактный и удобный способ передавать те же данные в LLM.

❓

Что такое TOON?

🟢Это альтернативная запись структур JSON, но:

🟢короче,

🟢проще для модели,

🟢удобнее для больших массивов однотипных объектов.

TOON сочетает идею YAML-отступов и табличный стиль для массивов объектов.

Структура сохраняется полностью: объекты, массивы и примитивы остаются теми же — меняется только запись.

⛏

Зачем это нужно?

🟢Главное преимущество — экономия токенов и предсказуемость поведения LLM:

🟢На больших массивах данных TOON сокращает токены на 30–60% по сравнению с обычным форматированным JSON.

🟢Даже против compact JSON экономия заметная.

⚠️ Но не везде TOON полезен:

— Авторы честно отмечают ограничения:

— При сильно вложенных, нерегулярных структурах компактный JSON может быть короче.

— Если данные плоские и идеально табличные, CSV остаётся самым компактным — TOON тут добавляет небольшой оверхед.

📌 То есть TOON лучше всего работает для: «большие массивы однотипных объектов с примитивными полями».

TOON — не замена JSON, а дополнительный слой кодировки данных, специально оптимизированный под LLM. В некоторых сценариях он может стать новым стандартом для промптов, где важны структура, компактность и экономия токенов.

🟢

Data Cluster

Please open Telegram to view this post

VIEW IN TELEGRAM

30 views15:52

Data Cluster

👀

GPT-5.1 Thinking — новая вершина в мире ИИ. Разбираем свежие бенчмарки

Опубликован обновлённый Artificial Analysis Intelligence Index — сводный рейтинг, который сравнивает крупные ИИ-модели по множеству популярных бенчмарков. Итог: на первом месте — GPT-5.1 Thinking High с результатом 70 баллов.

📈 Она обошла ближайших конкурентов:

🟢GPT-5 Thinking High — 68
🟢Kimi K2 Thinking — 67
🟢Grok 4 — 65
🟢Claude Sonnet 4.5 — 63

❓

Откуда прирост?

— Главный скачок пришёлся на TerminalBench, оценивающий агентные способности ИИ. Здесь GPT-5.1 Thinking показала рост сразу на 12 п.п., что стало решающим фактором для лидерства.

Кроме того, авторы индекса отмечают:

🟢более человечные ответы,

🟢улучшенную экономию токенов.

🟢Хотя цена в API осталась прежней, прогон всех бенчмарков подешевел с $913 до $859.

🔍 Версия GPT-5.1 Codex заняла 1-е место в SWE-Bench — бенчмарке, который проверяет, насколько хорошо ИИ решает реальные задачи разработчиков на основе GitHub-репозиториев.

GPT-5.1 Thinking уверенно сместила конкурентов, укрепив позиции как самой «умной» модели по сводным метрикам. Улучшенные агентные возможности, сильные компетенции в кодинге и дизайне, более низкая стоимость прогонов — всё это делает GPT-5.1 одной из самых практичных и передовых моделей на рынке ИИ.

🟢

Data Cluster

Please open Telegram to view this post

VIEW IN TELEGRAM

28 views07:38

Data Cluster

👀

Новый Grok с огромным контекстным окном испытывают на OpenRouter

На OpenRouter началось тестирование двух новых ИИ-моделей: Sherlock Dash Alpha (быстрая версия) и Sherlock Think Alpha (рассуждающая версия).

Главная особенность — контекстное окно 1,84 млн токенов, одно из крупнейших среди доступных моделей. Для сравнения: у Gemini 2.5 Flash/Pro — около 1 млн токенов.

❓

Кто создал “Шерлоков”?

В некоторых диалогах обе модели заявляют, что разработаны xAI. Формально ИИ иногда «прикидываются» моделями других компаний, но есть дополнительное подтверждение:

🟢исследователь Лех Мазур сравнил стиль ответов разных моделей;

🟢Sherlock Dash Alpha по его бенчмарку наиболее похож на Grok 4.

⚡️

Когда ждать официальный релиз

🟢Grok 4 Fast тестировали на OpenRouter под названиями Sonoma Sky Alpha и Sonoma Dusk Alpha;

🟢тест стартовал 5 сентября, релиз произошёл 19 сентября — то есть всего через 2 недели.

Если xAI придерживается той же схемы, то финальный релиз Sherlock/Grok 4.20 можно ожидать в конце ноября — начале декабря.

🟢

Data Cluster

Please open Telegram to view this post

VIEW IN TELEGRAM

24 views11:49

Data Cluster

📌 ИИ Google DeepMind приблизил учёных к разгадке вековой загадки газов и жидкостей

Когда самолёт разгоняется по взлётной полосе, вокруг крыла рождаются сложные вихри.

Мы привыкли считать, что физики давно умеют их описывать, но внутри этих уравнений скрыта фундаментальная загадка: могут ли в идеальной жидкости или газе возникнуть сингулярности — “разрывы”, где скорость и давление устремляются к бесконечности?

Эта проблема связана и с природой турбулентности, и с самой знаменитой нерешённой задачей математической физики — трёхмерными уравнениями Навье–Стокса, за которые Математический институт Клэя назначил награду в миллион долларов.

👀 Что сделала Google DeepMind

🟢Совместно с математиками под руководством Юнцзи Вана исследователи впервые систематически нашли целые семейства неустойчивых сингулярностей для ключевых уравнений, описывающих движение газов и жидкостей.

🟢Неустойчивые — значит, что такие разрывы возникают только при идеально точных начальных условиях: малейший шум — и система уходит от “траектории взрыва”.

Как ИИ помог поймать редкие “взрывы” в уравнениях ❓

Команда использовала специально обученную нейросеть:

🟢ИИ получает сами уравнения и ищет самоподобные профили течения — формы, которые при приближении к сингулярности только масштабируются, не меняясь.

🟢Затем подключается высокоточный численный оптимизатор, который “дотачивает” найденные решения до предельной точности — вплоть до уровня машинного нуля.

🟢В ряде случаев исследователям удалось получить точность, достаточную для строгих компьютерно-ассистированных доказательств — редчайший уровень обоснования для таких задач.

Какие уравнения поддались:

— уравнений пористой среды,

— модели Буссинеска,

— трёхмерных уравнений Эйлера с границей.

Эти модели напрямую связаны с реальными потоками воздуха и жидкости — от обтекания крыла до струй в двигателях.

Учёные не только показали, что решения действительно “взрываются” за конечное время, но и измерили их неустойчивость — насколько легко система отклоняется от критического режима.

🔍 Понимание того, где уравнение начинает “ломаться”, помогает улучшать численные схемы и точнее интерпретировать результаты симуляций.

Но загадка Навье–Стокса пока не решена. Работа DeepMind — это важный шаг, но не финальный. Для классических трёхмерных уравнений Навье–Стокса без границ вопрос о существовании сингулярностей остаётся открытым.

🟢

Data Cluster

Please open Telegram to view this post

VIEW IN TELEGRAM

24 views15:52

Data Cluster

📌

Google обновила ИИ-прогнозы погоды: WeatherNext 2 станет частью поисковика, Gemini и Pixel

Google представила новую версию своей ИИ-модели для прогноза погоды — WeatherNext 2. Теперь она работает в восемь раз быстрее предыдущей версии и точнее предсказывает 99,9% метеопараметров, включая температуру и ветер.

🟢Ключевое улучшение — использование функциональных генеративных сетей (FGN). Благодаря этому WeatherNext 2 может генерировать сотни возможных сценариев за один шаг, учитывая «шум» в данных. Прогнозы для 15-дневного периода формируются менее чем за минуту на TPU-чипах, тогда как традиционные физические модели требуют часов работы на суперкомпьютерах.

🟢По словам представителей Google, новая система особенно востребована в энергетике, транспорте, логистике и сельском хозяйстве — где критически важны точные почасовые прогнозы.

👀 Модель будет интегрирована в Google Карты, поисковик, Gemini и Pixel Weather, а также станет доступна для бизнес-клиентов через программу раннего доступа. Прогнозные данные появятся в Google Earth Engine и BigQuery, что упростит работу с геопространственным и крупномасштабным анализом.

Соревнование в области ИИ-метеопрогнозирования усиливается. Ранее DeepMind заявляла, что ИИ уже превосходит традиционные методы — тогда Google внедрила GraphCast. В это время Huawei развивала Pangu-Weather, IBM и NASA — модель Prithvi, а Microsoft представила Aurora для точного моделирования атмосферных процессов.

🟢

Data Cluster

Please open Telegram to view this post

VIEW IN TELEGRAM

❤1👍1

25 views08:10

Data Cluster

📌

xAI представила Grok 4.1

Компания xAI официально выпустила Grok 4.1 — обновлённую версию своей ИИ-модели, которая стала заметно более творческой, эмоционально чувствительной и последовательной в общении. Модель лучше улавливает намерения пользователя и сохраняет собственный стиль, не теряя точности и надёжности прежних версий.

Ключевые улучшения достигнуты благодаря масштабной системе обучения с подкреплением, применённой ранее в Grok 4. xAI также использовала новые методы, позволяющие задействовать агентные модели рассуждений как модели вознаграждения — это ускоряет улучшение качества ответов в большом масштабе.

⚡️ Тихий запуск и метрики

🟢С 1 по 14 ноября 2025 года новая модель проходила тихий запуск. На реальном трафике проводились слепые попарные сравнения — в 64,78% случаев пользователи предпочли Grok 4.1 предыдущей версии.

👀 Новые лидирующие позиции в рейтинг-битвах

🟢Thinking (quasarflux) — 1483 Elo, 1-е место, обогнав ближайшую не-xAI модель на 31 балл.

🟢Tensor (нерассуждающий режим) — 1465 Elo, 2-е место, превзойдя рассуждающие режимы всех других моделей в открытом рейтинге.

❗️ Для сравнения: предыдущая версия Grok 4 была лишь на 33-м месте.

В xAI подчеркнули улучшение фактической точности — особенно в быстрых режимах. Модель показала заметное снижение галлюцинаций на реальных пользовательских запросах и прошла проверку по FActScore — набору из 500 биографических вопросов.

🟢

Data Cluster

Please open Telegram to view this post

VIEW IN TELEGRAM

18 views11:52

Data Cluster

📌

Новый бенчмарк показывает: лишь три ИИ реже галлюцинируют, чем отвечают правильно

Исследовательская команда Artificial Analysis представила AA-Omniscience — бенчмарк для оценки галлюцинаций ИИ, который учитывает не только точность ответов, но и способность моделей честно говорить «не знаю».

Результаты получились неожиданно жёсткими: только три модели смогли дать больше правильных ответов, чем неправильных — и все они принадлежат линейке Claude.

🥇 Лидеры AA-Omniscience

🟢Claude 4.5 Haiku — около 26% неверных ответов среди всех неудачных попыток.
2–3. Claude 4.5 Sonnet и Claude 4.1 Opus — по 48%.

🟢Все остальные модели, включая Grok 4 и GPT-5 (high), ошибаются чаще, чем отвечают верно — не потому что хуже знают, а потому что предпочитают угадать, а не отказаться.

❓

Как устроен бенчмарк

🟢6000 вопросов по 42 темам и 6 областям: медицина, право, бизнес, инженерия, IT, гуманитарные и соцнауки.

🟢Источники — актуальные и авторитетные.

🟢Вопросы — короткие, однозначные.

🟢Поиск и инструменты отключены: проверяется только то, что уже «вшито» в модель.

📊 Метрики оценки

🟢Accuracy — долю правильных ответов.

🟢Hallucination Rate — долю неправильных среди всех неверных попыток.

🟢Omniscience Index — интегральная оценка, где ценится не только знание, но и самокритичность.

🟢Отказ от ответа не штрафуется — наоборот, считается здоровым поведением.

По мнению авторов и в соответствии с недавним исследованием OpenAI, текущие методы обучения поощряют модели за правильные ответы, но не наказывают за неправильные. В итоге угадывание становится выгодной стратегией — даже если шанс попасть в цель минимален.

🟢

Data Cluster

Please open Telegram to view this post

VIEW IN TELEGRAM

👍1

27 views15:42

Data Cluster

🌦 Google представила WeatherNext 2 — новый уровень ИИ-прогнозирования погоды

Google DeepMind и Google Research выпустили крупное обновление своей флагманской системы прогнозирования — WeatherNext 2. Это не просто улучшенная модель, а полноценный климатический симулятор, способный предсказывать погоду быстрее, точнее и глубже, чем когда-либо раньше.

👀

Главные особенности WeatherNext 2:

🟢В 8 раз быстрее предыдущей версии

🟢Поддержка прогноза с шагом в 1 час

🟢Основой стала архитектура Functional Generative Network, которая добавляет шум в модель и позволяет генерировать множество правдоподобных сценариев развития погоды

🟢Прогнозы становятся не усреднёнными, а физически связными и вариативными

🟢Набор сценариев генерируется менее чем за минуту на одном TPU, тогда как традиционные модели требуют суперкомпьютеров и часов работы

🟢ИИ самостоятельно научился собирать отдельные показатели в сложные структуры — циклоны, фронты и другие атмосферные явления

🟢WeatherNext 2 превосходит предыдущее поколение по 99,9% метеопараметров на горизонте до 15 дней

🌍 Где уже работает WeatherNext 2:

— Earth Engine

— BigQuery

— Поиск Google

— Gemini

— Pixel Weather

— Weather API (Google Maps)

А в ближайшие недели обновлённая система появится и в Google Maps, сделав высокоточные прогнозы частью привычных инструментов миллионов пользователей.

🟢

Data Cluster

Please open Telegram to view this post

VIEW IN TELEGRAM

28 views07:42

Data Cluster

🚀 Google запустила Antigravity — бесплатную среду для «вайб-кодинга» на базе Gemini 3 Pro

Вместе с релизом Gemini 3 Pro Google представила новый инструмент для разработчиков — Antigravity. Это бесплатная среда программирования, построенная вокруг агентного подхода: вместо одного ассистента здесь работают сразу несколько ИИ, которые умеют писать код, управлять терминалом и пользоваться браузером.

💡 Как работает Antigravity

🟢Внутри среды находится набор агентов, которым доступны привычные разработчику инструменты:

🟢редактор кода,

🟢встроенный терминал,

🟢браузер.

⚡️

Вы формулируете цель на естественном языке — например, «добавь функцию», «почини баг», «подготовь релиз». После этого агенты сами:

🟢составляют план,

🟢правят файлы,

🟢запускают команды,

🟢гоняют тесты,

🟢открывают нужные страницы в браузере,

🟢и параллельно ведут несколько задач в разных рабочих пространствах.

Все процессы отображаются в удобной панели: видно, какой агент чем занят и к какому результату он пришёл.

📌 Google продвигает новую парадигму: разработчик описывает желаемое поведение словами, а ИИ превращает это в цепочку подзадач и сам проходит путь от плана до результата. Пользователь остаётся архитектором и ревьюером, а рутинную работу берёт на себя ИИ. Каждый шаг сопровождается артефактами — логами, диффами, заметками и мини-отчётами.

Antigravity уже доступна в публичном превью, полностью бесплатна и предлагает «щедрые» лимиты на использование Gemini 3 Pro. При этом среда поддерживает и другие модели — от Claude до GPT-OSS, но в пределах их тарифных ограничений.

🟢

Data Cluster

Please open Telegram to view this post

VIEW IN TELEGRAM

27 views11:54

Data Cluster

☁️ Cloudflare купила платформу для хостинга нейросетей Replicate

Cloudflare объявила о покупке Replicate — популярной облачной платформы для хостинга и запуска моделей машинного обучения. Сделка должна значительно расширить возможности Workers AI, превратив её в более универсальную и гибкую среду для ИИ-разработчиков.

Replicate позволяет разворачивать модели ИИ в Docker-контейнерах через инструмент Cog и запускать их в облаке. Разработчики получают к ним доступ через API, а всё вычисление происходит на стороне платформы.

В Replicate уже есть тысячи готовых моделей и файнтюнов — для генерации текста, видео, работы с изображениями и множества других задач.

Всё это доступно через единый API, который работает даже с проприетарными нейросетями, так что не нужно адаптироваться под разных провайдеров.

👀

Для текущих пользователей Replicate — ничего:

🟢пайплайны продолжат работать,

🟢каталог моделей сохранится,

🟢бренд остаётся,

🟢а производительность вырастет благодаря инфраструктуре Cloudflare.

❓

Что получит Workers AI

🟢Cloudflare интегрирует Replicate в свою платформу, что даст пользователям:

🟢доступ ко всему каталогу моделей Replicate,

🟢возможность запускать собственные модели в контейнерах,

🟢инструменты для файнтюна,

🟢и новые функции за счёт расширения инфраструктуры.

Cloudflare фактически превращает Workers AI в полноценную платформу для ИИ-разработки с огромным выбором моделей и гибким окружением — шаг, который может заметно изменить ландшафт облачных ИИ-сервисов.

🟢

Data Cluster

Please open Telegram to view this post

VIEW IN TELEGRAM

❤1

27 views15:58

Data Cluster

📌

Линус Торвальдс: вайб-кодинг — неплох для старта, но «ужасен» для поддержки

На саммите Linux Foundation Open Source в Сеуле Линус Торвальдс поделился своим мнением о вайб-кодинге, ИИ и текущем состоянии разработки ядра Linux.

Несмотря на то что сам он не использует вайб-кодинг, Торвальдс признался, что относится к нему «довольно позитивно»: как к способу быстро получить новый функционал или результаты, которые иначе было бы сложно достичь. Но есть и серьёзный минус — такой код практически невозможно сопровождать. Поэтому для разработки ядра Linux подход не подходит.

🟢

Об изменениях в роли

Торвальдс отметил, что уже «почти 20 лет не программист» и его работа сместилась от постоянных «нет» к необходимости говорить «да» нововведениям — в том числе Rust, который постепенно становится полноценной частью ядра, несмотря на сопротивление некоторых старых разработчиков.

🟢Об ИИ и его влиянии

— Позитив: Nvidia стала активнее участвовать в работе над ядром благодаря ИИ-буму.

— Негатив: поисковые боты разрушают инфраструктуру, выкачивая данные с kernel org.

— Общий взгляд: ИИ — всего лишь инструмент, как когда-то компиляторы; профессия программиста никуда не исчезнет.

— Торвальдс также отметил, что ждёт времени, когда ИИ станет просто обычным инструментом, а не предметом бесконечного хайпа. По его оценке, сегодня ИИ на 90% маркетинг и на 10% реальность.

Он снова раскритиковал «безумное» форматирование кода Rust (особенно поведение rustfmtcheck), указав на хаотичный стиль в одном из недавних pull request'ов в подсистему DRM.
А ещё ранее выражал сомнения в перспективах RISC-V в ядре Linux.

🟢

Data Cluster

Please open Telegram to view this post

VIEW IN TELEGRAM

👌1

30 viewsedited 07:48

Data Cluster

🚀 OpenAI выпустила GPT-5.1 Pro — свою самую мощную модель ИИ

OpenAI начала развёртывание GPT-5.1 Pro в ChatGPT. Модель доступна только подписчикам плана Pro за $200 и корпоративным клиентам Enterprise. В компании не раскрывают бенчмарки — лишь подчёркивают, что это самая продвинутая модель OpenAI на сегодня.

🧠 Как работает GPT-5.1 Pro

🟢GPT-5.1 Pro основана на архитектуре GPT-5 Pro и фактически состоит как минимум из двух параллельных копий GPT-5.1 Thinking.

🟢Каждая из них получает расширенный «бюджет рассуждений» и независимо готовит ответ. Затем финальный модуль объединяет лучшие части двух вариантов в итоговый ответ.

⏱️ Медленно, но глубоко

🟢Первые обзоры от ранних пользователей сходятся в одном:

🟢GPT-5.1 Pro невероятно мощная, но очень медленная.

На один ответ может уходить 8–10 минут, так что пользователям рекомендуют сразу давать максимум контекста и чётко формулировать задачу.

👀

Чем хороша новая модель

По отзывам тестировщиков, GPT-5.1 Pro:

🟢отлично пишет глубокие аналитические документы, планы, отчёты;

🟢замечает нюансы, которые пропускают слабые модели;

🟢очень аккуратно следует инструкциям;

🟢в программировании особенно хорошо чтёт документацию и выдерживает сложные требования.

Модель превосходно чувствует себя в бэкенд-задачах, но вот для фронтенда её рекомендуют сочетать с Gemini 3 Pro, который лучше справляется с UI/UX-ориентированными задачами.

🟢

Data Cluster

Please open Telegram to view this post

VIEW IN TELEGRAM

28 views11:48

Data Cluster

🤖 AIRI запустил VLA Arena — открытую платформу для тестирования ИИ-роботов

Институт AIRI открыл тестовый доступ к VLA Arena — открытой площадке для оценки и сравнения моделей управления роботами. По сути, это «LLM-лидерборд», но для робототехнических моделей.

🧪 Что такое VLA Arena

🟢Платформа позволяет запускать и сравнивать модели управления как в виртуальной среде, так и на реальных роботах.

🟢Это делает тестирование доступным для исследователей, инженеров и энтузиастов, даже если у них нет собственного оборудования.

🟢Поддерживаются модели класса Vision-Language-Action (VLA) — адаптированные версии больших языковых моделей, которые могут понимать инструкции и выполнять действия в физическом мире.

📌

Роботы и оборудование

— VLA Arena поддерживает компактные манипуляторы LeRobot SO-100 и SO-101 от Hugging Face — их можно собрать самостоятельно или купить готовыми.

— Стоимость: около 30 000 ₽, что делает их доступными для образовательных и исследовательских проектов.

🔔

Возможности платформы

🟢запуск моделей в симуляции или на реальном роботе;

🟢сравнение моделей на одних и тех же задачах;

🟢лидерборд, где оценки формируются на основе случайных тестов, что снижает предвзятость;

🟢поддержка русского языка;

🟢открытые датасеты для LeRobot, переведённые и размеченные для обучения собственных моделей.

По словам руководителя группы «Адаптивные агенты» Владислава Куренкова, VLA Arena — не просто тестовая среда, а научный проект, призванный повысить прозрачность и объективность в оценке робототехнических моделей.

🟢

Data Cluster

Please open Telegram to view this post

VIEW IN TELEGRAM

👍1

26 views15:52

Data Cluster

👀

Dell начала поставки ноутбуков с дискретным NPU Qualcomm под Linux

Dell официально запустила продажи Pro Max 16 Plus — первого ноутбука компании с дискретным нейросетевым процессором Qualcomm AI 100 PC, работающим под управлением Ubuntu 24.04 LTS. Это первая мобильная рабочая станция корпоративного уровня, оснащённая таким NPU.

🟢Dell подчёркивает, что новый чип позволяет запускать крупные ИИ-модели локально, без обращения к облаку — что особенно актуально для задач в здравоохранении, финансах, юриспруденции, госуправлении, инженерии и научных исследованиях.

🟢Qualcomm уже некоторое время продвигает поддержку AI 100 в ядре Linux — драйвер находится в основной ветке.

В начале следующего года Dell начнёт поставлять версию Pro Max 16 Plus с Windows 11. Однако такой вариант будет оснащён уже не NPU Qualcomm, а дискретными GPU Nvidia GeForce RTX. В линейке Windows-конфигураций доступны процессоры Intel Ultra 5 245HX, Ultra 7 265HX и Ultra 9 285HX.

🟢

Data Cluster

Please open Telegram to view this post

VIEW IN TELEGRAM

❤1🔥1

26 views07:46

About

Blog

Apps

Platform