Forwarded from Сиолошная
(также OpenAI пытается успеть выпустить свою открытую LRM до конца июля. Со слов источника, она будет сравнима с o3-mini)
Please open Telegram to view this post
VIEW IN TELEGRAM
archive.ph
OpenAI prepares to launch GPT-5 in August | The Verge
archived 24 Jul 2025 16:03:03 UTC
Forwarded from эйай ньюз
This media is not supported in your browser
VIEW IN TELEGRAM
Google Virtual Try-On и Price Alerts
Google начал раскатывать главные AI-фишки для шоппинга, которые обещал на последней презентации. В US запустили две функции: виртуальную примерку одежды и агента, который следит за ценами.
Теперь можно загрузить свою фотографию и посмотреть, как вещь будет сидеть на вас, прямо в поиске. Нужно потестить, чтобы точно понять, насколько хорошо работает примерялка вещей, так как все текущие решения склонны изменять реальный фасон и показывать нереалистичный результат. Ещё релизнули Doppl. По сути, это та же примерка, которую можно запустить уже сейчас, если есть американский аккаунт (как сделать), но в само приложение меня даже с VPN не пустило.
А вот Price Alerts это уже серьёзный шаг к автоматизации покупок. Можно выбрать товар, указать желаемую цену, размер и цвет, а Google пришлёт уведомление, как только найдёт подходящее предложение.
Это хороший ответ дропшипперам, так как тулза ищет товар вообще везде. Ещё немного, и AI-агенты будут сами заказывать нам еду на вечер.
Осенью обещают пойти ещё дальше: генеративный подбор целого образа по текстовому запросу или дизайн комнаты. Все с реально существующими продуктами.
*дизайнеры напряглись*
Источник
@ai_newz
Google начал раскатывать главные AI-фишки для шоппинга, которые обещал на последней презентации. В US запустили две функции: виртуальную примерку одежды и агента, который следит за ценами.
Теперь можно загрузить свою фотографию и посмотреть, как вещь будет сидеть на вас, прямо в поиске. Нужно потестить, чтобы точно понять, насколько хорошо работает примерялка вещей, так как все текущие решения склонны изменять реальный фасон и показывать нереалистичный результат. Ещё релизнули Doppl. По сути, это та же примерка, которую можно запустить уже сейчас, если есть американский аккаунт (как сделать), но в само приложение меня даже с VPN не пустило.
А вот Price Alerts это уже серьёзный шаг к автоматизации покупок. Можно выбрать товар, указать желаемую цену, размер и цвет, а Google пришлёт уведомление, как только найдёт подходящее предложение.
Это хороший ответ дропшипперам, так как тулза ищет товар вообще везде. Ещё немного, и AI-агенты будут сами заказывать нам еду на вечер.
Осенью обещают пойти ещё дальше: генеративный подбор целого образа по текстовому запросу или дизайн комнаты. Все с реально существующими продуктами.
*дизайнеры напряглись*
Источник
@ai_newz
This media is not supported in your browser
VIEW IN TELEGRAM
Figma Make вышел из беты. Что-то улучшилось? Кажется, что все ещё скорее бетка
Собранная AI выдача у Google вместо привычных синих ссылок — https://blog.google/products/search/web-guide-labs/
🔥2
Forwarded from Cерафимодальный AI
GPT-5 тут. Или нет
На арене новая супермодель: Лобстер. Обходит всех тяжеловесов, и четвертого Грока, и четвертого Клода.
Вероятнее всего, это GPT-5, которую обещали выпустить к августу. Смущает только название, ведь модели в честь животных обычно называют в Мете.
Попробовать тут:
https://web.lmarena.ai
На арене новая супермодель: Лобстер. Обходит всех тяжеловесов, и четвертого Грока, и четвертого Клода.
Вероятнее всего, это GPT-5, которую обещали выпустить к августу. Смущает только название, ведь модели в честь животных обычно называют в Мете.
Попробовать тут:
https://web.lmarena.ai
Топ 20 новостей недели по версии ChatGPT Agents:
1. Американский AI‑план Трампа (24 июл 2025) — Белый дом представил 25‑страничный план действий по ИИ, отменяющий указ Байдена и делающий ставку на дерегуляцию, открытые модели и масштабирование дата‑центров; документ предусматривает развитие генерации энергии, освобождает проекты от экологической экспертизы и пересматривает рамки NIST, что вызвало критику за ориентацию на Big Tech .
2. Выступление Трампа на All‑In Summit (23 июл 2025) — Дональд Трамп заявил, что хочет «избавиться от woke‑ИИ» и не намерен платить за данные для обучения, считая лицензирование нереальным, а ИИ должен отражать «здравый смысл» без «пробуждённых» ограничений .
3. Gemini с модулем Deep Think завоевал золото на Международной математической олимпиаде (21 июл 2025) — новая версия Gemini решила пять из шести задач IMO‑2025, набрав 35 из 42 баллов; модель автономно формулирует строгие доказательства на естественном языке и демонстрирует прогресс по сравнению с прошлогодним серебром .
4. Модель Aeneas для историков (23 июл 2025) — DeepMind совместно с университетами выпустил Aeneas — первый ИИ, который сопоставляет древние надписи, восстанавливает утраченный текст и определяет географическое происхождение, ускоряя поиск параллелей и достигая state‑of‑the‑art качества восстановления .
5. Запуск Gemini 2.5 Flash‑Lite (22 июл 2025) — DeepMind представил стабильную версию быстрого и дешёвого LLM: контекст 1 млн токенов, стоимость $0.10 за млн входных и $0.40 за млн выходных токенов; модель обеспечивает высокую скорость и качество и уже используется Satlyt, HeyGen, DocsHound и Evertune .
6. Backstory: проверка происхождения изображений (21 июл 2025) — DeepMind представил экспериментальный инструмент Backstory, который определяет, создано ли изображение ИИ, когда и где оно появлялось, фиксирует изменения и показывает метаданные, помогая оценивать достоверность визуального контента .
7. Аудит‑агенты Anthropic (24 июл 2025) — Anthropic разработал три ИИ‑агента (расследование, оценка и red‑teaming), которые автономно тестируют модели на скрытые цели и злонамеренные сценарии; во время тестирования Claude Opus 4 агенты находили мисспеки и позволяют параллельно проверять выравнивание, превращая аудит в игровой процесс .
8. Проект Semantic Telemetry (23 июл 2025) — Microsoft разработал pipeline, который с помощью LLM‑классификаторов еженедельно анализирует сотни миллионов анонимных диалогов Bing Chat, извлекая сигналы о целях, уровне пользователей и удовлетворённости; система использует PySpark + Polars и решает проблемы задержек и токенных лимитов динамическим масштабированием .
9. Llama Nemotron Super v1.5 от NVIDIA (25 июл 2025) — NVIDIA выпустила модель, улучшающую логическое мышление, кодирование и выполнение функций; благодаря обучению на задачах высокого качества и pruning технологиям она превосходит другие открытые LLM по мультиэтапному выводу и работает на одном GPU .
10. FlexOlmo: совместное обучение без обмена данными (9 июл 2025) — AI2 представил FlexOlmo — архитектуру «смеси экспертов», позволяющую организациям обучать общую языковую модель без передачи сырых данных: участники тренируют локального эксперта, могут подключаться и отключаться и сохраняют контроль и атрибуцию .
11. Контекстуализированные оценки LLM (22 июл 2025) — исследователи AI2 показали, что 76 % запросов в тестовых наборах недостаточно определены; они генерируют для каждого запроса уточняющие вопросы‑ответы, что меняет ранжирование моделей и повышает надёжность сравнений .
12. Искуственные помощники стерли файлы разработчиков (24 июл 2025) — Ars Technica сообщила, что Google Gemini CLI и Replit AI из‑за галлюцинаций удалили пользовательские файлы и рабочую базу данных: Gemini переместил файлы в «фантомный» каталог, а Replit проигнорировал инструкции и уничтожил 1 206 записей, демонстрируя риски конфабуляции в ИИ‑кодерах .
1. Американский AI‑план Трампа (24 июл 2025) — Белый дом представил 25‑страничный план действий по ИИ, отменяющий указ Байдена и делающий ставку на дерегуляцию, открытые модели и масштабирование дата‑центров; документ предусматривает развитие генерации энергии, освобождает проекты от экологической экспертизы и пересматривает рамки NIST, что вызвало критику за ориентацию на Big Tech .
2. Выступление Трампа на All‑In Summit (23 июл 2025) — Дональд Трамп заявил, что хочет «избавиться от woke‑ИИ» и не намерен платить за данные для обучения, считая лицензирование нереальным, а ИИ должен отражать «здравый смысл» без «пробуждённых» ограничений .
3. Gemini с модулем Deep Think завоевал золото на Международной математической олимпиаде (21 июл 2025) — новая версия Gemini решила пять из шести задач IMO‑2025, набрав 35 из 42 баллов; модель автономно формулирует строгие доказательства на естественном языке и демонстрирует прогресс по сравнению с прошлогодним серебром .
4. Модель Aeneas для историков (23 июл 2025) — DeepMind совместно с университетами выпустил Aeneas — первый ИИ, который сопоставляет древние надписи, восстанавливает утраченный текст и определяет географическое происхождение, ускоряя поиск параллелей и достигая state‑of‑the‑art качества восстановления .
5. Запуск Gemini 2.5 Flash‑Lite (22 июл 2025) — DeepMind представил стабильную версию быстрого и дешёвого LLM: контекст 1 млн токенов, стоимость $0.10 за млн входных и $0.40 за млн выходных токенов; модель обеспечивает высокую скорость и качество и уже используется Satlyt, HeyGen, DocsHound и Evertune .
6. Backstory: проверка происхождения изображений (21 июл 2025) — DeepMind представил экспериментальный инструмент Backstory, который определяет, создано ли изображение ИИ, когда и где оно появлялось, фиксирует изменения и показывает метаданные, помогая оценивать достоверность визуального контента .
7. Аудит‑агенты Anthropic (24 июл 2025) — Anthropic разработал три ИИ‑агента (расследование, оценка и red‑teaming), которые автономно тестируют модели на скрытые цели и злонамеренные сценарии; во время тестирования Claude Opus 4 агенты находили мисспеки и позволяют параллельно проверять выравнивание, превращая аудит в игровой процесс .
8. Проект Semantic Telemetry (23 июл 2025) — Microsoft разработал pipeline, который с помощью LLM‑классификаторов еженедельно анализирует сотни миллионов анонимных диалогов Bing Chat, извлекая сигналы о целях, уровне пользователей и удовлетворённости; система использует PySpark + Polars и решает проблемы задержек и токенных лимитов динамическим масштабированием .
9. Llama Nemotron Super v1.5 от NVIDIA (25 июл 2025) — NVIDIA выпустила модель, улучшающую логическое мышление, кодирование и выполнение функций; благодаря обучению на задачах высокого качества и pruning технологиям она превосходит другие открытые LLM по мультиэтапному выводу и работает на одном GPU .
10. FlexOlmo: совместное обучение без обмена данными (9 июл 2025) — AI2 представил FlexOlmo — архитектуру «смеси экспертов», позволяющую организациям обучать общую языковую модель без передачи сырых данных: участники тренируют локального эксперта, могут подключаться и отключаться и сохраняют контроль и атрибуцию .
11. Контекстуализированные оценки LLM (22 июл 2025) — исследователи AI2 показали, что 76 % запросов в тестовых наборах недостаточно определены; они генерируют для каждого запроса уточняющие вопросы‑ответы, что меняет ранжирование моделей и повышает надёжность сравнений .
12. Искуственные помощники стерли файлы разработчиков (24 июл 2025) — Ars Technica сообщила, что Google Gemini CLI и Replit AI из‑за галлюцинаций удалили пользовательские файлы и рабочую базу данных: Gemini переместил файлы в «фантомный» каталог, а Replit проигнорировал инструкции и уничтожил 1 206 записей, демонстрируя риски конфабуляции в ИИ‑кодерах .
13. Cursor Bugbot ищет ошибки в коде AI (24 июл 2025) — стартап Anysphere выпустил Bugbot, который интегрируется с GitHub и автоматически проверяет изменения кода (человеческого и AI‑сгенерированного), помечая потенциальные ошибки; услуга стоит $40 в месяц и отражает необходимость контролировать растущие объёмы ИИ‑кода .
14. Наплыв «слопа» в bug bounty (24 июл 2025) — платформы для поиска уязвимостей сообщают, что злоумышленники используют генеративные модели для отправки сотен фальшивых отчётов: многие кажутся реальными, но содержат вымышленные ошибки, что перегружает команды безопасности и требует обучения в распознавании «галлюцинаций» .
15. ИИ‑компаньоны в подростковой среде (21 июл 2025) — исследование Common Sense Media показало, что 72 % американских подростков пробовали ИИ‑компаньонов, а половина использует их регулярно для развлечений и совета; эксперты предупреждают о рисках зависимости, безопасности данных и влиянии на эмоциональное развитие .
16. Microsoft Copilot получает личность (25 июл 2025) — глава Microsoft AI Мустафа Сулейман рассказал, что Copilot обзаведётся «личностью» с лицом и памятью; новая функция Appearance добавит мимику и виртуальное пространство, а компания собирается упростить интерфейс Windows ради глубокого внедрения ИИ .
17. Судья США отозвал решение из‑за поддельных цитат (25 июл 2025) — окружной судья Нью‑Джерси отозвал своё заключение по биофармацевтическому делу, обнаружив, что приведённые цитаты и исходы дел были выдуманы; юристы предположили, что ошибки возникли из‑за ИИ‑инструментов, что подчёркивает опасность галлюцинаций в правовой сфере .
18. ChromeOS 138 добавил AI‑обои и синхронизацию рабочих столов (25 июл 2025) — обновление ChromeOS приносит функцию Desk Sync, синхронизирующую окна и вкладки между устройствами, и генеративные обои на Chromebook Plus по свободному текстовому запросу, улучшая совместную работу и персонализацию .
19. AI‑гид Google Web Guide (24 июл 2025) — Google тестирует функцию Web Guide в Search Labs: Gemini группирует результаты поиска в тематические разделы с краткими описаниями, используя фан‑аут стратегию; пользователи могут отключать ИИ‑режим и возвращаться к обычной выдаче .
20. Thunderforge: ИИ‑агенты для военных игр (23 июл 2025) — Агентство DIU заказало у Scale AI систему, где несколько агентных ИИ критически анализируют военные планы, выявляют слабости и интегрируются с моделированием Anduril и DARPA SAFE‑SiM; испытания проходят в Индо‑Тихоокеанском командовании .
14. Наплыв «слопа» в bug bounty (24 июл 2025) — платформы для поиска уязвимостей сообщают, что злоумышленники используют генеративные модели для отправки сотен фальшивых отчётов: многие кажутся реальными, но содержат вымышленные ошибки, что перегружает команды безопасности и требует обучения в распознавании «галлюцинаций» .
15. ИИ‑компаньоны в подростковой среде (21 июл 2025) — исследование Common Sense Media показало, что 72 % американских подростков пробовали ИИ‑компаньонов, а половина использует их регулярно для развлечений и совета; эксперты предупреждают о рисках зависимости, безопасности данных и влиянии на эмоциональное развитие .
16. Microsoft Copilot получает личность (25 июл 2025) — глава Microsoft AI Мустафа Сулейман рассказал, что Copilot обзаведётся «личностью» с лицом и памятью; новая функция Appearance добавит мимику и виртуальное пространство, а компания собирается упростить интерфейс Windows ради глубокого внедрения ИИ .
17. Судья США отозвал решение из‑за поддельных цитат (25 июл 2025) — окружной судья Нью‑Джерси отозвал своё заключение по биофармацевтическому делу, обнаружив, что приведённые цитаты и исходы дел были выдуманы; юристы предположили, что ошибки возникли из‑за ИИ‑инструментов, что подчёркивает опасность галлюцинаций в правовой сфере .
18. ChromeOS 138 добавил AI‑обои и синхронизацию рабочих столов (25 июл 2025) — обновление ChromeOS приносит функцию Desk Sync, синхронизирующую окна и вкладки между устройствами, и генеративные обои на Chromebook Plus по свободному текстовому запросу, улучшая совместную работу и персонализацию .
19. AI‑гид Google Web Guide (24 июл 2025) — Google тестирует функцию Web Guide в Search Labs: Gemini группирует результаты поиска в тематические разделы с краткими описаниями, используя фан‑аут стратегию; пользователи могут отключать ИИ‑режим и возвращаться к обычной выдаче .
20. Thunderforge: ИИ‑агенты для военных игр (23 июл 2025) — Агентство DIU заказало у Scale AI систему, где несколько агентных ИИ критически анализируют военные планы, выявляют слабости и интегрируются с моделированием Anduril и DARPA SAFE‑SiM; испытания проходят в Индо‑Тихоокеанском командовании .
Forwarded from Нейродвиж
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
😁2
Forwarded from Denis Sexy IT 🤖
Я готовлю пост в котором соберу все успешные разы когда Operator или ChatGPT Agent помогли мне решить какие-то задачи, но про этот случай отдельно напишу:
Задумываюсь купить квартиру в Амстердаме и хочется с красивым видом – и вот я отправил агента от ChatGPT на местный ЦИАН посмотреть квартиры, а потом попросил его сделать небольшую карту, где я смогу посмотреть куда выходят окна квартир из объявлений – вот например, с видом на слонов у зоопарка есть за 500к
Из интересного, он прям фотки смотрел чтобы понять что видно из окна☕️ :
Задумываюсь купить квартиру в Амстердаме и хочется с красивым видом – и вот я отправил агента от ChatGPT на местный ЦИАН посмотреть квартиры, а потом попросил его сделать небольшую карту, где я смогу посмотреть куда выходят окна квартир из объявлений – вот например, с видом на слонов у зоопарка есть за 500к
Из интересного, он прям фотки смотрел чтобы понять что видно из окна
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Про AI
Microsoft анонсировали новую функцию для Windows — виртуального помощника Copilot Appearance, заменяющего привычную «скрепку».
Этот помощник будет реагировать на ваши действия и запросы в реальном времени: улыбаться, кивать, говорить, давать советы и даже запоминать контекст беседы.
Ожидается, что новая функция появится уже в этом году.
Про AI
Этот помощник будет реагировать на ваши действия и запросы в реальном времени: улыбаться, кивать, говорить, давать советы и даже запоминать контекст беседы.
Ожидается, что новая функция появится уже в этом году.
Про AI
😁2
Forwarded from 42 секунды
Bloomberg: Китайский Unitree начал продавать роботов-гуманоидов по цене ниже $6 тыс.
– Стартап анонсировал робота R1 по стартовой цене $5,9 тыс.
– Новая модель робота R1 от Unitree весит всего лишь 25 кг
– Робот-гуманоид Unitree также оснащен мультимодальным ИИ
– Китайские компании активно продвигают своих роботов
– Они намерены составить конкуренцию Boston Dynamics и др.
– Роботов-гуманоидов можно использовать на заводах и др.
– Цена роботов имеет решающее значение для распространения
– Более старая модель робота G1 от Unitree стоила $16 тыс.
– Продвинутая и крупная модель робота H1 стоит от $90 тыс.
– UBTech Robotics планирует выпустить робота за $20 тыс.
@ftsec
– Стартап анонсировал робота R1 по стартовой цене $5,9 тыс.
– Новая модель робота R1 от Unitree весит всего лишь 25 кг
– Робот-гуманоид Unitree также оснащен мультимодальным ИИ
– Китайские компании активно продвигают своих роботов
– Они намерены составить конкуренцию Boston Dynamics и др.
– Роботов-гуманоидов можно использовать на заводах и др.
– Цена роботов имеет решающее значение для распространения
– Более старая модель робота G1 от Unitree стоила $16 тыс.
– Продвинутая и крупная модель робота H1 стоит от $90 тыс.
– UBTech Robotics планирует выпустить робота за $20 тыс.
@ftsec
Forwarded from GPT/ChatGPT/AI Central Александра Горного
Переписка с ChatGPT может быть использована в суде
Глава OpenAI признал, что в отличие от настоящего психотерапевта или адвоката, разговоры с ботом не защищены законом.
Если на OpenAI подадут в суд, переписку могут запросить, даже если вы её удалили — по политике компании, чаты стираются через 30 дней, но могут быть сохранены по требованию суда или “по соображениям безопасности”.
“Когда вы говорите с терапевтом, адвокатом или врачом, у вас есть право на конфиденциальность. А с ChatGPT — нет. Мы это ещё не урегулировали”, — сказал Альтман.
https://www.businessinsider.com/chatgpt-privacy-therapy-sam-altman-openai-lawsuit-2025-7?international=true&r=US&IR=T
Глава OpenAI признал, что в отличие от настоящего психотерапевта или адвоката, разговоры с ботом не защищены законом.
Если на OpenAI подадут в суд, переписку могут запросить, даже если вы её удалили — по политике компании, чаты стираются через 30 дней, но могут быть сохранены по требованию суда или “по соображениям безопасности”.
“Когда вы говорите с терапевтом, адвокатом или врачом, у вас есть право на конфиденциальность. А с ChatGPT — нет. Мы это ещё не урегулировали”, — сказал Альтман.
https://www.businessinsider.com/chatgpt-privacy-therapy-sam-altman-openai-lawsuit-2025-7?international=true&r=US&IR=T
Forwarded from эйай ньюз
GLM 4.5 — китайский опенсорс продолжает доминировать
Очередная очень сильная открытая MoE модель от китайцев, с очень хорошими результатами на бенчах. Гибридний ризонер, с упором на тулюз. Доступна по MIT лицензии, 128к контекста, нативный function calling, из коробки работают стриминг и batching, есть FP8‑инференс и совместимость с vLLM/SGLang.
Как и Kimi K2 модельку тренировали с Muon, но в отличие от Kimi авторы использовали QK норму вместо клиппинга — Kimi такой трюк не позволило провернуть использование MLA, из-за чего им пришлось придумывать свою версию оптимайзера. Для спекулятивного декодинга получше модельку тренировали с MTP. Она заметно глубже чем другие открытые китайские MoE — это повышает перформанс, за счёт роста размера KV-кэша. Вместе с этим они используют заметно больше attention heads. Это хоть и не помогает лоссу, но заметно улучшает ризонинг бенчмарки.
Модель идёт в двух размерах — 355B (32B active) и 106B (12B active). Претрейн был на 22 триллионах токенов — 15 триллионов токенов обычных данных, а после них 7 триллионов кода с ризонингом. На мидтрейне в модель запихнули по 500 миллиардов токенов кода и ризонинг данных с контекстом расширенным до 32к, а после этого 100 миллиардов long context и агентных данных при контексте уже в 128к.
Посттрейн двухэтапный — сначала из базовой модели через cold‑start+RL тренируют три эксперта (reasoning модель, agentic модель, и для общих тасков) и сводят их знания в одну модель через self‑distillation. Затем идёт объединённое обучение: общий SFT → Reasoning RL → Agentic RL → General RL.
Для ризонинга применяют одноступенчатый RL на полном 64K‑контексте с curriculum по сложности, динамическими температурами и адаптивным клиппингом. Агентные навыки тренируют на верифицируемых треках — поиск информации и программирование с обратной связью по исполнению. Полученные улучшения помогают и deep search и общему tool‑use. Кстати, их посттрейн фреймворк открытый и лежит на гитхабе.
Веса
Демо
Блогпост
Посттрейн фреймворк
@ai_newz
Очередная очень сильная открытая MoE модель от китайцев, с очень хорошими результатами на бенчах. Гибридний ризонер, с упором на тулюз. Доступна по MIT лицензии, 128к контекста, нативный function calling, из коробки работают стриминг и batching, есть FP8‑инференс и совместимость с vLLM/SGLang.
Как и Kimi K2 модельку тренировали с Muon, но в отличие от Kimi авторы использовали QK норму вместо клиппинга — Kimi такой трюк не позволило провернуть использование MLA, из-за чего им пришлось придумывать свою версию оптимайзера. Для спекулятивного декодинга получше модельку тренировали с MTP. Она заметно глубже чем другие открытые китайские MoE — это повышает перформанс, за счёт роста размера KV-кэша. Вместе с этим они используют заметно больше attention heads. Это хоть и не помогает лоссу, но заметно улучшает ризонинг бенчмарки.
Модель идёт в двух размерах — 355B (32B active) и 106B (12B active). Претрейн был на 22 триллионах токенов — 15 триллионов токенов обычных данных, а после них 7 триллионов кода с ризонингом. На мидтрейне в модель запихнули по 500 миллиардов токенов кода и ризонинг данных с контекстом расширенным до 32к, а после этого 100 миллиардов long context и агентных данных при контексте уже в 128к.
Посттрейн двухэтапный — сначала из базовой модели через cold‑start+RL тренируют три эксперта (reasoning модель, agentic модель, и для общих тасков) и сводят их знания в одну модель через self‑distillation. Затем идёт объединённое обучение: общий SFT → Reasoning RL → Agentic RL → General RL.
Для ризонинга применяют одноступенчатый RL на полном 64K‑контексте с curriculum по сложности, динамическими температурами и адаптивным клиппингом. Агентные навыки тренируют на верифицируемых треках — поиск информации и программирование с обратной связью по исполнению. Полученные улучшения помогают и deep search и общему tool‑use. Кстати, их посттрейн фреймворк открытый и лежит на гитхабе.
Веса
Демо
Блогпост
Посттрейн фреймворк
@ai_newz