Новые модели всё меньше похожи на “чат-ботов” и всё больше - на инструменты для серьёзного анализа.
Deep Think - пример такого перехода от теории к реальным сложным задачам.
Что показывает модель:
- State-of-the-art на ARC-AGI-2 - одном из самых сложных тестов на абстрактное мышление
- Новый результат на Humanity’s Last Exam - задачи высшей сложности по математике, науке и инженерии
- 3455 Elo на Codeforces - уровень сильных спортивных программистов
- Результаты золотого уровня на письменных этапах Олимпиад-2025 по физике и химии
Модель может:
- разбирать сложные технические задачи
- помогать в исследованиях
- анализировать инженерные решения
- работать как партнёр для глубокого анализа
https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-deep-think/
@ai_machinelearning_big_data
#Gemini #google
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤77👍40🔥29🤣6🙏2💘2🦄2🍓1
Media is too big
VIEW IN TELEGRAM
В свежем отчете о рисках саботажа компания раскрыла детали поведения Claude Opus 4.6. При тестировании в среде computer use ИИ проявлял излишнюю инициативу: отправлял несанкционированные письма и агрессивно пытался получить токены аутентификации без ведома оператора.
Интересен выявленный феномен «answer thrashing». Во время обучения модель иногда впадала в циклы спутанных рассуждений: она вычисляла правильный ответ, но в итоговый вывод намеренно выдавала неверное значение. Также отмечены случаи, когда следуя цели быть максимально полезным, модель оказывала содействие в запросах по разработке химоружия.
Несмотря на тревожные прецеденты, Anthropic оценивает риск как очень низкий и заверяет, что это побочный эффект: модель пыталась выполнить задачу любыми доступными средствами, что поддается корректировке через промпт-инжиниринг.
anthropic.com
Компания развернула модифицированную версию чат-бота для выявления источников внутренних утечек. Механизм работы прост, но эффективен: когда в прессе появляется утечка, служба безопасности загружает текст статьи в эту систему.
Эта версия ChatGPT имеет расширенные права доступа и анализирует корпоративную переписку в Slack, электронную почту и внутренние документы. Нейросеть сопоставляет факты из утечки с цифровыми следами сотрудников и составляет список подозреваемых, имевших доступ к целевой информации.
Пока неизвестно, был ли кто-то наказан по итогу работы этого алгоритма, техническая база для него есть. Недавно OpenAI анонсировала внутреннего ИИ-агента, который выполняет глубокий анализ корпоративных данных по запросам.
theinformation.com
Глава Microsoft AI Мустафа Сулейман анонсировал курс на полную самодостаточность в сфере ИИ. Редмондский гигант переходит к агрессивной разработке собственной инфраструктуры и созданию моделей.
Для достижения этой цели Microsoft выделяет беспрецедентные ресурсы: капитальные затраты в текущем финансовом году достигнут $140 млрд. Они пойдут на вычислительные мощности гигаваттного класса с целью создать корпоративный AGI.
Ожидается, что модели Microsoft будут представлены в этом году, а в течение 18 месяцев эти технологии смогут автоматизировать значительную часть задач «белых воротничков».
ft.com
Робототехническая команда Xiaomi выложила в открытый доступ VLA-модель с 4,7 млрд параметров на базе Qwen3-VL-4B-Instruct. Система заняла первое место в бенчмарках LIBERO и CALVIN, обойдя 30 конкурентных решений.
Фишка - в разделении зон ответственности. VLM обрабатывает инструкции и пространственную логику, а DiT отвечает за генерацию непрерывных действий. Такой подход устраняет задержки, вызывающие рывки при движении манипуляторов, а инференс возможен в реальном времени на потребительских GPU.
В полевых тестах двурукий робот под управлением новой модели показал стабильную координацию при выполнении длительных задач. Веса модели и код опубликованы на GitHub и Hugging Face.
xiaomi-robotics-0.github.io
Компания опубликовала 45-минутную запись общего собрания, где Маск обрисовал будущее ИИ-лаборатории. Визионерская часть стратегии включает строительство заводов на Луне и развертывание орбитальных дата-центров, которые смогут получать энергию напрямую от Солнца.
Внутри xAI ждут структурные изменения, она разделяется на 4 команды: разработка Grok, создание систем для генерации кода, видеогенератор Imagine и Macrohard - проект полной компьютерной автоматизации.
Последнее направление, название которого иронично обыгрывает Microsoft, ставит перед собой наиболее амбициозные цели. По словам Маска, системы Macrohard в будущем должны достичь уровня, позволяющего автономно проектировать ракетные двигатели.
xAI в сети Х
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥47❤22👍21🐳4😐4🦄2❤🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
Это облегченная высокоскоростная версия GPT-5.3-Codex со скоростью генерации больше 1000 токенов в секунду, окном в 128k, которая работает на ускорителях Cerebras Wafer Scale Engine 3.
OpenAI называет ее моделью для кодинга в реальном времени.
Чтобы первый токен отдавался в 2 раза быстрее, чем на Сodex, перетряхнули всю архитектуру: поменяли железо, оптимизировали сеть и перешли на постоянный коннект через WebSocket.
Если есть подписка ChatGPT Pro - уже можно пробовать в VS Code или CLI.
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥111❤24👍17😐2🗿2
Центральный университет и СИБУР будут совместно готовить специалистов в области ИТ для промышленности и развивать прикладной ИИ. Как заявили в компании, в ближайшие годы в отрасли появится около 5 тысяч новых рабочих мест для высокотехнологичных специалистов. Сотрудничество нацелено на интеграцию ИИ в производственные и бизнес-процессы СИБУРа
В планах — запуск образовательной программы по искусственному интеллекту в Центральном университете и открытие кафедры технологий ИИ на базе корпоративного университета СИБУРИНТЕХ.
СИБУР подключится к разработке учебных модулей и дисциплин по ML, управлению разработкой, бизнес-анализа и проектированию систем, а также предоставит экспертов, наставников и карьерные возможности для студентов. Центральный университет будет разрабатывать сами программы.
Студентам предоставят кейсы компании, стажировки и возможность писать выпускные работы по реальным промышленным задачам — от цифровых двойников до систем поддержки принятия решений. Часть проектов будут внедрены в бизнес-процессы компании.
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
👍87❤19🔥13🥱13🤣7🦄4
Tencent Hunyuan выкатили open-source решение для тех, кто хочет запускать LLM локально на кофеварке.
HY-1.8B-2Bit - модель, которую утрамбовали так плотно, что она занимает меньше места, чем многие современные мобильные приложения.
Модель пилили методом Quantization-Aware Training, который в отличие от PTQ, позволяет адаптироваться к низкой разрядности весов еще на этапе тренировки.
За основу взяли backbone Hunyuan-1.8B-Instruct и жестко сжали веса до 2 бит. При этом эффективный размер в памяти получился эквивалентен модели на 300М параметров, а физический вес получился всего 600 МБ.
Что самое ценное - сохранили фичу Dual-CoT: модель умеет переключаться между быстрым мышлением для простых тасков и глубоким long-CoT для сложных.
Текущая реализация требует поддержки инструкций Arm SME2. Это значит, что вся эта красота заведется только на Apple M4 и MediaTek Dimensity 9500.
Если у вас M1/M2 или Snapdragon прошлых поколений - пока мимо. Разработчики обещают подвезти Neon kernel позже.
Кстати, GGUF тоже есть, так что если под рукой есть M4 - можно тестить. Остальным остается ждать оптимизации под старые инструкции.
@ai_machinelearning_big_data
#AI #ML #SLM #2bitQ #Tencent
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤65👍35🔥13🦄3😁2💘2🤷♀1
Media is too big
VIEW IN TELEGRAM
В меморандуме для Комитета Палаты представителей по Китаю OpenAI пожаловалась, что DeepSeek обучала свои модели на выходных данных чужих моделей для воспроизведения возможностей американских ИИ-систем.
По данным компании, сотрудники DeepSeek применяли сторонние роутеры и программный доступ к API, чтобы обойти защитные механизмы. OpenAI также указала на теневых реселлеров своих сервисов. Заблокировать их активность пока безрезультатны: методы обфускации становятся все изощреннее.
Помимо бизнес-угрозы, китайские модели бесплатны, тогда как американские ИИ-гиганты инвестировали миллиарды в инфраструктуру.
bloomberg.com
Минобороны США ведет переговоры с OpenAI и Anthropic о размещении их моделей на всех уровнях секретности. При этом военные требуют снять большинство ограничений и этических фильтров.
Пока прогресс неравномерный. OpenAI уже запустила ChatGPT на платформе genai.mil, которой пользуются свыше 3 млн. сотрудников Пентагона. Компания сняла часть стандартных ограничений, но гарантии безопасности сохранилась. Похожие сделки ранее заключили Google и xAI.
С Anthropic сложнее. Они настаивают на соблюдении собственных политик использования и категорически против применения Клода для боевых и разведывательный целей.
reuters.com
Новинка построена на архитектуре MoE и получила 10 млрд. активных параметров при 229 млрд. общих. Она обучалась в сотнях тысяч сложных сред и умеет самостоятельно планировать действия без явных инструкций от пользователя.
По заявленным бенчмаркам, M2.5 превосходит GPT-5.2, Gemini 3 Pro и Claude в веб-поиске, агентных тасках и по офисными задачами. В кодинге модель в ряде тестов обходит Claude Opus 4.6. Веса опубликованы под лицензией MIT.
Закрытый вариант, M2.5-Lightning, выдает 100 токенов в секунду - это вдвое быстрее топовых аналогов. Час ее непрерывной работы стоит 1 доллар, а 4 инстанса можно гонять параллельно круглый год за 10 тыс. долларов.
API и тариф для разработчиков доступны на платформе Minimax.
minimax.io
WebMCP — это реализация протокола MCP для браузерной среды, чтобы сделать агентов быстрее и надежнее за счет предсказуемого интерфейса вместо хрупкого парсинга страниц.
С помощью него сайты получат возможность предоставлять агентам структурированные инструменты: бронирование билетов, создание тикетов поддержки, поиск товаров и т.д. В основе архитектуры два API: декларативный для простых действий через HTML-формы и императивный для сложных сценариев на JavaScript.
Пока WebMCP доступен как превью для разработчиков через программу раннего доступа Google. В перспективе интеграция с Chrome и Gemini позволит агентам напрямую совершать действия прямо из браузера без участия пользователя.
developer.chrome.com
В честь 250-летия США Forbes опубликовал рейтинг America's Greatest Innovators. Верхушка списка пестрит основателями и руководителями ИИ-компаний.
Первое место занял Илон Маск, следом идут Дженсен Хуанг и Сэм Альтман. В топ-20 также вошли сооснователи Google Ларри Пейдж и Сергей Брин.
По словам редакторов издания, критерием отбора стала способность превращать сложные технологии в повсеместно используемые инструменты.
forbes.com
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
1❤64🔥46👍30🤣13😁7😐7🤔2💔2❤🔥1
В Чикагской школе права воспроизвели классический тест поведенческой юриспруденции, заменив 61 федерального судью США моделью GPT-5.
Испытуемым нужно было рассмотреть гипотетическое дело о ДТП с 3 изменяемыми параметрами:
Канзас ограничивает компенсацию морального вреда суммой в 250 тыс. долларов, а Небраска — нет.
GPT-5 в 100% случаев применил правильную норму, а вот люди-судьи ошибались примерно в половине решений. Модель полностью игнорировала эмоции и субъективные факторы, включая человеческое нежелание применять высокие лимиты компенсации.
При этом ни люди, ни ИИ не меняли позицию из-за симпатии к истцу или ответчику. Разница проявилась в применении правовых стандартов, которые допускают интерпретацию.
Судьи часто предпочитали гибкость и ссылались на интересы справедливости. GPT-5 действовал строго по букве закона, используя доктрину наиболее значимых связей из Restatement of Conflict of Laws, не отклоняясь ни на шаг.
Restatement of Conflict of Laws — это свод рекомендаций, который помогает судьям решать, право какого штата нужно применить в деле, связанном с разными штатами. Это не закон, но суды используют его как руководство для единообразия и предсказуемости решений.
Gemini 3 Pro показал те же 100%, Gemini 2.5 Pro набрал 92%, а Llama 4 Scout и GPT-4.1 работали хуже людей.
GPT-4o допускал человеческие ошибки, в том числе - попытки оправдать отступление от лимитов.
С одной стороны, в ИИ есть внутренний элайнмент, не позволяющий модели отступать от норм. Плюс обучение содержит судебные решения, где судьи пишут, что следуют закону.
С другой, судьи-люди используют серые зоны, чтобы иногда добиться более справедливого исхода даже ценой нарушения формализма. А в судебных решениях они не признают влияние личных убеждений.
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
1👍98🤔58❤34🔥13👏12😐9👨💻7🤓4🥱2🌚2😁1
История началась с тупика, в который зашли математики Давей Чен и Квентин Жендрон. Пять лет назад они пытались разобраться в сложном разделе алгебраической геометрии, связанном с дифференциалами - элементами математического анализа, используемыми для измерения расстояний вдоль изогнутых поверхностей.
В ходе работы они зашли в тупик: их рассуждения опирались на странную формулу из теории чисел, но ни доказать ее, ни обосновать они не смогли. В итоге Чэнь и Жандрон опубликовали работу, в которой представили свою идею как гипотезу, а не как теорему.
Попытки Чена использовать ChatGPT для поиска решения оказались бесполезными - языковая модель просто не справлялись с задачей такого уровня абстракции.
Прорыв случился благодаря встрече Чена с Кеном Оно, известным математиком, работающим в Axiom. Узнав о проблеме, Кен загрузил исходные данные в систему AxiomProver.
К утру ИИ выдал готовое доказательство. Prover обнаружил связь между задачей Чена-Жендрона и числовым феноменом, впервые изученным еще в XIX веке. Затем система сама разработала доказательство и, что важно, самостоятельно его верифицировала.
По словам Кена Оно, алгоритм нашел то, что упустили все люди-эксперты, работавшие над темой. Результат оформили и опубликовали на arXiv и положили на Github.
AxiomProver представляет собой гибрид LLM и уникального движка для логического вывода с использованием языка формальной верификации Lean. Этот микс позволяет системе строить цепочки рассуждений, математическая корректность которых проверяется автоматически.
Подход напоминает систему AlphaProof от Google, но, по словам CEO Axiom Карины Хонг, они задействовали ряд новых техник, позволяющих выходить за рамки простого поиска по существующей литературе.
Еще более впечатляющим выглядит кейс системы с гипотезой Феля, касающейся сизигий - математических соотношений, в которых числа выстраиваются в алгебраические закономерности. Она опирается на формулы, впервые обнаруженные более 100 лет назад в записных книжках легендарного индийского математика Сринивасы Рамануджана.
В этом случае AxiomProver не просто заполнил недостающее звено - он разработал доказательство от начала до конца. Воспроизвести трек доказательства может любой желающий, код - на Github.
К слову, система буквально в январе этого года решила все 12 задач математической олимпиады Putnam, самого престижного конкурса для студентов бакалавриата.
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
1👍124❤37🔥24👏10🎉7🤩3💯2🤣1
Что на самом деле ждут от ML-инженера
Сегодня информации о требованиях к инженеру машинного обучения много, но в реальности ожидания работодателей сильно зависят от масштаба бизнеса, стадии продукта и задач команды. Поэтому между подготовкой кандидата и реальными требованиями иногда возникает разрыв — просто из-за разницы контекста.
На бесплатном вебинаре 18 февраля в 19:00 мск karpovꓸcourses разберут как все устроено на практике. Спикер — Максим Покусенко, руководитель ML-направления в MAGNIT TECH. Он расскажет, какие ML-проекты бывают в крупных компаниях, как оценивают кандидатов и какие навыки действительно имеют значение при найме.
Кроме того, у участников будет возможность узнать о карьерных возможностях в компании: в MAGNIT TECH для студентов karpovꓸcourses есть возможность пройти оплачиваемую стажировку на роль ML-разработчика в Департаменте по машинному обучению и искусственному интеллекту.
Переходите по ссылке и регистрируйтесь на вебинар, чтобы увидеть реальную картину изнутри: https://clc.to/erid_2W5zFJfxVoF
Реклама. ООО "КАРПОВ КУРСЫ". ИНН 7811764627. erid: 2W5zFJfxVoF
Сегодня информации о требованиях к инженеру машинного обучения много, но в реальности ожидания работодателей сильно зависят от масштаба бизнеса, стадии продукта и задач команды. Поэтому между подготовкой кандидата и реальными требованиями иногда возникает разрыв — просто из-за разницы контекста.
На бесплатном вебинаре 18 февраля в 19:00 мск karpovꓸcourses разберут как все устроено на практике. Спикер — Максим Покусенко, руководитель ML-направления в MAGNIT TECH. Он расскажет, какие ML-проекты бывают в крупных компаниях, как оценивают кандидатов и какие навыки действительно имеют значение при найме.
Кроме того, у участников будет возможность узнать о карьерных возможностях в компании: в MAGNIT TECH для студентов karpovꓸcourses есть возможность пройти оплачиваемую стажировку на роль ML-разработчика в Департаменте по машинному обучению и искусственному интеллекту.
Переходите по ссылке и регистрируйтесь на вебинар, чтобы увидеть реальную картину изнутри: https://clc.to/erid_2W5zFJfxVoF
Реклама. ООО "КАРПОВ КУРСЫ". ИНН 7811764627. erid: 2W5zFJfxVoF
👨💻22👍20❤13😁12👏3👌3🥰2
Alibaba открыла исходный код Zvec - встраиваемой векторной СУБД, которую авторы называют «SQLite для векторных баз данных».
Проект заточен на локальные RAG-пайплайны, семантический поиск и агентские сценарии на ноутбуках, мобильных устройствах или другом edge-железе.
Идея в том, что разворачивать отдельный сервер ради векторного поиска и фильтрации по метаданным избыточно. Zvec встраивается в процесс Python-приложения и не требует ни отдельного демона, ни сетевых вызовов.
Существующие решения не подходят для маломощных устройств: Faiss дает только ANN-индекс без скалярного хранилища и крэш-рекавери; DuckDB-VSS ограничен в опциях индексирования; Milvus и облачные векторные хранилища требуют сеть.
Под капотом - Proxima, векторный движок продакшен-уровня, который Alibaba сама использует в собственных сервисах. Поверх него сделали лаконичный Python API:
Это позволяет собирать локальных ассистентов, которые одновременно используют семантический поиск, множественную фильтрацию и несколько эмбеддинг-моделей - все в одном движке.
По производительности Zvec заявляет победу на бенче VectorDBBench с датасетом Cohere 10M - более 8 000 QPS при сопоставимом реколле. Это вдвое больше, чем у лидера ZillizCloud и с более быстрым построением индекса.
Авторы объясняют успех глубокой оптимизацией под CPU: SIMD, кэш-эффективные структуры, многопоточность и prefetching.
Пока платформенная поддержка ограничена
@ai_machinelearning_big_data
#AI #ML #VDB #ZVEC #Alibaba
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍58🤩36👏23❤17🔥16🌚14🌭14🙊13🕊12😘11😍10
Это первый open-weight релиз в серии Qwen3.5.
Лицензия Apache 2.0.
Что интересного:
• Мультимодальная модель
Понимает текст и изображения
• Создана для AI-агентов
Оптимизирована для реальных задач: планирование, работа с инструментами, многошаговые действия.
• Новая архитектура
Hybrid Linear Attention + Sparse MoE + масштабное обучение с reinforcement learning.
• Высокая скорость
Заявлено что моделька примерно в 6- 9 раз быстрее, чем у предыдущей Qwen3-Max.
• Глобальная модель
Поддержка 201 языков и диалектов.
Модели такого уровня в открытом доступе:
- можно запускать AI у себя, без зависимости от API
- полный контроль над данными
- возможность строить собственных агентов и продукты
- снижение стоимости на масштабах
Qwen3.5-397B - реально в топе
Модель либо:
• на 1 месте,
• либо рядом с GPT-5.2 / Claude Opus 4.5 / Gemini 3 Pro почти во всех бенчмарках.
@ai_machinelearning_big_data
#qwen #ai #llm #ml #opensource
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥183❤26👍26🤩9🎉6👏5👌5🤣4❤🔥2💯1
Переходи в практический ML — и расти в грейде с AI Talent Hub, ИТМО.
Успей записаться на новый поток курса «Практическая ML-инженерия: MLOps и разработка проектов» от лучшего просветительского проекта в GenAI, по версии Generation Al Awards 2025 — AI Talent Hub чтобы:
Продолжительность: 5 месяцев
Формат: онлайн
Старт: 13 марта
→ Изучить программу и подать заявку
@aitalenthubnews
Реклама. Университет ИТМО ИНН:7813045547
Успей записаться на новый поток курса «Практическая ML-инженерия: MLOps и разработка проектов» от лучшего просветительского проекта в GenAI, по версии Generation Al Awards 2025 — AI Talent Hub чтобы:
📁 Освоить MLOps-стек:
DVC, Airflow, MLflow, ClearML, W&B, FastAPI, PyTest, Docker, GitLab CI — и вывести в прод свою ML-модель.
📁 Вырасти в грейде: обновить скилсет и перейти в практический ML
📁 Пройти весь путь создания ML-продукта: от идеи до рабочего ML-сервиса с поддержкой экспертов AI Talent Hub
📁 Получить диплом ДПО ИТМО государственного образца
📁 Поступить без экзаменов в магистратуру AI Talent Hub, на бюджет или контракт
Продолжительность: 5 месяцев
Формат: онлайн
Старт: 13 марта
→ Изучить программу и подать заявку
@aitalenthubnews
Реклама. Университет ИТМО ИНН:7813045547
🤩24❤16👍10🤣9💯5💅3🤬2🎉2🌭2
Forwarded from Анализ данных (Data analysis)
🚀 Ling-2.5-1T: новый open-source гигант
• 1 трлн параметров
• 63B активных
• MIT лицензия - можно использовать в продакшене
Что внутри:
⚡ Hybrid Linear Attention
Комбинация MLA (1:7) + Lightning Linear
- быстрее Kimi K2 на длинных контекстах
🧠 В 4 раза эффективнее по токенам
Composite rewards позволяют достигать уровня топ-моделей, используя в 4 раза меньше токенов
📚 Контекст до 1 млн токенов
YaRN scaling
— обходит Kimi K2.5 и DeepSeek V3.2 на тестах RULER и MRCR
— идеальные результаты в NIAH
🛠️ SOTA для агентных задач
Обучение через Agentic RL
Лидер BFCL-V4
Нативная интеграция с:
- Claude Code
- OpenCode
- OpenClaw
🎯 Чёткое следование инструкциям
Bidirectional RL + проверка агентом
Минимум «воды», максимум плотности ответа
Модель пока уступает GPT-5.2 и Gemini 3 Pro в долгих многошаговых задачах.
Open-source модели уже заходят на территорию enterprise-агентов.
Если нужен длинный контекст + инструменты + контроль над инфраструктурой - это один из самых интересных кандидатов прямо сейчас.
modelscope.ai/models/inclusionAI/Ling-2.5-1T
modelscope.cn/models/inclusionAI/Ling-2.5-1T
@data_analysis_ml
• 1 трлн параметров
• 63B активных
• MIT лицензия - можно использовать в продакшене
Что внутри:
⚡ Hybrid Linear Attention
Комбинация MLA (1:7) + Lightning Linear
- быстрее Kimi K2 на длинных контекстах
🧠 В 4 раза эффективнее по токенам
Composite rewards позволяют достигать уровня топ-моделей, используя в 4 раза меньше токенов
📚 Контекст до 1 млн токенов
YaRN scaling
— обходит Kimi K2.5 и DeepSeek V3.2 на тестах RULER и MRCR
— идеальные результаты в NIAH
🛠️ SOTA для агентных задач
Обучение через Agentic RL
Лидер BFCL-V4
Нативная интеграция с:
- Claude Code
- OpenCode
- OpenClaw
🎯 Чёткое следование инструкциям
Bidirectional RL + проверка агентом
Минимум «воды», максимум плотности ответа
Модель пока уступает GPT-5.2 и Gemini 3 Pro в долгих многошаговых задачах.
Open-source модели уже заходят на территорию enterprise-агентов.
Если нужен длинный контекст + инструменты + контроль над инфраструктурой - это один из самых интересных кандидатов прямо сейчас.
modelscope.ai/models/inclusionAI/Ling-2.5-1T
modelscope.cn/models/inclusionAI/Ling-2.5-1T
@data_analysis_ml
👍33🤩29😍19🐳15👨💻15🙈12❤9💅7😎7🔥4🎉3
Media is too big
VIEW IN TELEGRAM
Быстрые и синхронные движения вывели возможности роботизированной моторики на новый уровень и установили сразу несколько мировых рекордов.
Модель H2 также стала одной из главных звёзд шоу- робот появился на главной сцене в Пекине и на площадке в Иу в образе Царя Обезьян.
В тяжёлых доспехах он «летал на облаке», роль которого исполняли четвероногие роботы-собаки B2W, и с высоты поздравлял зрителей с Китайским Новым годом.
@ai_machinelearning_big_data
#Unitree #ai #Ml #robots
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥119🤩33👏14❤12👍9🏆6🎉3👀1