Media is too big
VIEW IN TELEGRAM
Запустили официальный бесплатный курс по Claude Code
Он длится меньше двух часов и рассказывает:
✓ как создавать приложения по дизайну из Figma
✓ как управлять браузером через Playwright MCP
✓ как применять лучшие практики на реальных проектах
→ http://deeplearning.ai/short-courses/claude-code-a-highly-agentic-coding-assistant/
Он длится меньше двух часов и рассказывает:
✓ как создавать приложения по дизайну из Figma
✓ как управлять браузером через Playwright MCP
✓ как применять лучшие практики на реальных проектах
→ http://deeplearning.ai/short-courses/claude-code-a-highly-agentic-coding-assistant/
Anthropic представила Claude Haiku 4.5 — новую компактную модель с флагманской скоростью и точностью
Компания Anthropic выпустила обновлённую версию своего лёгкого ИИ-моделя — Claude Haiku 4.5. По заявлению разработчиков, он обеспечивает такую же производительность при написании кода, как и прошлый флагман Claude Sonnet 4, но при этом работает в два раза быстрее и в три раза дешевле.
Haiku 4.5 особенно хорошо показывает себя в задачах, связанных с использованием компьютера и автоматизацией действий — например, в Claude for Chrome и Claude Code. В последнем модель делает работу с multi-agent проектами и быстрое прототипирование заметно более отзывчивыми.
Anthropic подчёркивает, что Sonnet 4.5 остаётся их лучшей моделью для программирования, но Haiku 4.5 даёт «почти флагманский» уровень качества при существенно меньших издержках.
Обе модели можно использовать совместно: Sonnet строит многошаговые планы, а Haiku выполняет подзадачи параллельно.
Haiku 4.5 уже доступен через Anthropic API, Amazon Bedrock и Google Cloud Vertex AI. Модель полностью совместима с Haiku 3.5 и Sonnet 4.
https://www.anthropic.com/news/claude-haiku-4-5
Компания Anthropic выпустила обновлённую версию своего лёгкого ИИ-моделя — Claude Haiku 4.5. По заявлению разработчиков, он обеспечивает такую же производительность при написании кода, как и прошлый флагман Claude Sonnet 4, но при этом работает в два раза быстрее и в три раза дешевле.
Haiku 4.5 особенно хорошо показывает себя в задачах, связанных с использованием компьютера и автоматизацией действий — например, в Claude for Chrome и Claude Code. В последнем модель делает работу с multi-agent проектами и быстрое прототипирование заметно более отзывчивыми.
Anthropic подчёркивает, что Sonnet 4.5 остаётся их лучшей моделью для программирования, но Haiku 4.5 даёт «почти флагманский» уровень качества при существенно меньших издержках.
Обе модели можно использовать совместно: Sonnet строит многошаговые планы, а Haiku выполняет подзадачи параллельно.
Haiku 4.5 уже доступен через Anthropic API, Amazon Bedrock и Google Cloud Vertex AI. Модель полностью совместима с Haiku 3.5 и Sonnet 4.
https://www.anthropic.com/news/claude-haiku-4-5
This media is not supported in your browser
VIEW IN TELEGRAM
Google готовит прототип Gemini Agent, который сможет выполнять задачи прямо в интернете!
По предварительным данным, он будет работать на базе недавно представленной модели Computer User и сможет управлять браузером, выполнять глубокие исследования и действовать автономно.
Мощная штука, но, как говорится, с большой силой приходит большая ответственность
https://www.testingcatalog.com/google-prepares-gemini-agent-to-perform-tasks-for-you/
По предварительным данным, он будет работать на базе недавно представленной модели Computer User и сможет управлять браузером, выполнять глубокие исследования и действовать автономно.
Мощная штука, но, как говорится, с большой силой приходит большая ответственность
https://www.testingcatalog.com/google-prepares-gemini-agent-to-perform-tasks-for-you/
Baidu выложила в open source свою новую модель PaddleOCR-VL — самый мощный мультимодальный движок для распознавания и понимания документов.
При 0,9 млрд параметров она заняла первое место в мире по бенчмарку OmniBenchDoc, обогнав GPT-4o, Gemini-2.5 Pro и другие.
Модель не просто читает текст, а понимает структуру документов, корректно обрабатывает таблицы, формулы, рукописные заметки и графики, превращая всё это в структурированные данные.
Поддерживает 109 языков и уже доступна на HuggingFace и GitHub.
https://github.com/PaddlePaddle/PaddleOCR
При 0,9 млрд параметров она заняла первое место в мире по бенчмарку OmniBenchDoc, обогнав GPT-4o, Gemini-2.5 Pro и другие.
Модель не просто читает текст, а понимает структуру документов, корректно обрабатывает таблицы, формулы, рукописные заметки и графики, превращая всё это в структурированные данные.
Поддерживает 109 языков и уже доступна на HuggingFace и GitHub.
https://github.com/PaddlePaddle/PaddleOCR
Команда Anthropic выпустила Decode - новый инструмент, который объединяет возможности Claude Code с браузером и интерактивным whiteboard. Теперь можно давать UX-фидбэк прямо во время локальной разработки, а Claude Code сам проверит и протестирует внесённые изменения.
Decode позволяет просматривать сразу несколько экранов приложения, как в Figma, и мгновенно применять правки. Infinite canvas даёт место для экспериментов: можно сравнивать варианты, тестить и делиться идеями с командой.
По сути, Decode даёт Claude Code «суперспособности» браузера и удобный способ общения с разработчиком - с поддержкой кастомных MCP, команд, саб-агентов и других фич.
Ранняя версия доступна на decode.dev
Decode позволяет просматривать сразу несколько экранов приложения, как в Figma, и мгновенно применять правки. Infinite canvas даёт место для экспериментов: можно сравнивать варианты, тестить и делиться идеями с командой.
По сути, Decode даёт Claude Code «суперспособности» браузера и удобный способ общения с разработчиком - с поддержкой кастомных MCP, команд, саб-агентов и других фич.
Ранняя версия доступна на decode.dev
This media is not supported in your browser
VIEW IN TELEGRAM
В Gemini CLI добавили поддержку псевдотерминала (PTY)
Теперь можно запускать сложные интерактивные команды вроде vim, top или git rebase -i прямо внутри CLI, не выходя из текущей сессии. Всё остаётся в контексте, удобно и без переключений.
Состояние терминала сериализуется и стримится в реальном времени, что даёт полноценное двустороннее взаимодействие с командами, требующими "настоящего" терминала.
Подробнее и как начать
Теперь можно запускать сложные интерактивные команды вроде vim, top или git rebase -i прямо внутри CLI, не выходя из текущей сессии. Всё остаётся в контексте, удобно и без переключений.
Состояние терминала сериализуется и стримится в реальном времени, что даёт полноценное двустороннее взаимодействие с командами, требующими "настоящего" терминала.
Подробнее и как начать
This media is not supported in your browser
VIEW IN TELEGRAM
9-летний парень написал свою собственную ОС на HTML и JavaScript, без React
Отец поделился, что его 9-летний сын собрал собственную операционку, пользуясь Aura и Cursor. Всё на чистом HTML и JavaScript, без каких-либо фреймворков.
Система не просто «рисует окна», в ней реально работают приложения, включая App Store, где можно устанавливать и запускать игры вроде Snake, Memory и Pong.
И да, всё по-взрослому: можно даже словить вирус и уронить систему.
Вы можете поиграть с ним на http://kyo-os.aura.build.
PS: не пытайтесь добывать на нем биткоин👌
Отец поделился, что его 9-летний сын собрал собственную операционку, пользуясь Aura и Cursor. Всё на чистом HTML и JavaScript, без каких-либо фреймворков.
Система не просто «рисует окна», в ней реально работают приложения, включая App Store, где можно устанавливать и запускать игры вроде Snake, Memory и Pong.
И да, всё по-взрослому: можно даже словить вирус и уронить систему.
Вы можете поиграть с ним на http://kyo-os.aura.build.
PS: не пытайтесь добывать на нем биткоин
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Представили HuggingChat Omni
Теперь модель выбирается автоматически под каждый запрос
- Автоматический выбор модели для ваших запросов
- Доступно 115 моделей от 15 провайдеров
Доступно всем пользователям Hugging Face. 100% открытый исходный код.
https://github.com/huggingface/chat-ui
Теперь модель выбирается автоматически под каждый запрос
- Автоматический выбор модели для ваших запросов
- Доступно 115 моделей от 15 провайдеров
Доступно всем пользователям Hugging Face. 100% открытый исходный код.
https://github.com/huggingface/chat-ui
This media is not supported in your browser
VIEW IN TELEGRAM
Крутая фича.
Теперь Claude Code умеет уточнять детали прямо в процессе, не просто гадать, что имел в виду пользователь, а реально спрашивать, когда есть несколько вариантов продолжения. Особенно полезно в "plan mode", где логика часто ветвится.
Если хочешь, чтобы он спрашивал чаще, можно прописать это в
Теперь Claude Code умеет уточнять детали прямо в процессе, не просто гадать, что имел в виду пользователь, а реально спрашивать, когда есть несколько вариантов продолжения. Особенно полезно в "plan mode", где логика часто ветвится.
Если хочешь, чтобы он спрашивал чаще, можно прописать это в
Claude.MD или добавить прямо в промпт, по сути, это настройка интерактивности.На днях Anthropic представили Skills в claude.ai, Claude Code и API.
Skills один из самых мощных способов управлять поведением Claude Code.
Особенно впечатляет, насколько они полезны для оптимизации.
Я сделал внутри Claude Code навык, который автоматически билдит, тестирует и оптимизирует MCP-тулы.
Он работает в цикле: подгружает контекст и инструменты (bash-скрипты), тестирует и оптимизирует MCP-тулы, исходя из лучших практик, реализации и результатов.
Вообще, при желании можно даже запускать MCP-тулы прямо внутри него, но в этом проекте мне это было не нужно.
Одна из самых крутых вещей в связке Claude Code + Skills = это эффективное использование токенов.
Система контекстного тирования реально меняет правила игры по сравнению с сабагентами.
Это как если бы у тебя был топовый инженер по контексту, который отлично понимает окружение и умеет самообучаться, подстраивая контекст и инструменты, чтобы агент (в данном случае Claude Code) стал максимально компетентным в любой задаче, которую ему даёшь.
Впервые у меня ощущение, что Claude Code действительно понимает проблему, код, подтягивает нужный контекст и по полной использует файловую систему.
И вообще, название Skills, реально меткое, когда вдумываешься.💯
Чем больше я с этим играюсь, тем сильнее вижу, как хорошо Skills дополняют MCP и субагентов.
Подробнее про нововведение можно прочитать в инженерном блоге и документации Anthropic.
Skills один из самых мощных способов управлять поведением Claude Code.
Особенно впечатляет, насколько они полезны для оптимизации.
Я сделал внутри Claude Code навык, который автоматически билдит, тестирует и оптимизирует MCP-тулы.
Он работает в цикле: подгружает контекст и инструменты (bash-скрипты), тестирует и оптимизирует MCP-тулы, исходя из лучших практик, реализации и результатов.
Вообще, при желании можно даже запускать MCP-тулы прямо внутри него, но в этом проекте мне это было не нужно.
Одна из самых крутых вещей в связке Claude Code + Skills = это эффективное использование токенов.
Система контекстного тирования реально меняет правила игры по сравнению с сабагентами.
Это как если бы у тебя был топовый инженер по контексту, который отлично понимает окружение и умеет самообучаться, подстраивая контекст и инструменты, чтобы агент (в данном случае Claude Code) стал максимально компетентным в любой задаче, которую ему даёшь.
Впервые у меня ощущение, что Claude Code действительно понимает проблему, код, подтягивает нужный контекст и по полной использует файловую систему.
И вообще, название Skills, реально меткое, когда вдумываешься.
Чем больше я с этим играюсь, тем сильнее вижу, как хорошо Skills дополняют MCP и субагентов.
Подробнее про нововведение можно прочитать в инженерном блоге и документации Anthropic.
Please open Telegram to view this post
VIEW IN TELEGRAM
Новый курс от Google по созданию голосовых агентов на базе ADK и Gemini.
Научись разрабатывать голосовых агентов в реальном времени, которые умеют искать информацию, обращаться к кастомным API и вести естественные диалоги с памятью и встроенными ограничителями поведения.
Полностью бесплатно.
https://www.deeplearning.ai/short-courses/building-live-voice-agents-with-googles-adk/
Научись разрабатывать голосовых агентов в реальном времени, которые умеют искать информацию, обращаться к кастомным API и вести естественные диалоги с памятью и встроенными ограничителями поведения.
Полностью бесплатно.
https://www.deeplearning.ai/short-courses/building-live-voice-agents-with-googles-adk/
This media is not supported in your browser
VIEW IN TELEGRAM
gitmvp теперь может превратить любой репозиторий в готовый MVP.
Не верится, что ушло несколько месяцев, чтобы это довести до релиза.
Media is too big
VIEW IN TELEGRAM
Представили grounding с Google Maps в Gemini API — теперь данные о 250 миллионах мест объединены с возможностями Gemini, открывая путь к совершенно новым сценариям 🗺
Очень круто видеть, как карты и поиск наконец связываются в одном опыте использования, мощная комбинация :)
Подробнее о запуске и демо-приложениях можно прочитать и попробовать в AI Studio.
https://blog.google/technology/developers/grounding-google-maps-gemini-api/
Очень круто видеть, как карты и поиск наконец связываются в одном опыте использования, мощная комбинация :)
Подробнее о запуске и демо-приложениях можно прочитать и попробовать в AI Studio.
https://blog.google/technology/developers/grounding-google-maps-gemini-api/
Please open Telegram to view this post
VIEW IN TELEGRAM
Этот инструмент позволяет «соскрести» любую страницу с документацией и превратить её в skill для Claude, который можно добавить в веб, приложение или Claude Code.
(Кто-то реально должен сделать его в виде хостинга!)
https://github.com/yusufkaraaslan/Skill_Seekers
(Кто-то реально должен сделать его в виде хостинга!)
https://github.com/yusufkaraaslan/Skill_Seekers
50
Гайд по настройке GLM 4.6 в Claude Code (сохрани себе)
1. Установи последнюю версию Claude Code
2. Зарегистрируйся на z.ai
Оформи план для кодинга за $3 в месяц (можно потом апгрейдить).
Если хочешь скидку 10%, используй ссылку: dub.sh/glm10off
3. Создай API-ключ
Перейди по ссылке https://z.ai/manage-apikey/apikey-list создай ключ и скопируй его куда-нибудь в текстовый файл.
4. Отредактируй ~/.claude/settings.json
Вставь туда следующее (не забудь подставить свой API-ключ):
5. Переключение между Claude и GLM
Можно попробовать этот скрипт
6. Запускай Claude Code и наслаждайся
1. Установи последнюю версию Claude Code
npm install -g @anthropic-ai/claude-code
2. Зарегистрируйся на z.ai
Оформи план для кодинга за $3 в месяц (можно потом апгрейдить).
Если хочешь скидку 10%, используй ссылку: dub.sh/glm10off
3. Создай API-ключ
Перейди по ссылке https://z.ai/manage-apikey/apikey-list создай ключ и скопируй его куда-нибудь в текстовый файл.
4. Отредактируй ~/.claude/settings.json
Вставь туда следующее (не забудь подставить свой API-ключ):
{
"env": {
"ANTHROPIC_AUTH_TOKEN": "your_zai_api_key",
"ANTHROPIC_BASE_URL": "https://api.z.ai/api/anthropic",
"API_TIMEOUT_MS": "3000000",
"ANTHROPIC_DEFAULT_HAIKU_MODEL": "glm-4.5-air",
"ANTHROPIC_DEFAULT_SONNET_MODEL": "glm-4.6",
"ANTHROPIC_DEFAULT_OPUS_MODEL": "glm-4.6"
}
}5. Переключение между Claude и GLM
Можно попробовать этот скрипт
6. Запускай Claude Code и наслаждайся
Media is too big
VIEW IN TELEGRAM
Один энтузиаст собрал агента для анализа M&A-файлов (DEF 14A), объединив Claude Code Skills и мощный парсинг PDF.
Агент проходит по папке с документами, вытягивает нужные данные и формирует Excel-таблицу с условиями сделок и сопоставимыми примерами.
Вместо стандартного pypdf, который не справляется с финансовыми таблицами, используется LlamaIndex semtools с LlamaCloud — она умеет разбирать даже сложные таблицы, графики и структурированные отчёты.
Claude напрямую пишет Excel-файлы, так что всё работает в одном промпте. Настройка LlamaCloud + Semtools занимает меньше 5 минут.
Есть мелкие баги с форматированием (часть значений отображается как проценты), но уже готовится улучшенная версия с нативными интеграциями.
Semtools: https://github.com/run-llama/semtools
LlamaCloud: https://github.com/run-llama/semtools
Агент проходит по папке с документами, вытягивает нужные данные и формирует Excel-таблицу с условиями сделок и сопоставимыми примерами.
Вместо стандартного pypdf, который не справляется с финансовыми таблицами, используется LlamaIndex semtools с LlamaCloud — она умеет разбирать даже сложные таблицы, графики и структурированные отчёты.
Claude напрямую пишет Excel-файлы, так что всё работает в одном промпте. Настройка LlamaCloud + Semtools занимает меньше 5 минут.
Есть мелкие баги с форматированием (часть значений отображается как проценты), но уже готовится улучшенная версия с нативными интеграциями.
Semtools: https://github.com/run-llama/semtools
LlamaCloud: https://github.com/run-llama/semtools
1
Если хочешь реально понять, как работает MCP , попробуй запустить в терминале:
Это своего рода дашборд, где ты можешь «побыть LLM-ом» и посмотреть, как всё устроено изнутри. Сервер заточен под Google Chrome — если нажмёшь и запустишь инструменты, браузер реально отреагирует, а ты увидишь, что именно вернётся модели. Очень наглядно и круто помогает понять механику MCP.
Например, я хотел узнать, зачем вообще нужны prompts. Оказалось, что для Chrome DevTools MCP Server их просто нет.✏️
npx -y @modelcontextprotocol/inspector npx chrome-devtools-mcp@latest
Это своего рода дашборд, где ты можешь «побыть LLM-ом» и посмотреть, как всё устроено изнутри. Сервер заточен под Google Chrome — если нажмёшь и запустишь инструменты, браузер реально отреагирует, а ты увидишь, что именно вернётся модели. Очень наглядно и круто помогает понять механику MCP.
Например, я хотел узнать, зачем вообще нужны prompts. Оказалось, что для Chrome DevTools MCP Server их просто нет.
Please open Telegram to view this post
VIEW IN TELEGRAM
1