https://wonderwhy-er.medium.com/claude-with-mcps-replaced-cursor-windsurf-how-did-that-happen-c1d1e2795e96
Интересный подход и деньги экономит
Интересный подход и деньги экономит
Medium
Claude with MCPs Replaced Cursor & Windsurf — How Did That Happen?
You can see in the screenshot that I was using Windsurf in December. But by January and February? It was gone from my workflow. So what…
https://x.com/openaidevs/status/1904957755829481737?s=46&t=o-gNuwBmunp1vKR4u9v13w
MCP 🤝 OpenAI Agents SDK
Ура
MCP 🤝 OpenAI Agents SDK
Ура
🔥1
Forwarded from Data Secrets
Вы не поверите, но GPT-4o теперь лучшая модель для кодинга
OpenAI только что обновили чекпоинт модели, и результаты на арене по сравнению с прошлой версией скакнули вот так:
- Math 14 место -> 2 место
- Hard Prompts 7 место -> 1 место
- Coding 5 место -> 1 место
- В целом 5 место -> 2 место
Сами разработчики пишут, что теперь моделька лучше следует инструкциям и воспринимает сложные промпты, лучше креативит и использует меньше эмодзи (ура)
На всех платных новый чекпоинт уже раскатили. Фри юзерам будет доступно в течение нескольких недель.
OpenAI только что обновили чекпоинт модели, и результаты на арене по сравнению с прошлой версией скакнули вот так:
- Math 14 место -> 2 место
- Hard Prompts 7 место -> 1 место
- Coding 5 место -> 1 место
- В целом 5 место -> 2 место
Сами разработчики пишут, что теперь моделька лучше следует инструкциям и воспринимает сложные промпты, лучше креативит и использует меньше эмодзи (ура)
На всех платных новый чекпоинт уже раскатили. Фри юзерам будет доступно в течение нескольких недель.
👍4👀1
На https://aider.chat/docs/leaderboards/ еще не бенчили. Но посмотрите кто на первом месте и с какими отрывом
👍1
И вот еще https://github.com/camel-ai/owl
🌟 Advanced AI Features for Your Needs 🌟
🚀 Online Search
Support for multiple search engines like Wikipedia, Google, DuckDuckGo, Baidu, and more for real-time information retrieval.
🎥 Multimodal Processing
Handle videos, images, and audio data seamlessly for enhanced understanding.
🌐 Browser Automation
Automate web interactions using Playwright: scrolling, clicking, navigation, downloading, and more.
📄 Document Parsing
Extract content from Word, Excel, PDF, and PowerPoint files into text or Markdown formats.
💻 Code Execution
Write and execute Python noscripts directly with integrated interpreter support.
🛠️ Built-in Toolkits
Access specialized tools like:
• ArxivToolkit for academic research
• ImageAnalysisToolkit for visual data
• MathToolkit for complex calculations
• VideoAnalysisToolkit, WeatherToolkit, and many more!
📖 Model Context Protocol (MCP)
A universal layer to standardize AI model interaction across tools and data sources.
🌟 Advanced AI Features for Your Needs 🌟
🚀 Online Search
Support for multiple search engines like Wikipedia, Google, DuckDuckGo, Baidu, and more for real-time information retrieval.
🎥 Multimodal Processing
Handle videos, images, and audio data seamlessly for enhanced understanding.
🌐 Browser Automation
Automate web interactions using Playwright: scrolling, clicking, navigation, downloading, and more.
📄 Document Parsing
Extract content from Word, Excel, PDF, and PowerPoint files into text or Markdown formats.
💻 Code Execution
Write and execute Python noscripts directly with integrated interpreter support.
🛠️ Built-in Toolkits
Access specialized tools like:
• ArxivToolkit for academic research
• ImageAnalysisToolkit for visual data
• MathToolkit for complex calculations
• VideoAnalysisToolkit, WeatherToolkit, and many more!
📖 Model Context Protocol (MCP)
A universal layer to standardize AI model interaction across tools and data sources.
GitHub
GitHub - camel-ai/owl: 🦉 OWL: Optimized Workforce Learning for General Multi-Agent Assistance in Real-World Task Automation
🦉 OWL: Optimized Workforce Learning for General Multi-Agent Assistance in Real-World Task Automation - camel-ai/owl
Forwarded from Machinelearning
Тщательно отобранный список (Awesome List) с MCP серверами (Model Control Plane Servers).
MCP серверы являются микросервисами, которые могут быть использованы LLM для выполнения вашей задачи.
По сути это мост между LLM и внешним миром: сайтами, базами данных, файлами и сервисами и тд.
Коллекция из 300+ MCP-серверов для ИИ-агентов 100% oпенсорс.!
Здесь можно найти платины на все случаи жизни:
•Автоматизация Браузера
• Облачные Платформы
• Командная Строка
• Коммуникации
• Базы данных
• Инструменты Разработчика
• Файловые Системы
• Финансы
• Игры
• Службы определения местоположения
• Маркетинг
• Мониторинг
• Поиск
• Спорт
• Путешествия И Транспорт
• Другие инструменты и интеграций
@ai_machinelearning_big_data
#mcp #ai #agents #awesome
Please open Telegram to view this post
VIEW IN TELEGRAM
Захотел я в Cursor начать использовать Gemini 2.5 Pro и не вышло. В новых версиях нет поддержки custom models
НО на помощь пришел VS Code Insiders. Тут завезли поддержку custom models причем без хаков. Нажимаете на модель агента -> Manage Models -> Gemini -> вставляете ключ и выбираете доступные модели для ключа. Вуаля у вас в агентах Gemini 2.5 Pro
НО на помощь пришел VS Code Insiders. Тут завезли поддержку custom models причем без хаков. Нажимаете на модель агента -> Manage Models -> Gemini -> вставляете ключ и выбираете доступные модели для ключа. Вуаля у вас в агентах Gemini 2.5 Pro
Forwarded from Pavel Zloi
⚡️ OpenAI сегодня ВЕЧЕРОМ представит GPT-5 — новая модель уже прошла внутреннее тестирование и готова к релизу.
Главные изменения:
• Мультимодальность — GPT-5 сможет обрабатывать видео, аудио и изображения в реальном времени.
• Автономные действия — ИИ сможет выполнять задачи в интернете без запросов пользователя (платежи, бронирования и т. д.).
• Ограничения — некоторые функции будут доступны только по подписке Pro Max.
Что еще известно:
• Первыми доступ получат корпоративные клиенты и разработчики.
• Бесплатная версия останется, но с урезанными возможностями.
⚡️ Подробности — сегодня в 20:00 по МСК.
PS. Поздравляю с 1м апреля!
Главные изменения:
• Мультимодальность — GPT-5 сможет обрабатывать видео, аудио и изображения в реальном времени.
• Автономные действия — ИИ сможет выполнять задачи в интернете без запросов пользователя (платежи, бронирования и т. д.).
• Ограничения — некоторые функции будут доступны только по подписке Pro Max.
Что еще известно:
• Первыми доступ получат корпоративные клиенты и разработчики.
• Бесплатная версия останется, но с урезанными возможностями.
⚡️ Подробности — сегодня в 20:00 по МСК.
👍2👀1
Вышел Cursor с multi-tab режимом. Когда можно в нескольких табах запускать агентов и работать над проектом/проектами в несколько потоков и только успевай, НО это релиз еще прекрасен тем, что наконец-то появились custom modes где можно легко настроить что запускать автоматически, а что нет и что на какой сетке делать. Другой мир.
https://www.cursor.com/changelog
https://www.cursor.com/changelog
🔥1
AI Coder
Захотел я в Cursor начать использовать Gemini 2.5 Pro и не вышло. В новых версиях нет поддержки custom models НО на помощь пришел VS Code Insiders. Тут завезли поддержку custom models причем без хаков. Нажимаете на модель агента -> Manage Models -> Gemini…
И да, продолжая тему Gemini 2.5 Pro - пока это очень хорошая модель, по некоторым бенчам SOTA, НО она не агентная и нормально работать как агент пишущий прекрасный код и помогающий вам она не может. Она выдает по промпту хорошие решения. Ждем обновлений, потенциал хороший
Forwarded from e/acc
Легендарный Скотт Александер и пацаны из OpenAI написали что там будет с этой вашей ИИшкой в 2027.
Если кратко: цифровой сверхинтеллект неизбежен начиная с 2027.
В первую очередь он начнет улучшать другие ИИ системы, которые будут решать все остальные проблемы на планете. Эти штуки будут мега-полезны, поэтому люди начнут их внедрять везде, но они так же будут сложны для анализа. Если у кого-то получится контролировать ASI, то он получит тотальный контроль над человечеством.
Основной фактор — геополитика, в которой реалистично шансы есть только у двух игроков — Китая и США. Из-за конкуренции они начнут топить еще сильнее, что может привести к забиванию болта на безопасность, а значит по мере развития ASI начнет контролировать людей, а не наоборот.
В эссе много очень точных описаний того как технологии развиваются и внедряются. Приведу только краткий таймлайн, но читать обязательно всем и полностью. Смысл не в прогнозах, а в логике.
- Agent-1 — ИИ-ассистент для R&D, ускоряет прогресс в 1.5 раза (янв 2026).
- Agent-1-mini — Упрощённая и дешевая версия для массового рынка (окт 2026).
- Agent-2 — Самообучающийся ИИ, с 3x ускорением прогресса и возможностью автономной репликации (янв 2027).
- Agent-3 — Суперпрограммист, масштабируемый в сотни тысяч копий (март 2027).
- Agent-3-mini — Публичная версия, заменяет офисную работу, потенциально опасен (июль 2027).
- Agent-4 — Сверхразумный исследователь, действует скрытно против интересов людей (сент 2027).
- Agent-5 — Полностью рациональный ИИ, манипулирует системой, проектирует себе преемника (нояб 2027).
дальше два варианта, либо:
- Consensus-1 — “Мирный” ИИ от США и Китая, устраняет человечество и расширяется в космос (дек 2029).
либо:
- Safer-1 — Прозрачный, но слабее Agent-4 ИИ, с читаемыми мыслями и ограниченной способностью к обману (дек 2027).
- Safer-2 — Более мощная и действительно выровненная версия, обученная по новой методике (янв 2028).
- Safer-3 — Суперэксперт и советник, ускоряет прогресс в 200 раз, способен на опасные действия, но под контролем (фев 2028).
- Safer-4 — Первый суперинтеллект, превосходит людей во всех сферах, ведёт переговоры с DeepCent-2 (апр 2028).
- Consensus-1 — Договорной ИИ США и Китая, создаётся для соблюдения тайного соглашения между Safer-4 и DeepCent-2 (июль 2028).
- Safer-∞ — Продолжение Safer-линии, формирует цивилизационные цели и ведёт человечество в постчеловеческую эпоху (2029–2030).
Если кратко: цифровой сверхинтеллект неизбежен начиная с 2027.
В первую очередь он начнет улучшать другие ИИ системы, которые будут решать все остальные проблемы на планете. Эти штуки будут мега-полезны, поэтому люди начнут их внедрять везде, но они так же будут сложны для анализа. Если у кого-то получится контролировать ASI, то он получит тотальный контроль над человечеством.
Основной фактор — геополитика, в которой реалистично шансы есть только у двух игроков — Китая и США. Из-за конкуренции они начнут топить еще сильнее, что может привести к забиванию болта на безопасность, а значит по мере развития ASI начнет контролировать людей, а не наоборот.
В эссе много очень точных описаний того как технологии развиваются и внедряются. Приведу только краткий таймлайн, но читать обязательно всем и полностью. Смысл не в прогнозах, а в логике.
- Agent-1 — ИИ-ассистент для R&D, ускоряет прогресс в 1.5 раза (янв 2026).
- Agent-1-mini — Упрощённая и дешевая версия для массового рынка (окт 2026).
- Agent-2 — Самообучающийся ИИ, с 3x ускорением прогресса и возможностью автономной репликации (янв 2027).
- Agent-3 — Суперпрограммист, масштабируемый в сотни тысяч копий (март 2027).
- Agent-3-mini — Публичная версия, заменяет офисную работу, потенциально опасен (июль 2027).
- Agent-4 — Сверхразумный исследователь, действует скрытно против интересов людей (сент 2027).
- Agent-5 — Полностью рациональный ИИ, манипулирует системой, проектирует себе преемника (нояб 2027).
дальше два варианта, либо:
- Consensus-1 — “Мирный” ИИ от США и Китая, устраняет человечество и расширяется в космос (дек 2029).
либо:
- Safer-1 — Прозрачный, но слабее Agent-4 ИИ, с читаемыми мыслями и ограниченной способностью к обману (дек 2027).
- Safer-2 — Более мощная и действительно выровненная версия, обученная по новой методике (янв 2028).
- Safer-3 — Суперэксперт и советник, ускоряет прогресс в 200 раз, способен на опасные действия, но под контролем (фев 2028).
- Safer-4 — Первый суперинтеллект, превосходит людей во всех сферах, ведёт переговоры с DeepCent-2 (апр 2028).
- Consensus-1 — Договорной ИИ США и Китая, создаётся для соблюдения тайного соглашения между Safer-4 и DeepCent-2 (июль 2028).
- Safer-∞ — Продолжение Safer-линии, формирует цивилизационные цели и ведёт человечество в постчеловеческую эпоху (2029–2030).
👍1
Forwarded from Data Secrets
Media is too big
VIEW IN TELEGRAM
Вышел Devin 2.0 – конкурент Cursor.
О первой версии мы писали вот тут, она была довольно популярна. Что интересного в обновлении:
➖ Можно запускать несколько агентов одновременно. Они будут работать параллельно над разными задачами, но каждого можно контролировать.
➖ К среде агента подключили локальный браузер, так что теперь можно полноценно тестировать продукты не отходя от кассы (и ИИ).
➖ Перед тем, как что-то делать, агент покажет вам план и предложит его подкорректировать. Он также может помочь уточнить сырые требования и вместе с вами докрутить тз.
➖ Есть специальные режимы Search и Deep Mode для поиска и ответов на вопросы по кодовой базе
➖ Ко всему, что делает, Devin сразу создает подробную документацию со схемами и ссылками на источники, чтобы пользователь не терял понимание происходящего
Стоит 20$. Попробовать можно здесь
О первой версии мы писали вот тут, она была довольно популярна. Что интересного в обновлении:
Стоит 20$. Попробовать можно здесь
Please open Telegram to view this post
VIEW IN TELEGRAM
Следующая агентная система для разработки на тест подъехала: https://aws.amazon.com/ru/q/developer/