AI Coder – Telegram
AI Coder
291 subscribers
82 photos
10 videos
2 files
186 links
AI will not replace you, people who use AI will.
Download Telegram
Ребзя, го тестить
Forwarded from Data Secrets
Вы не поверите, но GPT-4o теперь лучшая модель для кодинга

OpenAI только что обновили чекпоинт модели, и результаты на арене по сравнению с прошлой версией скакнули вот так:

- Math 14 место -> 2 место
- Hard Prompts 7 место -> 1 место
- Coding 5 место -> 1 место
- В целом 5 место -> 2 место

Сами разработчики пишут, что теперь моделька лучше следует инструкциям и воспринимает сложные промпты, лучше креативит и использует меньше эмодзи (ура)

На всех платных новый чекпоинт уже раскатили. Фри юзерам будет доступно в течение нескольких недель.
👍4👀1
На https://aider.chat/docs/leaderboards/ еще не бенчили. Но посмотрите кто на первом месте и с какими отрывом
👍1
И вот еще https://github.com/camel-ai/owl

🌟 Advanced AI Features for Your Needs 🌟
🚀 Online Search
Support for multiple search engines like Wikipedia, Google, DuckDuckGo, Baidu, and more for real-time information retrieval.
🎥 Multimodal Processing
Handle videos, images, and audio data seamlessly for enhanced understanding.
🌐 Browser Automation
Automate web interactions using Playwright: scrolling, clicking, navigation, downloading, and more.
📄 Document Parsing
Extract content from Word, Excel, PDF, and PowerPoint files into text or Markdown formats.
💻 Code Execution
Write and execute Python noscripts directly with integrated interpreter support.
🛠️ Built-in Toolkits
Access specialized tools like:
• ArxivToolkit for academic research
• ImageAnalysisToolkit for visual data
• MathToolkit for complex calculations
• VideoAnalysisToolkit, WeatherToolkit, and many more!
📖 Model Context Protocol (MCP)
A universal layer to standardize AI model interaction across tools and data sources.
Forwarded from Machinelearning
🔥 Awesome MCP Servers

Тщательно отобранный список (Awesome List) с MCP серверами (Model Control Plane Servers).

✔️ Что такое MCP серверы?
MCP серверы являются микросервисами, которые могут быть использованы LLM для выполнения вашей задачи.
По сути это мост между LLM и внешним миром: сайтами, базами данных, файлами и сервисами и тд.

Коллекция из 300+ MCP-серверов для ИИ-агентов 100% oпенсорс.!

Здесь можно найти платины на все случаи жизни:

Автоматизация Браузера
Облачные Платформы
Командная Строка
Коммуникации
Базы данных
Инструменты Разработчика
Файловые Системы
Финансы
Игры
Службы определения местоположения
Маркетинг
Мониторинг
Поиск
Спорт
Путешествия И Транспорт
Другие инструменты и интеграций

🟡Github

@ai_machinelearning_big_data


#mcp #ai #agents #awesome
Please open Telegram to view this post
VIEW IN TELEGRAM
Захотел я в Cursor начать использовать Gemini 2.5 Pro и не вышло. В новых версиях нет поддержки custom models

НО на помощь пришел VS Code Insiders. Тут завезли поддержку custom models причем без хаков. Нажимаете на модель агента -> Manage Models -> Gemini -> вставляете ключ и выбираете доступные модели для ключа. Вуаля у вас в агентах Gemini 2.5 Pro
Forwarded from Pavel Zloi
⚡️ OpenAI сегодня ВЕЧЕРОМ представит GPT-5 — новая модель уже прошла внутреннее тестирование и готова к релизу.

Главные изменения:

Мультимодальность — GPT-5 сможет обрабатывать видео, аудио и изображения в реальном времени.
Автономные действия — ИИ сможет выполнять задачи в интернете без запросов пользователя (платежи, бронирования и т. д.).
Ограничения — некоторые функции будут доступны только по подписке Pro Max.

Что еще известно:
• Первыми доступ получат корпоративные клиенты и разработчики.
• Бесплатная версия останется, но с урезанными возможностями.

⚡️ Подробности — сегодня в 20:00 по МСК.

PS. Поздравляю с 1м апреля!
👍2👀1
Вышел Cursor с multi-tab режимом. Когда можно в нескольких табах запускать агентов и работать над проектом/проектами в несколько потоков и только успевай, НО это релиз еще прекрасен тем, что наконец-то появились custom modes где можно легко настроить что запускать автоматически, а что нет и что на какой сетке делать. Другой мир.

https://www.cursor.com/changelog
🔥1
AI Coder
Захотел я в Cursor начать использовать Gemini 2.5 Pro и не вышло. В новых версиях нет поддержки custom models НО на помощь пришел VS Code Insiders. Тут завезли поддержку custom models причем без хаков. Нажимаете на модель агента -> Manage Models -> Gemini…
И да, продолжая тему Gemini 2.5 Pro - пока это очень хорошая модель, по некоторым бенчам SOTA, НО она не агентная и нормально работать как агент пишущий прекрасный код и помогающий вам она не может. Она выдает по промпту хорошие решения. Ждем обновлений, потенциал хороший
Очень интересный прогноз от OpenAI и комменты от Степы Гершуни
👍1
Forwarded from e/acc
Легендарный Скотт Александер и пацаны из OpenAI написали что там будет с этой вашей ИИшкой в 2027.

Если кратко: цифровой сверхинтеллект неизбежен начиная с 2027.

В первую очередь он начнет улучшать другие ИИ системы, которые будут решать все остальные проблемы на планете. Эти штуки будут мега-полезны, поэтому люди начнут их внедрять везде, но они так же будут сложны для анализа. Если у кого-то получится контролировать ASI, то он получит тотальный контроль над человечеством.

Основной фактор — геополитика, в которой реалистично шансы есть только у двух игроков — Китая и США. Из-за конкуренции они начнут топить еще сильнее, что может привести к забиванию болта на безопасность, а значит по мере развития ASI начнет контролировать людей, а не наоборот.

В эссе много очень точных описаний того как технологии развиваются и внедряются. Приведу только краткий таймлайн, но читать обязательно всем и полностью. Смысл не в прогнозах, а в логике.

- Agent-1 — ИИ-ассистент для R&D, ускоряет прогресс в 1.5 раза (янв 2026).
- Agent-1-mini — Упрощённая и дешевая версия для массового рынка (окт 2026).
- Agent-2 — Самообучающийся ИИ, с 3x ускорением прогресса и возможностью автономной репликации (янв 2027).
- Agent-3 — Суперпрограммист, масштабируемый в сотни тысяч копий (март 2027).
- Agent-3-mini — Публичная версия, заменяет офисную работу, потенциально опасен (июль 2027).
- Agent-4 — Сверхразумный исследователь, действует скрытно против интересов людей (сент 2027).
- Agent-5 — Полностью рациональный ИИ, манипулирует системой, проектирует себе преемника (нояб 2027).

дальше два варианта, либо:

- Consensus-1 — “Мирный” ИИ от США и Китая, устраняет человечество и расширяется в космос (дек 2029).

либо:

- Safer-1 — Прозрачный, но слабее Agent-4 ИИ, с читаемыми мыслями и ограниченной способностью к обману (дек 2027).
- Safer-2 — Более мощная и действительно выровненная версия, обученная по новой методике (янв 2028).
- Safer-3 — Суперэксперт и советник, ускоряет прогресс в 200 раз, способен на опасные действия, но под контролем (фев 2028).
- Safer-4 — Первый суперинтеллект, превосходит людей во всех сферах, ведёт переговоры с DeepCent-2 (апр 2028).
- Consensus-1 — Договорной ИИ США и Китая, создаётся для соблюдения тайного соглашения между Safer-4 и DeepCent-2 (июль 2028).
- Safer-∞ — Продолжение Safer-линии, формирует цивилизационные цели и ведёт человечество в постчеловеческую эпоху (2029–2030).
👍1
Обратите внимание что в Cursor появляется Deep Research
Forwarded from Data Secrets
Media is too big
VIEW IN TELEGRAM
Вышел Devin 2.0 – конкурент Cursor.

О первой версии мы писали вот тут, она была довольно популярна. Что интересного в обновлении:

Можно запускать несколько агентов одновременно. Они будут работать параллельно над разными задачами, но каждого можно контролировать.

К среде агента подключили локальный браузер, так что теперь можно полноценно тестировать продукты не отходя от кассы (и ИИ).

Перед тем, как что-то делать, агент покажет вам план и предложит его подкорректировать. Он также может помочь уточнить сырые требования и вместе с вами докрутить тз.

Есть специальные режимы Search и Deep Mode для поиска и ответов на вопросы по кодовой базе

Ко всему, что делает, Devin сразу создает подробную документацию со схемами и ссылками на источники, чтобы пользователь не терял понимание происходящего

Стоит 20$. Попробовать можно здесь
Please open Telegram to view this post
VIEW IN TELEGRAM
Devin 2.0 пока не зашел с их супер агентным подходом
Следующая агентная система для разработки на тест подъехала: https://aws.amazon.com/ru/q/developer/
Надо в Cursor и VS code погонять будет