Еще недавно не существовало четкой дорожной карты для создания AI-агента. В новом документе Google, на 64 страницах, охватывает весь путь от концепции до внедрения в продакшн, делая акцент на том, что важна не только идея, но и практика. Но чем же он отличается от всего, что было до этого?
📌 Почему AI-агенты — это не чат-боты
Одно из главных отличий, о котором говорит гайд, — это то, что AI-агенты — это не просто чат-боты, а полноценная парадигма. Мы не просто даем команду и получаем ответ. Агент, в отличие от бота, может планировать, принимать решения, привлекать различные источники данных и инструменты для решения комплексных задач. Это что-то гораздо более амбициозное. Например, агент может самостоятельно организовать запуск продукта или решить проблему в цепочке поставок.
Это, на мой взгляд, действительно переломный момент. Я сам, когда впервые создал простейшего агента, который выполняет сложные задачи без постоянного контроля, почувствовал, что это совсем не тот же чат-бот. Это совершенно новый класс решений, и Google, похоже, задает стандарты для всех нас.🕯 ЛЛМ не достаточно — нужно строить инфраструктуру
Google прямо заявляет: даже самая мощная языковая модель не сделает агента работоспособным без грамотной инфраструктуры. Для того чтобы агент стал чем-то большим, чем просто демонстрацией возможностей LLM, нужна четкая архитектура, интеграция данных и скалируемые инструменты. И гайд подробно расписывает, что нужно для этого — от памяти и оркестрации до логики работы с внешними источниками.
Именно такие моменты зачастую игнорируются. Вначале создается нечто вроде скрипта с GPT-4 и API, а потом агент не выдерживает нагрузок и просто падает. Google предлагает решение: использовать готовую инфраструктуру, которая упрощает создание стабильного и работоспособного агента. Это каркас, который снимает часть головной боли и позволяет сосредоточиться на более важных аспектах.⚠️ Погружение в реальность: от фантазий к фактам
Еще один важный момент — это Grounding. Как избежать «галлюцинаций» модели? Google предлагает привязать агента к достоверным источникам данных через методы, такие как Retrieval-Augmented Generation (RAG), что значительно повышает точность ответов. Агент становится не просто генератором текста, а исследователем, который проверяет свои данные.
Часто агенты, не подключенные к реальным источникам данных, могут выдавать совершенно некорректные ответы. Здесь, например, Google использует возможность интеграции с поисковыми системами, чтобы агент сам решал, когда и как использовать данные.⛔️ Безопасность и этика — обязательные требования
Особое внимание уделяется безопасности. В процессе разработки AI-агентов важнейшим фактором является защита данных и этическое поведение. На этом этапе уже невозможно пускать все на самотек. Для таких проектов нужны системные проверки, ограничения и мониторинг на каждом шаге. У Google в этом плане четкий подход: безопасность должна быть встроена в процесс с самого начала.
Прочитав этот гайд, я понял, что Google действительно задает новый стандарт в области создания AI-агентов. Это не просто документация, а руководство по построению надежных, безопасных и масштабируемых систем. Дисциплинированный подход, который пропагандирует Google, станет основой разработки таких технологий.
Data Science
Please open Telegram to view this post
VIEW IN TELEGRAM
❤5👍3🔥2
Российские генеративные модели Kandinsky 5.0 Video Lite и Pro в международной text-to-video арене
🔘 Pro версия является ТОП-1 опенсорсом в мире
🔘 Lite версия (2B параметров) лучше первой версии Sora
🔘 На данный момент Сбер уступает только топовым мировым бигтех компаниям: Google (Veo 3.1, Veo 3), OpenAI (Sora 2), Alibaba (Wan 2.5), KlingAI (Kling 2.5, 2.6); в паритете с Luma AI (Ray 3), MiniMax (Hailuo 2.3) — отрыв по ELO максимум 3 балла, при 95% доверительном интервале оценивания +-21 балла
🔘 Для российских генеративных моделей выход на международную арену — уникальное событие
🚀 Полезные ссылки:
🔘 Посмотреть весь лидерборд: lmarena
🔘 Почитать подробнее про Kandinsky 5.0: пост, техрепорт
🔘 Open Source Kandinsky 5.0: github и hf
🚀 Полезные ссылки:
Please open Telegram to view this post
VIEW IN TELEGRAM
👍11🔥3❤2
ИИ стремительно развивается. Но несмотря на все достижения, есть одно «но», которое не даёт индустрии двигаться вперёд так стремительно, как хотелось бы. Мы не можем забывать о физических ограничениях. Например, если заглянуть в будущее, мы видим, что текущий подход к вычислениям в ИИ, ориентированный на увеличение объема моделей (экстенсивный рост), сталкивается с неизбежными барьерами, такими как высокие затраты на энергию и охлаждение. Подобные ограничения буквально сводят на нет многие амбиции, особенно на уровне железа.
📌 Тем не менее, есть ли альтернативы, которые могут радикально изменить картину? Ответ, возможно, в фотонике.
Мы все привыкли к идее «бесконечного» роста вычислительных мощностей, но с 2006 года закон Мура не работает, как раньше. Транзисторы почти достигли своих физических пределов, а производительность процессоров больше не зависит от тактовой частоты. Все больше мы видим отказ от принципа моноядерных процессоров в пользу многоядерных решений, но тут тоже есть проблемы. Многозадачность и многопоточность, несмотря на свою популярность, не всегда приносят реальный выигрыш.
Задумайтесь на секунду: это ли не прямой путь к масштабированию проблем, а не их решению? Как бы мы ни пытались улучшить старую архитектуру, её физические ограничения — перегрев, высокое энергопотребление и медленный доступ к памяти — всё равно остаются.💬 Фотоника: революционный шаг вперёд
Вот тут и появляется возможность для изменения парадигмы — фотоника. Это технология, основанная на использовании света для передачи данных. В отличие от традиционных электроники, фотоника позволяет значительно ускорить вычисления благодаря скорости распространения света и моментальному изменению состояний.🕯 Фотонные устройства обладают множеством преимуществ: они не перегреваются, потребляют гораздо меньше энергии и могут работать с гигантскими объёмами данных. Но есть и сложности — например, трудность хранения данных. В фотонных системах оперативная память почти не используется, а данные обрабатываются по принципу параллельных вычислений с разными длинами волн.
Но эти ограничения могут стать преимуществами в специфических задачах — например, в инференсе ИИ, где важна высокая пропускная способность и минимальное энергопотребление. И тут фотоника может стать настоящей находкой, особенно если говорить о масштабных проектах, таких как вычислительные фабрики.
Итак, несмотря на очевидные трудности, фотоника представляет собой реальный шанс для решения множества вычислительных задач. Однако чтобы эта технология стала мейнстримом, нужно больше исследований и интеграции с существующими системами.
Data Science
Please open Telegram to view this post
VIEW IN TELEGRAM
❤5👀4🔥1
⚡️ Доступ к папке «AI & TECH & IT» открыт на 24 часа!
Вся полезная информация о заработке на ИИ и технологиях в одном месте:
✦ Живи и работай в мире, где правят технологии.
✦ Автоматизируй заявки с помощью ИИ-менеджеров.
✦ Используй промпты-убийцы, которые можно продавать дорого.
Подписывайтесь и прокачивайте свои навыки прямо сейчас с помощью папки «AI & TECH & IT»!
ПОДПИСАТЬСЯ
Вся полезная информация о заработке на ИИ и технологиях в одном месте:
✦ Живи и работай в мире, где правят технологии.
✦ Автоматизируй заявки с помощью ИИ-менеджеров.
✦ Используй промпты-убийцы, которые можно продавать дорого.
Подписывайтесь и прокачивайте свои навыки прямо сейчас с помощью папки «AI & TECH & IT»!
ПОДПИСАТЬСЯ
❤2👍2🔥2
Forwarded from xCode Journal
Срочно запоминаем определения микросервисной архитектуры и функций HR BP.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
😁16❤2🔥2👍1🐳1