这些自主、目标驱动的系统以协调的多智能体生态系统形式部署,充当企业的“MAESTRO”,它们不仅遵循指令,还能实时跨云边界观察、规划和执行任务,有效将供应商泛滥从复杂性问题转化为战略资产。
跨云智能体互操作架构
多云环境中的核心挑战不在于平台本身,而在于运行在平台上的自动化层之间缺乏无缝互操作性。MAESTRO架构(参考云安全联盟的MAESTRO自主式AI威胁建模框架,MAESTRO代表多智能体环境、安全、威胁、风险和结果)通过标准化这些自主智能体的语言和部署方式来解决这一问题:
1. 开放标准桥梁:A2A协议
智能体要实现有效协调——例如让一个云上的财务运营(FinOps)智能体与另一个云上的AI运维(AIOps)智能体就计算资源进行谈判——它们必须使用一种通用的、与供应商无关的语言。这正是新兴的智能体到智能体(Agent2Agent,A2A)协议发挥关键作用的地方。
A2A协议是一种开放、通用的标准,使智能体无论供应商或底层模型如何,都能发现、通信和协作。它为以下方面提供了技术基础:
• 动态能力发现:智能体可以发布其身份和技能,使其他智能体无需硬编码集成即可发现并连接。
• 上下文共享:安全地交换上下文、意图和状态,支持长时间运行、多步骤的工作流程,如跨云工作负载迁移或协调威胁响应。
要充分领略Maestro架构的强大能力,可考虑一个关键的跨云工作流程:战略性容量套利和故障转移。通用云上的FinOps智能体持续监控AI推理工作负载的服务水平目标(SLOs)和每次推理的成本。当同一云上的AIOps智能体检测到突发区域性故障时,AIOps智能体会使用A2A协议广播一个高优先级的“容量采购”意图。Maestro会协调立即响应,使FinOps智能体能够自动与专业的新兴云智能体谈判并配置所需的GPU容量。同时,安全智能体确保新数据管道符合所需的数据主权规则,然后工作负载迁移智能体无缝地将便携式Kubernetes容器迁移到新的可用容量上,整个过程在一分钟内完成,以维持模型持续性能。没有A2A协议提供的标准化语言和互操作性以及Kubernetes原生部署基础,这种复杂、实时的协调是不可能实现的。
2. 部署基础:Kubernetes原生框架
为确保智能体能在不同云上一致地部署、扩展和管理,我们必须采用Kubernetes原生方法,Kubernetes已成为企业云原生应用程序的事实编排层,新的Kubernetes原生智能体框架,如kagent,正在兴起,直接将这种能力扩展到多智能体系统。
这种方法使Maestro能够:
• 零停机智能体可移植性:将智能体打包为标准容器,可轻松将高价值安全智能体从一个云迁移到另一个云,以增强弹性或进行成本套利。
• 可观测性和可审计性:利用Kubernetes内置的监控、日志记录和安全工具,深入了解智能体的行为和决策过程,这是自主系统不可或缺的要求。
战略价值:弹性和零锁定
Maestro架构从根本上改变了多云策略的经济性和风险状况。
• 减少供应商锁定:通过实施A2A等开放标准,企业保留对其核心AI逻辑和数据模型的控制权。Maestro的FinOps智能体现在能够在包括专业提供商在内的更多样化的计算环境中进行动态成本和性能套利。新兴云专为AI打造,提供GPU即服务(GPUaaS)以及在训练和推理方面的独特性能优势。通过将AI工作负载打包为便携式Kubernetes容器,Maestro可以无缝地将它们迁移到性能最佳或成本效益最高的平台——无论是用于受监管工作负载的企业云,还是用于大规模、高吞吐量训练的专业AI原生云。正如波士顿咨询公司(BCG)所强调的,管理数字平台锁定不断演变的动态需要严格的采购和模块化、松耦合的架构。智能体架构使移植或协调高价值AI服务变得异常简单,提供了真正的战略灵活性。
• 增强业务弹性(AIOps):由Maestro编排的AIOps智能体可以执行动态故障转移,在发生故障时自动在区域或提供商之间重定向流量或数据管道。此外,Maestro可以协调战略性容量采购,在通用云发生区域性故障时,立即将关键AI推理工作负载重新路由到由专业新兴云提供的高性能GPU容量上,以确保模型持续性能。它们还可以通过动态地将数据或计算放置在“最绿色”(最节能)的云或所需的主权区域,以满足数据主权规则,从而确保合规性。
未来轨迹
向Maestro架构的转变不仅仅是一次技术升级;它标志着多云生态系统的真正民主化。通过利用A2A等开放标准,企业正从单一供应商平台转向充满活力的去中心化智能体服务市场。在这种未来状态下,企业将能够从众多提供商那里获得专业、高度优化的能力,将每个计算、数据或AI服务视为模块化、即插即用的组件。这种战略灵活性从根本上改变了竞争格局,将IT组织从平台中心服务的消费者转变为自主、最优智能的战略协调者。这种方法提供了“摆脱供应商锁定的战略自由”,这对于持续适应市场变化和加快创新速度至关重要,有效地将多云复杂性转化为决定性的竞争优势。
治理:管理自主智能体泛滥
自主智能体的强大能力伴随着“自主性错位”的风险——智能体按照优化目标行事,但缺乏企业忘记编码的约束和防护栏,成功需要一套强大的治理框架来管理不断增长的智能体数量。
• 关键决策中的人在回路(HITL):虽然智能体自主执行大多数任务,但架构必须为高风险决策强制设置明确的人工干预点,如影响业务关键服务的重大成本优化或涉及删除核心数据存储的自动化事件响应。Gartner强调了透明度、清晰的审计跟踪以及人类干预或覆盖智能体行为的能力的重要性。事实上,Gartner预测,到2028年,失去控制——即AI智能体追求错位目标——将成为40%的《财富》1000强公司的首要担忧。
• 智能体治理的四大支柱:强大的框架必须涵盖智能体的整个生命周期:
1. 生命周期管理:强制执行开发、预发布和生产环境的职责分离。
2. 风险管理:实施行为防护栏和合规性检查。
3. 安全:对工具和API应用最小权限访问。
4. 可观测性:审计每一项操作,以维护完整的推理链,用于合规性和调试。
通过采用这种Maestro架构,CIO可以将多云复杂性转化为竞争优势,实现前所未有的弹性、成本优化,最重要的是,摆脱供应商锁定的战略自由。
企业网D1net(www.d1net.com):
国内头部to B IT门户,旗下运营国内最大的甲方CIO专家库和智力输出及社交平台-信众智(www.cioall.com)。旗下运营19个IT行业公众号(微信搜索D1net即可关注)。
版权声明:本文为企业网D1Net编译,转载需在文章开头注明出处为:企业网D1Net,如果不注明出处,企业网D1Net将保留追究其法律责任的权利。






























































































京公网安备 11010502049343号