去年十二月,Anthropic公司推出了MCP协议,引发了广泛的关注和高涨的热情。紧接着上个月,Google的A2A协议也面世,再次掀起了讨论的热潮。这两个协议的火热背后,有其深刻的时代背景。
经常关注行业动态的朋友们会发现,近期基础模型的训练呈现出了明显的寡头化趋势。在基础大模型领域,有能力并有意愿投入的公司主要集中为几家头部大厂,而创业公司如凤毛麟角。虽然AI的前景被广泛认同,但创业机会更多地存在于模型的应用层面而非研发。
MCP和A2A两种协议,可以看作是AI应用生态构建的基础设施。整个AI的应用生态,围绕着用户、Agent和外部世界三个角色展开。为了让这个生态发展壮大,首先要解决的就是这三者之间的互联互通问题。
MCP主要解决的是Agent与外部世界的互联互通,而A2A解决的是Agent之间的互联互通。但你有没有想过,对于Agent自身以及与用户的交流互动,我们是否还需要一个更完善的协议来规范?今天我们要介绍的AG-UI协议正是为了解决这个问题。它完善了AI应用生态发展所需的最后一块协议拼图,规范了Agent与前端界面的连接、交流和互动方式。
我们来简单梳理一下背景概念。什么是Agent?尽管这是一个被反复提及的词汇,但它的内涵并没有得到准确的传达。英文里Agent的原意是代理人,它接受授权后,替其他人、公司或完成相应的工作。例如,房屋中介就是Agent的一种,他们代理完成房子的出租或出售工作。在AI领域,AI Agent在用户需要完成某个任务时,能够主动采取行动,包括分析拆解、获取信息、调用工具、整合响应等过程。最近出现的Lovart工具就是一个很好的例子,它作为设计Agent,在用户给出提示语后,能够自动生成广告片。
理解了Agent的概念后,MCP和A2A的作用就显而易见。Agent要完成任务,很多时候都需要调用外部世界的资源和工具。这时就需要一个像MCP这样的协议来规范工具的使用和调用。同样地,当多个Agent需要互相协作时,就需要一个像A2A这样的协议来规范它们之间的交流方式。
那么AG-UI协议要解决的问题是什么呢?简单来说,就是在Agent出现之前,用户已经与外部世界存在互动。当Agent加入后,就需要协调三个新的关系:Agent与外部世界、Agent之间以及Agent与用户的关系。MCP和A2A已经解决了前两个关系,而AG-UI则是为了补齐最后一个拼图。AG-UI协议的作用就是在应用和后端Agent之间搭建一座桥梁,提供了一个标准范式和基础实现来规范它们之间的沟通和协作方式。就像建房子时需要用到砖厂生产的高质量砖块一样,AG-UI提供了标准化的组件和功能模块来提高应用的开发效率和用户体验。它是事件驱动的工作模式核心在于根据不同的用户需求和任务进展动态调整应用界面显示的内容和功能通过AG-UI协议的规范前端应用可以实时了解后端Agent的工作状态和任务进展从而更好地向用户提供实时反馈和信息展示从而提高用户的使用体验和满意度这也是AG-UI协议的价值所在接下来我们将详细介绍AG-UI协议的五大事件类型包括生命周期事件文本信息事件工具调用事件状态管理事件和特殊事件其中涉及到的每个事件的类型、作用和应用场景等都将在后面的内容进行详细介绍与详细解释帮助您更加深入了解AG-UI协议的构成和使用方法让你清晰明白文档想传达的含义为基于协议的进一步研究打下基础