当前位置：首页 >新媒易动态 >新媒体服务

AI Agent代表了对传统言语模型的根本性打破

2025-01-11

AI Agent不仅仅是更聪明的模型

谷歌认为，AI Agent代表了对传统言语模型的根本性打破。像GPT-4和谷歌的Gemini这样的模型，在生成单轮呼应方面表现优异，但它们仅限于从练习数据中学习到的内容。相比之下，AI Agent规划的初衷是与外部体系互动，根据实时数据进行学习，并履行多步骤使命。

白皮书指出：“传统模型中的常识仅限于它们练习数据中已有的内容。AI Agent经过与外部体系的连接扩展了这些常识。”

这种差异不仅仅是理论上的。设想一个传统的言语模型被要求引荐旅游行程。它或许会根据一般常识提出一些建议，但缺少预订机票、检查酒店可用性或根据用户反馈调整建议的才能。然而，AI Agent则能做到这一切，它可以结合实时信息并做出自主决议计划。

这一转变使AI Agent成为一种新的数字工作者，可以处理杂乱的工作流。对于企业来说，这意味着可以自动化那些曾经需要多个人力人物来完结的使命。经过整合推理与履行，AI Agent或许成为从物流到客户服务等多个行业中不可或缺的东西。

人工智能Agent如何运用扩展拜访外部API以履行使命的细分。（图片来源：谷歌）

AI Agent才能的核心是其认知架构，谷歌将其描绘为一个用于推理、规划和决议计划的结构。这一架构被称为和谐层，使Agent可以以循环的方法处理信息，结合新数据来优化其举动和决议计划。

谷歌将这一进程比作一位大厨在繁忙厨房中的工作。大厨会收集食材，考虑顾客的口味需求，并根据反馈或食材的可用性调整食谱。类似地，AI Agent会收集数据，推理下一步举动，并根据目标调整自己的行为。

和谐层依赖于先进的推理技能来引导决议计划进程。比如推理与举动（ReAct）、思想链（CoT）和思想树（ToT）等结构，为拆解杂乱使命提供了结构化的方法。例如，ReAct允许Agent在实时中结合推理和举动，而ToT则使Agent可以一起探索多个或许的解决方案。