仅只有未实名的,新媒易不收取任何费用,公益非盈利机构
24小时服务热线: 4000-162-306
请扫码咨询

新媒易动态

NEWS CENTER

AI Agent代表了对传统言语模型的根本性打破

2025-01-11

AI Agent不仅仅是更聪明的模型

谷歌认为,AI Agent代表了对传统言语模型的根本性打破。像GPT-4和谷歌的Gemini这样的模型,在生成单轮呼应方面表现优异,但它们仅限于从练习数据中学习到的内容。相比之下,AI Agent规划的初衷是与外部体系互动,根据实时数据进行学习,并履行多步骤使命。

白皮书指出:“传统模型中的常识仅限于它们练习数据中已有的内容。AI Agent经过与外部体系的连接扩展了这些常识。”

这种差异不仅仅是理论上的。设想一个传统的言语模型被要求引荐旅游行程。它或许会根据一般常识提出一些建议,但缺少预订机票、检查酒店可用性或根据用户反馈调整建议的才能。然而,AI Agent则能做到这一切,它可以结合实时信息并做出自主决议计划。

这一转变使AI Agent成为一种新的数字工作者,可以处理杂乱的工作流。对于企业来说,这意味着可以自动化那些曾经需要多个人力人物来完结的使命。经过整合推理与履行,AI Agent或许成为从物流到客户服务等多个行业中不可或缺的东西。


人工智能Agent如何运用扩展拜访外部API以履行使命的细分。(图片来源:谷歌)

二、认知架构驱动它们的决议计划进程

AI Agent才能的核心是其认知架构,谷歌将其描绘为一个用于推理、规划和决议计划的结构。这一架构被称为和谐层,使Agent可以以循环的方法处理信息,结合新数据来优化其举动和决议计划。

谷歌将这一进程比作一位大厨在繁忙厨房中的工作。大厨会收集食材,考虑顾客的口味需求,并根据反馈或食材的可用性调整食谱。类似地,AI Agent会收集数据,推理下一步举动,并根据目标调整自己的行为。

和谐层依赖于先进的推理技能来引导决议计划进程。比如推理与举动(ReAct)、思想链(CoT)和思想树(ToT)等结构,为拆解杂乱使命提供了结构化的方法。例如,ReAct允许Agent在实时中结合推理和举动,而ToT则使Agent可以一起探索多个或许的解决方案。

相关推荐