新媒易动态
NEWS CENTER
NEWS CENTER
2024-12-21
在智能体的规划中,这是开始的一步。由于从人际交互的角度来说,只有当两边可以了解互相,咱们才或许拥有比较流畅的沟通,人机交互也一样。
但在我的实践中我发现,当咱们要考虑和考虑AI怎样才干了解并帮助用户处理目的之前,首先要先定义清楚的是:
什么是AI的能了解?
什么是AI的不能了解?
比方,在我最近做的项目中,AI的能了解被定义为XX常识库内&日常沟通相关。
那什么又是日常沟通相关的?最简略的,比方我在中文系统里输入Hello,它会觉得不能了解吗?
你会发现,在人际交往中似乎不是问题的,成为了智能体规划中的问题。
在这个问题上,咱们的技能人员挠了挠头,说那得取决于我能用的大模型了。
就像每个人有每个人的形象、语气、认知、习惯外,越来越可以经过天然交互与人类沟通的“机器”天然也需求有。
我之前把它称作IP(Intellectual Property)规划,RICH里叫做人物规划。
RICH里边说到的人物规划有三个需求规划的内容:
性情内核: 人物行为、决议计划与情感反应的底子驱动力,包括核心性情特质、价值观、崇奉动机和情感状态。
专业才干: 人物在特定领域内把握的常识技能、实践经验及处理问题的特长,支撑其工作表现,实现功能价值。
外在形象: 外观特征、服饰风格、肢体言语及声响特色等,是人物个性与布景故事的视觉与听觉表现。
优先处理专业才干,由于它决议了为什么用户需求和这个智能体沟通,什么时候需求和这个智能体沟通。换言之,对智能体的专业才干详细到可实操层的定义,决议了它为什么而存在。
对话规划和以往的规划比较,我觉得最大的差异在于什么时候“隐性”处理。
由于开始和完毕纷歧定要说你好和再见,诘问也纷歧定在末尾单独生成几个扩展问题才叫诘问,提示和确认或许全部隐藏在言语中,过错也不是GUI规划中那种过错,仅仅人际交往中最常见的状况。
这是我问询AI和它的交互流程是什么,它给我的答复,供规划参阅:
第一步:接纳输入等候并接纳你发送的文本内容,包括各类问题、指令、话题描述等信息。
第二步:了解目的。运用天然言语处理技能对所接纳的文本进行分析,尽力精确把握你想要表达的核心目的、希望达成的目标,例如是寻求常识回答、进行文案创造、要求言语翻译,还是单纯的闲聊等不同状况。
:信息检索与整合(如有需求)假如你的问题涉及到需求外部信息来辅助答复的状况,会在相关常识库、数据源中进行检索,筛选出合适且精确的信息,并依照必定逻辑进行整合。
第四步:生成回复根据对目的的了解以及检索整合的信息(若有),经过言语生成模型等技能,依照契合言语规范、逻辑明晰、重点突出等要求来构建相应的回复内容。
第五步:输出回复将生成好的回复内容发送给你,以便你能查看并继续展开后续的沟通互动。第四、怎么组织、操作多行为交融的界面?
这是需求和详细的场景、产品深度绑定才干答复的一个问题。
RICH给出的答案是根据现在最常用的Chat方式给出的,不同的产品、设备终端改变都或许让这个答案的详细方式产生改变。
比方XR设备的用户输入,或许纷歧定是有形的谈天一般的文字等内容输入,或许是声响的输入,也或许是行为的输入。
RICH根据PC终端来给出的分类给了很好的参阅:
Do 为主: 以界面操作为主,偶然引发 AI 方便指令。例如 Quick Bar、固定指令式、内嵌生成式等。
Do + Chat 均衡: 天然言语与界面操作均衡合作。例如双区联动交互、交互式操作气泡等。
Chat 为主: 以天然言语为主,几乎没有界面操作。例如侧边式 Copilot、独立 Web Bot 等。
RICH规划范式为咱们供给了一个在AI时代下规划智能界面的新思路。它经过四个要害要素来指导规划:
目的(Intent)帮助咱们考虑AI怎么了解用户需求
人物(Role)定义AI的形象与才干
对话(Interaction)探索天然的交互方式