
新媒易动态
NEWS CENTER
NEWS CENTER
2024-11-02
第一种是嵌入形式,适宜需求AI辅佐但依赖人工决议计划的场景,这也是大模型使用最根底的形式。
比如,法令剖析场景下,AI可以剖析大量法令文档,供给相关条文主张,但终究法令决议计划依然由人类律师作出。
在该形式中,AI主要是作为东西或帮手嵌入到现有的工作流程中,一般是由现有事务调用大模型的提示词接口和常识检索接口。
以智能客服体系为例,经过调用大模型的提示词接口来获取主张和信息,当用户经过输入特定的提示词,引导大模型生成相关的回答或主张;调用常识检索接口,结合RAG技能,体系可以在用户提问时,经过向量数据库检索相关常识,并将检索到的信息与提示词一同传递给大模型。
因而,嵌入形式适宜那些对人工决议计划要求较高的项目,AI仅需进步人类功率。它的优势在于较低的施行难度,并且可以在现有工作流程中轻松嵌入。但它的局限性在于AI的作用有限,无法充分发挥其在杂乱使命中的潜力。
所以,在AI需求较为根底、且需求高度人类监督的项目中,嵌入形式是最为抱负的挑选。
第二种是Copilot形式,适宜人机协作、需求实时调整的杂乱使命。
在该形式中,AI与人类共同参加使命履行,事务方不只调用提示词接口,还要调用大模型的实时交互接口,利用实时反馈机制去调整AI的呼应。且经过使命分化与履行接口,AI可以依据用户输入和上下文信息,独立完成部分使命,如主动生成回复、处理常见问题等,同时人类可以对AI的输出进行检查和调整。
比如,在客户服务中,AI可以协助客服代表编撰回复邮件或处理客户投诉,经过实时反馈优化其主张,进步工作功率。
因而,Copilot形式非常适宜那些需求频频调整和屡次迭代的杂乱项目,尤其是,项目要求频频的调整和屡次迭代,且AI可以承当部分使命时,Copilot形式是抱负挑选。
比如软件开发,AI可以与开发者合作,编写代码、进行调试,削减重复性劳作,并进步开发功率;再比如,内容创造场景,在编撰文章或创造内容时,AI可以与创造者共同协作,供给写作主张或部分草稿,帮助创造者更快速地完成工作。
智能体(agent)形式,适用于那些使命杂乱、需求高度自主化的场景,是最为自主化的使用形式。
在该形式中,AI不只是人类的帮手,仍是能独立完成使命的智能代理。人类的人物从履行者转变为使命设定者和监督者,AI可以基于大规模语言模型的才干,进行使命分化、东西挑选、资源调度等自主决议计划。
在AI Agent形式中,事务方需求调用大模型的自主决议计划和履行接口,AI可以依据预设方针和上下文信息,自主挑选适宜的东西和方法进行使命处理。同时,经过多轮对话办理接口,AI Agent可以办理杂乱的多轮对话,经过对话逻辑设置和记忆功用,继续跟踪用户需求并做出相应调整。
举个例子,在处理杂乱客户恳求时,AI Agent可以独立进行信息查询、问题解决,并在整个进程中保持与用户的对话,供给个性化服务。在金融买卖场景中,AI可以依据商场数据主动进行买卖策略的调整与履行,削减买卖中的人为干扰。
因而,假如项目具有高度的杂乱性,且AI可以在很大程度上代替人工操作,AI Agent形式将会是最佳挑选。这一形式的优势在于AI可以自主进行使命处理,削减了对人类干涉的需求。但其应战在于AI的履行才干和自主决议计划的准确性。
那么相应的,在施行AI Agent形式时,团队需求对AI的自主才干有充分信赖,并可以规划合理的监督机制以保证AI的表现符合预期。
当你规划需求时,不可避免地要对才干上线后的成效进行评价以便辅导产品后续的迭代方向。而关于AI使用来说也是一样,如何界说事务结合大模型后的评价规范值得商榷。
比如你在做客户服务场景,方针是进步顾客服务功率和满意度,拆解方针后你需求让模型基于底层常识库、话术引荐等信息,辅佐甚至是代替人工客服收集顾客信息后并完成电商场景的售前导购、答疑解惑、售后服务等流程。
整理这些事务流程的进程中,相信你会抽象出一些规范才干。关键来了,功用好不好用,作用达不达预期,你得界说一条评价的基准线,才干辅导产品优化后的作用观测。
这条评价基准线终究是什么,怎样界说?
在说评价规范前,先来了解下评测流程以及其间涉及到的关键环节。
以虚拟陪伴机器人为例,整个评测进程中的关键人物包含事务侧(事务产品、算法和工程团队)、评测渠道侧(评测运营团队、评测人员(含外包)、负责评测渠道的产品和工程团队)。
其间,常见的评测环节包含基线评测、模型迭代评测和对话质量评测,具体工作流如下:
本轮评测一般产生在模型布置练习后,由评测团队从题库中获取评测题目(不少公司会有各自的AI数据渠道,支持生成题库及AI回复),在AI数据渠道上展开评测并生成评测报告。整个进程对话主题主动匹配,算法再依据完整的常识库进行SFT;
图:基线评测的工作流
该评测环节一般产生在产品发布后,在机器人与用户互动的进程,可能会伴随着模型底座的继续练习和模型才干的评测,辅佐算法在规模化、RAG、记忆、安全、多模态、基座才干上得出迭代的结论。