新媒易动态
NEWS CENTER
NEWS CENTER
2023-09-05
AI技能在B端的运用场景非常广泛,但本文将专注于研讨如安在发现一个可行的场景时,有用地实施落地的过程,以处理企业在依靠第三方AI技能时面临的不可控性和不确认性问题。以下为个人总结的落地过程:
在清晰B端体系要运用AI的具体任务后,需求进行快速的可行性验证。尽管尚未确认最终选用哪个大型模型,但可以先运用一种点评较高的大型模型进行验证,并请技能团队和事务团队进行评价。为了快速验证,您可以尝试搭建一个演示版别,以便迅速进行事务验证。为避免浪费开发成本,主张优先选择一些开源的技能实现方案,仅需支付部署费用即可。这样可以有用下降开发成本并提高开发效率。
其中测试的时分有两种验证办法可供尝试:
1)角色扮演法:测试者扮演B端体系的用户角色,模拟事务的交互流程并输入信息,以评价AI的回来成果是否契合事务要求。例如,可以模拟用户向智能机器人提问,观察AI回来的问题是否可以满足事务要求,从中判别AI是否可以在该场景中供给处理方案的办法。
2)数据模拟法:通过在线事务数据获取实在的样本数据,并进行人工挑选以确认具有代表性的数据案例。随后,批量输入这些数据到AI模型中以获取输出成果,并进行大规模的评价。
当确认AI技能可在B端上落地后,需求确认接入的模型才能。这里需求基于事务梳理模型评价体系,运用量化的指标便于多个大模型之间的比照,以便归纳考量最终选取适宜的大模型供给方。一般指标会包含以下内容:
1)召回率
召回率是模型训练中的概念,又称“查全率”,是一个常用的衡量数据发掘模型在查询回归程度的指标。用简略的话介绍便是“原本需求体系判别出来的内容中,大模型真的抓出来了多少”,用来判别大模型可以精确判别的范围。
2)精确率
精确率同是模型训练中的概念,用于衡量模型猜测正确的成果所占的份额。浅显地讲,便是模型判别正确了多少。
在大模型才能有限的情况下,召回率和精确率必定程度上是冲突的。为了判别得全,就会加大判别错误的概率。为了判别得正确,又会有案例没有没判别到。
召回率和精确性直接决议了大模型的服务才能。
3)安全性
由于是第三方服务,B端企业需求考虑到数据的安全问题,评价模型能否维护用户数据的隐私和安全,并契合相关的数据维护法规和标准。