
新媒易动态
NEWS CENTER
NEWS CENTER
2024-12-14
剪映依靠抖音,把AI才干用在短视频的制作、发布、分享上,用户拍的东西能够直接导入剪映编辑,形成了从创作到分发的完好流程。
即梦结合了短视频和直播电商场景,不仅让创作者更高效地创作,还能在商业场景中直接变现,是不是有自己的生态闭环?
相比之下,独立的大模型没有这样的生态网络,光靠模型才干,就算触摸到了用户,也难产生持续的商业价值。
第三点,商业化路子得清楚。
东西箱再好,用户掏钱买它的欲望也没产品强,由于产品能解决实际问题。所以,想挣钱的AI产品,一开始就得想好怎么挣钱。
文心一言4.0一上来就做会员制,让付费用户享受更强的模型推理才干;Monica搞了个集成AI帮手的全能东西,满足了一些人对各种模型的需求。
想想看,现在市面上东西太多了,单个模型性价比往往不高,有时候答复还不靠谱;集成平台的优点是,如果一个模型不好用,我能够换另一个,这种灵活性自身就值钱。
用户愿意为“选择的自由”和“更高效的服务”掏钱,这让Monica打出了特征。
反过来看,一些大模型公司在商业化上模模糊糊,还停留在“东西箱”阶段。用户不知道它能干啥,更不知道为啥要掏钱;这样下去,商业化路子就拖长了,商场窗口期一过,就很难捉住用户心了。
值得一提的是:大模型自己不明白用户需求,产品才是贴近场景的东西。
就拿智能降噪来说,背后用了极为复杂的模型技能,用户根本不会关心这些,他们在乎“功用好不好用”。若反过来看,这一才干恰巧为模型提供更多语料,如:提取清晰的人声、场景声和人生分离;这种技能反而会让模型才干进一步提升。
因而,大模型自身不能作为一个完好产品,只有把模型赋能到产品中,才干在商场立足。
既然模型要做成产品,那得知道模型和AI产品的差异是什么?
前几天,遇到了一个风趣的场景:我把Excel文件给了豆包,豆包立马解说里边的内容。但是,我在GitHub上下了一个模型后,把Excel给模型的API,它却告诉我:不好意思,没办法读取这个文件的内容。
我就疑惑,这是为什么?带着疑问去找答案,成果发现,豆包是挺大的模型产品,它后面有好多多模态的模型支撑。
豆包拿到Excel文件后,会先把它转换成模型能懂的XML格局,然后再把信息输入模型里去做推理。这个进程是产品层面来完成的。
换句话说,大模型API是个接口,产品要在模型的基础上,加上一整套工程化的转换机制,让模型能直接和用户沟通,这些约束是产品层面的,不是API自己的约束。
这就点明一个核心问题:
模型提供的是才干,而产品需要通过工程化,将这些才干变成用户看得见、用得上的功用。既然如此,那么,大模型为什么无法直接调用内容,还得转化一下呢?
一方面,一个恳求里要来回调用很屡次,模型可能在API内部被调用很屡次,这种成本,API提供者扛不住。
一个常见例子是多轮对话:
用户在对话中问:“我这张信用卡什么时候还钱?”模型得先找出这个人的ID,再去银行的数据库里查信息,然后才干回来成果。
要是没有一套逻辑来操控,模型会由于信息不行,一直问用户,而不是直接去查;这就要产品这边,用外部的逻辑(比方条件判别和功用调用)来管每一步,保证用户只输入一次信息就能搞定。
通过这种逻辑操控,用户不用了解模型的底层机制,也能在一个自然的交互中取得成果。
另一方面,有时候模型也会犯错,比方:把好多数据混在一起剖析,这种重复检查的要求,一般做不到。
最常见的是处理PDF: