当前位置：首页 >新媒易动态 >视频号购买

剪映依靠抖音，把AI才干用在短视频的制作、发布、分享上，用户拍的东西能够直接导入剪映编辑

2024-12-14

剪映依靠抖音，把AI才干用在短视频的制作、发布、分享上，用户拍的东西能够直接导入剪映编辑，形成了从创作到分发的完好流程。

即梦结合了短视频和直播电商场景，不仅让创作者更高效地创作，还能在商业场景中直接变现，是不是有自己的生态闭环？

相比之下，独立的大模型没有这样的生态网络，光靠模型才干，就算触摸到了用户，也难产生持续的商业价值。

第三点，商业化路子得清楚。

东西箱再好，用户掏钱买它的欲望也没产品强，由于产品能解决实际问题。所以，想挣钱的AI产品，一开始就得想好怎么挣钱。

文心一言4.0一上来就做会员制，让付费用户享受更强的模型推理才干；Monica搞了个集成AI帮手的全能东西，满足了一些人对各种模型的需求。

想想看，现在市面上东西太多了，单个模型性价比往往不高，有时候答复还不靠谱；集成平台的优点是，如果一个模型不好用，我能够换另一个，这种灵活性自身就值钱。

用户愿意为“选择的自由”和“更高效的服务”掏钱，这让Monica打出了特征。

反过来看，一些大模型公司在商业化上模模糊糊，还停留在“东西箱”阶段。用户不知道它能干啥，更不知道为啥要掏钱；这样下去，商业化路子就拖长了，商场窗口期一过，就很难捉住用户心了。

值得一提的是：大模型自己不明白用户需求，产品才是贴近场景的东西。

就拿智能降噪来说，背后用了极为复杂的模型技能，用户根本不会关心这些，他们在乎“功用好不好用”。若反过来看，这一才干恰巧为模型提供更多语料，如：提取清晰的人声、场景声和人生分离；这种技能反而会让模型才干进一步提升。

因而，大模型自身不能作为一个完好产品，只有把模型赋能到产品中，才干在商场立足。

02

既然模型要做成产品，那得知道模型和AI产品的差异是什么？

前几天，遇到了一个风趣的场景：我把Excel文件给了豆包，豆包立马解说里边的内容。但是，我在GitHub上下了一个模型后，把Excel给模型的API，它却告诉我：不好意思，没办法读取这个文件的内容。

我就疑惑，这是为什么？带着疑问去找答案，成果发现，豆包是挺大的模型产品，它后面有好多多模态的模型支撑。

豆包拿到Excel文件后，会先把它转换成模型能懂的XML格局，然后再把信息输入模型里去做推理。这个进程是产品层面来完成的。

换句话说，大模型API是个接口，产品要在模型的基础上，加上一整套工程化的转换机制，让模型能直接和用户沟通，这些约束是产品层面的，不是API自己的约束。

这就点明一个核心问题：

模型提供的是才干，而产品需要通过工程化，将这些才干变成用户看得见、用得上的功用。既然如此，那么，大模型为什么无法直接调用内容，还得转化一下呢？

一方面，一个恳求里要来回调用很屡次，模型可能在API内部被调用很屡次，这种成本，API提供者扛不住。

一个常见例子是多轮对话：

用户在对话中问：“我这张信用卡什么时候还钱？”模型得先找出这个人的ID，再去银行的数据库里查信息，然后才干回来成果。

要是没有一套逻辑来操控，模型会由于信息不行，一直问用户，而不是直接去查；这就要产品这边，用外部的逻辑（比方条件判别和功用调用）来管每一步，保证用户只输入一次信息就能搞定。

通过这种逻辑操控，用户不用了解模型的底层机制，也能在一个自然的交互中取得成果。

另一方面，有时候模型也会犯错，比方：把好多数据混在一起剖析，这种重复检查的要求，一般做不到。

最常见的是处理PDF：‍