当前位置：首页 >新媒易动态 >视频号购买

LLama V2功能超过了GPT-4、Microsoft和Google的AI模型，能够生成言语、代码和图像。最重要的，比较GPT4，LLama V2开源，而且能够直接商用

2023-08-04

这年头，不做大模型就不好意思说自己是科技公司。

这不，“百模”大战打了几个月之后，又有新玩家进场了，京东、携程都加入了大模型“战场”。

比较京东、携程发发布大模型布，这两天的大模型发生了一个更重量级的作业：Meta发布新一代AI模型LLama V2，并宣布LLama V2开源，并可直接商用。

傅盛发朋友圈评论：“这一下不知道多少公司笑醒在深夜，多少公司哭晕在厕所……”

据传，LLama V2功能超过了GPT-4、Microsoft和Google的AI模型，能够生成言语、代码和图像。最重要的，比较GPT4，LLama V2开源，而且能够直接商用。

消息一出，不少人都在慨叹：一夜之间大模型变天了。

要说大模型职业变天，恐怕还有点早，但LLama V2开源可商用、再加上国内这么多大模型落地，“百模”大战，恐怕要迎来第一个“淘汰赛”阶段。

一、“百模”大战之后，大模型迈进使用驱动阶段

大模型赛道，做通用模型的都是大公司。

Open AI背面站在微软，文心一言背面是百度，通义千问背面是阿里，混元大模型背面是腾讯……再加上商汤、讯飞等“本乡”玩家，留给后来者的舞台其实并不大。

而这个不大的舞台，现在却显得有些拥挤。此前一份国产大模型列显示，目前国内的大模型现已有近百家。

这么多大模型落地，说明AI大模型或许行将进入产品驱动阶段。

互联网江湖认为，大模型的开展会通过三个阶段。

第一阶段，模型数据、数据为中心的技能驱动阶段。

从ChatGPT 到GPT3阶段，大模型是由技能驱动，这时候关键是算法，和数据练习。

GTP3之后，距离就在于数据量，这不难理解，这好比是一个有着超强学习才能的孩子，在咿呀学语之前，前进不大，一旦把握了世界的“数据言语”，那么大模型的进展是飞速的。

而做通用大模型的玩家，需求赶快度过这个阶段，并树立自己的中心优势。

目前来看，百度文心、腾讯混元、阿里通义千问、商汤大模型、以及讯飞火星等，国产首要大模型都走到这一阶段。

这些大模型，都是大公司做出来的，能走到这个阶段的大模型，要么算法更先进，要么有满足的数据参数和练习量。

以百度为例，5月份上线的文心大模型3.5，才能现已超出ChatGPT 3.5，虽然官方没有公布详细的数据量级，但很多的数据、算法优化练习是必经之路。

这个阶段，拼的其实便是硬实力，拼的是数据生态，人才技能和资金投入，创业公司很难真的从底层做起来。

第二阶段，是产品驱动阶段。

当国产大模型不断涌现，“百模”大战的格式演出之后，职业其实就现已走到了产品驱动阶段。

产品驱动阶段，“百模”大战会经历一轮淘汰赛。

大模型从业者普遍认为，400 亿-500亿参数量级是模型才能“质变”的门槛。换言之，关于资本市场来说，百亿参数量级之前，一些大模型项目很或许会首要遇到“生计问题”。也便是说，关于一些后来者、在遇到生计问题之前，有必要要有满足使用落地。

也因而，产品阶段的大模型，中心在落地场景。

大模型其实没有什么路线之争，笔直或许通用，与其说是路线之争，倒不如说是落地的场景之争。

我们认为产品驱动阶段，大模型落地的重点在于，大公司底层做起，打造职业大模型基础设施，在此之上，垂类的创业公司去做使用端的笔直立异。

其实现在现已有企业走在这条道路上了，比如商汤SenseChat大模型，在不少范畴现已开始与品牌协作落地。

“表面上看通用大模型和笔直大模型代表了两种技能方向，但实际上两者相得益彰，能够并行开展。更强的通用大模型具有更强大的学习才能，能够快速融合不同职业范畴的常识，支持笔直大模型的练习和开发。”商汤科技相关人士表示。

在大模型范畴，商汤扎根很深。