仅只有未实名的,新媒易不收取任何费用,公益非盈利机构
24小时服务热线: 4000-162-306
请扫码咨询

新媒易动态

NEWS CENTER

LLama V2功能超过了GPT-4、Microsoft和Google的AI模型,能够生成言语、代码和图像。最重要的,比较GPT4,LLama V2开源,而且能够直接商用

2023-08-04

这年头,不做大模型就不好意思说自己是科技公司。

这不,“百模”大战打了几个月之后,又有新玩家进场了,京东、携程都加入了大模型“战场”。

比较京东、携程发发布大模型布,这两天的大模型发生了一个更重量级的作业:Meta发布新一代AI模型LLama V2,并宣布LLama V2开源,并可直接商用。

傅盛发朋友圈评论:“这一下不知道多少公司笑醒在深夜,多少公司哭晕在厕所……”


据传,LLama V2功能超过了GPT-4、Microsoft和Google的AI模型,能够生成言语、代码和图像。最重要的,比较GPT4,LLama V2开源,而且能够直接商用。

消息一出,不少人都在慨叹:一夜之间大模型变天了。


要说大模型职业变天,恐怕还有点早,但LLama V2开源可商用、再加上国内这么多大模型落地,“百模”大战,恐怕要迎来第一个“淘汰赛”阶段。

一、“百模”大战之后,大模型迈进使用驱动阶段

大模型赛道,做通用模型的都是大公司。

Open AI背面站在微软,文心一言背面是百度,通义千问背面是阿里,混元大模型背面是腾讯……再加上商汤、讯飞等“本乡”玩家,留给后来者的舞台其实并不大。

而这个不大的舞台,现在却显得有些拥挤。此前一份国产大模型列显示,目前国内的大模型现已有近百家。


这么多大模型落地,说明AI大模型或许行将进入产品驱动阶段。

互联网江湖认为,大模型的开展会通过三个阶段。

第一阶段,模型数据、数据为中心的技能驱动阶段。

从ChatGPT 到GPT3阶段,大模型是由技能驱动,这时候关键是算法,和数据练习。

GTP3之后,距离就在于数据量,这不难理解,这好比是一个有着超强学习才能的孩子,在咿呀学语之前,前进不大,一旦把握了世界的“数据言语”,那么大模型的进展是飞速的。

而做通用大模型的玩家,需求赶快度过这个阶段,并树立自己的中心优势。

目前来看,百度文心、腾讯混元、阿里通义千问、商汤大模型、以及讯飞火星等,国产首要大模型都走到这一阶段。

这些大模型,都是大公司做出来的,能走到这个阶段的大模型,要么算法更先进,要么有满足的数据参数和练习量。

以百度为例,5月份上线的文心大模型3.5,才能现已超出ChatGPT 3.5,虽然官方没有公布详细的数据量级,但很多的数据、算法优化练习是必经之路。

这个阶段,拼的其实便是硬实力,拼的是数据生态,人才技能和资金投入,创业公司很难真的从底层做起来。

第二阶段,是产品驱动阶段。

当国产大模型不断涌现,“百模”大战的格式演出之后,职业其实就现已走到了产品驱动阶段。

产品驱动阶段,“百模”大战会经历一轮淘汰赛。

大模型从业者普遍认为,400 亿-500亿参数量级是模型才能“质变”的门槛。 换言之,关于资本市场来说,百亿参数量级之前,一些大模型项目很或许会首要遇到“生计问题”。也便是说,关于一些后来者、在遇到生计问题之前,有必要要有满足使用落地。

也因而,产品阶段的大模型,中心在落地场景。

大模型其实没有什么路线之争,笔直或许通用,与其说是路线之争,倒不如说是落地的场景之争。

我们认为产品驱动阶段,大模型落地的重点在于,大公司底层做起,打造职业大模型基础设施,在此之上,垂类的创业公司去做使用端的笔直立异。

其实现在现已有企业走在这条道路上了,比如商汤SenseChat大模型,在不少范畴现已开始与品牌协作落地。

“表面上看通用大模型和笔直大模型代表了两种技能方向,但实际上两者相得益彰,能够并行开展。更强的通用大模型具有更强大的学习才能,能够快速融合不同职业范畴的常识,支持笔直大模型的练习和开发。”商汤科技相关人士表示。

在大模型范畴,商汤扎根很深。

相关推荐