仅只有未实名的,新媒易不收取任何费用,公益非盈利机构
24小时服务热线: 4000-162-306
请扫码咨询

新媒易动态

NEWS CENTER

开源世界的敏捷昌盛,也正导致大模型生态链企业乃至底层芯片厂商的情绪和战略产生一些微妙改动

2023-08-18

开源世界的敏捷昌盛,也正导致大模型生态链企业乃至底层芯片厂商的情绪和战略产生一些微妙改动。

一家国内干流AI芯片企业人士告知数智前哨,Meta推出Llama 2开源模型后,呈现出的效果较好,这对目前市场上一些大模型来说是个绝杀。为此,他们已暂缓了对一些大模型的适配作业,观望一下再说。

国内外大模型大厂也已敏捷在战略上做出改动,遍及朝着“左手闭源,右手开源”的方向走。

在国外,微软除了投资OpenAI闭源大模型,也和Meta实现牵手,宣告在其Azure云和Windows内上线开源的Llama 2。亚马逊AWS、谷歌云也都在自研大模型根底上,支撑第三方和开源模型。

在国内,8月初,百度先宣告晋级千帆大模型渠道,接入Llama2全系列、清华ChatGLM2、RWKV等33个大模型,并对这些模型进行性能增强、推理优化等作业;之后,阿里开源通义千问70亿参数模型,包括通用模型Qwen-7B和对话模型Qwen-7B-Chat,称“开源、免费、可商用”;而在8月16日,腾讯亦亮出新动作,宣告腾讯云TI渠道已接入Llama 2、Falcon、Dolly等20多个干流模型,旨在打造职业大模型精选商店。


大厂们何故会有如此“整齐划一”的动作?

市场需求改动是一个因素。百度智能云AI与大数据渠道总经理忻舟告知数智前哨,他们发现市场需求已逐渐进入深水区,仅文心一言一个模型,不能满意客户多样化需求,而如果能把一个渠道做好,“会有更多的流量”。

业界调查,7月下旬,百度在对外表述中,已将原来的“文心千帆大模型渠道”转变为“千帆大模型渠道”,在做“去文心化”。

另一个实际因素是,大厂们单个项目报价遍及在千万元级别,闭源大模型暂时还没能有足够多的大项目落地。

此外,清华ChatGLM建立了有战略的、组合的商业模式,把小模型开源出去,招引商机和生态,它的闭源大模型也可以为企业供给定制化服务。大模型厂商供给一个开源的但规模较小的大模型供大家使用,也是一种营销模式。

一位熟悉阿里云的资深人士也表明,他猜想,上述这些因素也是阿里开源两款大模型的重要原因之一。“走别的一条路试试看。”

而大模型变现的通路,并不仅仅模型自身。

数智前哨获悉,华为在大模型上的考量,算力是重头之一。7月底到8月初,任正非就大模型有两次讲话,均与算力相关。

先是建立AI算力先遣队,由原煤矿军团团长邹志磊负责。任正非说,有4000个客户想要用华为昇腾渠道去练习大模型。华为也将可能在10月建立15个小组去分别服务15个客户。之后,针对华为在《自然》杂志上发表的华为云盘古气象大模型的论文,任正非也谈及要“在新的淘金年代卖铲子”。

无独有偶,忻舟介绍,百度在大模型上的商业模式可分为两个层面。从文心一言这个大模型的角度讲,百度赚的是AI的钱。但千帆同时仍是一个支撑其他第三方模型的渠道,本质上“仍是云的思路,赚云的钱”。

此外,开源对生态建设也是百利而无一害。究竟大模型被以为是智能年代的操作系统,而操作系统比拼的是生态,百度智能云AI渠道副总经理李景秋以为,好的开源模型会极大招引市场上立异公司重视大模型并参加其间,从而带来整个上下游服务生态的完善。

本年7月,阿里云也对外喊出“将促进中国大模型生态的昌盛作为首要方针”的标语。“这就类似于原来开源软件的模式,通过开源来招引客户,建立产品的社区。”一位大模型领域资深人士表明。

该人士以为,无论国内国外、开源闭源,大模型的发布可能还会更多,具有通用根底才能的大模型,可能会会集到少数几个厂商,但具有职业细分的大模型,比较典型的像医疗、法律、教育,会有更多厂商去做。别的,根据大模型的才能做出来的使用级产品,会逐渐昌盛,构成一个新的生态和软件开发模式,“比如最近比较火的MetaGPT和ToolLLM”。

相关推荐