当前位置：首页 >新媒易动态 >视频号购买

大模型使用之下，AI Infra成为其迸发的躲藏推手

2024-08-22

而在大模型使用之下，AI Infra成为其迸发的躲藏推手。

目前，大模型产业链大致能够分为数据准备、模型构建、模型产品层次。在国外，AI大模型的产业链比较老练，形成了数量众多的AI Infra（架构）公司，但这一块商场在国内还相对空白。

在充满不确定性的道路上，率先找到明晰的赛道，快速树立明显的里程碑尤为重要。AI Infra商场尚处于混沌期，每个科技巨子都希望在自己的生态中形成闭环。

在国内，巨子们都有一套自己的练习架构。

比方，华为的模型选用的是三层架构，其底层归于通识性大模型，具有的鲁棒性的泛化性，在这之上是行业大模型和针对具体场景和工作流程的布置模型。这种构架的优点是，当练习好的大模型布置到垂类行业时，能够不用再重复练习，本钱仅是上一层的5%~7%。

百度和腾讯也有相应的布局，百度拥有掩盖超50亿实体的中文知识图谱，腾讯的热启动课程学习能够将万亿大模型的练习本钱降低到冷启动的八分之一。

整体来看，各个大厂之间的侧重点尽管有所不同，但主要特色便是降本增效，而能够完成这一点，很大程度上便是受益于“一手包办”的闭环练习系统。

反观国外，老练的AI产业链形成了数量众多的AI Infra公司。

如果把开发AI使用看成建房子，那么AI Infra便是供给水泥钢筋的施工队。AI Infra施工队的价值点在于它是一个集成平台，将基层的算力芯片层与上层的AI使用层打通，让开发者完成一键调用，并且完成降低算力本钱、进步开发功率并且坚持模型优秀性能的效果。

让使用更简单，让AI落地更便捷，是AI Infra的任务。能够说，AI使用的商场有多大，AI Infra的时机就有多大。

AI Infra公司有的专门做数据标注、做数据质量、或许模型架构等。这些企业的专业性，能够让他们在某一个单一环节的功率、本钱、质量上都要比大厂亲身下场做得更好。

比方，数据质量公司Anomalo便是Google Cloud和Notion的供货商，它能够通过ML主动评估和通用化数据质量检测才能，来完成数据深度观察和数据质量检测。

这些公司就像汽车行业的Tier 1，通过专业的分工，能够让大模型企业不用重复造轮子，而只需求通过整合供货商资源，就能快速地搭建起自己模型构架，然后降低本钱。

但国内在这一方面并不老练，原因在于：一方面国内大模型的主要玩家都是大厂，他们都有一套自己的练习系统，外部供货商简直没有时机进入；另一方面，国内也缺乏足够巨大的创业生态和中小企业，AI供货商也很难在大厂之外找到生计的空间。

以谷歌为例，谷歌愿意将自己练习的数据成果分享给它的数据质量供货商，帮助供货商进步数据处理才能，供货商才能进步之后，又会反过来给谷歌供给更多高质量数据，然后形成一种良性循环。

国内AI Infra生态的缺乏，直接导致的便是大模型创业门槛的拔高。如果将在中国做大模型比喻成吃上一顿热乎饭，那必须从挖地、种菜开端。

目前，在AI 2.0的热潮中，一个重要的特色便是“两极化”：最热门的要么是大模型层、要么便是使用层。而相似AI Infra的中间层，反而是很大的真空地带，也可能是下一个机会所在。

铲子难卖，金矿难挖

尽管在大模型使用迸发的当下，AI Infra层潜藏着巨大的生意。但是对于这些做AI Infra的公司来说，即便他们在自己的专业范畴如此强壮，在潮水的改变面前依然脆弱。

英伟达CUDA生态现已开展了20年，在AI范畴，最先进的模型和使用都首先在CUDA上跑起来。

每个硬件之间都有不同的接口，CUDA一致了不同接口之间的语言，让使用者能够用一套规范语言去使用不同硬件。在模型开发过程中，开发者势必会趋同于在同一个语言系统中去完成自己的开发。而这实际上就构成了英伟达CUDA生态厚度。

目前，CUDA生态在AI算力商场占有了90%以上的比例。不过跟着AI模型的规范化，模型之间结构差异变小，不再需求调度多种大小模型，英伟达CUDA生态厚度在变薄。

即便如此，英伟达在算力商场也是肯定王者。据业内人士预测，英伟达在接下来的3~5年傍边，还会是整个AI硬件供给商中肯定的领头羊，商场开展占有率不会低于80%。

对AI Infra层的卖铲厂商来说，外有英伟达守矿人，堵在门口卖门票与铲子，好不容易找到一条进入金矿的小路，却发现，里面的挖矿人现已习气“徒手”挖矿，不再承受新铲子。

在国内，企业为软件付费志愿低，且大多习气集成式服务。国内SaaS投资现已降到冰点，如果AI Infra层厂商单靠卖硬件或软件难以完成商业化。