
新媒易动态
NEWS CENTER
NEWS CENTER
2023-07-15
在当时炽热的生成式AI职业中,大模型的技能日新月异,对于那些一无所知的人来说,就如同面对着不知道的世界,无所适从。
可以说,在这些领域上没有满足的技能知识,就像是当今社会的文盲一样,可能会错失许多时机。
但是,跟着越来越多的企业、创业团队和研究机构进入这个领域,个人感到颇为古怪,觉得这个领域的开展过快,仿佛有什么不对劲的当地。
这是一个非常有价值的论题,因此想在这里简要分享一下想法。
从各大厂商推出的大模型产品来看,它们借助本身的研发实力和财力,推出了文心一言、通义千问等产品,并早先进行内测和使用。
但是,其本质上的思路都是仿照OpenAI的思路,通过数据和预练习模型打造中国版的ChatGPT。初看起来,这似乎是合适咱们开展的路途。
但这里面其实有着咱们目前无法处理的两个关键问题:
以上两个问题,个人以为是涉及到大模型职业开展的最重要的问题,没有之一。
其间,问题1目前国内并没有可以攻克的实力,更多的需求依靠国外的技能支持。
问题2关于中文数据的问题,目前中文在全世界使用的规模有限,在处理中文数据质量及数量问题上,仍需求时刻。
根据《ChatGPT挑起的这场AI比赛,有一个肮脏的秘密》描绘:练习GPT-3消耗了1287兆瓦时,并导致超过550吨二氧化碳的排放——相当于一个人在纽约和旧金山之间往复550次。
大模型的练习本钱不是一个中小型乃至是大型公司可以轻易承受的本钱。此外,还需重视环境、灾祸管理和练习方法等课题。这些因素会导致企业面临昂扬的本钱问题。
尽管我个人以为许多草创公司的考虑仍然不行,但这并不影响以为这是一个需求重视的问题。
许多公司仍在喊标语:“未来,咱们要打造属于XX职业的大模型”。仅重视使用场景的深度和广度,并未提及到本身企业的优势、本钱及技能经历的储备。
类似于以往互联网、电商的开展,许多企业(包括openAI)已经在疯狂争夺大模型人才。相关JD描绘不少都是需求有大模型练习、GPT使用东西经历及prompt工程等要求。而这些在2022年前,都还不为大众所了解。
薪酬方面只要牵扯到GPT大型模型相关的,基本都保持在20w-80w的高水平(以深圳为例)。
另外大模型也出现了不少职业大模型,如BloombergGPT(金融)、MathGPT(数学)等,未来肯定还有更多职业属性的大模型出现。
但这个是很古怪的一个现象,类似于以往的语音agents,又将通用智能割裂成一个又一个模块。后边也许又会变成比较哪一个职业大模型更智能的问题上。