仅只有未实名的,新媒易不收取任何费用,公益非盈利机构
24小时服务热线: 4000-162-306
请扫码咨询

新媒易动态

NEWS CENTER

OpenAI打算更广泛地推出名为GPT-Vision的功用

2023-09-19

跟着今年秋天的临近,谷歌和OpenAI的多模态模型之战,也进入到白热化阶段。

就在上星期,谷歌已经对一些外部公司开放了多模态大模型Gemini的功用。

而OpenAI,当然不会坐以待毙。他们正在争分夺秒地把多模态功用整合进GPT-4里,争夺推出功用与Gemini相似的多模态大模型,一举击杀谷歌。

传说中的多模态功用,在今年3月OpenAI那场震动全世界的GPT-4发布会上,已经被展现过——

在纸上画个草图,拍个照发给GPT-4,说一声「给我按照这种布局做个网站」,它立马就写出了网页代码。


老板Greg Brockman亲自上线演示

不过随后,多模态似乎昙花一现,再也没人见过产品化的实体功用。

所以,谷歌和OpenAI的多模态大战,总算要来了吗?

一、对战谷歌,OpenAI抢发多模态大模型

面临传闻中谷歌要击杀自己的这款大杀器,OpenAI当然不会无动于衷。

据外媒The Information爆料,一款名为Gobi的全新多模态大模型,已经在紧锣密鼓地预备了。


OpenAI方案,在Gemini发布之前就推出多模态LLM,完全打败谷歌。

其实,在3月份推出GPT-4多模态功用的预览后,OpenAI已经向一家名为Be My Eyes的公司推出了这项功用,但并没有向其他公司供给。

从名字就可以看出来,这家公司在研发让盲人或视力欠安人群看得更清楚的技术。

最近,OpenAI打算更广泛地推出名为GPT-Vision的功用。


OpenAI为什么花了这么长期?

最主要的原因,是他们担心新的视觉功用会被不法分子利用,比方经过主动破解验证码来假充人类,或许经过面部识别来追踪人类。

不过,对于这些法律上的安全风险,OpenAI的工程师们似乎已经解决了。

同样,一位谷歌发言人也表示:谷歌已经采取了一些办法,防止Gemini被滥用。

在7月做出的许诺中,谷歌确保会在一切产品中开发负责任的人工智能。

相关推荐