
新媒易动态
NEWS CENTER
NEWS CENTER
2023-09-19
跟着今年秋天的临近,谷歌和OpenAI的多模态模型之战,也进入到白热化阶段。
就在上星期,谷歌已经对一些外部公司开放了多模态大模型Gemini的功用。
而OpenAI,当然不会坐以待毙。他们正在争分夺秒地把多模态功用整合进GPT-4里,争夺推出功用与Gemini相似的多模态大模型,一举击杀谷歌。
传说中的多模态功用,在今年3月OpenAI那场震动全世界的GPT-4发布会上,已经被展现过——
在纸上画个草图,拍个照发给GPT-4,说一声「给我按照这种布局做个网站」,它立马就写出了网页代码。
老板Greg Brockman亲自上线演示
不过随后,多模态似乎昙花一现,再也没人见过产品化的实体功用。
所以,谷歌和OpenAI的多模态大战,总算要来了吗?
面临传闻中谷歌要击杀自己的这款大杀器,OpenAI当然不会无动于衷。
据外媒The Information爆料,一款名为Gobi的全新多模态大模型,已经在紧锣密鼓地预备了。
OpenAI方案,在Gemini发布之前就推出多模态LLM,完全打败谷歌。
其实,在3月份推出GPT-4多模态功用的预览后,OpenAI已经向一家名为Be My Eyes的公司推出了这项功用,但并没有向其他公司供给。
从名字就可以看出来,这家公司在研发让盲人或视力欠安人群看得更清楚的技术。
最近,OpenAI打算更广泛地推出名为GPT-Vision的功用。
OpenAI为什么花了这么长期?
最主要的原因,是他们担心新的视觉功用会被不法分子利用,比方经过主动破解验证码来假充人类,或许经过面部识别来追踪人类。
不过,对于这些法律上的安全风险,OpenAI的工程师们似乎已经解决了。
同样,一位谷歌发言人也表示:谷歌已经采取了一些办法,防止Gemini被滥用。
在7月做出的许诺中,谷歌确保会在一切产品中开发负责任的人工智能。