欢迎来到合肥浪讯网络科技有限公司官网
  咨询服务热线:400-099-8848

曝OpenAI大模型新进展!将推出多模态大模型,新项目Gobi筹备中

发布时间:2023-09-20 文章来源:本站  浏览次数:1218

9月19日音讯,据The Information报导,OpenAI意图赶在谷歌推出多模态大言语模型Gemini前,发布其多模态大言语模型GPT-Vision。然后,OpenAI或许会推出一个更强大的多模态大模型,代号为Gobi。

本年3月OpenAI发布的GPT-4现已融入了部分多模态功用,相较于GPT-3.5只能接受文本输入,GPT-4还能够接受图画输入,但该视觉输入功用并不敞开运用。而Gobi与GPT-4不同,Gobi从一开端就是按多模态模型构建的,能够接受更多类型的信息输入并做出相应的处理。

OpenAI与谷歌将多模态功用纳入大言语模型,能够将图画、文字、音频等不同形式的数据整合起来,让大言语模型更准确、更全面地处理用户所给信息,为用户供给便利。据The Information报导,OpenAI与谷歌的多模态大言语模型之争,就像AI范畴的苹果与安卓之争。这或许预示着AI大模型范畴未来的开展趋势,一起也是OpenAI与谷歌抢占这项新技能的首发先机,提高用户影响力和技能引领地位的重要比赛。

一、Gobi VS Gemini,OpenAI与谷歌多模态大言语模型赛跑

此前有报导称,谷歌即将推出Gemini,而且现已向一小批外部公司共享了这个项目。但据知情人士泄漏,OpenAI正在争分夺秒地把公司先进的GPT-4与多模态功用相结合,想要抢在谷歌之前发布Gobi。而且,OpenAI在本年3月发布GPT-4时,就对GPT-4中融入的多模态功用进行了预展现。不过,依据The Information报导,OpenAI还没有开端训练Gobi,因此现在还不知道Gobi终究能否成为GPT-5。

关于OpenAI能否在多模态大言语模型方面超越谷歌,据The Information报导,目前,谷歌具有来自谷歌搜索引擎和YouTube等平台的文本、图画、音频、视频等专有数据,这是谷歌相较于OpenAI开展多模态大言语模型的一项特别优势。而且一位运用过Gemini前期版本的人士说,与现有的各种大言语模型相比,Gemini产生的过错答案似乎更少。

二、多模态功用肩负重任,被乱用的信息安全问题值得注重

在3月发布GPT-4预览多模态功用时,除了为盲人或低视力者开发技能的Be My Eyes公司,OpenAI没有给其它公司供给多模态功用。到现在,OpenAI才预备在更大范围内推出被称为GPT-Vision的功用。据The Information报导,OpenAI或许会在GPT-Vision之后再推出Gobi。

依据The Information报导,OpenAI之所以消耗很多时刻来推出Gobi,主要是忧虑新的视觉功用会被坏人利用,例如经过自动解决验证码来冒充人类,或许经过人脸辨认追寻人们。但现在,OpenAI的工程师们似乎想到办法来缓解这个安全问题了。

谷歌的Gemini也面临相同的问题,当谷歌被问到采取了哪些办法防止Gemini被乱用时,谷歌的一位讲话人称,谷歌在7月份做出过一系列承诺,以确保对其所有产品进行负责任的AI开发。

结语:多模态大模型之争或成下个AIGC焦点

多模态功用正被不断融入大言语模型,以提巨大言语模型剖析的精准度。如今,因ChatGPT名声大噪的OpenAI与AI老牌公司谷歌都致力于开发多模态大言语模型,可见其或许将成为AI大模型开展的未来趋势。

据The Information报导,这场OpenAI与谷歌的比赛类似于AI版的苹果与安卓之争,而未来Gobi与Gemini的到来,将提醒OpenAI和谷歌的比赛成果。

多模态大模型作为当时AI大模型范畴的新进展,OpenAI与谷歌之间的多模态大模型之争不仅是科技竞争的焦点,也或许引发全球范围内关于技能应用、协作、监管和道德等方面的重要评论。

上一条:波兰一公司延聘人工智能机...

下一条:Trickle:使用GP...