Google AI模型Bard迎更新:新增Googleit按钮,数学逻辑能力得到升级

新知榜官方账号

2023-07-03 21:11:25

自从AI热潮以来,「突发」就成了我们标题的常客。昨天,来自Google的大语言生成类AI模型Bard又迎来更新,新增了「Googleit」按钮,增强了数学与逻辑能力,并发布了一个全新的功能更新公告板。发布以来就饱受争议的Bard,如今能在数理逻辑领域,与GPT-4一较高下吗? 为了让用户更方便的了解Bard更新变化,Google上线了experimentupdates(实验更新)界面,展示Bard的最新消息。相比其他厂商「提高系统稳定性,优化系统流畅度」的更新对联,Bard不仅告诉你更新了什么,还告诉你为什么更新。Google表示,这是为了让用户更快的进行测试、提供反馈。顺着更新公告往下看,「Googleit」是这次的第一个功能更新,当你问过Bard后,可以在答案下方看到「Googleit」的按钮,点击后Bard会生成几个相关主题,以便你使用Google进行更多元的搜索。这样一来,Google搜索就变成了Bard的补充,如果在未来,Bard完全替代前者我也不会感到意外。不过,Googleit在提取复杂问题的主题时准确性还不够高,比如在我询问奥数题时,Googleit的主题几乎没有价值。 最后,也是最大的更新,Bard的数学和逻辑能力得到了升级,以前一道123456*654321就开始乱说的大语言模型终于站起了身,开始实践「学好数理化,走遍网络都不怕」的道理。光说不练假把式,Bard的数理能力够不够强,我们给它出了20道题,看看它的表现如何。GPT-4出了20道题,Bard满分。我们用GPT-4整理了20道数学、逻辑类问题,用于测试Bard的数理能力。先不说对不对,Bard的反应速度着实很快,即使是加速后的GPT-3.5也不是它的对手。先来看看Bard的表现,Bard不仅完全答对了所有题目,还给出了详细的解题过程。ChatGPT的表现也不错,数学题全对,逻辑题只错了一个。我们也把同样的问题翻译成中文去提问了百度的文心一言和阿里的通义千问,10道数学题,通义千问仅对1题,文心一言则对了4题;10道逻辑判断,通义千问3题正确略胜一筹,文心一言2题正确屈居第二。不得不说,数理计算对大语言模型来说,门槛确实比较高。 从我们简短的测试来看,Bard的表现相比它刚发布时确实有了显著的提升,在回答问题的逻辑性和正确性上已经逐渐赶上了GPT-3.5。比ChatGPT表现更好的是,Bard在回答问题时还会加入引用信源,降低了编造事实的可能。目前Google对Bard的试用申请似乎放松了不少,只要申请加入Waitlist后再刷新几次界面,就能马上体验Bard。如果你的试用申请一直都没通过,也不用着急。Google的CEOSundarPichai最近在接受采访时透露,Google计划将Bard整合到搜索引擎中,以应对ChatGPT等聊天机器人带来的竞争压力和更为广泛的商业问题。未来Google应该会像Bing那样开放一个聊天搜索界面,直接在搜索引擎就能调用Bard。目前Google并没有给出明确的时间表,也许在5月10日召开的GoogleI/O2023大会上会透露出更多的信息。AI不会画手、AI不会做数学题,这些问题已经慢慢成为了历史,那么问题来了,AI的下一个突破点,又会在哪里呢?

本页网址:https://www.xinzhibang.net/article_detail-5047.html

寻求报道,请 点击这里 微信扫码咨询

关键词

Google AI Bard 更新 Googleit 数学 逻辑

分享至微信: 微信扫码阅读

相关工具

相关文章