百度文心一言发布:五大能力全面解析

新知榜官方账号

2023-12-04 02:51:24

百度文心一言发布:五大能力全面解析

最近AI真是火得没边了。OpenAI靠着ChatGPT实力吸睛,Google带着Bard紧随其后,就在昨天,GPT-4模型又抢尽风头。你方唱罢我登场的AI领域,今天,轮到了百度了。就在今天下午,备受期待的百度文心一言如期而至。不过在发布会一开场,百度CEO李彦宏先给大家打了一剂预防针:从某种意义上说百度为此(发布文心一言)已经准备了多年,我们十几年前就开始投入AI研究,2019年就推出了文心大语言模型,今天的文心一言是过去多年努力的延续。但也不能说我们完全ready了,文心一言要对标ChatGPT、甚至是对标GPT-4的门槛是很高的,全球大厂还没有一个做出来的,百度是第一个。我自己测试感觉还是有很多不完美的地方。

姗姗来迟的文心一言表现如何?和ChatGPT的差距有多少?能满足市场对中文大语言模型的需求吗?我们对它做了一次全方位解析。新一代大语言模型、生成式AI产品文心一言,能做什么?五大要点:文学创作;商业文案的创作;数理逻辑的推算;中文的理解;多模态生成。针对这五大场景,李彦宏分别进行了演示。值得一提的是,这些演示并非现场操作,而是录播。

文学创作

首先是文心一言的文学创作能力,李彦宏连续对文心一言提出了与《三体》相关的若干问题。首先从演示视频看来,文心一言的回答速度很快,比ChatGPT快很多,另外出来的内容都挺不错的,后面我们也会把相同的问题扔给ChatGPT和必应Chat,看看三者之间的区别。

商业文案创作

针对商业文案创作,李彦宏向文心一言提问:如果要成立一个用大模型服务中小企业数字化升级的科技服务公司,可以起个什么公司名?以下是它的问答。

数理逻辑的推算

在数理逻辑推演环节,百度问了个鸡兔同笼的问题,文心一言先是发现了题目出错,后来换了个题目,它就能准确回答出来。文心一言发布前,已经有人猜测这个语言模型会比OpenAI、Google、微软做得更好,因此百度也在这部分炫了个技,文心一言不仅准确回答了成语「洛阳纸贵」的含义,还对背后的金融现象进行了解释,最后还用这个成语写了首藏头诗。李彦宏在现场也提到,中文是文心一言的优势,反过来说,对英文素材的解析则成了它的劣势。

中文的理解

中文理解方面,文心一言的优势就体现出来了。在询问「当时洛阳的纸到底有多贵」时,ChatGPT误以为我询问的是唐代的物价,告诉我洛阳的纸一点都不贵,BingChat识别上没有问题,但也没有给出准确数据。而文心一言给出两三千文的价格,至少与我搜索得到的数据是一致的。相信你也注意到了,且不说写的内容如何,ChatGPT和BingChat都没有理解什么是藏头诗,相比下来,百度文心一言的表现确实出色。

多模态生成

最后介绍了文心一言的多模态生成能力,画图、写长文、根据文字生成短视频内容,它都一一完成,这是ChatGPT所不具备的能力。还能用生成方言语音。李彦宏还提到,百家号已经在利用文心一言的多模态生成能力,把文字内容视频化。

在这之前,我们把会上演示的几个场景,分别喂给了ChatGPT(3.5版)和BingChat,看看他们输出的结果如何。对比ChatGPT&BingChat,文心一言体验如何?先说结论:文心一言在中文领域的表现,确实要优于ChatGPT、BingChat这两个前辈。不论是ChatGPT还是BingChat,它们在做数学题时并不能让我们完全放心,不过百度发布会中提到的鸡兔同笼问题并没有难倒二者,均准确的做出了解答。

相比之下,我更喜欢BingChat的解读,它更像是一位循循善诱的老师,而文心一言的回答则有点像课后的参考答案。脚踏实地,仰望星空毫无疑问,文心一言的发布对于中文互联网来说是个标志性的事件。获得测试机会后,我们会第一时间体验文心一言,表现如何到时再见分晓。

本页网址:https://www.xinzhibang.net/article_detail-21923.html

寻求报道,请 点击这里 微信扫码咨询

关键词

百度 文心一言 AI 中文语言模型 多模态生成

分享至微信: 微信扫码阅读

相关工具

相关文章

相关快讯