新知榜官方账号
2023-12-04 02:51:24
最近AI真是火得没边了。OpenAI靠着ChatGPT实力吸睛,Google带着Bard紧随其后,就在昨天,GPT-4模型又抢尽风头。你方唱罢我登场的AI领域,今天,轮到了百度了。就在今天下午,备受期待的百度文心一言如期而至。不过在发布会一开场,百度CEO李彦宏先给大家打了一剂预防针:从某种意义上说百度为此(发布文心一言)已经准备了多年,我们十几年前就开始投入AI研究,2019年就推出了文心大语言模型,今天的文心一言是过去多年努力的延续。但也不能说我们完全ready了,文心一言要对标ChatGPT、甚至是对标GPT-4的门槛是很高的,全球大厂还没有一个做出来的,百度是第一个。我自己测试感觉还是有很多不完美的地方。
姗姗来迟的文心一言表现如何?和ChatGPT的差距有多少?能满足市场对中文大语言模型的需求吗?我们对它做了一次全方位解析。新一代大语言模型、生成式AI产品文心一言,能做什么?五大要点:文学创作;商业文案的创作;数理逻辑的推算;中文的理解;多模态生成。针对这五大场景,李彦宏分别进行了演示。值得一提的是,这些演示并非现场操作,而是录播。
首先是文心一言的文学创作能力,李彦宏连续对文心一言提出了与《三体》相关的若干问题。首先从演示视频看来,文心一言的回答速度很快,比ChatGPT快很多,另外出来的内容都挺不错的,后面我们也会把相同的问题扔给ChatGPT和必应Chat,看看三者之间的区别。
针对商业文案创作,李彦宏向文心一言提问:如果要成立一个用大模型服务中小企业数字化升级的科技服务公司,可以起个什么公司名?以下是它的问答。
在数理逻辑推演环节,百度问了个鸡兔同笼的问题,文心一言先是发现了题目出错,后来换了个题目,它就能准确回答出来。文心一言发布前,已经有人猜测这个语言模型会比OpenAI、Google、微软做得更好,因此百度也在这部分炫了个技,文心一言不仅准确回答了成语「洛阳纸贵」的含义,还对背后的金融现象进行了解释,最后还用这个成语写了首藏头诗。李彦宏在现场也提到,中文是文心一言的优势,反过来说,对英文素材的解析则成了它的劣势。
中文理解方面,文心一言的优势就体现出来了。在询问「当时洛阳的纸到底有多贵」时,ChatGPT误以为我询问的是唐代的物价,告诉我洛阳的纸一点都不贵,BingChat识别上没有问题,但也没有给出准确数据。而文心一言给出两三千文的价格,至少与我搜索得到的数据是一致的。相信你也注意到了,且不说写的内容如何,ChatGPT和BingChat都没有理解什么是藏头诗,相比下来,百度文心一言的表现确实出色。
最后介绍了文心一言的多模态生成能力,画图、写长文、根据文字生成短视频内容,它都一一完成,这是ChatGPT所不具备的能力。还能用生成方言语音。李彦宏还提到,百家号已经在利用文心一言的多模态生成能力,把文字内容视频化。
在这之前,我们把会上演示的几个场景,分别喂给了ChatGPT(3.5版)和BingChat,看看他们输出的结果如何。对比ChatGPT&BingChat,文心一言体验如何?先说结论:文心一言在中文领域的表现,确实要优于ChatGPT、BingChat这两个前辈。不论是ChatGPT还是BingChat,它们在做数学题时并不能让我们完全放心,不过百度发布会中提到的鸡兔同笼问题并没有难倒二者,均准确的做出了解答。
相比之下,我更喜欢BingChat的解读,它更像是一位循循善诱的老师,而文心一言的回答则有点像课后的参考答案。脚踏实地,仰望星空毫无疑问,文心一言的发布对于中文互联网来说是个标志性的事件。获得测试机会后,我们会第一时间体验文心一言,表现如何到时再见分晓。
相关工具
相关文章
相关快讯
推荐
用Deepseek写AI绘图提示词,像呼吸一样简单!
2025-02-19 16:12
你以为AI绘画是黑科技?其实早成了“路边摊生意”!
2025-02-19 10:15
Flux爆火,全网最全面最详细的Flux使用教程!
2025-02-18 14:19
用AI如何创作音乐,实战教学来啦!
2025-02-17 17:23
MidJourney让你秒变绘画大神,从零开始画哪吒!
2025-02-17 14:56
AI应用新境界:让人工智能成为你的得力助手
2025-02-14 15:45
AI短片革命:当创作遇上智能,人人都能成为导演
2025-02-14 14:53
AI狂潮下的人类职场:是失业危机还是进化契机?
2025-02-13 16:53
开启影视创作新纪元,效率提升 10 倍的神器来了!
2025-02-13 15:11
深度解析DeepSeek:当AI技术照进创作产业的未来
2025-02-12 17:16