百度文心一言发布会后股价暴跌,实测表现如何?

新知榜官方账号

2023-10-22 22:32:25

背景

虽然OpenAI在前一天发布GPT-4抢走了不少热度、带来一些压力,但百度并未改变原计划,在上周四如期推出了大型语言模型、生成式AI产品“文心一言”。把时间拨回到发布会召开那一刻。当文心一言顶着“国内第一个”的光环亮相后,百度CEO李彦宏坦承,文心一言对标ChatGPT甚至是GPT-4,门槛还是很高的,“我自己测试感觉还是有很多不完美的地方”。或许是这样的表态,以及李彦宏在现场用录屏展示的操作,影响了资本市场的信心。在发布会最关键的时刻,百度股价却出现短线急跌。但随着“文心一言”逐步放开体验,以及百度对外释放“申请测试企业破9万”等信息,资本市场的态度开始分化甚至反转。上周五,百度股价大涨14%。随着新的一周到来,百度股价今天(3月20日)延续涨势,早盘高开3%,收盘涨幅收窄至1%左右,相关概念股也随之拉升。百度股价走势在发布会上,“文心一言”展示了文学创作等五方面功能。但由于现场是视频演示,被部分网友调侃为“ChatPPT”。在真实场景中,文心一言的水平到底如何?实力能否对标ChatGPT?

实测表现

从实测来看,文心一言的表现确实“算不上完美”、“进步空间很大”,甚至有时候还会胡说八道,但强如GPT-4也不能完全避免这些问题。文心一言的表现没有想象中的那么差,甚至在部分场景中有些出人意料。随着公测逐步放开,反馈越来越多,文心一言这类大模型的水平可能会进一步提高。

在文学创作方面,文心一言的表现乏善可陈,只能说是以诗歌的格式输出了几句话。在商业文案创作和生成新闻稿方面,文心一言的表现可圈可点,准确理解了指令要求和人物角色。在数理逻辑推算方面,文心一言还有很大进步空间,如果问题表达的不够清晰,文心一言很容易给出错误答案。在中文理解方面,文心一言表现不错,但在一些问题上,它也会胡说八道。在多模态生成方面,文心一言表现中规中矩,基本上理解了指令要求。

与ChatGPT等其它模型对比

人们之所以关注文心一言,最主要的原因就是ChatGPT的爆火。作为首个“中国版ChatGPT”,文心一言在与真正的ChatGPT同台竞技时,表现也有优劣之分。但从以上实测问题来看,备受吹捧的ChatGPT并不是一个“全能战士”,吸引了诸多眼球的“文心一言”也不能令人完全满意。二者都会出现“一本正经胡说八道”的情况。但它们的表现也都没有想象中的那么差,甚至在部分场景中会让人眼前一亮。

结论

随着公测逐步放开,反馈越来越多,文心一言这类大模型的水平可能会进一步提高。人工智能及其衍生的AIGC十分重要,无论国内做得如何,都得先有一个产品出来。通用人工智能的实现不可能“一蹴而就”,或许经过更多数据的训练和用户的“再教育”,ChatGPT和文心一言这类大模型才会表现的更好。在市场上,百度股价在发布会后暴跌,但随着公测逐步放开,反馈越来越多,股价也开始反转。市场观点认为,文心一言不需要碾压ChatGPT,只要能做到超过及格线,就很不错了,毕竟这才是第一代产品。

(题图由文心一言生成)

本页网址:https://www.xinzhibang.net/article_detail-17637.html

寻求报道,请 点击这里 微信扫码咨询

关键词

百度 文心一言 ChatGPT 语言模型 人工智能 实测

分享至微信: 微信扫码阅读

相关工具

相关文章

相关快讯