百度文心一言正式向公众开放,大模型迭代升级预示AI时代操作系统的到来

新知榜官方账号

2023-09-01 02:23:09

8月31日凌晨,百度宣布文心一言首批获批上线,正式向公众开放服务。目前用户已经可以在AppStore(免费榜第一)、官网下载/体验,无需申请内测资格即可使用。大模型获批,意味着文心一言将向所有用户全面开放,并在用户积累、数据获取和产品迭代上占有优势。

李彦宏的表态也直截了当,当文心一言向数以亿计互联网用户大规模开放服务后,能够获得大量真实世界中的人工反馈,这将进一步改进基础模型,并以更快速度迭代文心一言,创造更好的用户体验。与此同时,大模型也将逐渐从参数之争演变到以AI应用和产业落地为主的生态之争。

而百度此前启动的大模型领域首个创业大赛,据悉将在10月17日宣布结果。据称百度内部对此非常重视,李彦宏甚至直接过问并指挥百度战投与参赛者接洽,对优秀产品给予资源和资金支持。受开放消息提振,百度今夜凌晨美股盘中一度涨超5%。给予资本市场信心的一方面是文心一言的开放,另一方面也有此前被视为文心一言直接竞对的阿里通义千问、360智脑、讯飞星火等均不在首批获批名单中。某种程度上,这是对百度和文心一言的认可,但同时也是一种鞭策。

从模型来看,文心一言是高度本土化的大语言模型,更加匹配中文环境的使用习惯,作为百度基本盘的搜索业务,不仅能够提供巨大的基础数据,而且在中文搜索上具有显著优势。甚至此前,在AGIEval、C-Eval等中英文权威测试集和MMLU英文权威测试集中,文心大模型3.5取得了超过ChatGPT和LLaMa、ChatGLM等其他大模型的分数表现,在中文评测中甚至有超越GPT-4的表现。

百度布局AI最早可追溯到2010年,在移动互联网和智能手机尚未普及的年代布局AI,没有点魄力和前瞻性真的不行。那么这么多年持续性的投入又给百度带来了什么呢?表层上我们看到的是大模型、智能云等产品,而本质上百度其实构建了一个围绕技术迭代不断创新的周期穿越能力。这种能力在其它科技巨头身上也有,比如亚马逊的长期主义、微软坚定不移的投资OpenAI,相较下来靠为大模型提供弹药从而股价暴涨的英伟达多少有些躺赚的意思了。

而百度这种能力的的具象表现,可以用其改变和引领的四层技术栈变革举例:芯片层、框架层、模型层和应用层,百度针对每一层都都有领先业界的关键自研技术。在芯片层有昆仑芯、在框架层有飞桨、在模型层是文心大模型、在应用层是搜索等等。并且这些产品或技术仍在不断迭代进化,以文心一言为例,根据官方数据,自3月发布以来,文心一言熟练掌握的创作体裁超过200个,内容丰富度是发布初期的1.6倍,思维链长度是初期的2.1倍,知识点覆盖达到初期的8.3倍。

远方:真正的“飞轮”关于文心一言向公众开放,其实背后的产业逻辑仍旧是时间成本问题。大模型与大模型之间的差异,如果去除设备、数据等不同因素,最主要的差异就在训练的时间成本不同。而在向公众开放这件事上也是如此,大语言模型LLM特点是Generativepre-training(生成性预训练),其目标是根据现有数据提高模型生成新且准确信息的能力。这种方法包括两个主要步骤:预训练和微调。预训练阶段使用大量未标注数据训练模型的生成能力,通常采用自监督学习技术,模型尝试预测数据中的缺失信息或关系;微调阶段则针对特定任务或数据集进行调整。而越早开放,意味着大模型能够学习更多,产品进步迭代也会更快。例如,从GPT-3.5到GPT-4的迭代时间只用了三个月。

百度要做第一个把全部产品重做一遍的公司,不是整合,不是接入,是重做,重构。这是整个业界都非常期待的,特别是其中一点,“不是整合,不是接入,是重做,重构”。从这点来看,百度应该是有过思考的,这个思路和AI原生所表达的一样。以往的AI产品更多的是整合或接入,即用AI来改造现有系统,期待现有系统有一定的智能水平。但AI原生不是这样,是需要在产品设计中就考虑每一个组件都直接或间接来使用AI,来实现数据和知识的驱动。如果没有重做或重构,是无法实现的。比如OpenAI正考虑为AI软件创建一个应用商店,以及估值超2亿美元的DoNotPay这样的应用已经展现出繁荣的趋势。

好消息是,百度将在BaiduWorld2023上发布多款AI原生应用,并分享如何通过AI原生思维与产业界实现共赢。而且,为加速实现大模型在产业端的应用落地,挖掘国内AI原生的产品,百度也已经宣布将举办大模型领域首个创业大赛,将以百度全栈式技术优势加持,同时设立基金规模10亿元的文心投资基金,致力于推动大模型赋能千行百业。

本页网址:https://www.xinzhibang.net/article_detail-10705.html

寻求报道,请 点击这里 微信扫码咨询

相关工具

相关文章

相关快讯