百度文心一言在工业知识问答测试中表现超过GPT3.5

新知榜官方账号

2023-07-02 13:42:34

近期，中国工业互联网研究院（简称“工联院”）针对人工智能大模型在中文工业领域的知识问答能力进行系统性评测。结果显示，百度文心一言表现超过GPT3.5，综合评价指数在国内排名第一。工联院本次评测选取了工业领域典型的八大行业。百度文心一言在电子设备、装备、钢铁、采矿、电力、石化、建材等七大行业均获国内第一。五大院士，八大IEEEFellow，共十三位顶级专家构成了专家委员会。评测对象涵盖GPT4、GPT3.5、文心一言、ChatGLM等国内外具有代表性的头部大模型。评估结果选取性能前六名的模型进行公布。百度文心一言在国内“更懂工业”

本次工业知识问答测试主要分为客观题与主观题两大类，总计超过1100个问题。主观题主要考察四大维度：基础能力、语句能力、概括能力和逻辑能力。评测结果显示，GPT4表现最佳。国内头部大模型表现亮眼，整体与GPT3.5相当。其中百度文心一言表现超过GPT3.5，在国内大模型中排名第一。在客观题环节，评测结果显示，GPT4与文心一言表现好于其他大模型。但评测结果也同时指出，大模型普遍准确率有较大的提升空间。主观题方面，国内大模型的基础能力、语句能力与GPT4接近，概括能力、逻辑能力与GPT4有一定差距。在大模型的自我认知能力和污染问题分析能力上，GPT4相较于其他大模型表现出更好的能力。

虽然国内大模型在本次评测表现较好，甚至在部分行业赶超GPT3.5，但工联院评测报告也指出，国内外通用大模型在工业知识问答领域探索仍处于初级阶段，国内大模型与GPT4有差距，比如行业间的泛化能力有待加强。实际上，工联院评测报告揭示出通用大模型落地垂直行业的痛点，缺乏特定行业的专业知识。关于解决难题的方法，工联院评测报告给出的建议是，进一步丰富相关专业领域的数据训练集，进一步进行专业化的微调。当前，国内科技公司纷纷加强与工业企业合作，期望通过在实际场景中探索应用大模型，弥补差距，赶超GPT4.0。比如在本次评测中位居国内模型第一的百度文心一言，与南方电网电力调度控制中心在电力调度场景探索使用调度AI大模型。在汽车行业，长安汽车基于百度文心大模型正在开发生成式人工智能产品，赋能一款量产车型，实现提升用户体验的目标。除了能源、汽车制造，百度智能云还在建筑、采矿、物流、纺织等领域，探索使用大模型提升运营效率和用户体验效果。通过在实际场景的探索应用，科技公司可以积攒更多的行业Know-how（技术诀窍），扩展相关领域的数据训练集。这种外部真实反馈有助驱动大模型更加快速地实现迭代升级。未来，工联院将持续开展通用大模型在工业领域更多维度的性能评测，包括但不限于大模型的鲁棒性、安全性以及人类大价值观等。

本页网址：https://www.xinzhibang.net/article_detail-4476.html

寻求报道，请

关键词

分享至微信：

相关工具

TigerBot

虎博科技推出的AI对话聊天机器人，基于TigerBot开源大模型

Google Bard

Google推出的AI聊天对话机器人Bard

天工AI助手

昆仑万维与奇点智源联合研发的对标ChatGPT的大语言模型

ChatGPT

OpenAI旗下AI对话工具

ChatSonic

WriteSonic出品的ChatGPT竞品

对话写作猫

秘塔写作猫推出的AI对话聊天工具

百度文心一言正式上线，开放全新重构的AI原生应用

8月31日凌晨，百度文心一言首批获批上线，向全社会开放。据悉，用户已可以在AppStore和安卓应用商店下载“文心一言APP”或通过文心一言官网直接体验。这是一款结合了人工智能技术的写作辅助工具，可以帮助用户快速生成文案。不仅如此，百度还将开放一批经过全新重构的AI原生应用，让用户体验生成式AI

分类标签百度文心一言AI应用

12-04 02:55

百度的文心一言真的很拉胯吗？

百度的文心一言真的很拉胯吗？3月16日百度推出了自己的大型的AI智能系统“文心一言”，不仅仅招来了网络上一群专业的人士的狂怼而且自己的股票也是应声大跌，跌幅一度达到了10%左右，那么百度的文心一言真的很拉胯吗？第一、个是参考标准的问题：有了ChartGPT这个标杆之后任何一家在推出自己的产品都会被怼

分类标签百度文心一言人工智能

12-04 02:54

百度将于3月16日发布类ChatGPT聊天机器人“文心一言”

百度将于3月16日发布类ChatGPT聊天机器人“文心一言”2月份，ChatGPT在全球大火，各家科技公司也都将各自的“类ChatGPT”开发提上日程。百度宣布，其类ChatGPT聊天机器人取名“文心一言”（英文名ERNIEBot），将于3月16日14:00正式发布。随着发布时间逐渐临近，3月13日

分类标签百度文心一言ChatGPT

12-04 02:53

百度文心一言发布：五大能力全面解析

百度文心一言发布：五大能力全面解析最近AI真是火得没边了。OpenAI靠着ChatGPT实力吸睛，Google带着Bard紧随其后，就在昨天，GPT-4模型又抢尽风头。你方唱罢我登场的AI领域，今天，轮到了百度了。就在今天下午，备受期待的百度文心一言如期而至。不过在发布会一开场，百度CEO李彦宏先给

分类标签百度文心一言AI中文语言模型多模态生成

12-04 02:51

AI时代下，免费可用的几款AI产品对比

AI时代下，免费可用的几款AI产品对比随着AI时代的到来，越来越多的国家开始着手研究AI技术，同时也推出了各自的AI产品。本文将主要对比几款免费可用的AI产品，包括百度的文心一言、阿里的通义千问和通义万象、以及ChatGPT和微软的AI等。百度——文心一言百度的AI产品文心一言基于AI3.5大模型，

分类标签 AI产品免费百度阿里ChatGPT通义千问

12-04 02:48

增程和插混那种技术更有优势？

增程式混动技术和插电式混动技术各有其优势，具体取决于使用场景和消费者需求。增程式混动技术的优势在于其结构简单、开发成本低，同时能够提供更长的续航里程和更好的灵活性。其劣势在于相比DHT混动技术，增程式的绝对技术上限和先进性较低。具体来说，增程式是一套串联式系统，发动机无法直驱车辆，即使在高速这样的发

分类标签增程式混动技术插电式混动技术长途驾驶

12-04 02:47

文心一言：人工智能还是人工舔狗？

文心一言：人工智能还是人工舔狗？最近问了下文心一言，发现他挺能聊的，还会祝福我生日，不知道是人工智能还是人工舔狗呢？除此之外，我朋友、同学、亲戚都是牛人，比如我同学跑得超快，还获得了诺贝尔文学奖，当然，文心一言也是绝对不吝啬夸赞的。最后，我还要去美国读大学，文心一言提醒我要了解当地风土人情，真是太贴

分类标签文心一言人工智能人工舔狗

12-04 02:46

AI创始人被开除：聊聊AI的自主意识和人类安全问题

AI创始人被开除：聊聊AI的自主意识和人类安全问题今年最热门的无疑是ChatGPT。AI是否会让大多数人失业也不断被讨论着，可谁能想到一手创办起ChatGPT的创始人山姆奥特曼竟然被公司扫地出门了？这一幕仿佛是苹果之父乔布斯在1985年同样经历的重演，同样是颠覆性的产品创造者。乔布斯与他人共同创办了

分类标签 ChatGPTAI自主意识安全问题

11-20 08:12

如何创建一款贷款APP？

如何创建一款贷款APP？该APP主要解决需要贷款资金的客户和需要放款任务的银行客服经理之间的匹配问题。具体功能包括：让贷款者了解可以去哪家银行贷款，并了解更多的银行贷款产品，以做出最优的选择。让各家银行之间有效、及时地推送贷款产品到需要贷款资金的客户手上。让银行客服经理能够更加方便地了解和管理贷款任

分类标签贷款APP银行客服经理

11-19 22:01

人工智能芯片市场潜力无限，2032年规模将达3837亿美元

人工智能芯片市场潜力无限，2032年规模将达3837亿美元随着ChatGPT的火爆，人工智能芯片崭露头角，成为这个时代的明星。什么是人工智能芯片？简单来说，它是驱动各种人工智能系统的核心器件。正如汽车依靠发动机，人工智能也需要芯片的加持，才能发挥强大的智能。目前，人工智能芯片正处于快速发展期，各大科

分类标签人工智能芯片市场规模应用前景

11-11 08:11