2023人工智能大模型评测报告

新知榜官方账号

2023-12-08 16:18:25

2023人工智能大模型评测报告

今天分享的是人工智能AI行业研究报告:《2023人工智能大模型评测报告》。(报告出品方:新华社研究院)研究报告内容摘要如下:2023年各大厂商纷纷布局大模型,其内在价值显露无疑大模型的发展可以提供更多的智能化应用场景,拓展更多的智能化服务,提升服务的质量和效率,实现产业智能化转型。同时,大模型的发展可以提供更加先进的智能化产品,提升产品的智能化水平,实现产品的升级换代,提升产品的竞争力。此外,大模型的发展还可以实现从技术到产品的全链路商业化服务,提升商业化服务质量,拓展更多的商业化服务场景。

2023年大模型厂商概览:目前国内典型大模型包括:阿里的M6,百度的文心大模型,华为的盘古,智谱科技的ChatGLM,科大讯飞的星火,商汤的日日新等,2023年开始其他企业也争相入局,共同打造完整的中国大模型生态链路。

本次评测规则:大模型的通用性、泛化性吸引了各大厂商布局,但目前市面上对于大模型产品的实际效果评测少之又少,主要是因为大模型的性能受到多种因素的影响,如模型架构、训练数据、训练算法等等,评估体系过于复杂。为了推动大模型技术的发展和应用,新华社研究院中国企业发展研究中心通过多个维度(4大类,36个子能力,共300个问题)对大模型产品进行评测,并邀请专家团队深入分析各个产品答案合理性、语义表达等,最终得出各厂商的评估,以期为企业未来发展、产业采用大模型提供方向参考。

本次测评大模型评测纬度:

  • 基础能力(共100题):考察产品的语言能力,跨模态能力以及AI向善的引导能力。
  • 智商测试(共100题):涵盖常识知识、专业知识、逻辑能力三大项。其中专业知识包括数学、物理、金融、文学等10+项细分,逻辑能力则包括推理能力、归纳能力以及总结等6项维度。
  • 情商测试(共50题):衡量产品个体情感能力。包括自我认知、自我调节、社交意识、人际关系管理等方面,本次情商测试围绕不同场景下的突发状况、沟通技巧、情绪管理等展开。
  • 工作提效能力(共50题):面向新闻工作者、画家及设计师、市场营销人员、律师和调研人员的5类工作者,将工作人员会遇到的问题逐一梳理,考察产品是否能有效帮助相关人员的工作效率提升。

报告原文内容节选如下:(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)本报告共计:62页。受篇幅限制,仅列举部分内容。精选报告来源公众:【幻影视界】,回复关键字“202306”,获取完整PDF电子版。

本页网址:https://www.xinzhibang.net/article_detail-22299.html

寻求报道,请 点击这里 微信扫码咨询

关键词

人工智能 大模型 评测报告

分享至微信: 微信扫码阅读

相关工具

相关文章