阿里云发布通义千问2.0,综合性能超过GPT-3.5

新知榜官方账号

2023-11-08 02:39:14

阿里云发布通义千问2.0,综合性能超过GPT-3.5

阿里云在杭州正式发布了通义千问2.0,该模型拥有千亿级参数,综合性能超过GPT-3.5,正在加速追赶GPT-4。阿里云CTO周靖人透露,通义千问的APP版本在各大手机应用市场正式上线,所有人都可通过APP直接体验。大模型是本轮AI浪潮的核心技术,基础模型的质量很大程度决定了AI产业化的前景。

通义千问2.0在性能上取得巨大飞跃,相比4月发布的1.0版本,在复杂指令理解、文学创作、通用数学、知识记忆、幻觉抵御等能力上均有显著提升。在具体能力方面,中英文理解、数学计算、代码推理能力是大语言模型的基本功。以英语任务为例,通义千问2.0在MMLU基准中仅次于GPT-4,在HumanEval测试中,其得分也紧跟GPT-4和GPT-3.5。

模型能力的提升,也带来了市场需求的扩容,千行百业都想借助大模型实现生产和服务方式的变革。类似于文心大模型4.0推出后上线了十余款原生应用,星火大模型升级至3.0版本后,新增了虚拟人格、心理健康等功能,更多的通用大模型也在垂直场景深化布局。通义大模型2.0也同步训练了包括编码、阅读、研投等垂类大行业模型。

开发者可以通过网页嵌入、API/SDK调用等方式,这些模型能力集成到自己的大模型应用和服务中。周靖人表示,随着大模型技术与云计算本身的融合,未来的云可以像车一样也能够自动驾驶,大幅提升开发者使用云的体验。云计算就是一台超级计算机,可高效连接异构计算资源,突破单一性能芯片瓶颈,协同完成大规模智能计算任务,携手千行百业推动AI创新,共享技术红利。

本页网址:https://www.xinzhibang.net/article_detail-19271.html

寻求报道,请 点击这里 微信扫码咨询

关键词

阿里云 通义千问2.0 大模型

分享至微信: 微信扫码阅读

相关工具

相关文章