阿里云发布千亿级参数大模型通义千问2.0,推出“云工开物”计划

新知榜官方账号

2023-11-08 02:40:32

阿里云发布千亿级参数大模型通义千问2.0

10月31日上午,2023云栖大会在杭州云栖小镇开幕。大会期间,阿里云正式发布千亿级参数大模型通义千问2.0,在10个权威测评中,通义千问2.0综合性能超过GPT-3.5,正在加速追赶GPT-4。

过去6个月,通义千问2.0在性能上取得巨大飞跃,相比4月发布的1.0版本,通义千问2.0在复杂指令理解、文学创作、通用数学、知识记忆、幻觉抵御等能力上均有显著提升。目前,通义千问的综合性能已经超过GPT-3.5,加速追赶GPT-4。

在MMLU、C-Eval、GSM8K、HumanEval、MATH等10个主流Benchmark测评集上,通义千问2.0的得分整体超越Meta的Llama-2-70B,相比OpenAI的Chat-3.5是九胜一负,相比GPT-4则是四胜六负,与GPT-4的差距进一步缩小。中英文理解能力是大语言模型的基本功。英语任务方面,通义千问2.0在MMLU基准的得分是82.5,仅次于GPT-4,通过大幅增加参数量,通义千问2.0能更好地理解和处理复杂的语言结构和概念;中文任务方面,通义千问2.0以明显优势在C-Eval基准获得最高得分,这是由于模型在训练中学习了更多中文语料,进一步强化了中文理解和表达能力。在数学推理、代码理解等领域,通义千问2.0进步明显。

在指令遵循、工具使用、精细化创作等方面作了技术优化,能够更好地被下游应用场景集成。通义大模型官网上线了多模态和插件功能,支持图片输入、文档解析等细分任务。与此同时,基于通义大模型训练的8大行业模型组团上线,他们分别是通义灵码-智能编码助手、通义智文-AI阅读助手、通义听悟-工作学习AI助手、通义星尘-个性化角色创作平台、通义点金-智能投研助手、通义晓蜜-智能客服、通义仁心-个人专属健康助手、通义法睿-AI法律顾问。8大行业模型面向当下最受欢迎的多个垂直场景,使用领域数据进行专门训练。用户可以在官网直接体验模型功能,开发者可以通过网页嵌入、API/SDK调用等方式,将模型能力集成到自己的大模型应用和服务中。

阿里云推出“云工开物”计划

当天,阿里云还发布了向所有大学生免费提供云服务器的“云工开物”计划。所有中国高校在读的大学生,不限专业,凭借学信网认证,每年都可以在阿里云“云工开物”计划官网上(https://university.aliyun.com/)免费领取价值300元的云产品,比如一款2核2G的ECS服务器,外加500G的存储容量,可以轻松应对建站、web应用、计算机学习实践等应用场景。此外,“云工开物”计划还将为签约高校师生提供更大规模的算力资源支持,助力中国青年学者和学子云上探索、攀登科研高峰。目前,清华大学、北京大学、浙江大学、上海交通大学、中国科学技术大学、华南理工大学等首批高校已与阿里云达成合作。

本页网址:https://www.xinzhibang.net/article_detail-19272.html

寻求报道,请 点击这里 微信扫码咨询

关键词

阿里云 通义千问2.0 GPT-4 云工开物

分享至微信: 微信扫码阅读

相关工具

相关文章