新知榜官方账号
2023-08-04 16:30:53
在这场国内大模型的“百模大战”中,开源生态正在日趋活跃。8月3日,AI模型社区魔搭ModelScope上架两款开源模型——Qwen-7B和Qwen-7B-Chat,阿里云已确认其为通义千问70亿参数通用模型和对话模型,两款模型目前均开源、免费、可商用。至此,阿里云称已经成为国内首个开源自家大模型的大型科技企业。
具体到参数上,Qwen-7B基座模型支持中、英等多种语言,在超过2万亿token数据集上训练,上下文窗口长度达到8k。开源代码支持对Qwen-7B和Qwen-7B-Chat的量化,用户可以在消费级显卡上部署和运行模型。用户既可从魔搭社区直接下载模型,也可通过阿里云灵积平台访问和调用Qwen-7B和Qwen-7B-Chat,阿里云包括模型训练、推理、部署、精调等在内的全方位服务。
开源是追赶已有闭源模型的有效道路。但如今在海外,Meta旗下的Llama2在上个月开源,免费也可商用,一经推出,就被视作最强开源大模型。而在国内,百川智能发布的Baichuan-7B、清华大学和智谱AI发布的ChatGLM2-6B等开源大模型,也是AI初创企业中无法忽视的力量。这些开源动作无疑影响了大厂——此前,国内大厂普遍选择不开源。如今,阿里通义千问的开源,无疑是意味着大厂大模型思路的一场转变。
其实,阿里云的开源战略早有端倪,为通义千问的开源做出了铺垫。此次上架通义千问开源模型的魔搭ModelScope,是阿里云于去年11月初牵头发起的AI模型社区。目前,魔搭聚集了20多家人工智能机构贡献的1000多款开源模型,开发者数量超160万,模型下载量超2500万。在今年6月举行的2023开放原子全球开源峰会上,阿里云还公布了“1+4”开源战略。除魔搭社区外,阿里云还将聚焦操作系统、云原生、数据库、大数据等四大开源领域。
开源的同时,阿里云也公布了通义千问7B预训练模型在多个权威基准测评中的表现。在英文能力测评基准MMLU上,通义千问7B模型得分超过一众7B、12B、13B主流开源模型。在中文常识能力测评基准C-Eval上,通义千问在验证集和测试集中也都是得分最高的7B开源模型。在数学解题能力评测GSM8K、代码能力评测HumanEval上分别得分51.6、24.4,超过所有同等尺寸和部分大尺寸开源模型。
附开源地址:
相关工具
相关文章
推荐
用Deepseek写AI绘图提示词,像呼吸一样简单!
2025-02-19 16:12
你以为AI绘画是黑科技?其实早成了“路边摊生意”!
2025-02-19 10:15
Flux爆火,全网最全面最详细的Flux使用教程!
2025-02-18 14:19
用AI如何创作音乐,实战教学来啦!
2025-02-17 17:23
MidJourney让你秒变绘画大神,从零开始画哪吒!
2025-02-17 14:56
AI应用新境界:让人工智能成为你的得力助手
2025-02-14 15:45
AI短片革命:当创作遇上智能,人人都能成为导演
2025-02-14 14:53
AI狂潮下的人类职场:是失业危机还是进化契机?
2025-02-13 16:53
开启影视创作新纪元,效率提升 10 倍的神器来了!
2025-02-13 15:11
深度解析DeepSeek:当AI技术照进创作产业的未来
2025-02-12 17:16