阿里云在百模大战中开源自家大模型

新知榜官方账号

2023-08-04 16:30:53

阿里云在百模大战中开源自家大模型

在这场国内大模型的“百模大战”中，开源生态正在日趋活跃。8月3日，AI模型社区魔搭ModelScope上架两款开源模型——Qwen-7B和Qwen-7B-Chat，阿里云已确认其为通义千问70亿参数通用模型和对话模型，两款模型目前均开源、免费、可商用。至此，阿里云称已经成为国内首个开源自家大模型的大型科技企业。

具体到参数上，Qwen-7B基座模型支持中、英等多种语言，在超过2万亿token数据集上训练，上下文窗口长度达到8k。开源代码支持对Qwen-7B和Qwen-7B-Chat的量化，用户可以在消费级显卡上部署和运行模型。用户既可从魔搭社区直接下载模型，也可通过阿里云灵积平台访问和调用Qwen-7B和Qwen-7B-Chat，阿里云包括模型训练、推理、部署、精调等在内的全方位服务。

开源是追赶已有闭源模型的有效道路。但如今在海外，Meta旗下的Llama2在上个月开源，免费也可商用，一经推出，就被视作最强开源大模型。而在国内，百川智能发布的Baichuan-7B、清华大学和智谱AI发布的ChatGLM2-6B等开源大模型，也是AI初创企业中无法忽视的力量。这些开源动作无疑影响了大厂——此前，国内大厂普遍选择不开源。如今，阿里通义千问的开源，无疑是意味着大厂大模型思路的一场转变。

其实，阿里云的开源战略早有端倪，为通义千问的开源做出了铺垫。此次上架通义千问开源模型的魔搭ModelScope，是阿里云于去年11月初牵头发起的AI模型社区。目前，魔搭聚集了20多家人工智能机构贡献的1000多款开源模型，开发者数量超160万，模型下载量超2500万。在今年6月举行的2023开放原子全球开源峰会上，阿里云还公布了“1+4”开源战略。除魔搭社区外，阿里云还将聚焦操作系统、云原生、数据库、大数据等四大开源领域。

开源的同时，阿里云也公布了通义千问7B预训练模型在多个权威基准测评中的表现。在英文能力测评基准MMLU上，通义千问7B模型得分超过一众7B、12B、13B主流开源模型。在中文常识能力测评基准C-Eval上，通义千问在验证集和测试集中也都是得分最高的7B开源模型。在数学解题能力评测GSM8K、代码能力评测HumanEval上分别得分51.6、24.4，超过所有同等尺寸和部分大尺寸开源模型。

附开源地址：

魔搭ModelScope：https://modelscope.cn/models/qwen/Qwen-7B/summary
魔搭ModelScope：https://modelscope.cn/models/qwen/Qwen-7B-Chat/summary
HuggingFace：https://huggingface.co/Qwen
GitHub：https://github.com/QwenLM/Qwen-7B

本页网址：https://www.xinzhibang.net/article_detail-9249.html

寻求报道，请

关键词

分享至微信：

相关工具

MOSS

复旦大学团队开发的对话式大型语言模型

Forefront

免费版基于GPT-4的AI聊天机器人

文心一言

百度推出的基于文心大模型的AI对话互动工具

对话写作猫

秘塔写作猫推出的AI对话聊天工具

Bing新必应

微软推出的新版结合了ChatGPT功能的必应

YouChat AI

AI搜索对话工具

五款热门的人工智能工具对比

五款热门的人工智能工具对比2022年11月底，OpenAI发布ChatGPT，改变了大部分人的工作、生活和学习方式。其后，国内外大厂前赴后继，投身AI浪潮。今天，想从普通用户的身份对比一下五款热门的人工智能工具：ChatGPT、百度文心一言、科大讯飞的星火、阿里的通义千问、趣问问AI，给有兴趣的朋友

分类标签 ChatGPT百度文心一言科大讯飞星火阿里通义千问趣问问AI

11-27 16:08

通义千问：国产AI大模型的实用功能

通义千问是一款国产AI大模型，提供了许多实用的功能，包括自动生成文字、智能聊天机器人、文字翻译、内容创作、数据分析、学习辅导、策略建议、情感分析、代码生成和客户服务等功能。其中，自动生成文字功能可以自动生成各种类型的文章，例如新闻报道、产品描述、故事、论文等。智能聊天机器人可以通过对话的形式，解决用

分类标签通义千问AI大模型智能聊天机器人

11-15 02:32

大模型与智能手机的融合：通义千问、文心一言等大模型的应用探究

华为、小米、vivo等手机厂商纷纷推出自己的大模型APP植入旗下手机产品，通义千问、文心一言等大模型也纷纷推出APP版抢滩智能手机产品。大模型与智能手机的结合，不仅令手机助手变得更聪明，还能帮忙写邮件、写总结文档甚至制定旅游行程攻略。单就手机助手而言，在最新版本的iOS系统中，已经有了部分机器学习的

分类标签大模型智能手机通义千问文心一言AI助手应用平台

11-15 02:31

阿里云通义千问正式开放：超过谷歌T5模型的通用大模型

阿里云通义千问正式开放：超过谷歌T5模型的通用大模型近日，阿里云宣布通义千问大模型已首批通过备案，并正式向公众开放。这是继百度文心一言、百川智能、商汤商量SenseChat之后，又一通用大模型产品向公众开放的重要事件。通用大模型是指能够在多个领域和任务上表现出优异性能的人工智能模型，它们具有强大的泛

分类标签阿里云通义千问通用大模型

11-13 18:06

阿里云自研大模型“通义千问”开始邀请用户测试体验

阿里云自研大模型“通义千问”开始邀请用户测试体验4月7日消息，阿里云宣布自研大模型“通义千问”开始邀请用户测试体验。这也是继百度后国内又一家巨头启动AI大模型邀测。通义千问的官网是tongyi.aliyun.com。打开网址，可以看到它的自我介绍：“我是通义千问，一个专门响应人类指令的大模型。我服务

分类标签阿里云自研大模型通义千问

11-13 18:05

阿里巴巴所有产品将接入“通义千问”大模型，进行全面改造

阿里AI大“装修”阿里巴巴集团CEO张勇在2022年11月的阿里云智能大会上宣布，阿里巴巴所有产品未来将接入“通义千问”大模型，进行全面改造。这是阿里巴巴在AI领域的一次重大战略调整，旨在提升阿里巴巴的智能化水平，为用户和商家提供更优质的服务和体验。“通义千问”是阿里巴巴自主研发的一款基于自然语言理

分类标签阿里巴巴通义千问大模型

11-13 18:04

阿里公开Qwen-VL多模态大模型，通用模型首个支持中文开放域定位

简介阿里宣布开源Qwen-VL，一款支持中英文等多种语言的视觉语言大模型，具有细粒度视觉定位能力。Qwen-VL已开放可玩，具体效果通过多种测试得出。多模态大模型正成为大模型发展的必经之路，除了阿里，面壁智能、字节、360等企业也在开发多模态大模型。Qwen-VL多模态大模型Qwen-VL是一款支持

分类标签阿里Qwen-VL多模态大模型

11-13 16:59

阿里云首席技术官周靖人：阿里云覆盖500万客户，发布通义千问2.0等新产品

阿里云发展历程10月31日上午，在杭州西湖区云栖小镇国际会展中心，“2023杭州·云栖大会”正式开幕。主论坛上，阿里云首席技术官周靖人发表主题演讲。周靖人讲述阿里云发展历程，从2009年，阿里云成立，写下第一行飞天操作系统代码，“开启了阿里云追求技术卓越的创新之路。”到2013年，云产品矩阵成型，飞

分类标签阿里云周靖人云计算

11-13 16:58

张勇：人工智能应该“可用、可靠、可信”“通义千问”已有超过20万企业用户申请接入

张勇：人工智能应该“可用、可靠、可信”“世界互联网大会数字文明尼山对话”在山东曲阜召开，阿里云智能集团董事长兼CEO张勇在26日的主论坛上发表了主题演讲。他表示，人工智能技术应该“可用、可靠、可信”，科技企业在追求技术先进性的同时，必须坚守社会责任感。“通义千问”已有超过20万企业用户申请接入张勇介

分类标签张勇人工智能可用可靠可信通义千问阿里云企业用户

11-13 16:57

阿里云发布千亿级参数大模型通义千问2.0并推出八大行业模型组团

阿里云发布千亿级参数大模型通义千问2.0并推出八大行业模型组团10月31日，2023云栖大会在杭州云栖小镇开幕。阿里云正式发布千亿级参数大模型通义千问2.0。在10个权威测评中，通义千问2.0综合性能超过GPT-3.5，正在加速追赶GPT-4。当天，通义千问App在各大手机应用市场正式上线，所有人都

分类标签阿里云千亿级参数大模型通义千问2.0八大行业模型组团人工智能云计算

11-13 16:56

ChatGPT Midjourney 文心一言文心一格 bing新必应 Stable diffusion 稿定设计墨刀AI mastergo Adobe Firefly runway