阿里云推出大规模视觉语言模型Qwen-VL，支持图像问答、细粒度视觉定位等多种场景应用

新知榜官方账号

2023-08-30 10:08:41

背景

随着ChatGPT的快速进化吸引了全球网友的眼球，国内厂商也纷纷表示将推出相似的产品。不久前，笔者为大家整理了多款已宣布推出的国产AI，包括百度的“文心一言”、阿里巴巴的“通义千问”、360的“360智脑”等。其中，百度的AI产品率先进行测试，目前已在某些场景中得到实际应用。这些AI产品的推出标志着中国科技企业在人工智能领域取得了新的突破，展示出了强大的技术实力和市场竞争力。这些AI产品的应用前景广阔，将在未来为我们的生活和工作带来更多的便利和创新。

就在昨晚，阿里云推出了大规模视觉语言模型Qwen-VL，目前已经在ModeScope开源。据相关媒体报道，阿里云此前已经开源了通义千问70亿参数通用模型Qwen-7B和对话模型Qwen-7B-Chat。Qwen-VL是一款支持中英文等多种语言的视觉语言（VisionLanguage，VL）模型，相比之前的VL模型，它除了具备基本的图文识别、描述、问答及对话能力之外，还新增了视觉定位、图像中文字理解等功能。Qwen-VL以Qwen-7B为基座语言模型，在模型架构上引入视觉编码器，使得模型支持视觉信号输入，该模型支持的图像输入分辨率为448，此前开源的LVLM模型通常仅支持224分辨率。官方表示，该模型可用于知识问答、图像标题生成、图像问答、文档问答、细粒度视觉定位等场景，在主流的多模态任务评测和多模态聊天能力评测中，取得了远超同等规模通用模型的表现。

此外，在Qwen-VL的基础上，通义千问团队使用对齐机制，打造了基于LLM的视觉AI助手Qwen-VL-Chat，可让开发者快速搭建具备多模态能力的对话应用。通义千问团队同时表示，为了测试模型的多模态对话能力，他们构建了一套基GPT-4打分机制的测试集“试金石”，对Qwen-VL-Chat及其他模型进行对比测试，Qwen-VL-Chat在中英文的对齐评测中均取得了开源LVLM最好结果。而据之前的介绍，此前阿里云已经开源了通义千问70亿参数模型，包括通用模型Qwen-7B和对话模型Qwen-7B-Chat，两款模型均已上线魔搭社区，开源、免费、可商用。

本页网址：https://www.xinzhibang.net/article_detail-10604.html

寻求报道，请

关键词

分享至微信：

相关工具

DeepMind联创新公司推出的AI聊天机器人

文心一言

百度推出的基于文心大模型的AI对话互动工具

Poe

问答社区Quora推出的问答机器人工具

TigerBot

虎博科技推出的AI对话聊天机器人，基于TigerBot开源大模型

ChatSonic

WriteSonic出品的ChatGPT竞品

Open Assistant

免费开源的对话式AI，GitHub星标超3万

五款热门的人工智能工具对比

五款热门的人工智能工具对比2022年11月底，OpenAI发布ChatGPT，改变了大部分人的工作、生活和学习方式。其后，国内外大厂前赴后继，投身AI浪潮。今天，想从普通用户的身份对比一下五款热门的人工智能工具：ChatGPT、百度文心一言、科大讯飞的星火、阿里的通义千问、趣问问AI，给有兴趣的朋友

分类标签 ChatGPT百度文心一言科大讯飞星火阿里通义千问趣问问AI

11-27 16:08

通义千问：国产AI大模型的实用功能

通义千问是一款国产AI大模型，提供了许多实用的功能，包括自动生成文字、智能聊天机器人、文字翻译、内容创作、数据分析、学习辅导、策略建议、情感分析、代码生成和客户服务等功能。其中，自动生成文字功能可以自动生成各种类型的文章，例如新闻报道、产品描述、故事、论文等。智能聊天机器人可以通过对话的形式，解决用

分类标签通义千问AI大模型智能聊天机器人

11-15 02:32

大模型与智能手机的融合：通义千问、文心一言等大模型的应用探究

华为、小米、vivo等手机厂商纷纷推出自己的大模型APP植入旗下手机产品，通义千问、文心一言等大模型也纷纷推出APP版抢滩智能手机产品。大模型与智能手机的结合，不仅令手机助手变得更聪明，还能帮忙写邮件、写总结文档甚至制定旅游行程攻略。单就手机助手而言，在最新版本的iOS系统中，已经有了部分机器学习的

分类标签大模型智能手机通义千问文心一言AI助手应用平台

11-15 02:31

阿里云通义千问正式开放：超过谷歌T5模型的通用大模型

阿里云通义千问正式开放：超过谷歌T5模型的通用大模型近日，阿里云宣布通义千问大模型已首批通过备案，并正式向公众开放。这是继百度文心一言、百川智能、商汤商量SenseChat之后，又一通用大模型产品向公众开放的重要事件。通用大模型是指能够在多个领域和任务上表现出优异性能的人工智能模型，它们具有强大的泛

分类标签阿里云通义千问通用大模型

11-13 18:06

阿里云自研大模型“通义千问”开始邀请用户测试体验

阿里云自研大模型“通义千问”开始邀请用户测试体验4月7日消息，阿里云宣布自研大模型“通义千问”开始邀请用户测试体验。这也是继百度后国内又一家巨头启动AI大模型邀测。通义千问的官网是tongyi.aliyun.com。打开网址，可以看到它的自我介绍：“我是通义千问，一个专门响应人类指令的大模型。我服务

分类标签阿里云自研大模型通义千问

11-13 18:05

阿里巴巴所有产品将接入“通义千问”大模型，进行全面改造

阿里AI大“装修”阿里巴巴集团CEO张勇在2022年11月的阿里云智能大会上宣布，阿里巴巴所有产品未来将接入“通义千问”大模型，进行全面改造。这是阿里巴巴在AI领域的一次重大战略调整，旨在提升阿里巴巴的智能化水平，为用户和商家提供更优质的服务和体验。“通义千问”是阿里巴巴自主研发的一款基于自然语言理

分类标签阿里巴巴通义千问大模型

11-13 18:04

阿里公开Qwen-VL多模态大模型，通用模型首个支持中文开放域定位

简介阿里宣布开源Qwen-VL，一款支持中英文等多种语言的视觉语言大模型，具有细粒度视觉定位能力。Qwen-VL已开放可玩，具体效果通过多种测试得出。多模态大模型正成为大模型发展的必经之路，除了阿里，面壁智能、字节、360等企业也在开发多模态大模型。Qwen-VL多模态大模型Qwen-VL是一款支持

分类标签阿里Qwen-VL多模态大模型

11-13 16:59

阿里云首席技术官周靖人：阿里云覆盖500万客户，发布通义千问2.0等新产品

阿里云发展历程10月31日上午，在杭州西湖区云栖小镇国际会展中心，“2023杭州·云栖大会”正式开幕。主论坛上，阿里云首席技术官周靖人发表主题演讲。周靖人讲述阿里云发展历程，从2009年，阿里云成立，写下第一行飞天操作系统代码，“开启了阿里云追求技术卓越的创新之路。”到2013年，云产品矩阵成型，飞

分类标签阿里云周靖人云计算

11-13 16:58

张勇：人工智能应该“可用、可靠、可信”“通义千问”已有超过20万企业用户申请接入

张勇：人工智能应该“可用、可靠、可信”“世界互联网大会数字文明尼山对话”在山东曲阜召开，阿里云智能集团董事长兼CEO张勇在26日的主论坛上发表了主题演讲。他表示，人工智能技术应该“可用、可靠、可信”，科技企业在追求技术先进性的同时，必须坚守社会责任感。“通义千问”已有超过20万企业用户申请接入张勇介

分类标签张勇人工智能可用可靠可信通义千问阿里云企业用户

11-13 16:57

阿里云发布千亿级参数大模型通义千问2.0并推出八大行业模型组团

阿里云发布千亿级参数大模型通义千问2.0并推出八大行业模型组团10月31日，2023云栖大会在杭州云栖小镇开幕。阿里云正式发布千亿级参数大模型通义千问2.0。在10个权威测评中，通义千问2.0综合性能超过GPT-3.5，正在加速追赶GPT-4。当天，通义千问App在各大手机应用市场正式上线，所有人都

分类标签阿里云千亿级参数大模型通义千问2.0八大行业模型组团人工智能云计算

11-13 16:56

ChatGPT Midjourney 文心一言文心一格 bing新必应 Stable diffusion 稿定设计墨刀AI mastergo Adobe Firefly runway