阿里“通义千问”和百度“文心一言”大模型实测对比

新知榜官方账号

2023-07-06 10:14:28

背景

近年来，随着人工智能技术的不断发展，大语言模型也逐渐成为了研究热点之一。其中，阿里“通义千问”和百度“文心一言”是国内比较知名的两个大模型。

沟通能力测试

本文在实测中对“通义千问”和“文心一言”的沟通能力进行了测试。结果显示，“通义千问”在面对自己知识库中没有或本身就是错误的提问时，会积极认错，还懂在用户纠正后进行挽尊。而“文心一言”则不能保证能分辨出所有的错误描述相同的问题，并且显得更“话痨”一些，偶尔出现一本正经地胡说八道的问题。

多轮对话能力测试

多轮对话能力是指在一段涉及几十个回合的对话中体现出来的上下文处理能力。在这方面，“通义千问”比“文心一言”表现更好一些。虽然“通义千问”在10轮之内出现否认前期回答的情况，但当用户详细给出预设条件时，通义千问确实能够理解并按照设定条件对话。而“文心一言”则无法理解身份转换，不能很好地理解内容。

对职业的辅助能力测试

对话式AI能否替代某些工作一直是业界争论的一个焦点。本文对“通义千问”和“文心一言”进行了记者采访工作的测试。结果显示，两者都还做得不够好。

技术细节

“通义千问”和“文心一言”都没有公布更多的技术细节。当询问“通义千问”其模型的训练数据及量级时，“通义千问”表示无法提供准确数量级。此外，“通义千问”当前并无多模态生成能力，也就是无法生成图像、视频等。

本页网址：https://www.xinzhibang.net/article_detail-6318.html

寻求报道，请

关键词

分享至微信：

相关工具

Google Bard

Google推出的AI聊天对话机器人Bard

ChatGPT

OpenAI旗下AI对话工具

Forefront

免费版基于GPT-4的AI聊天机器人

ColossalChat

Colossal-AI推出的免费开源版ChatGPT聊天机器人替代品

DeepMind联创新公司推出的AI聊天机器人

Replika

AI对话陪伴工具

五款热门的人工智能工具对比

五款热门的人工智能工具对比2022年11月底，OpenAI发布ChatGPT，改变了大部分人的工作、生活和学习方式。其后，国内外大厂前赴后继，投身AI浪潮。今天，想从普通用户的身份对比一下五款热门的人工智能工具：ChatGPT、百度文心一言、科大讯飞的星火、阿里的通义千问、趣问问AI，给有兴趣的朋友

分类标签 ChatGPT百度文心一言科大讯飞星火阿里通义千问趣问问AI

11-27 16:08

通义千问：国产AI大模型的实用功能

通义千问是一款国产AI大模型，提供了许多实用的功能，包括自动生成文字、智能聊天机器人、文字翻译、内容创作、数据分析、学习辅导、策略建议、情感分析、代码生成和客户服务等功能。其中，自动生成文字功能可以自动生成各种类型的文章，例如新闻报道、产品描述、故事、论文等。智能聊天机器人可以通过对话的形式，解决用

分类标签通义千问AI大模型智能聊天机器人

11-15 02:32

大模型与智能手机的融合：通义千问、文心一言等大模型的应用探究

华为、小米、vivo等手机厂商纷纷推出自己的大模型APP植入旗下手机产品，通义千问、文心一言等大模型也纷纷推出APP版抢滩智能手机产品。大模型与智能手机的结合，不仅令手机助手变得更聪明，还能帮忙写邮件、写总结文档甚至制定旅游行程攻略。单就手机助手而言，在最新版本的iOS系统中，已经有了部分机器学习的

分类标签大模型智能手机通义千问文心一言AI助手应用平台

11-15 02:31

阿里云通义千问正式开放：超过谷歌T5模型的通用大模型

阿里云通义千问正式开放：超过谷歌T5模型的通用大模型近日，阿里云宣布通义千问大模型已首批通过备案，并正式向公众开放。这是继百度文心一言、百川智能、商汤商量SenseChat之后，又一通用大模型产品向公众开放的重要事件。通用大模型是指能够在多个领域和任务上表现出优异性能的人工智能模型，它们具有强大的泛

分类标签阿里云通义千问通用大模型

11-13 18:06

阿里云自研大模型“通义千问”开始邀请用户测试体验

阿里云自研大模型“通义千问”开始邀请用户测试体验4月7日消息，阿里云宣布自研大模型“通义千问”开始邀请用户测试体验。这也是继百度后国内又一家巨头启动AI大模型邀测。通义千问的官网是tongyi.aliyun.com。打开网址，可以看到它的自我介绍：“我是通义千问，一个专门响应人类指令的大模型。我服务

分类标签阿里云自研大模型通义千问

11-13 18:05

阿里巴巴所有产品将接入“通义千问”大模型，进行全面改造

阿里AI大“装修”阿里巴巴集团CEO张勇在2022年11月的阿里云智能大会上宣布，阿里巴巴所有产品未来将接入“通义千问”大模型，进行全面改造。这是阿里巴巴在AI领域的一次重大战略调整，旨在提升阿里巴巴的智能化水平，为用户和商家提供更优质的服务和体验。“通义千问”是阿里巴巴自主研发的一款基于自然语言理

分类标签阿里巴巴通义千问大模型

11-13 18:04

阿里公开Qwen-VL多模态大模型，通用模型首个支持中文开放域定位

简介阿里宣布开源Qwen-VL，一款支持中英文等多种语言的视觉语言大模型，具有细粒度视觉定位能力。Qwen-VL已开放可玩，具体效果通过多种测试得出。多模态大模型正成为大模型发展的必经之路，除了阿里，面壁智能、字节、360等企业也在开发多模态大模型。Qwen-VL多模态大模型Qwen-VL是一款支持

分类标签阿里Qwen-VL多模态大模型

11-13 16:59

阿里云首席技术官周靖人：阿里云覆盖500万客户，发布通义千问2.0等新产品

阿里云发展历程10月31日上午，在杭州西湖区云栖小镇国际会展中心，“2023杭州·云栖大会”正式开幕。主论坛上，阿里云首席技术官周靖人发表主题演讲。周靖人讲述阿里云发展历程，从2009年，阿里云成立，写下第一行飞天操作系统代码，“开启了阿里云追求技术卓越的创新之路。”到2013年，云产品矩阵成型，飞

分类标签阿里云周靖人云计算

11-13 16:58

张勇：人工智能应该“可用、可靠、可信”“通义千问”已有超过20万企业用户申请接入

张勇：人工智能应该“可用、可靠、可信”“世界互联网大会数字文明尼山对话”在山东曲阜召开，阿里云智能集团董事长兼CEO张勇在26日的主论坛上发表了主题演讲。他表示，人工智能技术应该“可用、可靠、可信”，科技企业在追求技术先进性的同时，必须坚守社会责任感。“通义千问”已有超过20万企业用户申请接入张勇介

分类标签张勇人工智能可用可靠可信通义千问阿里云企业用户

11-13 16:57

阿里云发布千亿级参数大模型通义千问2.0并推出八大行业模型组团

阿里云发布千亿级参数大模型通义千问2.0并推出八大行业模型组团10月31日，2023云栖大会在杭州云栖小镇开幕。阿里云正式发布千亿级参数大模型通义千问2.0。在10个权威测评中，通义千问2.0综合性能超过GPT-3.5，正在加速追赶GPT-4。当天，通义千问App在各大手机应用市场正式上线，所有人都

分类标签阿里云千亿级参数大模型通义千问2.0八大行业模型组团人工智能云计算

11-13 16:56

ChatGPT Midjourney 文心一言文心一格 bing新必应 Stable diffusion 稿定设计墨刀AI mastergo Adobe Firefly runway