智谱AI发布ChatGLM3:多模态能力提升,集成自研AgentTuning技术

新知榜官方账号

2023-10-29 02:27:27

智谱AI发布ChatGLM3:多模态能力提升,集成自研AgentTuning技术

钛媒体App获悉,10月27日下午举行的中国计算机大会(CNCC2023)一场论坛上,阿里、腾讯投资的人工智能(AI)独角兽公司智谱AI正式发布全新自研的第三代基座大模型ChatGLM3系列。

新的ChatGLM3包括ChatGLM3-1.5B(15亿)、3B和6B参数三种,不仅在多模态理解、代码模块、网络搜索等能力上有所提升,而且相对最佳开源模型推理速度提升2-3倍。同时,基于集成自研AgentTuning技术,在智能规划和执行上比ChatGLM-2提升1000%。

智谱AICEO张鹏表示,最新的自研模型ChatGLM3就是瞄准GPT-4V(多模态版的GPT-4)的跨模态能力,是ChatGLM全新一代的技术升级。“对标OpenAI是智谱AI成立以来的目标。智谱AI致力于让机器像人一样思考,我们希望利用ChatGLM3通用基座模型能力,与合作伙伴一起共同的支撑千行百业,进入生成式AI‘第二阶段’。”张鹏称。

智谱AI成立于2019年,脱胎于清华大学计算机系知识工程研究室团队,是清华大学知识成果转化的创业公司,瞄准AI大模型研发落地,公司CEO张鹏毕业于清华计算机系,总裁王绍兰为清华创新领军博士,清华大学计算系教授唐杰也参与研发中国最大规模预训练模型悟道2.0。

2023年,智谱AI推出千亿基座的对话模型ChatGLM,并开源单卡版模型ChatGLM-6B等,部署于个人开发者和企业应用领域。今年6月,智谱AI迭代出ChatGLM2,包括6B、130B、12B(120亿参数)、32B、66B等参数的模型,推理速度增长42%。据张鹏透露,相比GPT-4版的ChatGPT,ChatGLM2-12B、32B和66B性能分别提升16%、36%和280%。

智谱AI发布的最新ChatGLM3通用基座大模型,在性能、推理、算力、Agent智能体能力、API商业化等方面均有提升。其中,性能方面,ChatGLM3-6B在44个中英文公开数据集测试中国内同尺寸模型排名首位,相比ChatGLM2-6B,多个排名提升33%以上,GSM8K基准提升179%;推理方面,相较于目前伯克利大学开源的vLLM,速度提升2-3倍,推理成本降低一倍。同时,新的模型还集成自研AgentTuning技术,激活模型智能体能力,在智能规划和执行方面比ChatGLM2提升1000%,支持工具调用、代码执行、游戏、数据库操作、知识图谱搜索与推理、操作系统等复杂场景,最新AgentBench基准测试上ChatGLM3-turbo和GPT-3.5接近;国产算力层面,以昇腾生态为例,ChatGLM3推理速度提升达3倍之多。而在模型尺寸上,ChatGLM系列首次增加1.5B、3B这类小参数模型/张鹏称,主要原因是用户需求和算力成本之间的平衡,而且支持国产芯片的边缘侧模型ChatGLM3-1.5B可在笔记本电脑、手机、汽车等场景部署,速度达20Tokens/s,精度上1.5B和3B模型与ChatGLM2-6B模型性能接近。

现场演示中,对标ChatGPT、基于ChatGLM3的AI聊天机器人平台“智谱清言”,如今不仅可以实现表格生成柱状图、折线图,而且还可以获得实时新闻搜索数据、看蔬菜写菜谱以及代码生成函数等能力。然而,在比如“用代码画心形”这类问题上,智谱清言仍存在一定的输出错误等幻觉问题。另外,在ToB企业端方面,智谱AI提供的API开放平台支持开放模型、专属模型、本地化私有模型部署方案,帮助企业去构建自主可控大模型。同时,ChatGLM3开发平台从三种量级整合为ChatGLM3-turbo,只提供一个标准API模型方案,整体价格降低50%。

据钛媒体App了解,目前智谱AI公司主要销售三类技术产品:数字人SaaS/PaaS方案,科技情报SaaS/PaaS方案,以及包括ChatGLM系列在内的认知大模型PaaS/MaaS平台方案。张鹏透露,目前智谱AIGLM大模型已经应用于政务、金融、能源、制造、医疗等领域,支持华为昇腾、神威超算、海光DCU等10余种国产硬件生态,合作伙伴包括阿里、腾讯云、火山引擎、华为、美团、微软、OPPO、海天瑞声等数十家公司。

本页网址:https://www.xinzhibang.net/article_detail-18231.html

寻求报道,请 点击这里 微信扫码咨询

关键词

智谱AI ChatGLM3 人工智能

分享至微信: 微信扫码阅读

相关工具

相关文章