国产大模型估值最高创企,为何是智谱AI?

新知榜官方账号

2023-11-08 02:43:17

智谱AI发布自研大模型ChatGLM3

智谱AI最新发布自研大模型ChatGLM3,拥有强大的性能和功能,成为国内估值最高的创企之一。仅用4个月时间,智谱AI就甩出最新成绩证明了自己——自研大模型ChatGLM3,不止是底层架构,就连模型功能都进行了全方位大升级。性能上,最直观的表现就是“疯狂屠榜”,所有50个大模型公开性能测评数据集中,拿下44个全国第一;产品上,率先搞定了用户关注度MAX的代码解释器功能,能生成甚至直接跑通代码!

ChatGLM3的亮点

ChatGLM3主要在4个方面秀出亮点,对比上一代有不小提升。首先是性能的提升。据介绍,结合此前ChatGLM系列模型的开发经验,智谱AI采用了独创的多阶段增强与训练方法,同时丰富了训练数据,优化了训练方法,使训练更为充分。评测结果显示,与ChatGLM2系列模型相比,ChatGLM3一出,性能屠榜:同尺寸模型中,ChatGLM3拿下了44个中英文公开数据集测试国内第一。其次是推理能力方面,更为高效,成本也更低。ChatGLM3系列模型采用了最新的高效动态推理和显存优化技术。ChatGLM3还具备了全新的Agent智能体能力。智谱AI介绍说,本次迭代后的ChatGLM3集成了自研的AgentTuning技术,激活了模型智能代理能力。由此也使得ChatGLM3作为国产大模型,能够原生支持工具调用、代码执行、游戏、数据库操作、知识图谱搜索与推理、操作系统等复杂场景。

ChatGLM3的产品能力和落地应用

智谱AI的ChatGLM3具备了代码解释器、搜索和解读图片的能力,这也是当前大模型落地的产品能力刚需。目前大部分国产大模型仍然在云端运行,并且只出了对外的API接口,如果企业厂商想要接入,在不少场景中仍然有不方便的地方。智谱AI考虑到了这一点,率先把ChatGLM3大模型“做小”,能塞进汽车甚至是手机。ChatGLM3除了上述提到的模型以外,还推出了可手机部署的端侧模型ChatGLM3-1.5B和3B。ChatGLM3的适配能力也很强,全面支持10余种国产芯片。ChatGLM3的产品实用性和应用范围都很广,能够适用于对话、文生图、代码、搜索增强、图文理解等方面。

本页网址:https://www.xinzhibang.net/article_detail-19275.html

寻求报道,请 点击这里 微信扫码咨询

关键词

智谱AI 大模型 ChatGLM3

分享至微信: 微信扫码阅读

相关工具

相关文章