智普AI推出第三代基础模型ChatGLM3及相关产品线

新知榜官方账号

2023-11-01 16:24:28

智普AI推出第三代基础模型ChatGLM3及相关产品线

智普AI在2023中国计算机大会(CNCC)上推出了完全自主研发的第三代基础模型ChatGLM3及相关产品线。这也是智普AI千亿基础模型的推出。继ChatGLM和ChatGLM2对话模型之后的又一重大突破。此次推出的ChatGLM3,采用独创的多阶段高级预训练方法,让训练更加完美。

评测结果显示,ChatGLM3在44个中英文公共数据集的测试中,在国内同规模模型中排名第一。智普AI首席执行官张鹏现场发布新品,并实时演示最新产品功能。ChatGLM3新技术升级,性能更高,成本更低得益于更丰富的训练数据和更好的训练方案,智普AI搭载的ChatGLM3性能更加强大。

与ChatGLM2相比,MMLU提升36%,CEval提升33%,GSM8K提升179%,BBH提升126%。同时,ChatGLM3瞄准GPT-4V,实现了多项新功能的迭代创新,包括具有多模态理解能力的CogVLM——在10多个国际标准图评估数据集上实现SOTA的图像识别语义;代码改进代码解释器模块根据用户需求生成并执行代码,自动执行数据分析、文件处理等复杂任务;Web搜索增强WebGLM访问搜索增强功能可以根据问题自动在Internet上搜索相关信息,并在回答时提供相关参考。或文章链接。ChatGLM3的语义和逻辑能力得到了显着提升。

ChatGLM3还集成了自主研发的AgentTuning技术,激活模型代理的能力,特别是在智能规划和执行方面,比ChatGLM2好1000%;还可以让国产大型模型支持工具调用、代码执行、游戏和数据库。运算、知识图谱搜索与推理、操作系统等复杂场景。

另外,此次ChatGLM3将推出最终测试模型ChatGLM3-1.5B和ChatGLM3-3B,可用于手机。支持多种手机和车载平台,包括vivo、小米、三星等。它们甚至支持移动平台的推断CPU芯片。速度高达20个令牌/秒。在准确性方面,1.5B和3B模型的性能在公共基准上接近ChatGLM2-6B模型。

基于最新的高效动态推理和内存优化技术,当前的ChatGLM3推理框架在相同硬件和模型条件下比当前最好的开源实现更快,包括伯克利大学推出的vLLM和最新版本HuggingFaceTGI。已修复2-3次,推理成本增加了一倍。每千枚代币仅0.5积分,是最低价格。

智普青烟上线“代码”功能

国内首款码通新一代“智普青烟”上线“代码”功能目前支持图像处理、数学计算、数据分析等使用场景。

以下是:

  • 处理数据以创建图表
  • 绘制图形的代码
  • 上传SQL代码分析

在WebGLM大模型能力的加持下,智普清研还具备搜索增强能力,可以帮助用户整理出相关问题的网络文献或文章链接,并直接提供答案。此前发布的CogVLM模型提升了智普青岩的中文图像和文本理解能力,达到接近GPT-4V的图像理解能力。它可以回答不同类型的视觉问题,可以完成复杂的目标检测并添加标签,完成自动数据标注。

自2022年初以来,智普AI推出的GLM系列模型已支持Ascend、神威超算、海光DCU架构的广泛预训练和推理。截至目前,智普AI产品已支持升腾、神威超算、海光DCU、海飞科、木兮兮云、计算机科技、天枢智能芯、Cambrium、摩尔线程、百度昆仑芯、灵犀科技、长城等10余个国内硬件生态。朝云等通过与国内芯片企业联合创新,不断进行性能优化,将有助于国产大机型、国产芯片尽快走向国际舞台。

智普AI推出的ChatGLM3及相关系列产品全面提升了该模型的性能,为行业打造了开源生态,进一步降低了普通用户使用AIGC产品的门槛。人工智能正在引领我们进入一个新时代,而大型模型必将加速这一时刻的到来。

本页网址:https://www.xinzhibang.net/article_detail-18527.html

寻求报道,请 点击这里 微信扫码咨询

关键词

智普AI ChatGLM3 基础模型

分享至微信: 微信扫码阅读

相关工具

相关文章