智谱AI推出完全自主研发的第三代基础模型ChatGLM3及相关系列产品

新知榜官方账号

2023-11-01 16:28:39

智谱AI推出完全自主研发的第三代基础模型ChatGLM3及相关系列产品

智谱AI在2023年中国计算机大会(CNCC)上推出了完全自主研发的第三代基础模型ChatGLM3及相关系列产品。此次推出的ChatGLM3采用独创的多阶段增强预训练方法,使训练更加完整。评测显示,在44个中英文公开数据集测试中,ChatGLM3在国内同规模模型中排名第一。

ChatGLM3新技术升级,性能更高,成本更低更丰富的训练数据和更好的训练方案,让智谱AI推出的ChatGLM3性能更加强大。与ChatGLM2相比,MMLU提升36%,CEval提升33%,GSM8K提升179%,BBH提升126%。同时,ChatGLM3瞄准GPT-4V,实现了多项新功能的迭代升级,其中包括具有多模态理解能力的CogVLM——图像识别语义,在10多个国际标准图形评价数据集上实现了SOTA;代码增强模块CodeInterpreter根据用户需求生成并执行代码,自动完成数据分析、文件处理等复杂任务;网页搜索增强WebGLM-访问搜索增强可以根据问题自动在互联网上搜索相关信息,并在回答时提供相关参考文献。ChatGLM3的语义和逻辑能力得到了极大的增强。

ChatGLM3还集成了自主研发的AgentTuning技术,激活了模型代理能力,特别是在智能规划和执行方面,相比ChatGLM2提升了1000%;它还使国产大型模型能够原生支持工具调用、代码执行、游戏和数据库。运算、知识图谱搜索与推理、操作系统等复杂场景。此外,ChatGLM3此次推出了可部署在手机上的端测模型ChatGLM3-1.5B和ChatGLM3-3B。支持vivo、小米、三星等多种手机及车载平台。他们甚至支持移动平台上CPU芯片的推理。速度高达20个令牌/秒。在准确性方面,1.5B和3B模型的性能在公共基准上接近ChatGLM2-6B模型。基于最新的高效动态推理和内存优化技术,ChatGLM3当前的推理框架在相同硬件和模型条件下比当前最好的开源实现更快,包括UCBerkeley发布的vLLM和最新版本HuggingFaceTGI。提升了2-3倍,推理成本也提升了一倍。每千个代币仅0.5点,是最低价格。

新一代“智浦轻言”上线,国内首创代码交互功能“代码”功能目前支持图像处理、数学计算、数据分析等使用场景。以下是:

  • 处理数据以创建图表
  • 绘制图形的代码
  • 下载SQL代码分析

除了WebGLM的大模型功能外,智谱清研还具有搜索增强功能,可以帮助用户找到相关问题的网络文献或文章链接,并直接提供答案。此前发布的CogVLM模型提升了智谱青岩的中文图像和文本理解能力,达到了接近GPT-4V的图像理解能力。它可以回答各种视觉问题并执行复杂的对象检测并添加标签以执行自动数据标记。

2022年初以来,智谱AI推出的GLM系列模型已支持Ascend、神威超算、海光DCU架构上的大规模预训练和推理。截至目前,智谱AI产品已支持十余个国内硬件生态系统,包括升腾、神威超算、海光DCU、海飞科、木兮兮云、计算科技、天枢智能芯、寒武纪、摩尔线程、百度昆仑芯、灵犀科技、长城超云、通过与国内芯片企业联合创新,不断进行性能优化,将有助于国产本土机型、国产芯片尽快走向国际舞台。智谱AI此次推出的ChatGLM3及相关产品系列全面提升了模型性能,为行业打造了更加开源的生态系统,进一步降低了普通用户使用AIGC产品的门槛。人工智能正在引领我们进入一个新时代,大设计必将加速这一时刻的到来。

本页网址:https://www.xinzhibang.net/article_detail-18531.html

寻求报道,请 点击这里 微信扫码咨询

关键词

智谱AI ChatGLM3 自主研发

分享至微信: 微信扫码阅读

相关工具

相关文章