商汤联合多家国内顶尖科研机构发布InternLM-123B国产大模型

新知榜官方账号

2023-08-31 22:30:39

背景

在各大科技公司卷了半年的生成式AI热潮趋于冷静期的当下,何时会有一个大模型,能以极强的泛化能力,创建各种智能体、成为人类真正的助手?商汤联合多家国内顶尖科研机构发布的InternLM-123B国产大模型,似乎将这种差距感极大地给拉近了一些。

表现

在一场顶尖大模型“同台竞技”中,InternLM-123B表现亮眼:12项成绩排名第一,综合实力全球第二,部分成绩超越GPT-4。这个评测是在全球51个知名评测集、共计30万道问题集合上测试所得到的结果。

技术实力

商汤在技术上的打法是“日日新大模型体系+SenseCore大装置”,并非是简单的做加法那般叠加,而是之间有着深度融合的那种。在大模型的迭代速度上表现出色,这与其足够强、高吞吐量的数据清洗能力和人工智能计算中心(AIDC)提供的算力有关。

落地应用

商汤的大模型已经在移动端、知识交互、内容交互等多个领域得到了落地应用,并且商汤还基于InternLM的轻量级模型,与头部手机芯片厂商建立研发合作,成功实现了大语言模型的手机端实时计算能力。

战略布局

商汤在开源和闭源方面都有所涉足,在开源方面,部分训练数据、训练代码及基模型权重已经向学术界及工业界免费开源,并支持免费商用;在闭源方面,商汤目标打造具有竞争力且好用的“基座模型”,为公司在市场中占据优势地位。

本页网址:https://www.xinzhibang.net/article_detail-10686.html

寻求报道,请 点击这里 微信扫码咨询

关键词

商汤 InternLM-123B 国产大模型 AI技术 GPT-4 SEO关键词

分享至微信: 微信扫码阅读

相关工具

相关文章