HuggingFace与ServiceNow联合发布免费的150亿参数大型语言模型StarCoder

新知榜官方账号

2023-11-29 10:10:12

HuggingFace与ServiceNow联合发布免费的150亿参数大型语言模型StarCoder

近日,HuggingFace与ServiceNow联合发布了一个免费的大型语言模型StarCoder,该模型经过训练主要用途是可以生成代码,目的是为了对抗GitHubCopilot和亚马逊CodeWhisperer等基于AI的编程工具。目前像是GitHubCopilot这样的AI编程工具都是偏商业化的产品,开发者需要付费订阅才能使用,而StarCoder可以让任何人(包括企业)免费使用。

AI编程工具面临的另一个问题是,开发AI工具的这些科技公司通常都会使用网上公开的源代码来训练AI,但这些数据集并没有获得授权,产生的代码也面临着法律、道德,以及代码归属等问题。比如GitHub现在就面临Copilot的集体诉讼。

为了避免这样的问题,StarCoder则是在这两家公司获得授权的源代码上进行的训练,旨在以开放和负责任的方式为代码创建最先进的人工智能系统,授权的源代码涵盖了80种编程语言。为了训练这样的模型,HuggingFace使用了一个由512个NvidiaV100GPU组成的内部计算集群来训练StarCoder。

StarCoder并不是严格意义上的开源LLM模型,它是在OpenRAIL-M许可下发布的,其中包括适用于修改模型和使用模型的限制,以及对分发恶意代码的限制。StarCoder相关的支持代码目前已发布在GitHub上。

本页网址:https://www.xinzhibang.net/article_detail-21401.html

寻求报道,请 点击这里 微信扫码咨询

相关工具

相关文章

相关快讯