AI生成代码:Copilot、aiXcoder、Tabnine等

新知榜官方账号

2023-09-16 10:04:29

GPT-3

GPT-3是一个训练集45TB、参数规模1750亿、预训练结果700G的AI模型,其一经问世就成为了万众瞩目的焦点。在其出现之后,使用GPT-3作诗、作曲甚至作画的应用纷至沓来。AI编程其实也并非是新鲜事了,之前的AI自动辅助编程工具Copilot也是一个。实际上,Codex更像是Copilot的一个全面升级。二者同样都是再GPT-3的基础上构建而成,不过Codex能够直接将英文需求描述直接转换为代码。本质上,codex不能创造代码,仅仅是在不停地搬运代码而已。

CodeXGLUE

代码智能代码智能(codeintelligence)的目的是让计算机具备理解和生成代码的能力,并利用编程语言知识和上下文进行推理,支持代码检索、补全、翻译、纠错、问答等场景。微软亚洲研究院(自然语言计算组)联合VisualStudio和必应搜索发布了代码智能领域首个大规模多任务的新基准——CodeXGLUE。该基准可覆盖code-code、code-text、text-code、text-text四个类别,包含10个任务及14个数据集,具体有:代码克隆检测、代码缺陷检测、代码完形填空、代码补全、代码纠错、代码翻译、代码检索、代码生成、代码注释生成、代码文档翻译十项任务。CodeXGLUE中包含如下十项任务:代码克隆检测(CloneDetection)、代码缺陷检测(DefectDetection)、代码完形填空(ClozeTest)、代码补全(CodeCompletion)、代码翻译(CodeTranslation)、代码检索(CodeSearch)、代码纠错(CodeRefinement)、代码生成(Text-to-codeGeneration)、代码注释生成(CodeSummarization)、文档翻译(DocumentationTranslation)。

IBM CodeNet

IBM宣布了CodeNet项目,是一个包含超过1400万个代码样本的数据集,涵盖50种编程语言,旨在解决4000个编码问题。该数据集还包含许多附加数据,例如软件运行所需的内存量和运行代码的日志输出。

谷歌CloudAutoML

谷歌CloudAutoML系统基于监督学习,可以生成一个定制化的机器学习模型。据说,模型会在一天之内训练完成。在这个模型生成以及训练的过程中,不需要任何人为的干预。

Copilot、aiXcoder、Tabnine等

业内产品Copilot、aiXcoder、Tabnine等都是可以根据自然语言生成相应代码块的AI工具。未来,AI生成代码这项技术将会越来越普及,但在AI生成代码的过程中,人类程序员仍然有着不可替代的作用。未来,初级程序员的需求量将会减少,而信息安全方向将会变得更为吃香。

本页网址:https://www.xinzhibang.net/article_detail-11632.html

寻求报道,请 点击这里 微信扫码咨询

关键词

GPT-3 CodeXGLUE IBM CodeNet 谷歌CloudAutoML Copilot aiXcoder Tabnine

分享至微信: 微信扫码阅读

相关工具

相关文章