aiXcoder推出基于深度学习的支持方法级代码生成的智能编程模型

新知榜官方账号

2023-07-08 13:33:02

aiXcoder推出基于深度学习的支持方法级代码生成的智能编程模型

伴随AI和大数据技术在整体软件市场的应用,软件开发行业正迎来自己的“第三次工业革命”,AI技术也开始在编码工作中发挥作用。近日,智能编程机器人提供商aiXcoder宣布推出国内首个基于深度学习的支持方法级代码生成的智能编程模型——aiXcoderXL,该模型能同时理解人类语言和编程语言,可根据自然语言功能描述一键生成完整程序代码(NLtoCode)。

目前aiXcoderXL已完成在程序编写场景下的应用测试,并即将以IDE插件形态推出支持商业编程的产品。

aiXcoderXL方法级代码生成实测aiXcoderXL效果如何呢?我们以Java语言为例,“将byte数组转化为16进制字符串”,创建这样一个描述功能的自然语言语句,点击生成按钮,模型就自动生成了与之对应的完整函数代码,程序员可直接使用。再比如,输入“用map中的值更新url中的参数”这样一句中文描述,就可以获得一个完整方法的代码实现。aiXcoderXL对英文自然语言描述的支持也相当出色。比如以下这个示例,“Calculatetheinnerproductoftwomatrices”(计算两个矩阵的内积),当我们还在思考具体计算步骤时,aiXcoderXL已经给出了完整的程序方法。尝试了多个类似的输入,aiXcoderXL都给出了可以直接复用的代码生成结果。特别是对于一些软件开发中需要经常在不同场景中编写的代码(例如,各类文件操作、字符串操作、网络服务等)aiXcoderXL的生成结果更是令人眼前一亮。

随机应变:根据需求变化,生成相应代码

aiXcoderXL还能进行动态交互,实现个性化人机结对编程。在实际开发过程中,有时无法“一步到位”描述清楚想要的内容是什么,需要“边写边改”,这时就需要模型能灵活理解每一处调整。aiXcoderXL支持与程序员进行动态的人机交互:在处理一些复杂的场景时,开发者不仅可以通过修改自然语言,也可以直接对已生成的代码进行编辑,使后续生成的代码更匹配开发者的具体需求。例如,在下图示例中,开发者可以直接在已生成代码里修改函数签名,把输入的压缩文件参数类型InputStream换成File对象,这样aiXcoderXL就能根据修改重新生成匹配需求的代码。

贴近实战:功能自动拆分,逐级生成方法代码

为了更好的代码可读性,aiXcoderXL生成代码时会将功能进行拆分,有时会使生成的代码中包含对其它尚不存在的函数的引用。将鼠标移到这些函数上,根据提示选择“为这段函数调用生成它的实现”即可进一步生成这些函数的实现。整个交互的过程大大提升了开发者的编程效率,创造了更智能、流畅的人机结对编程体验。

对开发者来说,就像拥有了智能输入法一样,无论你在写什么代码,aiXcoderXL都有可能帮到你。在此之前能实现类似功能的只有由微软、OpenAI、GitHub三家联合推出的GitHubCopilot。aiXcoder进一步做了与Copilot的性能对比测试。根据aiXcoder的官方介绍,测试数据集包含了175个代码的功能描述,这些描述清晰明确、功能独立,包括Java编程中高频出现的代码例子,涵盖大部分应用场景,并为每个例子配备了自动测试程序来验证程序的正确性。结果显示,aiXcoderXL展现出了能够匹敌Copilot的代码生成能力。

瑕不掩瑜:针对问题,持续改进

对于代码自动生成而言,方法级代码生成是一项艰难的任务。aiXcoderXL带来诸多惊喜的同时,测试者在试用过程中也遇到了一些错误的案例,例如:

示例1:当测试中输入“计算标准差”时,生成的代码并不是所期待的。在这个例子中,中文描述中的“标准差”一词被理解成了“标准化”,导致生成的代码未能满足需求。不过,如果把输入文本改成“Calculatethestandarddeviation”,就能得到想要的输出结果。可能对这个案例而言,英文描述比中文描述更容易区分。

示例2:测试者输入“ExtractallimagesfromaPowerPointfile.Andsavethemintoafolder”时,所生成的代码中却缺少了对PowerPoint的支持。这里的需求是提取PowerPoint文件里的图片,但aiXcoderXL却理解成了从某个文件夹中提取图片文件。“这体现出aiXcoderXL对于一些特殊需求的捕捉和理解还需要进一步改进”,aiXcoder的技术人员反馈。

示例3,当测试者输入“Returnanewimmutablecollectioncontaining…”时,aiXcoderXL生成的代码中包含了一个未定义的对象。在这个例子中,生成的代码中包含了一个store对象,用来表示当前路径的目录,但它却是一个没有被定义的对象。在具体使用场景中,以上问题都有可能遇到。aiXcoderCTO郝逸洋表示,将在后续的训练过程中进行调整,帮助模型更快“成长”。

降本增效,重新定义编程领域

延续以往版本的优势,aiXcoderXL仍支持企业私有化部署。“私有”的云端环境可充分保护企业的代码知识产权,满足企业特定场景的智能开发需求,帮助企业降低开发成本、提升质效。对开发者而言,有了aiXcoder智能开发工具的辅助,将大大提高写代码的效率、减少编程错误,让开发者从繁重的重复性编码劳动中解放出来,投入到更具创造性的工作中。

目前,在aiXcoder官方网站上,提供了aiXcoderXL模型的测试页面,可供开发者们在线体验。还会有aiXcoderXXL吗?距离自动化编程还有多远?“会有。”aiXcoder联合创始人刘洋表示,“大家也许已经看到,aiXcoder本系列的版本标号,采用了类似服装号码的标记。从L版到XL版,再到XXL版,是一个逐步演化的过程。这不仅体现了模型规模的变化,也体现了模型能力的逐步提升。在不久之后,大家将会看到能力更加强大的aiXcoderXXL。”

本页网址:https://www.xinzhibang.net/article_detail-6958.html

寻求报道,请 点击这里 微信扫码咨询

相关工具

相关文章