AI代码补全工具CodeGeeX介绍

新知榜官方账号

2023-07-06 05:12:34

前言

ChatGPT把AI带火了,我就在想,能用它做点什么呢,总不能只让它给我们带来焦虑,也要让我们从科技浪潮中分得一点红利吧。一番查找下来,有个功能对我们程序员来说比较实用,就是AI的代码提示补全功能。

最先找到的是GitHubCopilot。不幸的是GitHubCopilot从2022年8月22日之后,开始收费。正式版定价10美元/月(人民币约67元),年付有优惠100美元/年(人民币约669元),每月67元还是有些小贵。经验告诉我,如果市场上存在一块大蛋糕,不可能只被一家公司看到,肯定有许多公司都在研究开发,有替代品。沿着这个思路,我找到了今天的主角CodeGeeX。

CodeGeex简介

CodeGeeX是一个具有130亿参数的多编程语言代码生成预训练模型。CodeGeeX采用华为MindSpore框架实现,在鹏城实验室“鹏城云脑II”中的192个节点(共1536个国产昇腾910AI处理器)上训练而成。截至2022年6月22日,CodeGeeX历时两个月在20多种编程语言的代码语料库(>8500亿Token)上预训练得到。

CodeGeeX有以下特点:

  • 高精度代码生成:支持生成Python、C++、Java、JavaScript和Go等多种主流编程语言的代码,在多语言代码生成基准HumanEval-X[1]代码生成任务上取得47%~60%求解率,较其他开源基线模型有更佳的平均性能。
  • 跨语言代码翻译:支持代码片段在不同编程语言间进行自动翻译转换,翻译结果正确率高,在HumanEval-X代码翻译任务上超越了其它基线模型。
  • 自动编程插件:CodeGeeX插件现已上架VSCode插件市场(完全免费),用户可以通过其强大的少样本生成能力,自定义代码生成风格和能力,更好辅助代码编写。
  • 模型跨平台开源:所有代码和模型权重开源开放,用作研究用途。CodeGeeX同时支持昇腾和英伟达平台,可在单张昇腾910或英伟达V100/A100上实现推理。

我使用下来,觉得CodeGeeX的主要功能是通过解读你的代码注释生成对应功能的代码,或者基于你前面/以前的代码给出后面/下一代码片段的补全建议。

代码补全功能

写一个生成饼图的中文注释,CodeGeeX就把用ECharts生成饼图的主体功能实现了,微调一下就可以投入实际使用。这个过程中不需要等待过长时间,能够提高编码生产力。不过,补全的代码仍旧需要人工CodeReview和调试,现阶段AI还不能完全替代程序员。

其他AI代码补全工具

除了CodeGeeX,还有一些其他的AI代码补全工具,如Codeium、Codiga、Kite等。这些工具的目标都是帮助程序员更快地编写高质量的代码。

结语

ChatGPT掀起的这股科技浪潮,才是一次划时代的科技变革,必将影响深远。随着AI技术的不断发展,编程的门槛将会大幅降低,程序员的护城河将不复存在,这是百年未有之大变局。

不过,AI补全代码的功能虽然强大,但只适合通用场景,要是开发一些定制化很强的业务代码,也很难给它描述清楚。

本页网址:https://www.xinzhibang.net/article_detail-6200.html

寻求报道,请 点击这里 微信扫码咨询

关键词

AI 代码补全 CodeGeeX

分享至微信: 微信扫码阅读

相关工具

相关文章