Copilot 之所以比那些程度一般的法式员更糟糕,一个关键问题在于,它甚至没有测验考试编译代码或查抄代码是否有效,也没有考虑过本身是否真的遵循了文档的指示。此外,Codex 没有接受过去一两年内创建代码的训练,因此它完全没学过最新版本、库和语言特性。例如,提示它创建 fastai 代码后,它只会给出使用 v1 API 的建议,而不是大约一年前发布的 v2 版本。
值得一提的是,本年 4 月,微软推出了 AI 代码审查东西 Jigsaw,以期进一步提升 AI 编码的准确率。
在研究论文《Jigsaw:当大型语言模型牵手法式综合》(Jigsaw: Large Language Models meet Program Synthesis,文章已被国际软件工程会议 ICSE 2022 接收)中,微软介绍了一种可以提高这类大型语言模型性能的新东西。Jigsaw 中包含可以理解法式语法及语义的后措置技术,可操感化户的反馈不竭提升修正能力。配合多模输入,Jigsaw 即可为 Python Pandas API 合成代码。
随着 Jigsaw 逐步在提高系统准确性方面阐扬重要感化,Copilot 这类 AI 编程东西准确率或将获得提升。