一种代码生成与缺陷修复方法和装置制造方法及图纸

技术编号：39154366 阅读：30 留言：0更新日期：2023-10-23 15:00

本申请涉及人工智能应用技术领域，提供了一种代码生成与缺陷修复方法和装置。该方法包括：构建有监督的代码生成语料库，以及基于代码生成语料库，对大语言模型进行预训练；输入代码生成需求和/或缺陷描述至经过预训练的大语言模型，以便对大语言模型进行微调后，获得生成代码和/或代码缺陷修复建议；依据代码编译器对生成代码的编译测试结果，采用强化学习类算法，对生成代码和/或代码缺陷修复建议进行评估，以便更新大语言模型的参数，直至模型收敛。本申请实施例的在对生成代码或者需要进行缺陷修复的代码进行修改或者修复时，能够有效检测评估代码缺陷以及代码缺陷修复准确性。效检测评估代码缺陷以及代码缺陷修复准确性。效检测评估代码缺陷以及代码缺陷修复准确性。

全部详细技术资料下载

【技术实现步骤摘要】
一种代码生成与缺陷修复方法和装置

[0001]本申请涉及人工智能应用
，尤其涉及一种代码生成与缺陷修复方法和装置。

技术介绍

[0002]近年来，随着人工智能技术的发展，特别是大语言模型的运用颠覆了传统的由程序员进行软件开发软件的模式，形成了代码生成技术。由于软件代码缺陷在软件开发过程中本身是不可避免的，加之软件规模在不断增加软件代码缺陷的数量也在随之增加，再叠加代码自动生成的新模式，更是给开发过程中出现的软件代码缺陷修复工作，带来了新的挑战。软件代码缺陷自动修复技术的发展，吸引了来自软件工程、程序语言、人工智能、形式化验证等多领域的交叉研究。
[0003]然而，基于大语言模型的代码生成技术也存在一些问题和挑战。由于大语言模型通常是基于海量文本数据进行训练而得到的，并不一定能够完全符合编程规范和逻辑。在使用大语言模型生成代码时，可能会出现一些错误或者不合理之处，导致代码不能正常运行或者达不到预期效果。
[0004]因此，在对生成代码或者需要进行缺陷修复的代码进行修改或者修复时，如何有效检测评估代码中是否存在缺陷以及缺陷修复的准确性，是亟待解决的技术问题。

技术实现思路

[0005]有鉴于此，本申请实施例提供了一种代码生成与缺陷修复方法、装置、电子设备及计算机可读存储介质，以解决现有技术在有效检测评估代码中是否存在缺陷以及缺陷修复准确性的问题。
[0006]本申请实施例的第一方面，提供了一种代码生成与缺陷修复方法，大语言模型与代码编译器相连，所述方法包括：构建有监督的代码生...

【技术保护点】

【技术特征摘要】
1.一种代码生成与缺陷修复方法，其特征在于，大语言模型与代码编译器相连，所述方法包括：构建有监督的代码生成语料库，以及基于所述代码生成语料库，对所述大语言模型进行预训练；输入代码生成需求和/或缺陷描述至经过预训练的所述大语言模型，以便对所述大语言模型进行微调后，获得生成代码和/或代码缺陷修复建议；依据所述代码编译器对所述生成代码的编译测试结果，采用强化学习类算法，对所述生成代码和/或所述代码缺陷修复建议进行评估，以便更新所述大语言模型的参数，直至模型收敛。2.根据权利要求1所述的方法，其特征在于，所述有监督的代码生成语料库的数据包括代码片段、对应功能描述和预期输出。3.根据权利要求1所述的方法，其特征在于，对所述大语言模型进行微调包括采用编码解码结构的seq2seq序列到序列模型训练方法。4.根据权利要求1所述的方法，其特征在于，所述强化学习类算法包括策略梯度算法、Q
‑
Leaning、DQN、PPO和/或A3C。5.根据权利要求4所述的方法，其特征在于，当采用所述策略梯度算法时，包括：采用策略梯度对所述大语言模型的梯度进行更新，计算所述策略梯度为，其中为评分函数，表示大语言模型及其参数，表示输出，表示输入，表示依据所述代码编译器对所述生成代码的编译测试结果评价；基于所述策略梯度，对所述大语言模型的所述参数进行更新，更新所述参数为，其中，为权重因子，为所述大语言模型的所述参数。6.根据权利要求5所述的方法，其...

【专利技术属性】
技术研发人员：徐琳，王芳，暴宇健，
申请(专利权)人：深圳须弥云图空间科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人