【技术实现步骤摘要】
基于生成式人工智能的代码补全方法和装置、介质
[0001]本公开的实施方式涉及生成式人工智能领域,更具体地,本公开的实施方式涉及一种基于生成式人工智能的代码补全方法和装置
、
介质
。
技术介绍
[0002]本部分旨在为权利要求书中陈述的本公开的实施方式提供背景或上下文
。
此处的描述不因为包括在本部分中就承认是现有技术
。
[0003]生成式人工智能是一种人工智能技术,它利用深度学习算法来模拟人类创造信息的能力
。
与传统的基于规则的人工智能不同,生成式人工智能可以通过学习大规模数据集来生成新的不同模态
(
比如文本,图片,语音等
)
的数据
。
生成式人工智能在许多领域都有广泛的应用,包括自然语言处理
、
计算机视觉
、
音频合成等
。
例如,在自然语言处理领域,生成式人工智能可以用于自动文本摘要
、
文章创作
、
对话系统等任务
。
[0004]相关技术中的代码补全方法依赖于事先定义好的规则和模板生成补全代码,但其受限于已定义的规则,难以适应复杂的业务场景,当遇到新的
、
非常规的代码片段时,生成的代码无法实现预期的功能
。
技术实现思路
[0005]有鉴于此,本公开提供一种基于生成式人工智能的代码补全方法和装置
、
介质,以解决相关技术中的不 ...
【技术保护点】
【技术特征摘要】
1.
一种基于生成式人工智能的代码补全方法,其特征在于,包括:将第一信息输入至经训练的代码补全模型中,由所述代码补全模型输出与所述第一信息对应的目标代码,所述目标代码用于实现预期的代码功能;其中,所述第一信息包括采用自然语言对所述代码功能进行描述的代码描述语句,和
/
或,待补全的代码字符串片段
。2.
根据权利要求1所述的方法,其特征在于,所述代码补全模型是基于样本数据集进行训练而获得的;其中,所述样本数据集包括:代码样本数据,以及对应于所述代码样本数据的注释样本数据
。3.
根据权利要求2所述的方法,其特征在于,所述代码补全模型是在经预训练的初始化模型的基础上,微调得到的因果语言模型;其中,所述因果语言模型用于根据所述代码样本数据和所述注释样本数据拼接而成的输入样本数据,对所述待补全的代码字符串片段中的缺失字符进行预测,以确定所述目标代码
。4.
根据权利要求3所述的方法,其特征在于,所述因果语言模型是基于第一损失函数对所述初始化模型进行微调获得的;其中,所述注释样本数据和所述代码样本数据分别包括若干个
token
,所述第一损失函数针对每个所述
token
设置有权重,所述权重表征所述
token
的损失对所述初始化模型的总损失的影响程度;所述注释样本数据中每个
token
的权重小于与所述注释样本数据对应的代码样本数据中每个
token
的权重
。5.
根据权利要求4所述的方法,其特征在于,所述注释样本数据中每个
token
的权重为0,以使所述第一损失函数屏蔽所述注释样本数据
。6.
根据权利要求4所述的方法,其特征在于,所述第一损失函数的公式为:其中,表示所述注释样本数据中第
...
【专利技术属性】
技术研发人员:林吴航,袁威强,胡光龙,刘东,李家诚,沙雨辰,
申请(专利权)人:网易杭州网络有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。