深度学习模型的在线训练方法、装置、设备及存储介质制造方法及图纸

技术编号:34805436 阅读:22 留言:0更新日期:2022-09-03 20:12
本申请公开了一种深度学习模型的在线训练方法、装置、设备及存储介质,方法包括:获取原始图像数据集,原始图像数据集包括多个图像数据;利用预设的不确定性量化模块,对原始图像数据集进行数据筛选,得到预设数量的第一高质量样本;基于对第一高质量样本进行标注后的第一标注样本,对深度学习模型进行训练,直至深度学习模型达到收敛,得到目标深度学习模型;若目标深度学习模型的模型性能参数达到目标性能参数,则判定深度学习模型在线训练完成。本申请能够有效减少因样本质量差而导致出现目标类别易混淆和标注人员认知差异等情况,同时每次筛选预设数量的高质量样本,以减少样本标注量,并保证模型性能在有限样本量的前提下能够达标。下能够达标。下能够达标。

【技术实现步骤摘要】
深度学习模型的在线训练方法、装置、设备及存储介质


[0001]本申请涉及人工智能
,尤其涉及一种深度学习模型的在线训练方法、装置、设备及存储介质。

技术介绍

[0002]智能机器人的功能实现依赖于ResNet、YOLO等深度神经网络,深度神经网络需要庞大的标注数据集进行训练,以使模型胜任真实场景下的任务。目前,在数据集的标注过程中,由于目标类别易混淆、标注人员认知差异等不可控因素,导致样本类别被错误标注,所以不可避免的引入标签噪声,从而导致模型性能降低。

技术实现思路

[0003]本申请提供了一种深度学习模型的在线训练方法、装置、设备及存储介质,以解决数据集样本质量差导致模型性能降低的技术问题。
[0004]为了解决上述技术问题,第一方面,本申请提供了一种深度学习模型的在线训练方法,包括:
[0005]获取原始图像数据集,原始图像数据集包括多个图像数据;
[0006]利用预设的不确定性量化模块,对原始图像数据集进行数据筛选,得到预设数量的第一高质量样本;
[0007]基于对第一高质量样本进行标注后的第一标注样本,对深度学习模型进行训练,直至深度学习模型达到收敛,得到目标深度学习模型;
[0008]若目标深度学习模型的模型性能参数达到目标性能参数,则判定深度学习模型在线训练完成。
[0009]作为优选,利用预设的不确定性量化模块,对原始图像数据集进行数据筛选,得到预设数量的第一高质量样本,包括:
[0010]利用预设的后验概率分布公式,将图像数据作为输入值,计算图像数据在预设超参数和目标预测值时的后验概率分布值,目标预测值为图像数据在预设超参数时预测的输出值;
[0011]根据后验概率分布值,计算图像数据对应的预测熵和互信息,预测熵用于表征目标预测值所包含的信息量,互信息用于表征目标预测值的置信度;
[0012]若目标图像数据的预测熵和互信息满足预设的第一高质量样本条件,则目标图像数据作为第一高质量样本。
[0013]作为优选,后验概率分布公式为:
[0014][0015]表示后验概率分布,为目标预测值,为图像数据,D
1:T
为原始图像数据集,θ为预设超参数。
[0016]作为优选,根据后验概率分布值,计算图像数据对应的预测熵和互信息,包括:
[0017]利用预设的预测熵公式和互信息公式,根据后验概率分布值,计算图像数据对应的预测熵和互信息,预测熵公式为:
[0018][0019]互信息公式为:
[0020][0021]其中,为预测熵,用于表征目标预测值所包含的信息量;C为图像数据的类别;为互信息,用于表征目标预测值的置信度;表示条件熵。
[0022]作为优选,若目标图像数据的预测熵和互信息满足预设的第一高质量样本条件,则将目标图像数据作为第一高质量样本,包括:
[0023]将预测熵与预设熵进行对比,以及将互信息与预设互信息进行对比;
[0024]若预测熵大于预设熵,以及互信息大于预设互信息,则判定目标图像数据的预测熵和互信息满足第一高质量样本条件,并将目标图像数据作为第一高质量样本。
[0025]作为优选,基于对第一高质量样本进行标注后的第一标注样本,对深度学习模型进行训练,直至深度学习模型达到收敛,得到目标深度学习模型之后,还包括:
[0026]若目标深度学习模型的模型性能参数未达到目标性能参数,则执行数据筛选步骤,数据筛选步骤包括利用不确定性量化模块,继续对原始图像数据集进行数据筛选,得到预设数量的第二高质量样本;
[0027]基于对第二高质量样本进行标注后的第二标注样本,继续对深度学习模型进行训练,直至深度学习模型再次达到收敛,得到新的目标深度学习模型;
[0028]若新的目标深度学习模型的模型性能参数未达到目标性能参数,则返回数据筛选步骤,直至新的目标深度学习模型的模型性能参数达到目标性能参数,或返回数据筛选步骤的次数达到预设次数,则判定完成深度学习模型在线训练完成。
[0029]作为优选,获取机器人设备采集的原始图像数据集,包括:
[0030]向机器人设备发送目标控制参数,目标控制参数用于调整机器人设备上的相机单元的位姿参数,并通过相机单元采集原始图像数据集;
[0031]接收机器人设备采集的原始图像数据集。
[0032]第二方面,本申请还提供一种深度学习模型的在线训练装置,包括:
[0033]获取模块,用于获取原始图像数据集,原始图像数据集包括多个图像数据;
[0034]不确定性量化模块,用于对原始图像数据集进行数据筛选,得到预设数量的第一高质量样本;
[0035]训练模块,用于基于对第一高质量样本进行标注后的第一标注样本,对深度学习模型进行训练,直至深度学习模型达到收敛,得到目标深度学习模型;
[0036]判定模块,用于若目标深度学习模型的模型性能参数达到目标性能参数,则判定深度学习模型在线训练完成。
[0037]第三方面,本申请还提供一种计算机设备,包括处理器和存储器,存储器用于存储
计算机程序,计算机程序被处理器执行时实现如第一方面的深度学习模型的在线训练方法。
[0038]第四方面,本申请还提供一种计算机可读存储介质,其存储有计算机程序,计算机程序被处理器执行时实现如第一方面的深度学习模型的在线训练方法。
[0039]与现有技术相比,本申请具备以下有益效果:
[0040]通过获取原始图像数据集,并利用预设的不确定性量化模块,对原始图像数据集进行数据筛选,得到预设数量的第一高质量样本,从而提高待标注样本的质量,以有效减少因样本质量差而导致出现目标类别易混淆和标注人员认知差异等情况,同时每次筛选预设数量的高质量样本,以减少样本标注量;再基于对第一高质量样本进行标注后的第一标注样本,对深度学习模型进行训练,直至深度学习模型达到收敛,得到目标深度学习模型,从而利用高质量样本提高模型性能;最后,对模型性能参数进行验证,若目标深度学习模型的模型性能参数达到目标性能参数,则判定深度学习模型在线训练完成,从而保证模型性能在有限样本量的前提下能够达标。
附图说明
[0041]图1为本申请实施例示出的一种深度学习模型的在线训练方法的流程示意图;
[0042]图2为本申请实施例示出的另一种深度学习模型的在线训练方法的流程示意图;
[0043]图3为本申请实施例示出的步骤S102的流程示意图;
[0044]图4为本申请实施例示出的深度学习模型的在线训练装置的结构示意图;
[0045]图5为本申请实施例示出的计算机设备的结构示意图。
具体实施方式
[0046]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种深度学习模型的在线训练方法,其特征在于,包括:获取原始图像数据集,所述原始图像数据集包括多个图像数据;利用预设的不确定性量化模块,对所述原始图像数据集进行数据筛选,得到预设数量的第一高质量样本;基于对所述第一高质量样本进行标注后的第一标注样本,对深度学习模型进行训练,直至所述深度学习模型达到收敛,得到目标深度学习模型;若所述目标深度学习模型的模型性能参数达到目标性能参数,则判定所述深度学习模型在线训练完成。2.如权利要求1所述的深度学习模型的在线训练方法,其特征在于,所述利用预设的不确定性量化模块,对所述原始图像数据集进行数据筛选,得到预设数量的第一高质量样本,包括:利用预设的后验概率分布公式,将所述图像数据作为输入值,计算所述图像数据在预设超参数和目标预测值时的后验概率分布值,所述目标预测值为所述图像数据在所述预设超参数时预测的输出值;根据所述后验概率分布值,计算所述图像数据对应的预测熵和互信息,所述预测熵用于表征所述目标预测值所包含的信息量,所述互信息用于表征目标预测值的置信度;若目标图像数据的所述预测熵和所述互信息满足预设的第一高质量样本条件,则所述目标图像数据作为所述第一高质量样本。3.如权利要求2所述的深度学习模型的在线训练方法,其特征在于,所述后验概率分布公式为:公式为:表示所述后验概率分布,为所述目标预测值,为所述图像数据,D
1:T
为所述原始图像数据集,θ为所述预设超参数。4.如权利要求2所述的深度学习模型的在线训练方法,其特征在于,所述根据所述后验概率分布值,计算所述图像数据对应的预测熵和互信息,包括:利用预设的预测熵公式和互信息公式,所述根据所述后验概率分布值,计算所述图像数据对应的预测熵和互信息,所述预测熵公式为:所述互信息公式为:其中,为所述预测熵,用于表征所述目标预测值所包含的信息量;C为所述图像数据的类别;为所述互信息,用于表征目标预测值的置信度;表示条件熵。5.如权利要求2所述的深度学习模型的在线训练方法,其特征在于,所述若目标图像数据的所述预测熵和所述互信息满足预设的第一高质量样本条件,则将所述目标图像数据作
为所述第一高质量样本,包括:将所述预测熵与预设熵进行对比,以及将所述互信息与预设互信息进行对比;若所述预测熵大于预设熵,以及所述互...

【专利技术属性】
技术研发人员:刘娜吴国栋袁野万里红
申请(专利权)人:河南爬客智能机器人有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1