计算机视觉模型的训练方法、装置、电子设备和存储介质制造方法及图纸

技术编号:26033593 阅读:28 留言:0更新日期:2020-10-23 21:11
本申请公开了一种计算机视觉模型的训练方法、装置、电子设备和存储介质,所述计算机视觉模型的训练方法包括:利用计算机视觉模型对第一样本图像集中的样本图像进行识别,得到图像识别结果;基于图像识别结果对所述样本图像进行分类,并基于统计分布函数分别选取各分类下的至少部分样本图像,根据选取的样本图像生成第二样本图像集;根据第二样本图像集对计算机视觉模型进行迭代训练,根据每个迭代训练阶段得到的训练损失值对计算机视觉模型进行参数更新或结束训练。本申请通过选取典型样本图像对模型进行迭代训练,减少了人工标注样本的时间,通过将人工标注和模型标注结果比较,能够得到难样本图像,从而训练出具有较好识别性能的模型。

【技术实现步骤摘要】
计算机视觉模型的训练方法、装置、电子设备和存储介质
本申请涉及计算机视觉
,具体涉及一种计算机视觉模型的训练方法、装置、电子设备和存储介质。
技术介绍
随着人工智能时代的到来,深度学习技术已经被广泛应用到了各个领域,尤其是在计算机视觉领域,深度学习模型也发挥的重要作用。对于深度学习模型的训练,其在面对不同情况的样本时,需要大量的训练样本和时间来提高模型性能,从而达到预期的效果。然而现有的深度学习训练过程很难得到训练模型的难样本,导致了许多初始模型在不同情况下对一些难样本的检测性能较差,因此模型需要不断的改进和更新,才能得到较好的性能。
技术实现思路
鉴于上述问题,提出了本申请以便提供一种克服上述问题或者至少部分地解决上述问题的计算机视觉模型的训练方法、装置、电子设备和存储介质。依据本申请的第一方面,提供了一种计算机视觉模型的训练方法,包括:利用计算机视觉模型对第一样本图像集中的样本图像进行识别,得到图像识别结果;基于图像识别结果对所述第一样本图像集中的样本图像进行分类,并基于统计分布函数分别选取各分类下的至少部分样本图像,根据选取的样本图像生成第二样本图像集;根据所述第二样本图像集对所述计算机视觉模型进行迭代训练,根据每个迭代训练阶段得到的训练损失值对所述计算机视觉模型进行参数更新或结束训练。可选地,所述图像识别结果包括图像预测概率值,所述基于图像识别结果对所述第一样本图像集中的样本图像进行分类,并基于统计分布函数分别选取各分类下的至少部分样本图像包括:将所述图像预测概率值与预设概率值进行比较,根据比较结果确定模糊样本图像和清晰样本图像;基于正态分布概率模型分别对所述模糊样本图像和所述清晰样本图像进行样本抽取。可选地,所述根据选取的样本图像生成第二样本图像集包括:根据所述图像识别结果确定所述第二样本图像集中各样本图像的样本属性,以根据所述样本属性确定所述计算机视觉模型的训练样本权重。可选地,所述根据所述图像识别结果确定所述第二样本图像集中各样本图像的样本属性包括:将所述第二样本图像集中各样本图像的图像识别结果与图像人工标注结果进行比较;根据比较结果确定各样本图像的样本难易属性。可选地,所述根据比较结果确定各样本图像的样本难易属性包括:若比较结果表征的差异度大于预设阈值,则确定相应的样本图像的样本难易属性为困难,否则为常规;所述根据所述图像识别结果确定所述第二样本图像集中各样本图像的样本属性还包括:将样本难易属性为困难的各样本图像的比较结果作为相应的样本图像的标注差异属性。可选地,所述标注差异属性包括候选框位置差异、候选框大小差异和候选框类别差异中的至少一种,所述根据所述样本属性确定所述计算机视觉模型的训练样本权重包括:根据样本难易属性为困难的各样本图像的标注差异属性确定相应的样本图像的训练样本权重。可选地,所述根据所述第二样本图像集对所述计算机视觉模型进行迭代训练包括:通过前端页面可视化地展示所述第二样本图像集中各样本图像的图像识别结果和标注信息。依据本申请的第二方面,提供了一种计算机视觉任务的实现方法,包括:获取待处理图像;利用计算机视觉模型执行基于所述待处理图像的计算机视觉任务,得到任务执行结果,其中所述计算机视觉模型基于如前任一项所述的计算机视觉模型的训练方法训练得到。依据本申请的第三方面,提供了一种计算机视觉模型的训练装置,包括:识别单元,用于利用计算机视觉模型对第一样本图像集中的样本图像进行识别,得到图像识别结果;选取单元,用于基于图像识别结果对所述第一样本图像集中的样本图像进行分类,并基于统计分布函数分别选取各分类下的至少部分样本图像,根据选取的样本图像生成第二样本图像集;训练单元,用于根据所述第二样本图像集对所述计算机视觉模型进行迭代训练,根据每个迭代训练阶段得到的训练损失值对所述计算机视觉模型进行参数更新或结束训练。可选地,所述图像识别结果包括图像预测概率值,所述选取单元还用于:将所述图像预测概率值与预设概率值进行比较,根据比较结果确定模糊样本图像和清晰样本图像;基于正态分布概率模型分别对所述模糊样本图像和所述清晰样本图像进行样本抽取。可选地,所述选取单元还用于:根据所述图像识别结果确定所述第二样本图像集中各样本图像的样本属性,以根据所述样本属性确定所述计算机视觉模型的训练样本权重。可选地,所述选取单元还用于:将所述第二样本图像集中各样本图像的图像识别结果与图像人工标注结果进行比较;根据比较结果确定各样本图像的样本难易属性。可选地,所述选取单元还用于:若比较结果表征的差异度大于预设阈值,则确定相应的样本图像的样本难易属性为困难,否则为常规;将样本难易属性为困难的各样本图像的比较结果作为相应的样本图像的标注差异属性。可选地,所述标注差异属性包括候选框位置差异、候选框大小差异和候选框类别差异中的至少一种,所述选取单元还用于:根据样本难易属性为困难的各样本图像的标注差异属性确定相应的样本图像的训练样本权重。可选地,所述训练单元还用于:通过前端页面可视化地展示所述第二样本图像集中各样本图像的图像识别结果和标注信息。依据本申请的第四方面,提供了一种计算机视觉任务的实现装置,包括:获取单元,用于获取待处理图像;执行单元,用于利用计算机视觉模型执行基于所述待处理图像的计算机视觉任务,得到任务执行结果,其中所述计算机视觉模型基于如前所述的计算机视觉模型的训练装置训练得到。依据本申请的第五方面,提供了一种电子设备,包括:处理器;以及被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行如上述任一所述的计算机视觉模型的训练方法,或者如上述所述的计算机视觉任务的实现方法。依据本申请的第六方面,提供了一种计算机可读存储介质,其中,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被处理器执行时,实现如上述任一所述的计算机视觉模型的训练方法,或者如上述所述的计算机视觉任务的实现方法。由上述可知,本申请的技术方案,通过利用计算机视觉模型对第一样本图像集中的样本图像进行识别,得到图像识别结果;基于图像识别结果对所述第一样本图像集中的样本图像进行分类,并基于统计分布函数分别选取各分类下的至少部分样本图像,根据选取的样本图像生成第二样本图像集;根据所述第二样本图像集对所述计算机视觉模型进行迭代训练,根据每个迭代训练阶段得到的训练损失值对所述计算机视觉模型进行参数更新或结束训练。本申请通过选取典型样本图像对计算机视觉模型进行迭代训练,节省了大量人工标注样本图像的时间和精力,大大提高了模型的训练效率。此外,通过将人工标注和模型标注结果比较,能够得到难样本图像,从而训练出具有较好识别性能的模型。通过训练效果的可视化展示,可以更本文档来自技高网...

【技术保护点】
1.一种计算机视觉模型的训练方法,其特征在于,包括:/n利用计算机视觉模型对第一样本图像集中的样本图像进行识别,得到图像识别结果;/n基于图像识别结果对所述第一样本图像集中的样本图像进行分类,并基于统计分布函数分别选取各分类下的至少部分样本图像,根据选取的样本图像生成第二样本图像集;/n根据所述第二样本图像集对所述计算机视觉模型进行迭代训练,根据每个迭代训练阶段得到的训练损失值对所述计算机视觉模型进行参数更新或结束训练。/n

【技术特征摘要】
1.一种计算机视觉模型的训练方法,其特征在于,包括:
利用计算机视觉模型对第一样本图像集中的样本图像进行识别,得到图像识别结果;
基于图像识别结果对所述第一样本图像集中的样本图像进行分类,并基于统计分布函数分别选取各分类下的至少部分样本图像,根据选取的样本图像生成第二样本图像集;
根据所述第二样本图像集对所述计算机视觉模型进行迭代训练,根据每个迭代训练阶段得到的训练损失值对所述计算机视觉模型进行参数更新或结束训练。


2.根据权利要求1所述的计算机视觉模型的训练方法,其特征在于,所述图像识别结果包括图像预测概率值,所述基于图像识别结果对所述第一样本图像集中的样本图像进行分类,并基于统计分布函数分别选取各分类下的至少部分样本图像包括:
将所述图像预测概率值与预设概率值进行比较,根据比较结果确定模糊样本图像和清晰样本图像;
基于正态分布概率模型分别对所述模糊样本图像和所述清晰样本图像进行样本抽取。


3.根据权利要求1所述的计算机视觉模型的训练方法,其特征在于,所述根据选取的样本图像生成第二样本图像集包括:
根据所述图像识别结果确定所述第二样本图像集中各样本图像的样本属性,以根据所述样本属性确定所述计算机视觉模型的训练样本权重。


4.根据权利要求3所述的计算机视觉模型的训练方法,其特征在于,所述根据所述图像识别结果确定所述第二样本图像集中各样本图像的样本属性包括:
将所述第二样本图像集中各样本图像的图像识别结果与图像人工标注结果进行比较;
根据比较结果确定各样本图像的样本难易属性。


5.根据权利要求4所述的计算机视觉模型的训练方法,其特征在于,所述根据比较结果确定各样本图像的样本难易属性包括:
若比较结果表征的差异度大于预设阈值,则确定相应的样本图像的样本难易属性为困难,否则为常规;
所述根据所述图像识别结果确定所述第二样本图像集中各样本图像的样本属性还包括:
将样本难易属性为困难的各样本图像的比较结果作为相应的样本图像的标注差异属性。


6.根据权利要求5所述的计算机视觉模型的训练方法,其特征在于,所述标注差异属性包括候选框位置差异、候选框大小差异和候选框类别差异中的至少一种,所述根据所...

【专利技术属性】
技术研发人员:苑帅付万豪刘殿超张观良王刚
申请(专利权)人:理光软件研究所北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1