检测模型训练、目标检测方法、装置、设备、介质及产品制造方法及图纸

技术编号:33456136 阅读:13 留言:0更新日期:2022-05-19 00:38
本公开提供了检测模型训练、目标检测方法、装置、设备、介质及产品,涉及人工智能领域中的计算机视觉、图像识别和深度学习技术领域。具体实现方案为:获取对多个原始无标签图像分别进行两种程度变形处理后的多个变形图像对;多个变形图像对划分为两组;每个变形图像对中的第一变形图像的变形程度低于第二变形图像的变形程度;循环执行以下操作,直到满足检测模型收敛条件为止:基于第一组变形图像对和当前基准检测模型,对待优化参数的影子检测模型进行训练,获得当前影子检测模型;基于第二组变形图像对和当前影子检测模型,对待优化参数的基准检测模型进行训练,获得当前基准检测模型;当前基准检测模型与当前影子检测模型的网络结构相同。型的网络结构相同。型的网络结构相同。

【技术实现步骤摘要】
检测模型训练、目标检测方法、装置、设备、介质及产品


[0001]本公开涉及人工智能领域中的计算机视觉、图像识别和深度学习
,尤其涉及一种检测模型训练、目标检测方法、装置、设备、介质及产品。

技术介绍

[0002]在半监督检测技术中,训练数据通常可以分为有标签数据和无标签数据。现有的半监督检测方法中,需要使用有标注的数据训练老师模型,也可称为基准检测模型,再使用老师模型对无标注的数据进行标签预测,获得无标注数据的伪标签,利用具有伪标签的无标签数据训练学生模型,也可称为影子检测模型,以提高学生模型的训练精度。
[0003]但是,由于使用的老师模型预测的伪标签的精度不高,最终训练获得的学生模型并不准确。

技术实现思路

[0004]本公开提供了一种用于图像分类或者检测的检测模型训练、目标检测方法、装置、设备、介质及产品。
[0005]根据本公开的第一方面,提供了一种检测模型训练方法,包括:
[0006]获取对多个原始无标签图像分别进行两种程度变形处理后的多个变形图像对;多个变形图像对划分为两组;每个变形图像对中的第一变形图像的变形程度低于第二变形图像的变形程度;
[0007]循环执行以下操作,直到满足检测模型收敛条件为止:
[0008]基于第一组变形图像对和当前基准检测模型,对待优化参数的影子检测模型进行训练,获得当前影子检测模型;
[0009]基于第二组变形图像对和当前影子检测模型,对待优化参数的基准检测模型进行训练,获得当前基准检测模型;当前基准检测模型与当前影子检测模型的网络结构相同。
[0010]根据本公开的第二方面,提供了一种目标检测方法,包括:
[0011]确定待检测图像以及基于本公开实施例提供的检测模型训练方法获得的影子检测模型或者基准检测模型;
[0012]将待检测图像输入影子检测模型,获得第一目标检测结果;
[0013]或者将待检测图像输入基准检测模型,获得第二目标检测结果。
[0014]根据本公开的第三方面,提供了一种检测模型训练装置,包括:
[0015]图像变形单元,用于获取对多个原始无标签图像分别进行两种程度变形处理后的多个变形图像对;多个变形图像对划分为两组;每个变形图像对中的第一变形图像的变形程度低于第二变形图像的变形程度;
[0016]循环判断单元,用于循环执行以下操作,直到满足检测模型收敛条件为止;
[0017]第一训练单元,用于基于第一组变形图像对和当前基准检测模型,对待优化参数的影子检测模型进行训练,获得当前影子检测模型;
[0018]第二训练单元,用于基于第二组变形图像对和当前影子检测模型,对待优化参数的基准检测模型进行训练,获得当前基准检测模型;当前基准检测模型与当前影子检测模型的网络结构相同。
[0019]根据本公开的第四方面,提供了一种目标检测装置,包括:
[0020]第一确定单元,用于确定待检测图像以及基于本公开实施例提供的检测模型训练方法获得的影子检测模型或者基准检测模型;
[0021]第一检测单元,用于将待检测图像输入影子检测模型,获得第一目标检测结果;或者,
[0022]第二检测单元,用于将待检测图像输入基准检测模型,获得第二目标检测结果。
[0023]根据本公开的第五方面,提供了一种电子设备,包括:
[0024]至少一个处理器;以及
[0025]与至少一个处理器通信连接的存储器;其中,
[0026]存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行第一方面的方法。
[0027]根据本公开的第六方面,提供了一种电子设备,包括:
[0028]至少一个处理器;以及
[0029]与至少一个处理器通信连接的存储器;其中,
[0030]存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行第二方面的方法。
[0031]根据本公开的第七方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,计算机指令用于使计算机执行第一方面的方法。
[0032]根据本公开的第八方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,计算机指令用于使计算机执行第二方面的方法。
[0033]根据本公开的第九方面,提供了一种计算机程序产品,计算机程序产品包括:计算机程序,计算机程序存储在可读存储介质中,电子设备的至少一个处理器可以从可读存储介质读取计算机程序,至少一个处理器执行计算机程序使得电子设备执行第一方面的方法。
[0034]根据本公开的第十方面,提供了一种计算机程序产品,计算机程序产品包括:计算机程序,计算机程序存储在可读存储介质中,电子设备的至少一个处理器可以从可读存储介质读取计算机程序,至少一个处理器执行计算机程序使得电子设备执行第二方面的方法。
[0035]根据本公开的技术解决了半监督模型训练精度不高的问题,通过影子检测模型以及基准检测模型的交叉训练,可以提高影子检测模型以及基准检测模型的模型训练精度,获得更准确的影子检测模型以及基准检测模型。
[0036]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0037]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0038]图1是根据本公开第一实施例提供的检测模型训练以及目标检测方法的系统架构图;
[0039]图2是根据本公开第二实施例提供的检测模型训练方法的流程图;
[0040]图3是根据本公开第三实施例提供的检测模型训练方法的流程图;
[0041]图4是根据本公开第四实施例提供的检测模型训练方法的流程图;
[0042]图5是根据本公开第五实施例提供的目标检测方法的流程图;
[0043]图6是根据本公开第六实施例提供的检测模型训练装置的结构示意图;
[0044]图7是根据本公开第七实施例提供的目标检测装置的结构示意图;
[0045]图8是用来实现本公开实施例的检测模型训练方法的电子设备的框图;
[0046]图9是用来实现本公开实施例的目标检测方法的电子设备的框图。
具体实施方式
[0047]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0048]本公开实施例中,对于半监督检测模型而言,其可以采用老师模型以及学生模型,结合有标签的训练数据以及无标签的训练数据进行模型训练。模型训练时,可以认为老师模型是已知参数的,可以将无标本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种检测模型训练方法,包括:获取对多个原始无标签图像分别进行两种程度变形处理后的多个变形图像对;多个变形图像对划分为两组;每个变形图像对中的第一变形图像的变形程度低于第二变形图像的变形程度;循环执行以下操作,直到满足检测模型收敛条件为止:基于第一组变形图像对和当前基准检测模型,对待优化参数的影子检测模型进行训练,获得当前影子检测模型;基于第二组变形图像对和当前影子检测模型,对待优化参数的基准检测模型进行训练,获得当前基准检测模型;所述当前基准检测模型与所述当前影子检测模型的网络结构相同。2.根据权利要求1所述的方法,其中,所述基于第一组变形图像对和当前基准检测模型,对待优化参数的影子检测模型进行训练,获得当前影子检测模型,包括:采用当前基准检测模型对第一组变形图像对中第一变形图像进行检测,将检测获得的第一伪标签,作为所述第一组变形图像对中的第二变形图像的伪标签,对待优化参数的影子检测模型进行训练,获得当前影子检测模型;所述基于第二组变形图像对和当前影子检测模型,对待优化参数的基准检测模型进行训练,获得当前基准检测模型,包括:采用当前影子检测模型对第二组变形图像对中第一变形图像进行检测,将检测获得的第二伪标签,作为所述第二组变形图像对中的第二变形图像的伪标签,对待优化参数的基准检测模型进行训练,获得当前基准检测模型。3.根据权利要求2所述的方法,其中,所述将检测获得的第一伪标签,作为所述第一组变形图像对中的第二变形图像的伪标签,对待优化参数的影子检测模型进行训练,获得当前影子检测模型,包括:对待优化参数的影子检测模型进行模型初始化,获得候选影子检测模型;将所述第一组变形图像对中的第二变形图像,输入所述候选影子检测模型,获得第一预测标签;基于所述第二变形图像对应的第一伪标签以及第一预测标签,对所述候选影子检测模型进行模型损失计算,获得第一损失值;若确定所述第一损失值小于或等于预设第一损失阈值,则确定所述候选影子检测模型为当前影子检测模型;若确定所述第一损失值大于所述第一损失阈值,则更新所述候选影子检测模型的模型参数,返回执行所述将所述第一组变形图像对中的第二变形图像,输入候选影子检测模型,获得预测标签的步骤继续执行。4.根据权利要求3所述的方法,其中,所述将检测获得的第二伪标签,作为所述第二组变形图像对中的第二变形图像的伪标签,对待优化参数的基准检测模型进行训练,获得当前基准检测模型,包括:对待优化参数的基准检测模型进行模型初始化,获得候选基准检测模型;将所述第二组变形图像对中的第二变形图像,输入所述候选基准检测模型,获得第二预测标签;
基于所述第二变形图像对应的第二伪标签以及第二预测标签,对所述候选基准检测模型进行模型损失计算,获得第二损失值;若确定所述第二损失值小于或等于预设第二损失阈值,则确定所述候选基准检测模型为当前基准检测模型;若确定所述第二损失值大于预设第二损失阈值,则更新所述候选基准检测模型的模型参数,返回执行所述将所述第二组变形图像对中的第二变形图像,输入所述候选基准检测模型,获得第二预测标签的步骤继续执行。5.根据权利要求4所述的方法,还包括:基于所述第一损失值以及所述第二损失值,计算所述当前基准检测模型以及所述当前影子检测模型对应的总损失值;根据所述总损失值判断所述检测模型是否满足收敛条件;若所述总损失值小于或等于预设第三损失阈值,则确定满足检测模型收敛条件,停止执行循环训练;若所述总损失值大于预设第三损失阈值,则确定不满足检测模型收敛条件,继续执行循环训练。6.根据权利要求1

4任一项所述的方法,还包括:获取预设的最大迭代次数;判断检测模型当前训练次数是否达到最大迭代次数;若确定达到最大迭代次数,则确定满足检测模型收敛条件,停止执行循环训练;若确定未达到最大迭代次数,则确定不满足检测模型收敛条件,继续执行循环训练。7.根据权利要求1

6任一项所述的方法,其中,所述获取对多个原始无标签图像分别进行不同程度变形后的多个变形图像对,包括:对多个所述原始无标签图像分别进行第一变形处理,获得多个所述原始无标签图像分别对应的第一变形图像;对多个所述原始无标签图像分别进行第二变形处理,获得多个所述原始无标签图像分别对应的第二变形图像;确定多个所述原始无标签图像分别对应的第一变形图像以及第二变形图像构成的多个所述变形图像对。8.根据权利要求7所述的方法,其中,所述对多个所述原始标签图像分别进行第一变形处理,获得多个所述原始无标签图像分别对应的第一变形图像包括:对多个所述原始无标签图像分别进行图像翻转处理,获得多个所述原始无标签图像分别对应的第一变形图像。9.根据权利要求7或8所述的方法,其中,所述对多个所述原始无标签图像分别进行第二变形处理,获得多个所述原始无标签图像分别对应的第二变形图像,包括:确定所述原始无标签图像的待替换区域;所述待替换区域属于非目标区域;将待替换区域中的像素进行像素替换处理,获得目标替换区域;基于所述原始无标签中的未替换区域以及所述目标替换区域,生成所述原始无标签图像的第二变形图像。10.一种目标检测方法,包括:
确定待检测图像以及基于权利要求1

9任一项所述的检测模型训练方法获得的影子检测模型或者基准检测模型;将所述待检测图像输入所述影子检测模型,获得第一目标检测结果;或者将所述待检测图像输入所述基准检测模型,获得第二目标检测结果。11.一种检测模型训练装置,包括:图像变形单元,用于获取对多个原始无标签图像分别进行两种程度变形处理后的多个变形图像对;多个变形图像对划分为两组;每个变形图像对中的第一变形图像的变形程度低于第二变形图像的变形程度;循环判断单元,用于循环执行以下操作,直到满足检测模型收敛条件为止;第一训练单元,用于基于第一组变形图像对和当前基准检测模型,对待优化参数的影子检测模型进行训练,获得当前影子检测模型;第二训练单元,用于基于第二组变形图像对和当前影子检测模型,对待优化参数的基准检测模...

【专利技术属性】
技术研发人员:蒋旻悦谭啸孙昊
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1