模型的训练方法、装置、设备、存储介质以及检测方法制造方法及图纸

技术编号:31797290 阅读:16 留言:0更新日期:2022-01-08 10:57
本公开提供了模型的训练方法、装置、设备、存储介质以及检测方法,涉及人工智能领域,具体涉及计算机视觉和深度学习领域,可应用于智能机器人和自动驾驶场景下。具体实现方案为:利用第一有监督数据对待训练的初始模型进行第一阶段训练,得到预选检测模型;利用第二有监督数据以及无监督数据对预选检测模型进行第二阶段训练,得到目标检测模型;其中,目标检测模型用于根据输入的待检测图像,输出待检测图像中的3D物体信息。根据本公开的技术,可以训练得到具有较高检测精度和泛化性能的目标检测模型,降低了第一有监督数据和第二有监督数据的数据量,减少了人工标注的人力成本和时间成本,提高了模型的训练效率。提高了模型的训练效率。提高了模型的训练效率。

【技术实现步骤摘要】
模型的训练方法、装置、设备、存储介质以及检测方法


[0001]本公开涉及人工智能领域,具体涉及计算机视觉和深度学习领域,可应用于智能机器人和自动驾驶场景下。

技术介绍

[0002]针对单目图像的3D检测,主要依赖于3D目标包围框的先验信息,提前遍历数据集生成3D候选框,然后利用图像检测模型处理输入的单目图像输出3D偏移量,结合3D候选框和3D偏移量得到物体的真实3D包围框,实现对单目图像的3D检测任务。
[0003]针对图像检测模型的训练过程,相关技术中通常需要利用人工标注好的标签数据对图像检测模型进行有监督学习,但由于人工标注的工作量大且标注周期较长,导致图像检测模型的定位精度受限于人工标注样本的数据量以及标注精度。

技术实现思路

[0004]本公开提供了一种模型训练的方法、装置、设备、存储介质以及检测方法。
[0005]根据本公开的一方面,提供了一种模型的训练方法,包括:
[0006]利用第一有监督数据对待训练的初始模型进行第一阶段训练,得到预选检测模型;
[0007]利用第二有监督数据以及无监督数据对预选检测模型进行第二阶段训练,得到目标检测模型;
[0008]其中,目标检测模型用于根据输入的待检测图像,输出待检测图像中的3D物体信息。
[0009]根据本公开的另一方面,提供了一种图像的检测方法,包括:
[0010]将待检测图像输入目标检测模型;
[0011]从目标检测模型接收待检测图像中的3D物体信息;
[0012]其中,目标检测模型采用根据本公开上述实施例的模型训练方法得到。
[0013]根据本公开的另一方面,提供了一种模型的训练装置,包括:
[0014]第一阶段训练模块,用于利用第一有监督数据对待训练的初始模型进行第一阶段训练,得到预选检测模型;
[0015]第二阶段训练模块,用于利用第二有监督数据以及无监督数据对预选检测模型进行第二阶段训练,得到目标检测模型;
[0016]其中,目标检测模型用于根据输入的待检测图像,输出待检测图像中的3D物体信息。
[0017]根据本公开的另一方面,提供了一种图像的检测装置,包括:
[0018]输入模块,用于将待检测图像输入目标检测模型;
[0019]接收模块,用于从目标检测模型接收待检测图像中的3D物体信息;
[0020]其中,目标检测模型是根据本公开上述实施例的模型训练装置得到的。
[0021]根据本公开的另一方面,提供了一种电子设备,包括:
[0022]至少一个处理器;以及
[0023]与该至少一个处理器通信连接的存储器;其中,
[0024]该存储器存储有可被该至少一个处理器执行的指令,该指令被该至少一个处理器执行,以使该至少一个处理器能够执行本公开任一实施例中的方法。
[0025]根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,该计算机指令用于使计算机执行本公开任一实施例中的方法。
[0026]根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现本公开任一实施例中的方法。
[0027]根据本公开实施例的模型的训练方法,可以训练得到具有较高检测精度和泛化性的目标检测模型,并且,通过利用无监督数据对预选检测模型进行训练,降低了第一有监督数据和第二有监督数据的数据量,减少了人工标注的人力成本和时间成本,提高了模型的训练效率。
[0028]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0029]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0030]图1是根据本公开实施例的模型的训练方法的流程图;
[0031]图2是根据本公开实施例的模型的训练方法的进行第二阶段训练的具体流程图;
[0032]图3是根据本公开实施例的模型的训练方法的进行数据预处理的具体流程图;
[0033]图4是根据本公开实施例的模型的训练方法的进行自监督训练的具体流程图;
[0034]图5是根据本公开实施例的模型的训练方法的进行自监督训练的具体流程图;
[0035]图6是根据本公开实施例的模型的训练方法的进行第二阶段训练的具体流程图;
[0036]图7是根据本公开实施例的图像的检测方法的流程图;
[0037]图8是根据本公开实施例的模型的训练装置的框图;
[0038]图9是根据本公开实施例的图像的检测装置的框图;
[0039]图10是用来实现本公开实施例的模型的训练方法和/或图像的检测方法的电子设备的框图。
具体实施方式
[0040]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0041]下面参照图1至图6描述根据本公开实施例的目标检测模型的训练方法。
[0042]如图1所示,本公开实施例的目标检测模型的训练方法具体包括以下步骤:
[0043]S101:利用第一有监督数据对待训练的初始模型进行第一阶段训练,得到预选检测模型;
[0044]S102:利用第二有监督数据以及无监督数据对预选检测模型进行第二阶段训练,得到目标检测模型;
[0045]其中,目标检测模型用于根据输入的待检测图像,输出待检测图像中的3D物体信息。
[0046]示例性地,第一有监督数据和第二有监督数据可以为针对样本图像经过人工标注或机器标注后的数据,具体可以包括样本图像以及样本图像中的目标物的真实3D物体信息。其中,真实3D物体信息可以包括目标物的分类信息、位置信息、尺寸信息以及角度信息等。无监督数据可以为未经人工标注的样本图像。
[0047]更为具体地,在目标检测模型为针对单目视觉图像的3D物体检测的应用场景中,样本图像可以为利用单目视觉传感器所采集到的单目视觉图像。
[0048]需要说明的是,在第一阶段训练中所使用的第一有监督数据以及在第二阶段训练中所使用的第二有监督数据可以为相同的数据,也可以为不同的数据。
[0049]示例性地,在步骤S101中,第一阶段训练可以为有监督训练。
[0050]在一个具体示例中,利用第一有监督数据对待训练的初始模型进行有监督训练,具体可以包括以下步骤:
[0051]将第一有监督数据输入待训练的初始模型,得到第一有监督数据对应的初始检测结果。确定第一有监督数据对应的标注信息与初始检测结果之间的差异,并根据上述差异对待训练的初始模型的模型参数进行调整,经过多轮迭代,直至得到满足预设收敛条件本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种模型的训练方法,包括:利用第一有监督数据对待训练的初始模型进行第一阶段训练,得到预选检测模型;利用第二有监督数据以及无监督数据对所述预选检测模型进行第二阶段训练,得到目标检测模型;其中,所述目标检测模型用于根据输入的待检测图像,输出所述待检测图像中的3D物体信息。2.根据权利要求1所述的方法,其中,利用第二有监督数据以及无监督数据对所述预选检测模型进行第二阶段训练,包括:对所述无监督数据进行预处理,得到第一增强数据和第二增强数据;将所述第一增强数据和所述第二增强数据分别输入所述预选检测模型,得到第一无监督检测结果和第二无监督检测结果,其中,所述第一无监督检测结果的置信度大于所述第二无监督检测结果的置信度;根据所述第一无监督检测结果和所述第二无监督检测结果之间的差异,对所述预选检测模型进行自监督训练。3.根据权利要求2所述的方法,其中,对所述无监督数据进行预处理,得到第一增强数据和第二增强数据,包括:对所述无监督数据进行第一增强处理,得到第一增强数据,所述第一增强处理包括光照变化处理和/或颜色变化处理;以及,对所述无监督数据进行第二增强处理,得到第二增强数据,所述第二增强处理包括伸缩处理、裁剪处理、平移处理和随机遮挡处理中的至少一种。4.根据权利要求2所述的方法,其中,所述第一无监督检测结果包括第一预测框以及所述第一预测框对应的预测框置信度和分类置信度;根据所述第一无监督检测结果和所述第二无监督检测结果之间的差异,对所述预选检测模型进行自监督训练,包括:根据所述预测框置信度和所述分类置信度,计算所述第一预测框的综合置信度;从多个所述第一预测框中选取综合置信度符合预设条件的第一预测框作为伪标签;根据所述伪标签,将所述第二增强数据输入所述预选检测模型并对所述预选检测模型进行自监督训练。5.根据权利要求4所述的方法,其中,根据所述伪标签,将所述第二增强数据输入所述预选检测模型并对所述预选检测模型进行自监督训练,包括:将所述第二增强数据输入所述预选检测模型,得到第二无监督检测结果;根据所述伪标签与所述第二无监督检测结果之间的差异,调整所述预选检测模型的模型参数。6.根据权利要求1所述的方法,其中,利用第二有监督数据以及无监督数据对所述预选检测模型进行第二阶段训练,包括:将所述第二有监督数据输入所述预选检测模型,得到有监督检测结果;根据所述有监督检测结果和所述第二有监督数据对应的标注信息之间的差异,调整所述预选检测模型的模型参数。7.一种图像的检测方法,包括:
将待检测图像输入目标检测模型;从所述目标检测模型接收所述待检测图像中的3D物体信息;其中,所述目标检测模型采用根据权利要求1至6任一项所述的模型训练方法得到。8.根据权利要求7所述的方法,其中,所述3D物体信息包括分类信息、位置信息、尺寸信息以及角度信息中的至少一项。9.一种模型的训练装置,包括:第一阶段训练模块,用于利用第一有监督数据对待训练的初始模型进行第一阶段训练,得到预选检测模型;第二阶段训练模块,用于利用第二有监督数据以及无监督数据对所述预选检测模型进行第二阶段训练,得到目标检测模型;其中,所述目标检测模型用于根据输入的待检测图像,输...

【专利技术属性】
技术研发人员:邹智康叶晓青孙昊
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1