模型的训练方法、装置、设备、存储介质以及检测方法制造方法及图纸

技术编号：31797290 阅读：16 留言：0更新日期：2022-01-08 10:57

本公开提供了模型的训练方法、装置、设备、存储介质以及检测方法，涉及人工智能领域，具体涉及计算机视觉和深度学习领域，可应用于智能机器人和自动驾驶场景下。具体实现方案为：利用第一有监督数据对待训练的初始模型进行第一阶段训练，得到预选检测模型；利用第二有监督数据以及无监督数据对预选检测模型进行第二阶段训练，得到目标检测模型；其中，目标检测模型用于根据输入的待检测图像，输出待检测图像中的3D物体信息。根据本公开的技术，可以训练得到具有较高检测精度和泛化性能的目标检测模型，降低了第一有监督数据和第二有监督数据的数据量，减少了人工标注的人力成本和时间成本，提高了模型的训练效率。提高了模型的训练效率。提高了模型的训练效率。

全部详细技术资料下载

【技术实现步骤摘要】
模型的训练方法、装置、设备、存储介质以及检测方法

[0001]本公开涉及人工智能领域，具体涉及计算机视觉和深度学习领域，可应用于智能机器人和自动驾驶场景下。

技术介绍

[0002]针对单目图像的3D检测，主要依赖于3D目标包围框的先验信息，提前遍历数据集生成3D候选框，然后利用图像检测模型处理输入的单目图像输出3D偏移量，结合3D候选框和3D偏移量得到物体的真实3D包围框，实现对单目图像的3D检测任务。
[0003]针对图像检测模型的训练过程，相关技术中通常需要利用人工标注好的标签数据对图像检测模型进行有监督学习，但由于人工标注的工作量大且标注周期较长，导致图像检测模型的定位精度受限于人工标注样本的数据量以及标注精度。

技术实现思路

[0004]本公开提供了一种模型训练的方法、装置、设备、存储介质以及检测方法。
[0005]根据本公开的一方面，提供了一种模型的训练方法，包括：
[0006]利用第一有监督数据对待训练的初始模型进行第一阶段训练，得到预选检测模型；
[0007]利用第二有监督数据以及无监督数据对预选检测模型进行第二阶段训练，得到目标检测模型；
[0008]其中，目标检测模型用于根据输入的待检测图像，输出待检测图像中的3D物体信息。
[0009]根据本公开的另一方面，提供了一种图像的检测方法，包括：
[0010]将待检测图像输入目标检测模型；
[0011]从目标检测模型接收待检测图像中的3D物体信息；
[0012]其中，...

【技术保护点】

【技术特征摘要】
1.一种模型的训练方法，包括：利用第一有监督数据对待训练的初始模型进行第一阶段训练，得到预选检测模型；利用第二有监督数据以及无监督数据对所述预选检测模型进行第二阶段训练，得到目标检测模型；其中，所述目标检测模型用于根据输入的待检测图像，输出所述待检测图像中的3D物体信息。2.根据权利要求1所述的方法，其中，利用第二有监督数据以及无监督数据对所述预选检测模型进行第二阶段训练，包括：对所述无监督数据进行预处理，得到第一增强数据和第二增强数据；将所述第一增强数据和所述第二增强数据分别输入所述预选检测模型，得到第一无监督检测结果和第二无监督检测结果，其中，所述第一无监督检测结果的置信度大于所述第二无监督检测结果的置信度；根据所述第一无监督检测结果和所述第二无监督检测结果之间的差异，对所述预选检测模型进行自监督训练。3.根据权利要求2所述的方法，其中，对所述无监督数据进行预处理，得到第一增强数据和第二增强数据，包括：对所述无监督数据进行第一增强处理，得到第一增强数据，所述第一增强处理包括光照变化处理和/或颜色变化处理；以及，对所述无监督数据进行第二增强处理，得到第二增强数据，所述第二增强处理包括伸缩处理、裁剪处理、平移处理和随机遮挡处理中的至少一种。4.根据权利要求2所述的方法，其中，所述第一无监督检测结果包括第一预测框以及所述第一预测框对应的预测框置信度和分类置信度；根据所述第一无监督检测结果和所述第二无监督检测结果之间的差异，对所述预选检测模型进行自监督训练，包括：根据所述预测框置信度和所述分类置信度，计算所述第一预测框的综合置信度；从多个所述第一预测框中选取综合置信度符合预设条件的第一预测框作为伪标签；根据所述伪标签，将所述第二增强数据输入所述预选检测模型并对所述预选检测模型进行自监督训练。5.根据权利要求4所述的方法，其中，根据所述伪标签，将所述第二增强数据输入所述预选检测模型并对所述预选检测模型进行自监督训练，包括：将所述第二增强数据输入所述预选检测模型，得到第二无监督检测结果；根据所述伪标签与所述第二无监督检测结果之间的差异，调整所述预选检测模型的模型参数。6.根据权利要求1所述的方法，其中，利用第二有监督数据以及无监督数据对所述预选检测模型进行第二阶段训练，包括：将所述第二有监督数据输入所述预选检测模型，得到有监督检测结果；根据所述有监督检测结果和所述第二有监督数据对应的标注信息之间的差异，调整所述预选检测模型的模型参数。7.一种图像的检测方法，包括：
将待检测图像输入目标检测模型；从所述目标检测模型接收所述待检测图像中的3D物体信息；其中，所述目标检测模型采用根据权利要求1至6任一项所述的模型训练方法得到。8.根据权利要求7所述的方法，其中，所述3D物体信息包括分类信息、位置信息、尺寸信息以及角度信息中的至少一项。9.一种模型的训练装置，包括：第一阶段训练模块，用于利用第一有监督数据对待训练的初始模型进行第一阶段训练，得到预选检测模型；第二阶段训练模块，用于利用第二有监督数据以及无监督数据对所述预选检测模型进行第二阶段训练，得到目标检测模型；其中，所述目标检测模型用于根据输入的待检测图像，输...

【专利技术属性】
技术研发人员：邹智康，叶晓青，孙昊，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人