一种半监督旋转目标检测模型的训练方法及相应的装置制造方法及图纸

技术编号:38590523 阅读:8 留言:0更新日期:2023-08-26 23:30
本发明专利技术公开了一种半监督旋转目标检测模型的训练方法及相应的装置,包括:通过标注样本对第二模型进行训练,根据第二模型的预测结果和样本标签计算得到有监督损失L

【技术实现步骤摘要】
一种半监督旋转目标检测模型的训练方法及相应的装置


[0001]本专利技术属于计算机视觉领域,更具体地,涉及一种半监督旋转目标检测模型的训练方法及相应的装置。

技术介绍

[0002]遥感目标检测是遥感分析和对地观测领域的重要研究课题之一,旨在对遥感图像数据中出现的感兴趣目标(如车辆和船舶)进行检测,输出相应类别和所处位置。其中,遥感图像是指由飞机和卫星等平台搭载的传感器在高空和超高空中捕获的地面图像,其分辨率最高可达半米。作为遥感分析领域的基本问题,遥感目标检测技术具备广泛而实际的应用前景,许多现实应用中都依赖于该项技术,如城市管理、农业精准化、紧急救援和灾害监测等。此外,遥感目标检测技术也是后续的目标跟踪、场景分类和图像理解等任务的基础。
[0003]现有的遥感目标检测方法主要采用有监督的学习范式,依赖大量的有标注数据,但对于遥感场景而言,由于目标尺度小、分布密集且朝向多样,需要耗费大量人力物力去构建大规模有标注数据集。相较高昂的标注成本,遥感数据的采集成本较低,易于得到海量的无标注数据。因此,研究利用大量的无标注数据以进一步提高遥感目标检测算法的性能,有着十分重要的应用价值。

技术实现思路

[0004]针对现有技术的以上缺陷或改进需求,本专利技术提供了一种半监督旋转目标检测模型的训练方法及相应的装置,能够同时利用有标注数据和大量的无标注数据来进一步提高遥感目标检测方法的性能,用于缓解遥感目标检测领域面临的标注成本高、有标注数据获取难的问题的技术问题。
[0005]为实现上述目的,按照本专利技术的一个方面,提供了一种半监督旋转目标检测模型的训练方法,包括:
[0006]基于预定的旋转目标检测器构造第一模型和第二模型;
[0007]从有标注图像数据中随机采样预设数量的标注样本,通过所述标注样本对所述第二模型进行训练,根据所述第二模型的预测结果和样本标签计算得到有监督损失L
S

[0008]从无标注图像数据中随机采样预设数量的无标注样本,分别对所述无标注样本不同程度的增强,以得到第一增强样本I
w
和第二增强样本I
s
,通过所述第一增强样本I
w
对所述第一模型进行训练,将所述第二增强样本I
s
对所述第二模型进行训练;
[0009]根据所述第一模型的预测结果以及所述第二模型的预测结果,分别得到旋转感知的自适应加权损失L
R
和全局一致性损失L
G

[0010]根据所述有监督损失L
S
、自适应加权损失L
R
和全局一致性损失L
G
对第一模型和第二模型进行迭代训练,直至模型收敛。
[0011]进一步地,所述基于预定的旋转目标检测器构造第一模型和第二模型包括:
[0012]选择旋转目标检测器,根据旋转目标检测器的结构构造所述第一模型和所述第二
模型,以保证所述第一模型的结构与所述第二模型的结构相同,且所述第一模型和所述第二模型的参数不共享;
[0013]通过神经网络反向传播的方式更新所述第二模型的参数,由所述第二模型通过指数滑动平均的方式更新所述第一模型的参数。
[0014]进一步地,所述根据所述第一模型的预测结果以及所述第二模型的预测结果,分别得到旋转感知的自适应加权损失L
R
和全局一致性损失L
G
包括:
[0015]获取所述第一模型基于第一增强样本I
w
所预测得到的第一预测矩阵P
T
,以及获取所述第二模型基于第二增强样本I
s
所预测得到的第二预测矩阵P
S
,其中,所述第一预测矩阵P
T
和所述第二预测矩阵P
S
的每个元素均包含预测结果,每个预测结果包括目标框回归和目标框分类;
[0016]对所述第一预测矩阵P
T
中的预测结果进行处理后得到预测框,将预测框投影到第一预测矩阵P
T
,在投影的区域内选取预设数量的预测样本,以形成伪标签集合S
pse
={y
i
},i=1,2,

,n,其中,n为伪标签的数量;
[0017]在所述第二预测矩阵P
S
的对应位置选择样本,作为预测集合S
prd
={x
i
},i=1,2,

,n;
[0018]将每个伪标签y
i
同对应的预测结果x
i
构成一对伪标签

预测对z
i
=(x
i
,y
i
),并对每个伪标签

预测对计算得到损失
[0019]对每个伪标签

预测对的损失构造旋转感知的自适应加权损失L
R

[0020]进一步地,所述对每个伪标签

预测对的损失构造旋转感知的自适应加权损失L
R
包括:
[0021]确定伪标签y
i
的预测旋转角确定预测结果x
i
的预测旋转角
[0022]根据预测旋转角和预测旋转角计算调制因子根据调制因子对每个伪标签

预测对的损失进行加权求和,得到旋转感知的自适应加权损失L
R

[0023]自适应加权损失L
R
的计算公式为:
[0024][0025]调制因子的计算公式为:
[0026][0027][0028]其中,α设为超参数。
[0029]进一步地,所述根据所述第一模型的预测结果以及所述第二模型的预测结果,分别得到旋转感知的自适应加权损失L
R
和全局一致性损失L
G
包括:
[0030]设定所述第一模型的类别预测分数为s
t
∈R
n
×
K
,以及所述第二模型的类别预测分数为s
s
∈R
n
×
K
,其中,n为伪标签

预测对的数量,K为类别数;
[0031]根据所述第一模型的类别预测分数为s
t
和所述第二模型的类别预测分数为s
s
构建
最优匹配代价公式,求解最优匹配代价公式的最小值,进而得到全局一致性损失L
G

[0032]进一步地,所述根据所述第一模型的类别预测分数为s
t
和所述第二模型的类别预测分数为s
s
构建最优匹配代价公式,求解最优匹配代价公式的最小值,进而得到全局一致性损失L
G
包括:
[0033]计算类别预测分数s
t
和类本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种半监督旋转目标检测模型的训练方法,其特征在于,包括:基于预定的旋转目标检测器构造第一模型和第二模型;从有标注图像数据中随机采样预设数量的标注样本,通过所述标注样本对所述第二模型进行训练,根据所述第二模型的预测结果和样本标签计算得到有监督损失L
S
;从无标注图像数据中随机采样预设数量的无标注样本,分别对所述无标注样本不同程度的增强,以得到第一增强样本I
w
和第二增强样本I
s
,通过所述第一增强样本I
w
对所述第一模型进行训练,将所述第二增强样本I
s
对所述第二模型进行训练;根据所述第一模型的预测结果以及所述第二模型的预测结果,分别得到旋转感知的自适应加权损失L
R
和全局一致性损失L
G
;根据所述有监督损失L
S
、自适应加权损失L
R
和全局一致性损失L
G
对第一模型和第二模型进行迭代训练,直至模型收敛。2.根据权利要求1所述的半监督旋转目标检测模型的训练方法,其特征在于,所述基于预定的旋转目标检测器构造第一模型和第二模型包括:选择旋转目标检测器,根据旋转目标检测器的结构构造所述第一模型和所述第二模型,以保证所述第一模型的结构与所述第二模型的结构相同,且所述第一模型和所述第二模型的参数不共享;通过神经网络反向传播的方式更新所述第二模型的参数,由所述第二模型通过指数滑动平均的方式更新所述第一模型的参数。3.根据权利要求1所述的半监督旋转目标检测模型的训练方法,其特征在于,所述根据所述第一模型的预测结果以及所述第二模型的预测结果,分别得到旋转感知的自适应加权损失L
R
和全局一致性损失L
G
包括:获取所述第一模型基于第一增强样本I
w
所预测得到的第一预测矩阵P
T
,以及获取所述第二模型基于第二增强样本I
s
所预测得到的第二预测矩阵P
S
,其中,所述第一预测矩阵P
T
和所述第二预测矩阵P
S
的每个元素均包含预测结果,每个预测结果包括目标框回归和目标框分类;对所述第一预测矩阵P
T
中的预测结果进行处理后得到预测框,将预测框投影到第一预测矩阵P
T
,在投影的区域内选取预设数量的预测样本,以形成伪标签集合S
pse
={y
i
},i=1,2,

,n,其中,n为伪标签的数量;在所述第二预测矩阵P
S
的对应位置选择样本,作为预测集合S
prd
={x
i
},i=1,2,

,n;将每个伪标签y
i
同对应的预测结果x
i
构成一对伪标签

预测对z
i
=(x
i
,y
i
),并对每个伪标签

预测对计算得到损失对每个伪标签

预测对的损失构造旋转感知的自适应加权损失L
R
。4.根据权利要求3所述的半监督旋转目标检测模型的训练方法,其特征在于,所述对每个伪标签

预测对的损失构造旋转感知的自适应加权损失L
R
包括:确定伪标签y
i
的预测旋转角确定预测结果x
i
的预测旋转角根据预测旋转角和预测旋转角计算调制因子根据调制因子对每个伪标签

预测对的损失进行加权求和,得到旋转感知的自适应加权损失L
R

自适应加权损失L
R
的计算公式为:调制因子的计算公式为:的计算公式为:其中,α设为超参数。5.根据权利要求3所述的半监督旋转目标检测模型的训练方法,...

【专利技术属性】
技术研发人员:白翔华威梁定康李靖宇程建伟
申请(专利权)人:华中科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1