语义分割模型的训练方法和语义分割方法、装置制造方法及图纸

技术编号：33637672 阅读：16 留言：0更新日期：2022-06-02 01:52

本公开提供了一种语义分割模型的训练方法和语义分割方法，涉及人工智能领域，具体涉及计算机视觉、图像识别和深度学习领域。语义分割模型的训练方法的具体实现方案为：根据无标签的第一图像，采用语义分割模型得到针对第一图像的多个第一掩膜特征图和与多个第一掩膜特征图对应的多个第一类别信息；根据第一图像，采用语义分割模型的教师模型得到针对第一图像的多个第二掩膜特征图和与多个第二掩膜特征图对应的多个第二类别信息；根据多个第二掩膜特征图和多个第二类别信息，确定针对第一图像的伪标签信息；以及根据多个第一掩膜特征图、多个第一类别信息和伪标签信息，对语义分割模型进行训练。其中，教师模型与语义分割模型的网络结构相同。型的网络结构相同。型的网络结构相同。

全部详细技术资料下载

【技术实现步骤摘要】
语义分割模型的训练方法和语义分割方法、装置

[0001]本公开涉及人工智能领域，具体涉及计算机视觉、图像识别和深度学习领域，尤其涉及一种语义分割模型的训练方法和语义分割方法、装置、电子设备和存储介质。

技术介绍

[0002]随着计算机技术和网络技术的发展，深度学习技术在众多领域得到了广泛应用。例如，可以采用深度学习技术构建的模型进行图像识别，以进行目标检测、目标跟踪和目标分割。模型学习能力和精度的提高是重要且具有挑战性的工作。

技术实现思路

[0003]本公开旨在提供一种提高模型学习能力和分割精度的语义分割模型的训练方法和语义分割方法、装置、电子设备、存储介质。
[0004]根据本公开的一个方面，提供了一种语义分割模型的训练方法，包括：根据无标签的第一图像，采用语义分割模型得到针对第一图像的多个第一掩膜特征图和与多个第一掩膜特征图对应的多个第一类别信息；根据第一图像，采用语义分割模型的教师模型得到针对第一图像的多个第二掩膜特征图和与多个第二掩膜特征图对应的多个第二类别信息；根据多个第二掩膜特征图和多个第二类别信息，确定针对第一图像的伪标签信息；以及根据多个第一掩膜特征图、多个第一类别信息和伪标签信息，对语义分割模型进行训练，其中，教师模型的网络结构与语义分割模型的网络结构相同。
[0005]根据本公开的一个方面，提供了一种语义分割方法，包括：将待处理图像输入语义分割模型，得到针对待处理图像的多个第四掩膜特征图和与多个第四掩膜特征图对应的多个预测类别信息；根据多个预测类别信息和多个第四掩...

【技术保护点】

【技术特征摘要】
1.一种语义分割模型的训练方法，包括：根据无标签的第一图像，采用所述语义分割模型得到针对所述第一图像的多个第一掩膜特征图和与所述多个第一掩膜特征图对应的多个第一类别信息；根据所述第一图像，采用所述语义分割模型的教师模型得到针对所述第一图像的多个第二掩膜特征图和与所述多个第二掩膜特征图对应的多个第二类别信息；根据所述多个第二掩膜特征图和所述多个第二类别信息，确定针对所述第一图像的伪标签信息；以及根据所述多个第一掩膜特征图、所述多个第一类别信息和所述伪标签信息，对所述语义分割模型进行训练，其中，所述教师模型的网络结构与所述语义分割模型的网络结构相同。2.根据权利要求1所述的方法，其中，所述伪标签信息指示与所述第一图像包括的至少一类物体对应的至少一个第一掩膜图像和与所述至少一类物体对应的至少一个第一类别；所述根据所述多个第一掩膜特征图、所述多个第一类别信息和所述伪标签信息，对所述语义分割模型进行训练包括：根据所述多个第一掩膜特征图和所述至少一个第一掩膜图像，确定所述语义分割模型的对比损失；根据所述多个第一类别信息和所述至少一个第一类别，确定所述语义分割模型的一致性损失；以及根据所述对比损失和所述一致性损失，对所述语义分割模型进行训练。3.根据权利要求2所述的方法，其中，所述语义分割模型包括像素级解码网络；所述方法还包括：根据所述第一图像，采用所述语义分割模型的像素级解码网络得到所述第一图像的像素级特征图；其中，所述根据所述多个第一掩膜特征图和所述至少一个第一掩膜图像，确定所述语义分割模型的对比损失包括：根据所述像素级特征图和所述多个第一掩膜特征图，得到与所述多个第一掩膜特征图对应的多个第一区域特征图；根据所述像素级特征图和所述至少一个第一掩膜图像，得到与所述至少一个第一掩膜图像对应的至少一个第二区域特征图；以及根据所述多个第一区域特征图和所述至少一个第二区域特征图，确定所述对比损失包括的区域特征对比损失。4.根据权利要求2或3所述的方法，其中，所述根据所述多个第一掩膜特征图和所述至少一个第一掩膜图像，确定所述语义分割模型的对比损失包括：采用匹配算法匹配所述多个第一掩膜特征图和所述至少一个第一掩膜图像，得到至少一个匹配图对，每个匹配图对包括一个第一掩膜特征图和一个第一掩膜图像；以及针对所述至少一个匹配图对，根据属于同一匹配图对的第一掩膜特征图和第一掩膜图像之间的差异以及不属于同一匹配图对的第一掩膜特征图和第一掩膜图像之间的差异，确定所述对比损失包括的掩膜对比损失。5.根据权利要求3所述的方法，其中，所述根据所述多个第一区域特征图和所述至少一
个第二区域特征图，确定所述对比损失包括的区域特征对比损失包括：采用匹配算法匹配所述多个第一掩膜特征图和所述至少一个第一掩膜图像，得到至少一个匹配图对，每个匹配图对包括一个第一掩膜特征图和一个第一掩膜图像；针对属于同一匹配图对中的第一掩膜特征图和第一掩膜图像，根据与第一掩膜特征图对应的第一区域特征图和与第一掩膜图像对应的第二区域特征图之间的差异，得到第一差异；针对不属于同一匹配图对中的第一掩膜特征图和第一掩膜图像，根据与第一掩膜特征图对应的第一区域特征图和与第一掩膜图像对应的第二区域特征图之间的差异，得到第二差异；以及根据所述第一差异和所述第二差异，确定所述区域特征对比损失。6.根据权利要求2所述的方法，其中，所述根据所述多个第一类别信息和所述至少一个第一类别，确定所述语义分割模型的一致性损失包括：采用匹配算法匹配所述多个第一掩膜特征图和所述至少一个第一掩膜图像，得到至少一个匹配图对，每个匹配图对包括一个第一掩膜特征图和一个第一掩膜图像；以及对属于同一匹配图对中的第一掩膜特征图和第一掩膜图像，根据与第一掩膜特征图对应的第一类别信息和第一掩膜图像所对应物体的第一类别，确定所述一致性损失包括的类别一致性损失。7.根据权利要求6所述的方法，其中，所述根据所述多个第一类别信息和所述至少一个第一类别，确定所述语义分割模型的一致性损失还包括：根据所述多个第一类别信息，对所述多个第一掩膜特征图进行合并，得到合并后掩膜特征图；以及根据所述合并后掩膜特征图与所述至少一个第一掩膜图像之间的差异，确定所述一致性损失包括的掩膜一致性损失。8.根据权利要求1所述的方法，其中：所述根据所述第一图像，采用所述语义分割模型的教师模型得到针对所述第一图像的多个第二掩膜特征图和与所述多个第二掩膜特征图对应的多个第二类别信息包括：对所述第一图像进行第一增强处理，得到第一增强后图像；以及将所述第一增强后图像输入所述教师模型，得到所述多个第二掩膜特征图和所述多个第二类别信息；所述根据无标签的第一图像，采用所述语义分割模型得到针对所述第一图像的多个第一掩膜特征图和与所述多个第一掩膜特征图对应的多个第一类别信息包括：对所述第一增强后图像进行第二增强处理，得到第二增强后图像；以及将所述第二增强后图像输入所述语义分割模型，得到所述多个第一掩膜特征图和所述多个第一类别信息。9.根据权利要求1所述的方法，还包括：将具有标签的第二图像输入所述语义分割模型，得到针对所述第二图像的多个第三掩膜特征图和与所述多个第三掩膜特征图对应的多个第三类别信息；所述标签指示与所述第二图像包括的至少一类物体对应的至少一个第二掩膜图像和与所述至少一类物体对应的至少一个第二类别；以及
根据所述多个第三掩膜特征图、所述多个第三类别信息、所述至少一个第二掩膜图像和所述至少一个第二类别，对所述语义分割模型进行训练。10.一种语义分割方法，包括：将待处理图像输入语义分割模型，得到针对所述待处理图像的多个第四掩膜特征图和与所述多个第四掩膜特征图对应的多个预测类别信息；以及根据所述多个预测类别信息和所述多个第四掩膜特征图，确定所述待处理图像包括的至少一类物体的类别和所述至少一类物体的位置信息，其中，所述语义分割模型是采用权利要求1～9中任一项所述的方法训练的。11.一种语义分割模型的训练装置，包括：第一图像分割模块，用于根据无标签的第一图像，采用所述语义分割模型得到针对所述第一图像的多个第一掩膜特征图和与所述多个第一掩膜特征图对应的多个第一类别信息；第二图像分割模块，用于根据所述第一图像，采用所述语义分割模型的教...

【专利技术属性】
技术研发人员：伍天意，张健荣，郭国栋，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人