弱监督图像语义分割方法、系统、设备及存储介质技术方案

技术编号：37962161 阅读：9 留言：0更新日期：2023-06-30 09:37

本发明专利技术公开了一种弱监督图像语义分割方法、系统、设备及存储介质，它们是一一对应的方案，方案中：通过训练一个孪生网络，对图像的不确定像素进行网络间的交互监督，以实现网络对不确定像素的鲁棒学习，减缓伪标签噪声的影响；同时针对边界噪声的问题，通过构造一些边界已知的样本来增强边缘区域的预测能力；综上，本发明专利技术通过结合提出的边界增强和协同训练方式，有效减缓了伪标签噪声的影响，提高了网络的语义分割性能，能够更为准确的实现图像的语义分割。语义分割。语义分割。

全部详细技术资料下载

【技术实现步骤摘要】
弱监督图像语义分割方法、系统、设备及存储介质

[0001]本专利技术涉及图像语义分割
，尤其涉及一种弱监督图像语义分割方法、系统、设备及存储介质。

技术介绍

[0002]语义分割是计算机视觉中的一项基本任务，当前基于深度学习的方法在图像语义分割方面取得了巨大的成功。然而，这些均为全监督的方法，需要逐像素的标注，极为耗时耗力。为了减轻对像素级标签的高度依赖，许多研究人员致力于开发具有弱标签形式的弱监督语义分割模型，例如使用显著图像、涂鸦、点、边界框和图像级标注的弱标签（图像级标签）形式作为分割模型的监督。特别地，图像级标签仅表示图像中某些类别的存在，在弱监督中最容易获得，因此，图像级标签监督的语义分割（简称图像级监督的语义分割）更具挑战性以及研究价值。
[0003]图像级监督的语义分割是指仅利用图像级标签来执行像素级分类。该任务通常涉及两个训练阶段。在第一阶段，使用图像标签训练分类模型，用于生成类激活图，然后作为种子区域进一步扩展成伪标签。在第二阶段，生成的伪标签作为像素级的真实监督去训练语义分割模型。在公开号为CN114359559A的中国专利技术专利申请《基于注意力机制图像块度量学习的弱监督语义分割方法》中，基于类激活图像提取正、负样本对，为分类网络增加度量学习任务，以在训练过程中提高网络对同一个类别正图像块的响应,降低对背景和其它噪声类别图像块的响应，从而提高种子区域精度。在公开号为CN115393598A的中国专利技术专利申请《一种基于非显著区域对象挖掘的弱监督语义分割方法》中，引入了一个基于图推...

【技术保护点】

【技术特征摘要】
1.一种弱监督图像语义分割方法，其特征在于，包括：获取图像数据集中每一图像的分数图，利用每一图像的分数图生成对应的离线伪标签与指示相应离线伪标签不确定度的离线掩码，将图像数据集中的单个图像、对应的离线伪标签与指示相应离线伪标签不确定度的离线掩码称为一个边界未知样本；构建协同训练的用于语义分割的孪生网络，将图像数据集中单个图像分别输入至孪生网络，将孪生网络的预测结果融合，生成融合伪标签与指示相应融合伪标签不确定度的融合掩码，并利用图像数据集中任意两个图像及相应融合伪标签与指示相应融合伪标签不确定度的融合掩码构造一个边界已知的样本；利用若干边界未知样本与构造的若干边界已知的样本形成训练集，利用所述训练集训练孪生网络；训练过程中，对于每一样本，根据相应掩码指示的不确定度和相应伪标签对孪生网络的预测结果计算协同训练损失来施加一致性，以及基于样本包含或未包含的边界信息计算边界增强损失，利用协同训练损失与边界增强损失训练孪生网络；其中，所述每一样本包括边界未知样本与边界已知的样本，掩码包括边界未知样本中的离线掩码与边界已知的样本中的掩码，伪标签包括边界未知样本中的离线伪标签与边界已知的样本中的伪标签；利用训练后的孪生网络对输入图像进行语义分割。2.根据权利要求1所述的一种弱监督图像语义分割方法，其特征在于，所述获取图像数据集中每一图像的分数图，利用每一图像的分数图生成对应的离线伪标签与指示相应离线伪标签不确定度的离线掩码包括：获取包含图像级标签的图像数据集，并利用图像数据集训练分类网络；利用训练后的分类网络生成图像数据集中每一图像样本的种子区域，再通过语义分割方法得到每一图像样本的分数图，分数图表示预测的相应图像样本中每个像素的在每一类别上的分数；对分数图进行argmax操作，生成每一图像样本对应的离线伪标签，其中，argmax表示取最大值对应的元素；同时，根据每一图像样本的分数图生成指示相应离线伪标签不确定度的离线掩码。3.根据权利要求1或2所述的一种弱监督图像语义分割方法，其特征在于，生成指示相应离线伪标签不确定度的离线掩码的方式包括：计算每一图像样本的分数图中每个像素最高分数和第二高分数的差值，将差值最大的一部分像素记为第一置信度像素，将剩余部分像素记为第二置信度像素，生成指示相应离线伪标签不确定度的离线掩码；其中，第一置信度高于第二置信度，第一置信度像素的掩码值为1，第二置信度像素的掩码值为0。4.根据权利要求1所述的一种弱监督图像语义分割方法，其特征在于，所述将图像数据集中单个图像分别输入至孪生网络，将孪生网络的预测结果融合，生成融合伪标签与指示相应融合伪标签不确定度的融合掩码包括：将单个图像分别输入至孪生网络，获得孪生网络的预测结果，记为和；将孪生网络的预测结果和融合，获得融合预测结果；对融合预测结果执行argmax操作生成融合伪标签，对于融合伪标签中每个像素，
如果类别对应融合预测结果中的概率大于设定的阈值，则记为第一置信度像素，否则记为第二置信度像素，生成指示相应融合伪标签不确定度的融合掩码；其中，argmax表示取最大值对应的元素，第一置信度高于第二置信度，第一置信度像素的掩码值为1，第二置信度像素的掩码值为0。5.根据权利要求1所述的一种弱监督图像语义分割方法，其特征在于，所述利用图像数据集中任意两个图像及相应融合伪标签与指示相应融合伪标签不确定度的融合掩码构造一个边界已知的样本包括：将任意两个图像及相应融合伪标签与指示相应融合伪标签不确定度的融合掩码记为和；其中，与表示任意两个图像，与为图像对应的融合伪标签与指示相应融合伪标签不确定度的融合掩码，与为图像对应的融合伪标签与指示相应融合伪标签不确定度的融合掩码；随机选择融合伪标签中一半的类别获得类别掩码，并过滤第二置信度像素，获得第一置信度像素的类别掩码：；其中，表示逐元素乘操作，类别掩码中所选择类别对应像素的掩码值为1，剩余像素的掩码值为0；然后，构造混合图像、混合伪标签、混合掩码与边界图，形成一个边界已知的样本：；；；其中，表示混合图像，表示边界已知的样本中的伪标签，即混合伪标签，表示边界已知的样本中的掩码，即混合掩码；表示边界图，通过第一置信度像素的类别掩码得到。6.根据权利要求...

【专利技术属性】
技术研发人员：王子磊，容圣海，
申请(专利权)人：中国科学技术大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人