一种改善行人属性识别准确率的方法、终端及介质技术

技术编号：29586468 阅读：61 留言：0更新日期：2021-08-06 19:45

本发明专利技术提供了一种改善行人属性识别准确率的方法、终端及介质，方法包括：利用卷积神经网络提取行人特征，进行区域提取；对于前景区域掩膜保留图像前景区域，通过生成器重建图像背景；对于背景区域掩膜保留图像背景区域，通过生成器重建图像前景；通过判别器判断重建图像的真伪，实现对抗学习；训练得到区域提取网络后可以作为前处理网络与属性识别网络进行连接，辅助行人属性识别过程。本发明专利技术通过基于生成对抗学习的方式训练了行人区域掩膜提取网络，可以辅助行人属性识别过程，提升了行人属性识别的性能。

全部详细技术资料下载

【技术实现步骤摘要】
一种改善行人属性识别准确率的方法、终端及介质
本专利技术涉及计算机视觉
，具体地，涉及一种改善行人属性识别准确率的方法、终端及介质，可以辅助改善行人属性识别效果。
技术介绍
在基于深度学习的行人属性识别方法中，可以通过在网络中提供不同的约束条件改善行人属性识别性能。这些在网络中提供的各种先验约束的方法可以看作通过提升对行人内部不同特征间关系的学习，从而提升对目标特征的处理效果。实际监控中的输入图像中不仅包括行人信息，也包含有一些监控背景信息。同时，正常的掩膜提取网络在训练时需要提供较为复杂的像素级别的标注。
技术实现思路
本专利技术的目的在于克服现有技术的不足之处，提出了一种通过弱监督提取行人掩膜来改善行人属性识别准确率的方法。本专利技术第一方面，提供一种改善行人属性识别准确率的方法，包括：获取包含目标行人的图像I；采用行人区域掩膜提取网络F，提取所述图像I中目标行人区域掩膜T和背景区域掩膜B，其中，所述目标行人区域掩膜T和背景区域掩膜B互补，即T+B＝1；对于前景区域掩膜B保留图像前景区域，通过第一生成器G1重建图像背景；对于背景区域掩膜T保留图像背景区域，通过第二生成器G2重建图像前景；所述第一生成器G1、所述第二生成器G2具有相同的网络结构；采用判别器D判断重建图像的真伪。本专利技术通过先提取掩膜改善识别效果，同时，降低了标注工作量，减少监控背景噪声对属性识别过程的干扰，提升属性识别的效果，可选地，所述采用行人区域掩膜提取网络F，...

【技术保护点】
1.一种改善行人属性识别准确率的方法，其特征在于，包括：/n获取包含目标行人的图像I；/n采用行人区域掩膜提取网络F，提取所述图像I中目标行人区域掩膜T和背景区域掩膜B，其中，所述目标行人区域掩膜T和背景区域掩膜B互补，即T+B＝1；/n对于前景区域掩膜B保留图像前景区域，通过第一生成器G1重建图像背景；对于背景区域掩膜T保留图像背景区域，通过第二生成器G2重建图像前景；所述第一生成器G1、所述第二生成器G2具有相同的网络结构；/n采用判别器D判断重建图像的真伪。/n

【技术特征摘要】
1.一种改善行人属性识别准确率的方法，其特征在于，包括：
获取包含目标行人的图像I；
采用行人区域掩膜提取网络F，提取所述图像I中目标行人区域掩膜T和背景区域掩膜B，其中，所述目标行人区域掩膜T和背景区域掩膜B互补，即T+B＝1；
对于前景区域掩膜B保留图像前景区域，通过第一生成器G1重建图像背景；对于背景区域掩膜T保留图像背景区域，通过第二生成器G2重建图像前景；所述第一生成器G1、所述第二生成器G2具有相同的网络结构；
采用判别器D判断重建图像的真伪。

2.根据权利要求1所述的改善行人属性识别准确率的方法，其特征在于，所述采用行人区域掩膜提取网络F，提取所述图像I中目标行人区域掩膜T和背景区域掩膜B，包括：
将图像I输入行人区域掩膜提取网络F：
首先通过行人区域掩膜提取网络F中的卷积网络得到特征f∈Rw×h×c，其中w,h,c分别指代特征f的宽带，高度和通道数；
然后所述特征f通过不同大小的池化模块，池化为大小为w/2×h/2×c,w/3×h/3×c,w/6×h/6×c的特征，经过参数为3×3的卷积对特征进行进一步提取得到特征fc,然后对特征fc进行上采样操作后和原有特征f进行拼接操作，获得新的分割特征；
将所述分割特征通过卷积网络获得通道数为1的目标行人区域掩膜T,同时间接获得背景区域掩膜B＝1-T。

3.根据权利要求1所述的改善行人属性识别准确率的方法，其特征在于，所述对于前景区域掩膜B保留图像前景区域，通过第一生成器G1重建图像背景，包括：
采用所述第一生成器G1对背景进行补全生成，基于自注意力的方式，对每个位置像素和其它位置进行关系建模，与原有区域叠加后得到重建图像Igen1；
所述对于背景区域掩膜T保留图像背景区域，通过第二生成器G2重建图像前景，包括：
采用所述第二生成器G2对行人区域进行补全生成，基于自注意力的方式，对每个位置像素和其它位置进行关系建模，与原有区域叠加后得到重建图像Igen2。

4.根据权利要求3所述的改善行人属性识别准确率的方法，其特征在于，所述第一生成器G1、所述第二生成器G2根据掩膜覆盖区域的部分图像信息，计算还原出合理的全局图像，其中：
所述第一生成器G1的输入信息为T⊙I，生成背景信息为V1，最终重建图像Igen1＝T⊙I+B⊙V1；
所述第二生成器G2的输入信息为B⊙I，生成前景信息为V2，最终重建图像Igen2＝B⊙I+T⊙V2。

5.根据权利要求1所述的改善行人属性识别准确率的方法，其特征在于，所述采用判别器D判断重建图像的真伪，其中：
在训练过程中为了对生成图像进行约束，判别...

【专利技术属性】
技术研发人员：杨华，孙铭君，
申请(专利权)人：上海交通大学，
类型：发明
国别省市：上海;31

全部详细技术资料下载我是这个专利的主人