A pedestrian recognition method based on sorting loss and Siamese network is proposed. The improved learning feature of Siamese network is used to supervise the learning of the network by sorting loss and two SoftMax identifying losses. The two-way maximum boundary sorting loss is used to deal with the similarity between classes and within classes, so that the learned features have stronger robustness. Using the label information of pedestrian image and the image depth feature extracted by Siamese network, the detected pedestrians can be distinguished. The experimental results show that compared with the classical pedestrian recognition methods, the proposed pedestrian recognition method based on sorting loss and Siamese network has higher recognition accuracy.
【技术实现步骤摘要】
基于排序损失和Siamese网络的行人再识别方法
本专利技术涉及一种行人再识别方法,尤其涉及一种基于排序损失和Siamese网络的行人再识别方法。属于计算机视觉
技术介绍
行人再识别,是利用计算机视觉技术判断图像或者视频序列中是否存在特定行人的技术,识别出跨摄像头跨场景下的行人是否为同一个人。行人再识别的应用领域广泛,例如视频监控、城市监管、刑事安防等。近几年,行人再识别发展迅速,吸引了许多研究者。但是,行人再识别的研究仍然存在很大的挑战,主要困难在于行人图像是由远离目标的摄像设备采集的,不同摄像设备之间又存在差异,导致图像中行人的细节特征不明显。另一方面,由于服装或姿势的变化,行人图像的不同类别可能是相似的,但相同种类的行人图像并不是非常相似。如图1所示,Market-1501数据集的一些照片清楚地显示了上述困难的存在。当前行人再识别研究大部分都是有监督学习方法,这些方法可以概括为3种:基于特征提取的方法,基于度量学习的方法和基于深度学习的方法。早期传统的行人再识别方法主要包括特征提取和度量学习,并且大都只关注其中的一个方面。特征提取通过手工提取一个具有分辨力和鲁棒性的行人特征来解决行人再识别问题。常用的手工特征包括颜色特征,纹理特征,也有其他一些对多种特征组合的方法。但是手工特征大部分只能适用于某些情况下拍摄的图像,对于未考虑到的特殊情况无法很好的适用,需要较高的经验水平。并且随着行人再识别研究的进行,手工特征对识别率的提升变得越来越小。鉴于手工特征研究中存在的问题和困难,度量学习的方法被应用于行人再识别问题。但是这种特征提取和度量学习相互独 ...
【技术保护点】
1.一种基于Siamese网络结合识别损失和排序损失的行人再识别方法,其特征在于:包括以下步骤:S1,视频采集设备实时采集视频数据;S2,对所述视频数据进行行人检测,生成四元图像组;S3,把四元图像组输入到改进的Siamese网络进行特征向量提取;所述改进的Siamese网络结合识别损失和排序损失监督网络在训练集上进行训练,并且通过正负样本对的相似度差值大于预定阈值,使得负例图像对之间的距离大于正例图像对;S4,通过计算两个特征向量之间的距离来判断是否为同一行人,所述距离采用余弦相似度进行度量。
【技术特征摘要】
1.一种基于Siamese网络结合识别损失和排序损失的行人再识别方法,其特征在于:包括以下步骤:S1,视频采集设备实时采集视频数据;S2,对所述视频数据进行行人检测,生成四元图像组;S3,把四元图像组输入到改进的Siamese网络进行特征向量提取;所述改进的Siamese网络结合识别损失和排序损失监督网络在训练集上进行训练,并且通过正负样本对的相似度差值大于预定阈值,使得负例图像对之间的距离大于正例图像对;S4,通过计算两个特征向量之间的距离来判断是否为同一行人,所述距离采用余弦相似度进行度量。2.一种如权利要求1所述的基于Siamese网络结合识别损失和排序损失的行人再识别方法,其特征在于:所述步骤S2中的所述四元图像组表示为:(Xp,Yp,Xn,Yn),其中Xp,Yp,Xn,Yn分别代表输入图像,(Xp,Yp)代表相同图像对,它们具有相同的类别标签,(Xn,Yn)代表其他图像对,(Xn,Yn)分别和(Xp,Yp)具有不相同的类别标签;并且,相同类图像之间的距离小于不同类图像之间的距离,即Dis(Xp,Yp)<Dis(Xp,Yn)(2)Dis(Yp,Xp)<Dis(Yp,Xn)(3)其中Dis(*,*)代表距离度量,(Xp,Yp)为输入的正样例,(Xn,Yn)为输入的负样例。3.一种如权利要求1所述的基于Siamese网络结合识别损失和排序损失的行人再识别方法,其特征在于:所述步骤S3中的所述改进的Siamese网络包括两个经过训练的卷积神经网络(CNN)。4.一种如权利要求1所述的基于Siamese网络结合识别损失和排序损失的行人再识别方法,其特征在于:所述步骤S3中的所述改进的Siamese网络的目标函数包括第一识别损失、排序损失和第二识别损失;所述第一识别损失和第二识别损失均为SoftMax损失;所述SoftMax损失定义为:其中.N代表样本的个数,C表示样本类别的种类数,pi表示SoftMax函数输出的C维的表示概率的列向量,yi表示...
【专利技术属性】
技术研发人员:祁子梁,曲寒冰,董良,
申请(专利权)人:北京市新技术应用研究所,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。