基于TOIM损失函数的行人重识别方法技术

技术编号：24123120 阅读：117 留言：0更新日期：2020-05-13 03:42

本发明专利技术公开了一种基于TOIM损失函数的行人重识别方法，包括以下步骤：S1、准备数据集，数据集中每个不同身份的行人具有不同ID；S2、利用pytorch框架搭建基于ResNet‑50模型的网络模型；S3、将数据集中训练集的图片输入至网络模型中进行训练；S4、将数据集中测试集的图片输入至训练好的网络模型中，识别行人身份。本发明专利技术结合了在线实例匹配（OIM)损失函数和三重（Triplet）损失函数的优势，同时强调了对困难样本的重视和简化了三重损失函数的批处理构造过程，从而使得收敛速度大大加快，有效地提高了行人重识别的准确率。

Pedestrian recognition based on toim loss function

全部详细技术资料下载

【技术实现步骤摘要】
基于TOIM损失函数的行人重识别方法
本专利技术属于行人重识别
，尤其涉及一种基于TOIM损失函数的行人重识别方法。
技术介绍
行人重识别也称行人再识别，是利用计算机视觉技术判断图像或者视频序列中是否存在特定行人的技术。广泛被认为是一个图像检索的子问题。给定一个监控行人图像，检索跨设备下的该行人图像。旨在弥补目前固定的摄像头的视觉局限，并可与行人检测/行人跟踪技术相结合，可广泛应用于智能视频监控、智能安保等领域。由于不同摄像设备之间的差异，同时行人兼具刚性和柔性的特性，外观易受穿着、尺度、遮挡、姿态和视角等影响，使得行人重识别成为计算机视觉领域中一个既具有研究价值同时又极具挑战性的热门课题。一直以来，行人重识别领域中最显著的挑战是挖掘相同身份的行人在不同场景中共有特征，以及不同身份的行人在同一场景下的特有特征。现有的行人重识别方法主要采用在线实例匹配(OnlineInstanceMatching，简称OIM)损失函数和三重(Triplet)损失函数。然而，对于在线实例匹配损失函数来说，其存在的主要缺点是所有的样本都被平等对待，没有针对困难样本(hardsamples)进行特殊训练。其中，所述的困难样本(hardsamples)是指anchor样本与positive样本属于同一身份，特征之间的距离用d(a,p)表示，anchor样本和negative样本属于不同身份，特征之间的距离用d(a,n)表示，从图5可以明显看出d(a,p)>>d(a,n)，因此，该类样本就属于困难样本(hard...

【技术保护点】
1.一种基于TOIM损失函数的行人重识别方法，其特征在于，包括以下步骤：/nS1、准备数据集，数据集中每个不同身份的行人具有不同ID；/nS2、利用pytorch框架搭建基于ResNet-50模型的网络模型；/nS3、将数据集中训练集的图片输入至网络模型中进行训练；/nS4、将数据集中测试集的图片输入至训练好的网络模型中，识别行人身份。/n

【技术特征摘要】
1.一种基于TOIM损失函数的行人重识别方法，其特征在于，包括以下步骤：
S1、准备数据集，数据集中每个不同身份的行人具有不同ID；
S2、利用pytorch框架搭建基于ResNet-50模型的网络模型；
S3、将数据集中训练集的图片输入至网络模型中进行训练；
S4、将数据集中测试集的图片输入至训练好的网络模型中，识别行人身份。

2.根据权利要求1所述的基于TOIM损失函数的行人重识别方法，其特征在于：所述步骤S1中，所述的数据集为数据集Duke、数据集Market-1501、数据集UESTC-PR中的一种,当数据集为数据集UESTC-PR时，其准备过程为：将若干摄像头架设在UESTC-PR中的路灯顶端，由摄像头俯视采集行人图片，采集的行人图片为至少三个摄像头在同一场景下拍摄的图像的集合，采集完后得到数据集UESTC-PR，然后对数据集UESTC-PR中每个不同身份的行人标定不同ID，并划分为训练集和测试集。

3.根据权利要求1所述的基于TOIM损失函数的行人重识别方法，其特征在于：所述步骤S2中，所述的网络模型依次包括卷积层、块结构、平均池化层和全连接层，其中，块结构的数量为4个，每个块结构分别包含3，4，6，3个残差单元。

4.根据权利要求1所述的基于TOIM损失函数的行人重识别方法，其特征在于：所述步骤S2中，所述的网络模型搭建后，使用AdaDelta优化器进行初始化，初始学习率设置为0.001，批处理图片数量设置为M，M为15—30。

5.根据权利要求1所述的基于TOIM损失函数的行人重识别方法，其特征在于：所述步骤S2中，所述的网络模型中图片的输入维度为M*3*256*128，M代表批处理图片数量，3代表通道数，256*128为图片大小；图片的输出维度为M*512，512代表每张图片中行人的512维特征信息。

6.根据权利要求1—5中任一项所述的基于TOIM损失函数的行人重识别方法，其特征在于：所述步骤S3的训练过程为：
(1)、利用交叉熵损失函数对网络模型进行预训练；
(2)、预设每个ID对应生成一个用于存储该ID所对应行人在不同摄像头下的512维特征信息的存储表，然后将训练集中的图片输入到经步骤(1)训练好的网络模型中，利用网络模型的输出结果初始化所有ID的存储表；
(3)、结合步骤(2)中的存储表对经步骤(1)训练好的网络模型进行再训练。

7.根据权利要求6所...

【专利技术属性】
技术研发人员：李耶，殷光强，刘学婷，候少麒，向凯，石方炎，李超，
申请(专利权)人：电子科技大学，
类型：发明
国别省市：四川;51

全部详细技术资料下载我是这个专利的主人