本发明专利技术提供了一种行人重识别方法及系统,该行人重识别方法包括:通过行人分析网络对输入图像进行行人分析,提取输入图像中的行人的细粒度特征;将细粒度特征与行人重识别网络模型的卷积层输出的输入图像的行人特征融合;根据融合后的行人特征,识别输入图像中的行人。通过将行人分析网络提取的细粒度特征与行人重识别网络提取的行人特征结合,可以提高行人特征的辨识度,提高行人识别的准确率。
Pedestrian recognition method and system
【技术实现步骤摘要】
行人重识别方法及系统
本专利技术涉及行人重识别
,具体涉及一种行人重识别方法及系统。
技术介绍
行人重识别(PersonRe-identification,ReID)是利用计算机视觉技术判断图像或者视频序列中是否存在特定行人的技术。广泛被认为是一个图像检索的子问题,即给定一个监控行人图像,检索跨设备下的该行人图像。现有的行人重识别技术之中,都是将行人分割成不同的块,针对每一个块提取特征,然后进行分类,得到最终的结果,这样可能引入背景信息,并没有达到精确的提取人体的特征。
技术实现思路
有鉴于此,本专利技术实施例提供了一种行人重识别方法及系统,能够精确提取图像中的行人特征,增加行人特征的辨识度,提高行人识别的准确率。根据本专利技术实施例的第一方面,提供一种行人重识别方法,包括:通过行人分析网络对输入图像进行行人分析,提取输入图像中的行人的细粒度特征;将细粒度特征与行人重识别网络模型的卷积层输出的输入图像的行人特征融合;根据融合后的行人特征,识别输入图像中的行人。在本专利技术的一个实施例中,行人重识别网络模型包括多粒度网络模型,多粒度网络模型包括五层卷积神经网络、最大池化层、卷积层和全连接层,其中,五层卷积神经网络的第四层和第五层被划分为三个分支:全局分支、上下身分支和上中下身分支,其中,上述通过行人分析网络对输入图像进行行人分析,提取输入图像中的行人的细粒度特征,包括:通过行人分析网络将输入图像分割成上下身区域和上中下身区域;分别提取上下身区域中每个区域的第一细粒度特征,以及上中下身区域中每个区域的第二细粒度特征,其中,上述将细粒度特征与行人重识别网络模型的卷积层输出的输入图像中的行人特征融合,包括:利用全连接层,将上下身区域中每个区域的第一细粒度特征分别与多粒度网络模型的卷积层输出的上下身分支中对应分支的第一局部特征融合;以及利用全连接层,将上中下身区域中每个区域的第二细粒度特征分别与多粒度网络模型的卷积层输出的上中下身分支中对应分支的第二局部特征融合,其中,上述根据融合后的行人特征,识别输入图像中的行人,包括:将三个分支中每个分支的输出特征进行合并,根据合并后的行人特征,识别输入图像中的行人,其中,合并后的行人特征包括融合后的行人特征。在本专利技术的一个实施例中,卷积层包括1×1卷积层,多粒度网络模型的最大池化层输出的2048维行人特征通过1×1卷积层降为256维,其中,上述利用全连接层,将上下身区域中每个区域的第一细粒度特征分别与多粒度网络模型的卷积层输出的上下身分支中对应分支的第一局部特征融合,包括:通过1×1卷积层使第一细粒度特征降为256维;将256维的第一细粒度特征与256维的第一局部特征加权融合,得到融合后的第一局部特征,其中,上述利用全连接层,将上中下身区域中每个区域的第二细粒度特征分别与多粒度网络模型的卷积层输出的上中下身分支中对应分支的第二局部特征融合,包括:通过1×1卷积层使第二细粒度特征降为256维;将256维的第二细粒度特征与256维的第二局部特征加权融合,得到融合后的第二局部特征。在本专利技术的一个实施例中,该行人重识别方法还包括:采用三元组损失函数与交叉熵损失函数训练多粒度网络模型。在本专利技术的一个实施例中,上述采用三元组损失函数与交叉熵损失函数训练多粒度网络模型,包括:在一个训练回合中,全局分支、上下身分支和上中下身分支的最大池化层输出的2048维全局特征采用三元组损失函数,卷积层输出的256维全局特征采用交叉熵损失函数,上下身分支和上中下身分支的融合后的第一局部特征和第二局部特征采用交叉熵损失函数来训练多粒度网络模型;在另一个训练回合中,全局分支、上下身分支和上中下身分支的最大池化层输出的2048维全局特征与卷积层输出的256维全局特征均采用交叉熵损失函数,上下身分支和上中下身分支的融合后的第一局部特征和第二局部特征均采用交叉熵损失函数来训练多粒度网络模型。在本专利技术的一个实施例中,多粒度网络模型以Resnet50为主干,卷积层为降维压缩层,最大池化层包括全局最大池化层。在本专利技术的一个实施例中,上述细粒度特征包括人体的衣物部件和/或身体轮廓。根据本专利技术实施例的第二方面,提供一种行人重识别系统,包括:提取模块,用于通过行人分析网络对输入图像进行行人分析,提取输入图像中的行人的细粒度特征;融合模块,用于将细粒度特征与行人重识别网络模型的卷积层输出的输入图像的行人特征融合;识别模块,用于根据融合后的行人特征,识别输入图像中的行人。根据本专利技术实施例的第三方面,提供一种计算机可读存储介质,其上存储有计算机可执行指令,可执行指令被处理器执行时实现如上所述的行人重识别方法。根据本专利技术实施例提供的技术方案,通过行人分析网络对输入图像进行行人分析,提取输入图像中的行人的细粒度特征;将细粒度特征与行人重识别网络模型的卷积层输出的输入图像的行人特征融合;根据融合后的行人特征,识别输入图像中的行人。通过将行人分析网络提取的细粒度特征与行人重识别网络提取的行人特征结合,可以提高行人特征的辨识度,提高行人识别的准确率。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1所示为本专利技术一实施例提供的行人重识别方法的流程示意图。图2所示为本专利技术一实施例提供的网络框架图。图3所示为本专利技术一实施例提供的行人重识别系统的框图。图4所示为本专利技术另一实施例提供的行人重识别系统的框图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。图1所示为本专利技术一实施例提供的行人重识别方法的流程示意图。该方法可以由计算机设备(例如,服务器)执行。如图1所示,该方法包括如下内容。S110:通过行人分析网络对输入图像进行行人分析,提取输入图像中的行人的细粒度特征。具体地,行人分析网络利用人体解析技术提取图像的细粒度特征,细粒度特征可以包括人体的衣物部件和/或身体轮廓等,本专利技术对此不作限定。人体解析是指将在图像中捕获的人分割成多个语义上一致的区域,例如身体部位和衣物。人体解析是一种细粒度的语义分割任务,它比仅是寻找人体轮廓的人物分割更具挑战性。人体解析对于以人为中心的分析非常重要,并且具有许多工业上的应用,例如,虚拟现实,视频监控和人类行为分析等等。S120:将细粒度特征与行人重识别网络模型的卷积层输出的输入图像的行人特征融合。将通过行人分析网络提取的细粒度特征与行人重识别网络提取的行人特征结合,可以增加行人特征的辨识度。应当理解,可以是输入图像的全局细粒度特征与行人重识别网络模型提取的全局行人特征进行融合,也可以是输入图像的局部细粒度特征与行人重识别网络模型提取的对应的局部行人特征进行融合,本专利技术对此不作限定。行人重识别网络可以基于卷积神经网络,也可以基于多粒度网络,本专利技术对此不作限定。例如,多粒度网络以Resnet50为主干,卷积本文档来自技高网...
【技术保护点】
1.一种行人重识别方法,其特征在于,包括:通过行人分析网络对输入图像进行行人分析,提取所述输入图像中的行人的细粒度特征;将所述细粒度特征与行人重识别网络模型的卷积层输出的所述输入图像的行人特征融合;根据融合后的行人特征,识别所述输入图像中的行人。
【技术特征摘要】
1.一种行人重识别方法,其特征在于,包括:通过行人分析网络对输入图像进行行人分析,提取所述输入图像中的行人的细粒度特征;将所述细粒度特征与行人重识别网络模型的卷积层输出的所述输入图像的行人特征融合;根据融合后的行人特征,识别所述输入图像中的行人。2.如权利要求1所述的行人重识别方法,其特征在于,所述行人重识别网络模型包括多粒度网络模型,所述多粒度网络模型包括五层卷积神经网络、最大池化层、所述卷积层和全连接层,其中,所述五层卷积神经网络的第四层和第五层被划分为三个分支:全局分支、上下身分支和上中下身分支,其中,所述通过行人分析网络对输入图像进行行人分析,提取所述输入图像中的行人的细粒度特征,包括:通过所述行人分析网络将所述输入图像分割成上下身区域和上中下身区域;分别提取所述上下身区域中每个区域的第一细粒度特征,以及所述上中下身区域中每个区域的第二细粒度特征,其中,所述将所述细粒度特征与行人重识别网络模型的卷积层输出的所述输入图像中的行人特征融合,包括:利用所述全连接层,将所述上下身区域中每个区域的所述第一细粒度特征分别与所述多粒度网络模型的所述卷积层输出的所述上下身分支中对应分支的第一局部特征融合;以及利用所述全连接层,将所述上中下身区域中每个区域的所述第二细粒度特征分别与所述多粒度网络模型的所述卷积层输出的所述上中下身分支中对应分支的第二局部特征融合,其中,所述根据融合后的行人特征,识别所述输入图像中的行人,包括:将所述三个分支中每个分支的输出特征进行合并,根据合并后的行人特征,识别输入图像中的行人,其中,所述合并后的行人特征包括所述融合后的行人特征。3.如权利要求2所述的行人重识别方法,其特征在于,所述卷积层包括1×1卷积层,所述多粒度网络模型的所述最大池化层输出的2048维行人特征通过所述1×1卷积层降为256维,其中,所述利用所述全连接层,将所述上下身区域中每个区域的所述第一细粒度特征分别与所述多粒度网络模型的所述卷积层输出的所述上下身分支中对应分支的第一局部特征融合,包括:通过所述1×1卷积层使所述第一细粒度特征降为256维;将256维的所述第一细粒度特征与256维的第一局部特征加权融合,得到融...
【专利技术属性】
技术研发人员:张韵东,任丽云,刘小涛,
申请(专利权)人:北京中星微电子有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。