一种基于大数据训练的行人重识别方法及装置制造方法及图纸

技术编号:24036562 阅读:224 留言:0更新日期:2020-05-07 02:04
本发明专利技术公开了一种基于大数据训练的行人重识别方法及装置,所述方法包括:获取第一行人图像数据库;利用第一行人图像数据库对重识别系统模型进行分布式训练;将第一行人图像数据库中的图像进行PTGAN处理,获得第二行人图像数据库;对第二行人图像数据库中的图像进行多维度特征提取并确定推理线索模型;根据推理线索模型调整重识别系统模型的目标参数的参数值;通过将待识别图像的特征向量输入训练好的重识别系统模型,搜索出相似度最高的行人图像。本发明专利技术解决了现有技术中的行人重识别方法跨摄像头的检索难度大,重识别准确率低的问题。

A pedestrian recognition method and device based on big data training

【技术实现步骤摘要】
一种基于大数据训练的行人重识别方法及装置
本专利技术涉及计算机视觉和智慧城市
,具体涉及一种基于大数据训练的行人重识别方法、装置、终端设备及计算机可读介质。
技术介绍
随着人工智能、计算机视觉和硬件技术的不断发展,视频图像处理技术已经广泛应用于智能城市系统中。行人重识别(PersonRe-identification)也称行人再识别,简称为Re-ID。是利用计算机视觉技术判断图像或者视频序列中是否存在特定行人的技术。广泛被认为是一个图像检索的子问题。给定一个监控行人图像,检索跨设备下的该行人图像。由于不同摄像设备之间的差异,同时行人兼具刚性和柔性的特性,外观易受穿着、尺度、遮挡、姿态和视角等影响,使得行人重识别成为计算机视觉领域中一个既具有研究价值同时又极具挑战性的热门课题。目前来说,虽然行人重识别的检测能力已经显著提升,但是在实际场合中很多具有挑战性的问题还没被完全解决:比如在复杂的场景,光线差异,视角和姿势的改变,大量的行人在一个监控摄像头网络中等情况。在这些情况下,跨摄像头的检索通常难度会很大,同时前期进行视频图像样本训练时的标注工作代价昂贵,需要耗费大量的人力,并且往往现有算法通常无法达到预期效果,重识别准确率较低。
技术实现思路
有鉴于此,本专利技术的目的在于提供一种基于大数据训练的行人重识别方法、装置、终端设备及计算机可读介质,能够提高不同摄像头下行人重识别的准确率,解决了现有技术中的行人重识别方法跨摄像头的检索难度大,重识别准确率低的问题。本专利技术实施例的第一方面提供了一种基于大数据训练的行人重识别方法,包括:获取第一行人图像数据库,其中,所述第一行人图像数据库包含已标注的行人图像;利用所述第一行人图像数据库对重识别系统模型进行分布式训练,得到训练之后的所述重识别系统模型;将所述第一行人图像数据库中的图像进行PTGAN处理,通过实现行人前景不变的前提下实现背景差异区域的迁移,获得第二行人图像数据库;对所述第二行人图像数据库中的图像进行多维度特征提取并确定推理线索模型;根据所述推理线索模型调整所述重识别系统模型的目标参数的参数值;通过将待识别图像的特征向量输入训练好的所述重识别系统模型,搜索出相似度最高的行人图像。进一步地,所述利用所述第一行人图像数据库对重识别系统模型进行分布式训练,得到训练之后的所述重识别系统模型,包括:通过使用多个处理器增大批量大小对所述重识别系统模型进行迭代训练;根据线性缩放和预热策略算法对所述重识别系统模型进行迭代训练;应用适应率缩放(LARS)对所述重识别系统模型中的每一层网络使用不同的学习率。进一步地,在将所述第一行人图像数据库中的图像进行PTGAN处理步骤中,所述PTGAN的损失函数表达示如下:式中LStyle代表生成的风格损失或区域差异,LID代表生成图像的身份损失。λ1是平衡LStyle和LID的权重。进一步地,所述对所述第二行人图像数据库中的图像进行多维度特征提取并确定推理线索模型包括:提取行人外观特征;提取行人面部特征;根据行人在第二行人图像数据库中不同视频图像的时间和定位特征构建定位分支Markov链,根据定位分支Markov链训练推理线索模型;使用推理算法对所述推理线索模型进行调整并确定最后的推理线索模型。本专利技术实施例的第二方面提供了一种基于大数据训练的行人重识别装置,其特征在于,包括:获取模块,用于获取第一行人图像数据库,其中,所述第一行人图像数据库包含已标注的行人图像;分布式训练模块,用于利用所述第一行人图像数据库对重识别系统模型进行分布式训练,得到训练之后的所述重识别系统模型;PTGAN处理模块,用于将所述第一行人图像数据库中的图像进行PTGAN处理,通过实现行人前景不变的前提下实现背景差异区域的迁移,获得第二行人图像数据库;推理线索模块,用于对所述第二行人图像数据库中的图像进行多维度特征提取并确定推理线索模型;调整模块,用于根据所述推理线索模型调整所述重识别系统模型的目标参数的参数值;识别模块,用于通过将待识别图像的特征向量输入训练好的所述重识别系统模型,搜索出相似度最高的行人图像。进一步地,所述分布式训练模块包括:处理器增加模块,用于通过使用多个处理器增大批量大小对所述重识别系统模型进行迭代训练;批量算法模块,用于根据线性缩放和预热策略算法对所述重识别系统模型进行迭代训练;学习率调整模块,用于应用适应率缩放(LARS)对所述重识别系统模型中的每一层网络使用不同的学习率。进一步地,所述PTGAN的损失函数表达示如下:式中LStyle代表生成的风格损失或区域差异,LID代表生成图像的身份损失。λ1是平衡LStyle和LID的权重。进一步地,所述推理线索模块包括:外观提取模块,用于提取行人外观特征;面部提取模块,用于提取行人面部特征;定位分支模块,用于根据行人在第二行人图像数据库中不同视频图像的时间和定位特征构建定位分支Markov链,根据定位分支Markov链训练推理线索模型;推理线索调整模块,用于使用推理算法对所述推理线索模型进行调整并确定最后的推理线索模型。本专利技术实施例的第三方面提供了一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述基于大数据训练的行人重识别方法的步骤。本专利技术实施例的第四方面提供了一种计算机可读介质,所述计算机可读介质存储有计算机程序,所述计算机程序被处理执行时实现上述基于大数据训练的行人重识别方法的步骤。在本专利技术实施例中,通过利用所述第一行人图像数据库对重识别系统模型进行分布式训练,大大提高了模型训练的速度,通过使用推理线索模型调整所述重识别系统模型的目标参数的参数值,提高了复杂条件下跨镜头追踪的行人重识别的准确率、提高了系统的鲁棒性。解决了现有技术中的行人重识别方法跨摄像头的检索难度大,重识别准确率低的问题。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术实施例提供的一种基于大数据训练的行人重识别方法的流程图;图2是本专利技术实施例提供的不同行人重识别方法实时转换效果对比图;图3是本专利技术实施例所述的推理算法在关联矩阵上的工作原理图;图4是本专利技术实施例提供的一种基于大数据训练的行人重识别装置的结构示意图;图5是本专利技术实施例提供的分布式训练模块的细化结构图;图6是本专利技术实施例提供的推理线索模块的细化结构图;图7是本专利技术实施例提供的终端设备的示意图本文档来自技高网...

【技术保护点】
1.一种基于大数据训练的行人重识别方法,其特征在于,包括:/n获取第一行人图像数据库,其中,所述第一行人图像数据库包含已标注的行人图像;/n利用所述第一行人图像数据库对重识别系统模型进行分布式训练,得到训练之后的所述重识别系统模型;/n将所述第一行人图像数据库中的图像进行PTGAN处理,通过实现行人前景不变的前提下实现背景差异区域的迁移,获得第二行人图像数据库;/n对所述第二行人图像数据库中的图像进行多维度特征提取并确定推理线索模型;/n根据所述推理线索模型调整所述重识别系统模型的目标参数的参数值;/n通过将待识别图像的特征向量输入训练好的所述重识别系统模型,搜索出相似度最高的行人图像。/n

【技术特征摘要】
1.一种基于大数据训练的行人重识别方法,其特征在于,包括:
获取第一行人图像数据库,其中,所述第一行人图像数据库包含已标注的行人图像;
利用所述第一行人图像数据库对重识别系统模型进行分布式训练,得到训练之后的所述重识别系统模型;
将所述第一行人图像数据库中的图像进行PTGAN处理,通过实现行人前景不变的前提下实现背景差异区域的迁移,获得第二行人图像数据库;
对所述第二行人图像数据库中的图像进行多维度特征提取并确定推理线索模型;
根据所述推理线索模型调整所述重识别系统模型的目标参数的参数值;
通过将待识别图像的特征向量输入训练好的所述重识别系统模型,搜索出相似度最高的行人图像。


2.根据权利要求1所述的基于大数据训练的行人重识别方法,其特征在于,所述利用所述第一行人图像数据库对重识别系统模型进行分布式训练,得到训练之后的所述重识别系统模型,包括:
通过使用多个处理器增大批量大小对所述重识别系统模型进行迭代训练;
根据线性缩放和预热策略算法对所述重识别系统模型进行迭代训练;
应用适应率缩放(LARS)对所述重识别系统模型中的每一层网络使用不同的学习率。


3.根据权利要求1所述的基于大数据训练的行人重识别方法,其特征在于,在将所述第一行人图像数据库中的图像进行PTGAN处理步骤中,所述PTGAN的损失函数表达示如下:



式中LStyle代表生成的风格损失或区域差异,LID代表生成图像的身份损失。λ1是平衡LStyle和LID的权重。


4.根据权利要求3所述的基于大数据训练的行人重识别方法,其特征在于,所述对所述第二行人图像数据库中的图像进行多维度特征提取并确定推理线索模型包括:
提取行人外观特征;
提取行人面部特征;
根据行人在第二行人图像数据库中不同视频图像的时间和定位特征构建定位分支Markov链,根据定位分支Markov链训练推理线索模型;
使用推理算法对所述推理线索模型进行调整并确定最后的推理线索模型。


5.一种基于大数据训练的行人重识别装置,其特征在于,包括:
获取模块,用于获取第一行人图像数据库,其中,所述第一行人图像数据库包含已标注的行人图像;
分布式训练模块,用于利用所述第一行...

【专利技术属性】
技术研发人员:王景辉张斯尧罗茜王思远蒋杰张诚李乾谢喜林黄晋
申请(专利权)人:湖南千视通信息科技有限公司
类型:发明
国别省市:湖南;43

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1