一种基于高精度哈希图像检索技术的行人检测方法及系统技术方案

技术编号:21478925 阅读:80 留言:0更新日期:2019-06-29 05:06
本发明专利技术属于图像检索技术领域,公开了一种基于高精度哈希图像检索技术的行人检测方法及系统,对于提取的行人图像采用机器学习创建目标函数,进行目标最小化,得到临阶相似矩阵,再采用ILS算法进一步最小化目标函数,得到精确的哈希码;得到精确的哈希码后,采用端到端哈希深度学习方法学习哈希函数,并根据人工神经网络ANN的隐藏层中不同节点的不同权重对输入进行调整;在CNNs后,选择单隐藏层MLP学习hash标签;最后生成的训练函数本发明专利技术减少了识别误差与语义损失,提高了对象搜索的准确性和全面性;利用高精度的哈希图像检索算法提高了识别准确率以及识别速率。

【技术实现步骤摘要】
一种基于高精度哈希图像检索技术的行人检测方法及系统
本专利技术属于图像检索
,尤其涉及一种基于高精度哈希图像检索技术的行人检测方法及系统。
技术介绍
目前,最接近的现有技术:基于区域提案的神经网络是一种将区域建议和卷积神经网络相结合的目标检测算法,比如RCNN,SPP-net,Fast,RCNN,FasterRCNN,RFCN等,通常采用区域选择或者区域提案网络获取感兴区域,然后在每个提案区域上使用卷积神经网路做分类得到分类类别和置信度。这种提案方法大大提升了行人检测精度,但是检测速度有待提升,较难满足行人检测中的高效率检测要求。端到端的深度学习行人检测采用使用单通道网络架构,比如YOLO,SSD,YOLOv2[3】等,将行人定位和行人识别统一,一次性输出行人的位置信息和行人的置信度,这样大大提升的网络的执行效率,但是检精度较低有待提升。所以现阶段行人检测的所采用的深度学习网络总是之具备其中一种特性,要么速度快但是精度较低,要么精度高但是速度太慢。本专利技术采用了深度学习领域新型算法HPSLH,意图同时解决两种问题。综上所述,现有技术存在的问题是:(1)现阶段行人检测的所采用的深度学习网络总是只具备其中一种特性,要么速度快但是精度较低,要么精度高但是速度太慢,使得如果现有检测系统采用其中一种网络,如采用速度快但精度低的网络,在日后的改进中就无法具备高精度的优点,反之亦然,这使得行人检测系统必然存在无法改进的缺陷这。(2)现有行人检测技术难以相互贯通。由第一点看到由于不同的神经网络特性并不相同,所以很难将不同的网络体系结合在一起,也就意味着行人监测系统难以相互融合各自的优点进而得到改进。解决上述技术问题的难度:现有行人检测的难点有:外观差异大。包括视角,姿态,服饰和附着物,光照,成像距离等。从不同的角度看过去,行人的外观是很不一样的。处于不同姿态的行人,外观差异也很大。由于人穿的衣服不同,以及打伞、戴帽子、戴围巾、提行李等附着物的影响,外观差异也非常大。光照的差异也导致了一些困难。远距离的人体和近距离的人体,在外观上差别也非常大。检测速度。行人检测一般采用了复杂的模型,运算量相当大,要达到实时非常困难,一般需要大量的优化。检测精度较低。就算可以获取清晰的图像,也可能得到低精度的检测结果。难以融合不同算法的优点。由于网络架构千奇百怪,所以很难将两种不同的网络架构结合在一起,很难融合不同算法的优点。由于HPSLH算法相对于其他算法来说,其作为检索标签所应用的哈希码更为精准,针对细节的识别更为准确。由于行人检测中人的外观差异巨大,所以更需要细节方面的把握。由此可以解决最主要的问题。并且此算法应用预创建标签库的方法,所以检测速度方面也有相应提高。解决上述技术问题的意义:由此,采用HPSLH可以解决以上行人检测领域的传统难题。采用预生成标签的方式,杜绝外观差异大的影响。运用将两种端到端的深度学习算法结合在一起,创建混成网络的方式,解决了传统行人检测领域中高检测精度与快检测速度无法共存的问题。由于本算法中所创建的检测标签更为精细,由此可以解决检测精度较低的问题。由于本专利技术在图像检索领域为前沿高精度算法,精度问题可以解决。本算法采取从零打造神经网络架构的方式,从零结合两个领域,不存在融合的问题。
技术实现思路
针对现有技术存在的问题,本专利技术提供了一种基于高精度哈希图像检索技术的行人检测方法及系统。本专利技术采用了深度学习领域新型算法HPSLH,同时解决了现有技术存在的两种问题。本专利技术是这样实现的,高精度图像检索算法(HPSLH,Highprecisionself-learninghashingforImageRetrieval)是一种基于深度学习的图像检索算法,本专利技术提供了一种基于高精度哈希图像检索技术的行人检测方法分为两个部分,第一部分为哈希码创建部分,第二部分为端到端的哈希深度学习来学习哈希函数,进而利用函数完成检测。在第一步,首先对于所提取的行人图像,采用机器学习创建目标函数,将其目标最小化,得到临阶相似矩阵,之后采用ILS算法进一步最小化目标函数,进而得到精确的哈希码。得到精确的哈希码之后,本专利技术采用一种端到端哈希深度学习来学习哈希函数,本专利技术采用的是一种人工神经网络(ANN),由输入层、隐藏层和输出层组成。它可以根据隐藏层中不同节点的不同权重对输入进行调整。在CNNs之后,选择单隐藏层MLP来学习hash标签。最后生成的函数可表示为:本函数F(X)表示输出一个mxd矩阵,m是批量的样本数量,d是最后一个全连接层的输出数量,x是输出向量,y是对应的标签。则生成的训练函数可表示为基于以上方法,本专利技术得出了一个区域式网络与端到端相结合的神将网络架构,将其用于行人检测领域中,便可解决现有技术存在的两种问题。进一步,所述基于高精度哈希图像检索技术的行人检测方法具体包括:第一步,获取目标图像;第二步,创建临阶相似矩阵;第三步,将生成的矩阵带入ISL算法得到对应的哈希码标签;第四步,将所生成的哈希码标签带入Ann网络进项多次迭代学习,进而得到最终的检测结果。进一步,第一步中,采用深层的CNN网络结构获取图像的特征;在图片经过深层次的神经网络捕捉特征后,对获取的特征进行数据格式上的规范化处理,使特征的数据格式完全符合哈希码创建公式:其中N为输入特征向量的临近集合,S为创建的临近相似矩阵,C为偏置参数;I为单位矩阵。进一步,第二步中,建立n×n相似矩阵S,两个二进制码hi和hj之间的汉明距离由hi和hj之间不同的比特数给出;将加权平均汉明距离最小化,表示语义损失,得到符合相似矩阵S计算公式的哈希码。进一步,得到符合相似矩阵S计算公式的哈希码中,训练特征为:X=[x1,x2,...,xn]∈Rp×n,训练特征为前面环节所输入的视觉特征,R为参数矩阵,n为训练图像的个数,p为特征的维数,设哈希码为H=[h1,h2,...,hn]T∈{1,-1}n×c,c是哈希码的长度,n为图片的数量;其中Nk(x)表示特征向量x的近邻集合;通过相似矩阵S判断特征是否所输入参数是否属于临近特征集合。进一步,第三步中,哈希函数表示为:哈希函数为最终哈希码H的计算公式,选取(N-S+φC)的最小非零特征值作为H的数值;其中N为输入特征向量的临近集合,S为创建的临近相似矩阵,C为偏置参数;I为单位矩阵。进一步,第四步中,采用MLP算法的端到端的深度学习算法学习哈希函数;MLP包括一个输入层,一个输出层和若干个隐藏层;根据隐藏层中不同节点的不同权重对输入进行调整;CNNs后,选择单隐藏层型的MLP学习哈希码标签,在多输出条件下构建ANN的端到端的哈希函数深度学习模型。本专利技术的另一目的在于提供一种实施所述的基于高精度哈希图像检索技术的行人检测方法的道路交通行人图像检索检测终端。本专利技术的另一目的在于提供一种基于高精度哈希图像检索方法的行人检测控制系统。综上所述,本专利技术的优点及积极效果为:由于行人检测中识别的基础表示是身形等相对于一般图片精度要求更高的要素,所以在行人检测领域,提高识别要素的精度一直是研究工作者所追求的目标。本专利技术目标在于利用一种基于高精度哈希算法(HPSLH)其识别精度相对较高的特点,减少了识别误差与语义损失,提高了对象搜索的准确性和全面本文档来自技高网
...

【技术保护点】
1.一种基于高精度哈希图像检索技术的行人检测方法,其特征在于,所述基于高精度哈希图像检索技术的行人检测方法包括:对于提取的行人图像采用机器学习创建目标函数,进行目标最小化,得到临阶相似矩阵,再采用ILS算法进一步最小化目标函数,得到精确的哈希码;得到精确的哈希码后,采用端到端哈希深度学习方法学习哈希函数,根据人工神经网络ANN的隐藏层中不同节点的不同权重对输入进行调整;并进行CNNs后,选择单隐藏层MLP学习hash标签;最后生成训练函数:

【技术特征摘要】
1.一种基于高精度哈希图像检索技术的行人检测方法,其特征在于,所述基于高精度哈希图像检索技术的行人检测方法包括:对于提取的行人图像采用机器学习创建目标函数,进行目标最小化,得到临阶相似矩阵,再采用ILS算法进一步最小化目标函数,得到精确的哈希码;得到精确的哈希码后,采用端到端哈希深度学习方法学习哈希函数,根据人工神经网络ANN的隐藏层中不同节点的不同权重对输入进行调整;并进行CNNs后,选择单隐藏层MLP学习hash标签;最后生成训练函数:表示输出为一个mxd矩阵,m是批量的样本数量,d是最后一个全连接层的输出数量,x是输出向量,y是对应的标签。2.如权利要求1所述的基于高精度哈希图像检索技术的行人检测方法,其特征在于,所述基于高精度哈希图像检索技术的行人检测方法具体包括:第一步,获取目标图像;第二步,创建临阶相似矩阵;第三步,将生成的矩阵带入ISL算法得到对应的哈希码标签;第四步,将所生成的哈希码标签带入Ann网络进项多次迭代学习,得到最终的检测结果。3.如权利要求2所述的基于高精度哈希图像检索技术的行人检测方法,其特征在于,第一步中,采用深层的CNN网络结构获取图像的特征;在图片经过深层次的神经网络捕捉特征后,对获取的特征进行数据格式上的规范化处理,使特征的数据格式完全符合哈希码创建公式:S.t.HHT=I其中N为输入特征向量的临近集合,S为创建的临近相似矩阵,C为偏置参数;I为单位矩阵。4.如权利要求2所述的基于高精度哈希图像检索技术的行人检测方法,其特征在于,第二步中,建立n×n相似矩阵S,两个二进制码hi和hj之间的汉明距离由hi和hj之间...

【专利技术属性】
技术研发人员:焦宏哲魏斯玮傅稼润王春枝严灵毓叶志伟
申请(专利权)人:湖北工业大学
类型:发明
国别省市:湖北,42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1