【技术实现步骤摘要】
一种基于深度学习的纹身图像分类方法
本专利技术涉及图像处理和模式识别等
,尤其是一种纹身图像分类方法。
技术介绍
纹身图像识别的研究刚刚兴起,没查阅到国内相关的论文和专利,在国外也只有A.K.Jain等几个学者在从事纹身相关的学术研究。尽管已有了一定的发展,但仍存在诸多迫切需要解决的问题。第一,现有感兴趣区检测方法存在一定的缺陷。现有纹身图像感兴趣区的检测,主要是通过人工标定或图像分割算法。图像分割算法是低层视觉特征对用户实际兴趣的一种估计,难以实现对感兴趣区的客观描述。因此,这两种方法都存在主观性问题。第二,人工语义标注难以适应日益变大的图像数据库。对大规模的图像数据库进行的人工语义标注需要耗费大量的人力和时间,而且人对图像的理解是非常主观的,不同的人依据自身的知识、经验、情绪和其他情况,可能对相同的图像做出不同的理解。第三,低质量图像匹配方法尚待完善。现有的纹身识别方法,大都通过提取关键点作为比对特征,当图像对比度小、亮度不均或者图像分辨率低的时候,提取得到的关键点数少;如果纹身图像被毛发遮挡,那么大部分的关键点会从毛发而不是从纹身中提取得到。由于纹身是刻在人体皮肤上的,因此纹身图像会随人体的运动而发生扭曲和变形。纹身识别系统的性能往往因为未能合理的计算低质量纹身图像间的相似度而明显下降。深度学习是受大脑是一个深度网络结构的启发,对于深度结构的神经网络研究了10多年。但是在2006年前一直没有好的结果,只有2,3层的网络有比较好的结果,更加深层的网络甚至比浅层网络的表现还要差。在2006年可以看做是深度结构的神经网络的一种突破,Hinton和他的 ...
【技术保护点】
一种基于深度学习的纹身图像分类方法,其特征在于:所述分类方法包括以下步骤: 1)样本变换 1.1)仿射变换; 1.2)弹性变换:对样本进行曲面模拟; 1.3)遮挡模拟:在每幅输入训练机的图像随机把某一区域的像素值置0; 1.4)白化; 2)自编码预训练:使用CUDA优化后的自编码训练机对大量彩色纹身图像进行训练,得到纹身图像的一些共同地边缘信息,同时对这些图像做些挑选后用于卷积网络的第一层; 3)卷积网络训练:使用CUDA优化后的卷积网络对有标定的纹身图像进行训练得到最终分类结果。
【技术特征摘要】
1.一种基于深度学习的纹身图像分类方法,其特征在于:所述分类方法包括以下步骤:1)样本变换1.1)仿射变换;1.2)弹性变换:对样本进行曲面模拟,过程如下:对n*m的图像进行变换,得到n*m个向量构成坐标矩阵X;其中Y=[y1,y2,…,ym],1≤i≤n,列向量表示图中横坐标第i位置,纵坐标第j位置,1≤j≤m,将其输入到输入维度为2,输出维度为1的神经网络中,采用3层神经网络,变换函数为:P=g(W2g(W1(X+b1))+b2)(2)其中:P=[p1,1,p1,2,…,p1,m,p2,1,p2,2,…,p2,m,…,pn,1,pn,2,…,pn,m]pi,j为向量对应的输出值;g为神经网络的激活函数,选用sigmoid函数即x为函数的输入值;W1,W2,b1,b2是(-r,r)均匀分布的随机数;对于神经网络随机初始化的范围为(-r,r)即构成所需要的曲面模型,满足光滑,并且由参数控制形变复杂度的特性;得到曲面后,对曲面上毎一点求导得到偏移矩阵G,得到每个像素点最后的偏移坐标:Xo=X+G(3)最后把新图像中点X的像素值取原图像Xo经过线性插值后的像素值;1.3)遮挡模拟:在每幅输入训练机的图像随机把某一区域的像素值置0;1.4)白化;2)自编码预训练:使用CUDA优化后的自编码训练机对大量彩色纹身图像进行训练,得到纹身图像的一些共同地边缘信息,同时对这些图像做些挑选后用于卷积网络的第一层;3)卷积网络训练:使用CUDA优化后的卷积网络对有标定的纹身图像进行训练得到最终分类结果。2.如权利要求1所述的一种基于深度学习的纹身图像分类方法,其特征在于:所述分类方法还包括以下步骤:4)对卷积网络优化:使用了随机池化和对于随机池化的BP算法,使用CUDA对整体流程进行优化。3.如权利要求2所述的一种基于深度学习的纹身图像分类方法,其特征在于:所述分类方法还包括以下步骤:5)使用holdout验证控制样本变换程度。4.如权利要求1~3之一所述的一种基于深度学习的纹身图像分类方法,其特征在于:所述步骤1.1)中,仿射变换原理如下:其中为变换图像的坐标位置,θ为旋转角,为平移向量,tx为x轴平移距离,ty为y轴平移距离;为原始图像的坐标位置。5.如权利要求1~3之一所述的一种基于深度学习的纹身图像分类方法,其特征在于:所述步骤1.4)中,白化过程:若有矩阵Xo={x(1),x(2),…,x(m)},其中x(i)∈Rn×1,R为实数;首先算出样本的协方差矩阵C:其中(x(i))T为向量x(i)的转置;那么对C分解得到矩阵U:U=[u1,u2,…,un](5)其中u1,u2,…,un是C的特征向量,且为列向量,另记λ1,λ2,…,λn为对应的特征值并且按特征值由大到小的顺序排列;把数据转换到由矩阵U构成的基上:Xrot=UTXo(6)进行白化:xrot,i是矩阵Xrot的第i个列向量;同理xrotwhite,i是矩阵Xrotwhite的第i个列向量;其中ε取一个极小值;把白化结果转换回去,即白化的最终结果为:Xwhite=UXrotwhite(8)。6.如权利要求1~3之一所述的一种基于深度学习的纹身图像分类方法,其特征在于:所述步骤2)中,先把纹身样本随机采集n万张a×a的图像,这些图像包含纹身图像的各种区域信息,输入到隐藏层为b的自编码...
【专利技术属性】
技术研发人员:张永良,肖健伟,高思斌,肖刚,
申请(专利权)人:浙江工业大学,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。