一种多层稀疏编码特征的鸟类图像识别方法技术

技术编号:14803368 阅读:136 留言:0更新日期:2017-03-14 23:29
本发明专利技术公开了一种多层稀疏编码特征的鸟类图像识别方法,首先在局部图像块的R,G,B三通道上利用级联多层稀疏编码结构提取稀疏编码特征,每层稀疏编码结构都包含特征编码部分和特征最大值抽取两部分;然后在输出特征上,多层稀疏编码特征使用线性核进行融合,并使用SVM作为分类器进行分类判决。在多层稀疏编码结构中,在优化目标函数中加入了一个局部约束项,在特征编码部分迭代地使用所求得目标函数的近似解进行稀疏编码,然后使用这些编码值最小化重构误差,更新字典。本发明专利技术的多层稀疏编码特征的鸟类图像识别方法,能极大提高系统对于鸟类图像的识别精度。

【技术实现步骤摘要】

本专利技术涉及图像识别领域,特别涉及一种多层稀疏编码特征的鸟类图像识别方法
技术介绍
目前已有一些鸟类识别的专利,但是对于鸟类图像进行识别的专利并未发现。在鸟类识别方面,如专利2009102108999提供基于声像一体化野生鸟类识别技术的远程无线监测系统,其用于远程生态监测,所述系统包括鸣声录制模块、视频录制模块、音视频数据处理模块、音视频流传输模块和音视频数字文件存储模块。专利2013105810072提供一种基于鸟鸣声的移动式鸟类识别方法,该专利通过LabVIEW软件对采集的鸟鸣声信号进行预处理,并通过LabVIEW和MATLAB软件混合编程的AOK时频分析方法处理预处理之后的鸟鸣声信号,最后通过MATLAB软件处理AOK时频谱图,实现特征值的提取。将已知鸟种的鸟的特征值经模型训练生成训练模板并进行数据存储,将待识别鸟种的鸟的特征值经模型训练生成测试模板,结合DTW算法将测试模板与训练模板进行匹配来实现鸟类的识别。在实际生活中,用户更常用手机对鸟类拍照等方式来进行记录和识别。为此急需一种基于鸟类图像的识别方法。
技术实现思路
为了克服现有技术的上述缺点与不足,本专利技术的目的在于一种多层稀疏编码特征的鸟类图像识别方法,对于鸟类图像的识别精度高。本专利技术的目的通过以下技术方案实现:一种多层稀疏编码特征的鸟类图像识别方法,包括以下步骤:S1训练过程S1.1收集各种鸟类训练图像,组成鸟类训练数据集;S1.2字典学习S1.2.1设定字典学习的目标函数为:minD,X||Y-DX||F2+λΣi=1NΣj=1,j≠iN|diTdj|+βΣi=1N||ei·xi||2---(1)]]>其中Y为图像块的像素矩阵集,yi是像素矩阵集Y中第i个图像块的像素矩阵;D是需学习的字典,字典个数为N,字典元素为di和dj;X是字典的权重系数,其元素为xi;是F范数,ei=exp([dist(yi,d1),...,dist(yi,dN)]T/σ),而dist(yi,dj)是yi与dj的欧式距离,·表示矩阵点乘,σ为权重,λ,β是平衡两种约束的权重系数;S1.2.2计算输入信号像素矩阵集Y的编码系数X,得到的新目标函数如式(2)所示,其解析解如式(3)所示;minD,X||Y-DX||F2+βΣi=1N||ei·xi||2---(2)]]>s.t.∀i,1Txi=1]]>Ci=(DT-1yiT)(DT-1yiT)Txi=(Ci+βdiag2(e))\\1xi=xi/1Txi---(3)]]>S1.2.3在求得编码系数X后,字典中的单词通过KSVD算法按顺序优化更新,目标函数(1)更新为:mindm{x‾mTx‾mdmTdm-2Rmx‾m+λΣj=1,j≠mN|djTdm|本文档来自技高网...

【技术保护点】
一种多层稀疏编码特征的鸟类图像识别方法,其特征在于,包括以下步骤:S1训练过程S1.1收集各种鸟类训练图像,组成鸟类训练数据集;S1.2字典学习S1.2.1设定字典学习的目标函数为:minD,X||Y-DX||F2+λΣi=1NΣj=1,j≠iN|diTdj|+βΣi=1N||ei·xi||2---(1)]]>其中Y为图像块的像素矩阵集,yi是像素矩阵集Y中第i个图像块的像素矩阵;D是需学习的字典,字典个数为N,字典元素为di和dj;X是字典的权重系数,其元素为xi;是F范数,ei=exp([dist(yi,d1),...,dist(yi,dN)]T/σ),]]>而dist(yi,dj)是yi与dj的欧式距离,·表示矩阵点乘,σ为权重,λ,β是平衡两种约束的权重系数;S1.2.2计算输入信号像素矩阵集Y的编码系数X,得到的新目标函数如式(2)所示,其解析解如式(3)所示;minD,X||Y-DX||F2+βΣi=1N||ei·xi||2---(2)]]>s.t.∀i,1Txi=1]]>Ci=(DT-1yiT)(DT-1yiT)Txi=(Ci+βdiag2(e))\1xi=xi/1Txi---(3)]]>S1.2.3在求得编码系数X后,字典中的单词通过KSVD算法按顺序优化更新,目标函数(1)更新为:mindm{x‾mTx‾mdmTdm-2Rmx‾m+λΣj=1,j≠mN|djTdm|}---(4)]]>s.t.||dm||2=1其中是X第m行的向量,是像素矩阵集Y关于第m个单词的残差;N是字典总个数;S1.2.3不断地迭代实现步骤S1.2.1~S1.2.2;直到每次迭代运行的字典D不再改变;S1.3利用S1.1得到的字典,采用多层稀疏编码对鸟类训练图像进行稀疏编码稀疏计算,得到稀疏编码特征输出;S1.4分类器训练将步骤S1.3所得的稀疏编码特征输出送入线性支持矢量机分类器,得到不同类别鸟类之间的最大分类平面模型;S2测试过程对测试图像,采用步骤S1.3的方法得到稀疏编码特征输出,送入S1.4的分类器所得的鸟类不同类别之间的最大分类平面模型,判断当前测试图像对应的鸟类类别输出。...

【技术特征摘要】
1.一种多层稀疏编码特征的鸟类图像识别方法,其特征在于,包括以下步
骤:
S1训练过程
S1.1收集各种鸟类训练图像,组成鸟类训练数据集;
S1.2字典学习
S1.2.1设定字典学习的目标函数为:
minD,X||Y-DX||F2+λΣi=1NΣj=1,j≠iN|diTdj|+βΣi=1N||ei·xi||2---(1)]]>其中Y为图像块的像素矩阵集,yi是像素矩阵集Y中第i个图像块的像素矩
阵;D是需学习的字典,字典个数为N,字典元素为di和dj;X是字典的权重系
数,其元素为xi;是F范数,ei=exp([dist(yi,d1),...,dist(yi,dN)]T/σ),]]>而dist(yi,dj)
是yi与...

【专利技术属性】
技术研发人员:郭礼华
申请(专利权)人:华南理工大学
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1