当前位置: 首页 > 专利查询>安徽大学专利>正文

一种基于深度迁移和Cayley-Klein度量的小样本下茶叶病害识别算法制造技术

技术编号:29586902 阅读:21 留言:0更新日期:2021-08-06 19:46
本发明专利技术涉及一种基于深度迁移和Cayley‑Klein度量的小样本下茶叶病害识别算法,深度迁移和Cayley‑Klein度量的神经网络的训练过程:基于深度迁移和Cayley‑Klein度量的神经网络的训练过程分为两个阶段:第一个阶段是数据由低层次向高层次传播的阶段,即前向传播阶段;另外一个阶段是,择Cayley‑Klein度量以反应样本空间结构信息或语义信息,使得距离度量具有更好的区分性,更好的减少负迁移特征所带来的影响。本算法能够准确地检测三种不同的茶叶病害图像,并且具有较高的识别精度,同时具有较快的识别速度。该特性主要得益于迁移学习解决了小样本情况下数据量不足无法进行深度学习提取特征的问题,而Cayley‑Klein度量边降维边度量的过程,降低了因迁移学习带来的负迁移影响。

【技术实现步骤摘要】
一种基于深度迁移和Cayley-Klein度量的小样本下茶叶病害识别算法
本专利技术涉及基于图片特征的图像分类算法的研究领域,具体为一种结合深度迁移和Cayley-Klein度量的小样本下茶叶病害识别算法。
技术介绍
当使用经典机器学习方法来识别植物病害时,需要人工提取植物病害特征,特征提取效果对识别精度有着很大的影响。由于受不同茶叶病害感染的茶叶病斑颜色和纹理相差甚小,采用经典机器学习方法识别的准确率较低。近年发展起来的深度学习方法在进行目标识别的时候不需要人工提取目标特征,利用深度学习方法进行植物病害识别的准确率非常高,用于植物叶片病害识别的最常用深度学习模型是深度卷积神经网络CNN。收集足够的茶叶病数据作为训练样本是困难和昂贵的,在茶叶病害培养样本不足的情况下,大部分深度学习方法难以获得较高的识别准确率。如果样本数量不足,通过图像增广方式扩充训练样本数量,也可以用来训练深度学习模型。传统数据扩充方法通过几何变换、伽马校正、主成分分析(PCA)、噪声注入来增加训练图像,上述图像增广方式并没有增加额外的信息,利用所增广的样本训练深度学习模型仍然存在过拟合问题。尽管已有方法的性能不能令人满意,但已经为植物病害分类做了很多工作。对于训练数据中存在的位置偏差,几何变换是非常好的解决方案。有许多潜在的偏差来源,可以将训练数据与测试数据的分布分开。如果存在位置偏差,例如在人脸识别数据集中,每个人脸都是完全居中的,几何变换是一个很好的解决方案。除了克服位置偏差的强大能力之外,几何变换也很有用,因为它们很容易实现。有很多成像处理库,可以让水平翻转和旋转等操作轻松上手。几何变换的一些缺点包括额外的内存、变换计算成本和额外的训练时间。一些几何变换,如平移或随机裁剪等几何变换必须手动观察,以确保它们没有改变图像的标签。最后,在所涉及的许多应用领域,如医学图像分析,训练数据与测试数据之间的偏差比位置偏差和平移偏差更复杂。因此,几何变换也不一定总是能带来明显的效果。伽玛校正(GammaCorrection),所谓伽玛校正就是对图像的伽玛曲线进行编辑,以对图像进行非线性色调编辑的方法,检出图像信号中的深色部分和浅色部分,并使两者比例增大,从而提高图像对比度效果。计算机绘图领域惯以此屏幕输出电压与对应亮度的转换关系曲线,称为伽玛曲线(GammaCurve)。在图像处理中,可以将漂白(相机过曝)的图片或者过暗(曝光不足)的图片,进行修正。然而伽马变换对于图像对比度偏高,并且整体亮度值偏低情况下的图像增强效果明显不好。主成分分析(PCA),通过PCA变换,可以把多波段图像中的有用信息集中到数量尽可能少的新的主成分图像中,并使这些主成分图像之间互不相关,从而大大减少总的数据量。但PCA变换对噪声比较敏感,即信息量大的主成分分量,信噪比(信号与噪声的比)不一定高,当某个信息量大的主成分中包含的噪声的方差大于信号的方差时,该主成分分量形成的图像质量就差,PCA变换用于融合处理并不是为了减少噪声,而是通过该变换,使得多光谱影像在各个波段具有统计独立性,即这些波段间的数据互不相关,便于分别采用相应的融合策略。噪声注入,基于噪声的数据增强就是在原来的图片的基础上,随机叠加一些噪声,最常见的做法就是高斯噪声。更复杂一点的就是在面积大小可选定、位置随机的矩形区域上丢弃像素产生黑色矩形块,从而产生一些彩色噪声。然而随机加入噪声,产生的几乎是对模型有害的噪声,这会干扰到模型的正常收敛。
技术实现思路
本专利技术的目的在于提供一种基于深度迁移和Cayley-Klein度量的小样本下茶叶病害识别算法,该方法以其他类作物病害图像为源域样本,以病害茶叶图像为目标域样本,通过以下三个步骤实现小样本下茶叶病害识别:第一个步骤是病斑图像分割。利用适合处理小样本的支持向量机方法分割茶叶病害图像中的病斑,以去除复杂背景的影响。第二个步骤是病斑图像特征抽取。为了解决小样本下的过拟合问题,借鉴深度迁移学习思想,利用大数据量的源域样本中分割出的病斑图像训练VGG16网络模型,并用目标域样本微调后获得特征提取网络,以抽取茶叶病斑图像特征。第三步骤是病斑图像分类识别。将抽取出来的茶叶病斑图像特征用来训练和测试Cayley-Klein度量模型,最终实现茶叶病害识别结果。为实现上述目的,本专利技术提供如下技术方案:一种基于深度迁移和Cayley-Klein度量的小样本下茶叶病害识别算法,其特征在于,包括多卷积神经网络的训练过程:网络的训练过程分为两个阶段:第一个阶段是数据由低层次向高层次传播的阶段,即前向传播阶段;另外一个阶段是,择Cayley-Klein度量以反应样本空间结构信息或语义信息,使得距离度量具有更好的区分性,更好的减少负迁移特征所带来的影响;具体训练过程为:第一步:网络进行权值的初始化;第二步:输入数据经过卷积层、下采样层的向前传播得到茶叶特征数据;第三步:茶叶病斑图像特征用来训练和测试Cayley-Klein度量模型,最终实现茶叶病害识别结果。优选的,包括卷积层,卷积层可实现对输入数据的特征提取功能,通过若干个卷积层重复作用于不同图像位置的感受野,将卷积所得到的结果组合得到特征图像,卷积层与输入接收区运算公式如下所示:其中:x表示接收局域(M,N)的二维向量;W表示长和宽分别为j、i的卷积层;b为每个输出特征映射所加的偏置项,yconv为卷积结果;M为二维向量的长,N为二维向量的宽;f为激活函数。优选的,包括池化层,池化层的主要作用是对卷积计算结果进行尺度缩小,以减少网络的参数量,经过池化层处理后的特征图的尺度会一定程度减小,尺寸为2,步长为2的最大池化函数为:fpool=Max(xm,n,xm+1,n,xm,n+1,xm+1,n+1),(0≤m≤M,0≤n≤N)其中:fpool为最大池化结果。9.优选的,Cayley-Klein度量是解决多分类问题的分类器,Cayley-Klei度量依赖于一个对称矩阵Ω。数据的统计特性通常可以在一定程度上比较好的反映出数据样本之间的几何结构,因此根据样本之间的类内高斯分布与类间高斯分布的对数似然比来定义Cayley-Klein度量矩阵的概念。对初始特征xi,xj∈Rd,通过降维矩阵W∈Rd×r(r<d)将初始高维(d维)特征向量映射到低维子空间(r维)中。因此,Cayley-Klein度量矩阵转化为:其中∑′I是新的特征子空间中类内协方差矩阵,∑′E表示的是新特征子空间中相同类别之间的协方差矩阵,且∑′I=WT∑IW,∑′E=WT∑EW。为了使不同类的样本图像更容易区分,利用度量的方法尽可能减小相同类别之间的方差,同时增大不同类别之间方差。这样通过增大方差的距离可以提升数据样本的区分度,对于矩阵W的列向量w,有方差σI(w)=wT∑Iw,因此可以定义广义瑞利熵来最大化方差之间的比值:使得j(w)最大化等价于:于是可以根据求解广义特征值分解问题的方法,将矩阵W求解的问题变成一个监督问本文档来自技高网
...

【技术保护点】
1.一种基于深度迁移和Cayley-Klein度量的小样本下茶叶病害识别算法,其特征在于,包括多卷积神经网络的训练过程:/n基于深度迁移和Cayley-Klein度量的神经网络的训练过程分为两个阶段:第一个阶段是数据由低层次向高层次传播的阶段,即前向传播阶段;另外一个阶段是,择Cayley-Klein度量以反应样本空间结构信息或语义信息,使得距离度量具有更好的区分性,更好的减少负迁移特征所带来的影响,具体训练过程为:/n第一步:网络进行权值的初始化;/n第二步:输入数据经过卷积层、下采样层、全连接层的向前传播得到输出值;/n第三步:借鉴深度迁移学习思想,利用大数据量的源域样本中分割出的病斑图像训练VGG16网络模型,并用目标域样本微调后获得特征提取网络,以抽取茶叶病斑图像特征;/n第四步:将抽取出来的茶叶病斑图像特征用来训练和测试Cayley-Klein度量模型,最终实现茶叶病害识别结果。/n

【技术特征摘要】
1.一种基于深度迁移和Cayley-Klein度量的小样本下茶叶病害识别算法,其特征在于,包括多卷积神经网络的训练过程:
基于深度迁移和Cayley-Klein度量的神经网络的训练过程分为两个阶段:第一个阶段是数据由低层次向高层次传播的阶段,即前向传播阶段;另外一个阶段是,择Cayley-Klein度量以反应样本空间结构信息或语义信息,使得距离度量具有更好的区分性,更好的减少负迁移特征所带来的影响,具体训练过程为:
第一步:网络进行权值的初始化;
第二步:输入数据经过卷积层、下采样层、全连接层的向前传播得到输出值;
第三步:借鉴深度迁移学习思想,利用大数据量的源域样本中分割出的病斑图像训练VGG16网络模型,并用目标域样本微调后获得特征提取网络,以抽取茶叶病斑图像特征;
第四步:将抽取出来的茶叶病斑图像特征用来训练和测试Cayley-Klein度量模型,最终实现茶叶病害识别结果。


2.根据权利要求1所述的一种基于深度迁移和Cayley-Klein度量的小样本下茶叶病害识别算法,其特征在于,包括卷积层,卷积层可实现对输入数据的特征提取功能,通过若干个卷积层重复作用于不同图像位置的感受野,将卷积所得到的结果组合得到特征图像,卷积层与输入接收区运算公式如下所示:



其中:x表示接收局域(M,N)的二维向量;w表示长和宽分别为j、i的卷积层;b为每个输出特征映射所加的偏置项,yconv为卷积结果;M为二维向量的长,N为二维向量的宽;f为激活函数。


3.根据权利要求1所述的一种基于深度迁移和Cayley-Klein度量的小样本下茶叶病害识别算法,其特征在于,包括池化层,池化层的主要作用是对卷积计算结果进行尺度缩小,以减少网络的参数量,经过池化层处理后的特征图的尺度会一定程度减小,尺寸为2,步长为2的最大池化函数为:
fpool=Max(xm,n,xm+1,n,xm,n+1,xm+1,n+1),(0≤m≤M,0≤n≤N)
其中:fpool为最大池化结果。


4.根据权利要求1所述的一种基于深度迁移和Cayley-Klein度量的小样本下茶叶病害识别算法,其特征在于,Cayley-Klein度量,Cayley-Klein度量是解决多分类问题的分类器,Cayley-Klei度量依赖于一个对称矩阵Ω,数据的统计特性通常可以在一定程度上比较好的反映出数据样本之间的几何结构,因此根据样本之间的类内高斯分布与类间高斯分布的对数似然比来定义Cayley-Klein度量矩阵的概念,对初始特征xi,xj∈Rd,通过降维矩阵W∈Rd×r(r<d)将初始高维(d维)特征向量映射到低维子空间(r维)中,因此,Cayley-Klein度量矩阵转化为:



其中Σ′I是新的特征子空间中类内协方差矩阵,Σ′E表示的是新特征子空...

【专利技术属性】
技术研发人员:方敏黄雪峰竺德胡根生刘辉
申请(专利权)人:安徽大学赛尔网络有限公司
类型:发明
国别省市:安徽;34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1