本发明专利技术公开了一种带子空间投影的电子鼻信号误差自适应学习方法,1、数据白化预处理;2、计算源域XS和目标域数据XT的中心μS以及μT;3、初始化平衡参数λ和子空间维度d;4、对矩阵执行特征分解,并获得特征向量矩阵V和特征值对角矩阵U;5、获得子空间投影基矩阵P=[v1,…,vd];6、获得源域XS和目标域XT在新子空间中的投影X′S和X′T;7、在新子空间中利用(X′S,yS)训练分类器,获得分类器参数;8:利用X′T测试上述获得的分类器,获得识别率。本发明专利技术的优点是:在不增加样本的条件下,找到一种映射使源域和目标域的子空间达到分布一致,实现了传感器漂移补偿,保持模式识别系统的性能。
【技术实现步骤摘要】
本专利技术属于电子鼻的气体检测领域,具体涉及一种自适应学习电子鼻的误差补偿方法。
技术介绍
电子鼻,又称人工嗅觉系统,其由传感器阵列和模式识别系统组成,能够检测未知气体及其浓度。理论上,电子鼻的传感器对同一气体的同一浓度在一样的环境下,其响应是相同的。但是,在实际应用中,传感器使用一段时间后,由于中毒、老化等原因会导致传感器发生缓慢地漂移。传感器漂移极大地降低了系统的模式识别性能,使得电子鼻使用一段时间后变得不可靠。在传感器和模式识别领域,漂移已成为一个非常棘手的问题。近年来,传感器漂移补偿方法已有很多种,第一类为单变量方法,具体有频率分析,基线处理和差分检测等,用于分别对每个传感器的响应进行补偿;这类方法简单且计算复杂度低,但不能完全解决漂移问题,因为这类方法对采样率特别敏感。第二类为多变量方法,与单变量方法相比,多变量方法是对全部传感器响应进行补偿,这类方法最具代表性的是成分校正法,但这类方法最大的缺点是假设漂移方向是线性的,虽然核化后的成分校正似乎可行,如KPCA,能用于非线性的漂移方向,但是,这种方法需要一个参考气体用来估计漂移方向且假设其它气体的漂移方向与参考气体的漂移方向是一致的。第三类为机器学习方法,该类方法有很多,它们是使分类器根据漂移情况进行调整,并不是计算或者明确描述漂移。如:基于支持向量机的集成方法,这种方法的性能优于基于信号校正的方法。但是,这种方法需要大量的标签样本。在机器学习领域,未漂移的数据集称为源域,漂移的数据集称为目标域,目标域的特征分布不同于源域的特征分布,这种处于不同域的电子鼻数据被称为异构数据。如图1所示,目标域的特征分布与源域的特征分布有明显的差异,另外,特征分布也可理解为特征子空间。导致源域和目标域特征子空间不一致的原因是传感器使用较长时间后,由于老化、中毒等原因,使得传感器发生漂移。传感器发生漂移后,即使将其放置在同样的环境(同样的温湿度、气体以及浓度)下,传感器的响应值与未漂移的响应值有着较大的差别,即电子鼻数据的异构特性;若此时仍用未漂移时的数据训练获得的模式识别系统进行分类,则模式识别系统的性能将会被大大地降低。
技术实现思路
针对现有技术中存在的技术问题,本专利技术所要解决的技术问题就是提供一种带子空间投影的电子鼻信号误差自适应学习方法,它能找到一种映射使源域和目标域的子空间达到分布一致,在不增加样本的条件下,从而实现传感器漂移补偿,保持模式识别系统的性能。为了描述简便,本说明书中规定以下符号为:用下角标“S”和“T”分别表示源域和目标域,为源域样本,为目标域样本,其中,D表示每个样本的维数,NS和NT分别表示源域和目标域的样本数量。为把源域和目标域从原始空间映射到某d维子空间的一组变换基,其中变换基P=[v1,v2,...,vd]其中vi=[vi1,vi2,...,viD]T,i=1,...,d。||·||F表示一个矩阵的Frobenius范数。表示的是源域的第i个样本,表示的是目标域的第j个样本。C是常数。大写的粗黑体表示矩阵。小写的粗黑体表示向量,变量用斜体表示。本专利技术所要解决的技术问题是通过这样的技术方案实现的,它包括以下步骤:步骤1:数据白化预处理;由于原始数据有很多特征,且特征值差异较大,为了便于后面的模式识别算法,需要对数据进行预处理,即对数据进行归一化,并中心化,使处理后的数据中心为零矢量;步骤2:计算源域XS和目标域数据XT的中心μS以及μT,其中NS和NT分别表示源域和目标域的样本数量,表示的是源域的第i个样本,表示的是目标域的第j个样本;步骤3:初始化平衡参数λ和子空间维度d;步骤4:对矩阵执行特征分解,并获得特征向量矩阵V和特征值对角矩阵U;步骤5:获得子空间投影基矩阵P=[v1,…,vd],其中,v1,…,vd对应于前d个最大的特征值λ1,…,λd;步骤6:获得源域XS和目标域XT在新子空间中的投影X′S和X′T,其中,X′S=PTXS和XT=PTXT;步骤7:在新子空间中利用(X′S,yS)训练分类器,获得分类器参数,其中yS为样本的类别标签;步骤8:用X′T对步骤7得到的分类器进行验证,获取测试识别精度。由于采用了上述技术方案,找到一种映射P,使源域和目标域的子空间达到分布一致。本专利技术具有如下的优点:在不增加样本的情况下,找到一种映射使源域和目标域的子空间达到分布一致,实现了传感器漂移补偿,保持模式识别系统的性能。附图说明本专利技术的附图说明如下:图1为源域、目标域特征子空间和新构二维子空间的示意图;图2为本方法专利技术的流程图;图3为合成异构数据的三维图;图4为应用本专利技术对图3处理后生成的新二维子空间图;图5为电子鼻采集的第一、第二批数据的主成分分析散点图;图6为电子鼻采集的第三、第四批数据的主成分分析散点图;图7为电子鼻采集的第五、第六批数据的主成分分析散点图;图8为电子鼻采集的第七、第八批数据的主成分分析散点图;图9为电子鼻采集的第九、第十批数据的主成分分析散点图;图10为经本专利技术处理后的第一批与第二批数据子空间的主成分分析散点图;图11为经本专利技术处理后的第一批与第三批数据子空间的主成分分析散点图;图12为经本专利技术处理后的第一批与第四批数据子空间的主成分分析散点图;图13为经本专利技术处理后的第一批与第五批数据子空间的主成分分析散点图;图14为经本专利技术处理后的第一批与第六批数据子空间的主成分分析散点图;图15为经本专利技术处理后的第一批与第七批数据子空间的主成分分析散点图;图16为经本专利技术处理后的第一批与第八批数据子空间的主成分分析散点图;图17为经本专利技术处理后的第一批与第九批数据子空间的主成分分析散点图;图18为经本专利技术处理后的第一批与第十批数据子空间的主成分分析散点图。具体实施方式下面结合附图和实施例对本专利技术作进一步说明。本专利技术的技术构思是:图1所示的源域和目标域不属于同一分布,通过找到一种映射或者变换,使目标域样本的分布与源域的分布为同一分布,从而实现对目标域样本的漂移补偿,那么目标域样本能用由源域样本训练得到的模式识别系统进行识别且其性能不会降低。为此,要得到一组变换基P,使得源域和目标域的原始分布空间经P映射后得到的子空间里源域和目标域的特征分布趋于一致。为了使得训练样本(源域样本和目标域样本)经P映射后不发生变形且能保留绝大部分原始信息,则有两个最优化问题: m a x P P T X S X S T P - - - ( 1 ) ]]> m a x P P T X T X T T P - - - ( 2 ) ]]>实际上,P同时满足(1)、(2)式使其都达到最本文档来自技高网...
【技术保护点】
一种带子空间投影的电子鼻信号误差自适应学习方法,其特征是,包括以下步骤:步骤1:数据白化预处理;步骤2:计算源域XS和目标域数据XT的中心μS以及μT,其中NS和NT分别表示源域和目标域的样本数量,表示的是源域的第i个样本,表示的是目标域的第j个样本;步骤3:初始化平衡参数λ和子空间维度d;步骤4:对矩阵执行特征分解,并获得特征向量矩阵V和特征值对角矩阵U;步骤5:获得子空间投影基矩阵P=[v1,…,vd],其中,v1,…,vd对应于前d个最大的特征值λ1,…,λd;步骤6:获得源域XS和目标域XT在新子空间中的投影X′S和X′T,其中,X′S=PTXS和X′T=PTXT;步骤7:在新子空间中利用(X′S,yS)训练分类器,获得分类器参数,其中yS为样本的类别标签。步骤8:用X′T对步骤7得到的分类器进行验证,获取测试识别精度。
【技术特征摘要】
1.一种带子空间投影的电子鼻信号误差自适应学习方法,其特征是,包括以下步骤:步骤1:数据白化预处理;步骤2:计算源域XS和目标域数据XT的中心μS以及μT,其中NS和NT分别表示源域和目标域的样本数量,表示的是源域的第i个样本,表示的是目标域的第j个样本;步骤3:初始化平衡参数λ和子空间维度d;步骤4:对矩阵执行特征分解,并获得特征向量矩阵V和特征值对角矩阵U;步骤5:获得子空间投影基矩阵P=[v1,…,vd],其中,v1,…,vd对应...
【专利技术属性】
技术研发人员:张磊,刘燕,田逢春,邓平聆,刘涛,
申请(专利权)人:重庆大学,
类型:发明
国别省市:重庆;50
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。