当前位置: 首页 > 专利查询>浙江大学专利>正文

一种光谱波数的选择方法技术

技术编号:14869615 阅读:156 留言:0更新日期:2017-03-21 01:38
本发明专利技术公开了一种光谱波数的选择方法,所述方法针对光谱的波数,多次随机抽样校正样本,建立偏最小二乘回归模型,计算每个波数的变量投影重要性系数,按降序排序,并得到与之相应排列顺序的波数集,对重排后的波数集进行逐步波数筛选,统计每次波数选择的结果,得到波数初选集;然后统计所有波数初选集内每个波数的偏最小二乘回归系数的绝对值并作相应的处理,并对处理后的偏最小二乘回归系数按降序排序,记录对应的波数排列次序,再采用反向剔除弱相关的波数的策略,从而获得最优特征波数集。本发明专利技术能充分挖掘波数中的有效信息,有效克服波数选择的主观性问题,最大限度地提取特征波数,消除弱相关因素的影响,显著提高了模型的稳健性与精度。

【技术实现步骤摘要】

本专利技术涉及光谱分析领域,尤其是涉及一种光谱波数的选择方法
技术介绍
光谱分析技术作为一种快速无损的定量分析方法,已成功应用于食品、农业、石油化工等领域。然而光谱检测中获得的谱图往往重叠严重,光谱信息冗余,特征吸收区域不明显。为了提高模型预测精度和简化模型,需要对波数进行优选,选择与待测样本信息最相关的特征波数用于模型的建立。目前,关于光谱分析中波长(波长是波数的倒数)选择方法的研究,主要有基于间隔的波长选择策略、无信息变量消除算法等方法。基于间隔的波长选择策略,波长区间大小的选择难以确定,且特征波长可能只是单独的点,而选择出的波长段中可能含有无关的波长,并不能最大程度地消除无关波长;无信息变量消除算法消除无关变量也是一种常用的波长选择方法,其采用对校正光谱矩阵人为产生一噪声矩阵,消除信息小于噪声变量的波长的方法进行特征波长提取,但这种方法也存在一定的主观性,并且噪声矩阵的选择影响着波长选择的结果,最终波长选择结果通常存在较多的冗余。上述现有方法的局限性,影响了模型的稳健性与精度。
技术实现思路
本专利技术的目的在于,针对现有技术的不足,提供一种光谱波数的选择方法。为此,本专利技术采用如下解决方案:一种光谱波数的选择方法,所述光谱波数的选择方法针对光谱的波数,多次随机抽取校正样本,建立偏最小二乘回归模型,计算每个波数的变量投影重要性系数(VariableImportanceintheProjection,VIP),按降序排序,并得到与之相应排列顺序的波数集,对重排后的波数集进行逐步波数筛选,统计每次波数选择的结果,得到波数初选集;然后统计所有波数初选集内每个波数的偏最小二乘回归系数的绝对值并作相应的处理,对处理后的偏最小二乘回归系数按降序排序,记录对应的波数排列次序,再采用反向剔除弱相关的波数的策略,从而获得最优特征波数集。本专利技术的基于变量投影重要性系数与偏最小二乘回归系数协同的光谱特征波数选择方法,所述方法包括以下步骤:步骤(1),对于样本个数为m、波数个数为p的样本集,建立样本光谱矩阵X(m×p),样本性质矩阵为Y(m×1),样本原波数集V={x1,x2,…,xp本文档来自技高网...
一种光谱波数的选择方法

【技术保护点】
一种光谱波数的选择方法,其特征在于,所述光谱波数的选择方法针对光谱的波数,多次随机抽样校正样本,建立偏最小二乘回归模型,计算每个波数的变量投影重要性系数,按降序排序,并得到与之相应排列顺序的波数集,对重排后的波数集进行逐步波数筛选,统计每次波数选择的结果,得到波数初选集;然后统计所有波数初选集内每个波数的偏最小二乘回归系数的绝对值并作相应的处理,并对处理后的偏最小二乘回归系数按降序排序,记录对应的波数排列次序,再采用反向剔除弱相关的波数的策略,从而获得最优特征波数集,具体步骤包括:步骤(1),对于样本个数为m、波数个数为p的样本集,建立样本光谱矩阵X(m×p),样本性质矩阵为Y(m×1),样本原波数集V={x1,x2,…,xp};设定最大统计次数T,设定建模过程中最大筛选次数KMAX,初始化统计次数t=1;同时,将样本集划分为校正集及预测集;步骤(2),从步骤(1)所述的校正集内随机抽取S个样本作为校正样本集,对校正样本集建立偏最小二乘回归模型;步骤(3),基于步骤(2)中建立的偏最小二乘回归模型,通过变量投影重要性系数来判断每个波数对建立模型的重要程度,VIP值大的波数对模型的重要程度高,将VIP值按降序排列,并得到和VIP值排列顺序相对应的波数集Vt,1,然后,根据每个波数对模型的重要程度,逐步淘汰波数,并计算第k次淘汰波数时建模的交叉验证均方根误差RMSECVt,k,记录第k次淘汰波数时波数子集Vt,k,其中k为从1到KMAX的自然数;步骤(4),查找交叉验证均方根误差RMSECVt,k的最小值,将此次波数选择的波数子集Vt,k记为波数初选集selected_t,并记录波数子集selected_t对应的回归模型系数绝对值的矩阵w_t;步骤(5),重复步骤(2)到步骤(4),直至达到最大统计次数T,获得波数子集selected_t,其中t=1,2,…,T,同时得到每个波数子集对应的回归模型系数绝对值的矩阵集合{w_1,w_2,…,w_T};步骤(6),统计出每个波数在步骤(5)中的集合{w_1,w_2,…,w_T}相应的回归模型系数值之和,并做归一化处理得到矩阵W1×p,将W1×p每个波数按降序排列,得到矩阵WS1×p;记与矩阵WS1×p相对应的原波数重排后的波数集为resort_wave={x′1,x′2,…,x′p},其中x′1为原波数集内偏最小二乘回归系数最大的波数点,x′p为原波数集内偏最小二乘回归系数最小的波数点;步骤(7),针对步骤(6)所述的波数集采取反向剔除法,即从低位开始逐个剔除系数值小的波数;剔除个数设定阈值g,所述阈值g为自然数,所述阈值g大于等于2同时小于步骤(1)所述的波数个数p,在步骤(6)所述的波数集resort_wave={x′1,x′2,…,x′p}中,将波数子集{x′p‑g+1,…,x′p‑1,x′p}剔除,波数子集{x′1,…,x′p‑g‑1,x′p‑g}保留并作为最优特征波数子集selected_wave。...

【技术特征摘要】
1.一种光谱波数的选择方法,其特征在于,所述光谱波数的选择方法针对光谱的波数,
多次随机抽样校正样本,建立偏最小二乘回归模型,计算每个波数的变量投影重要性系数,
按降序排序,并得到与之相应排列顺序的波数集,对重排后的波数集进行逐步波数筛选,统
计每次波数选择的结果,得到波数初选集;然后统计所有波数初选集内每个波数的偏最小二
...

【专利技术属性】
技术研发人员:卢建刚杨静文
申请(专利权)人:浙江大学
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1