近红外定量模型构建方法、装置及存储介质制造方法及图纸

技术编号:38203527 阅读:11 留言:0更新日期:2023-07-21 16:48
本发明专利技术公开了一种近红外定量模型构建方法、装置及存储介质,其中方法包括:获取近红外光谱数据,构建近红外定量模型训练样本集;获取多种近红外光谱数据预处理算法、变量选择算法及建模算法及其参数的取值范围,构建由这些参数以及红外光谱数据预处理算法顺序组成的粒子群搜索空间;基于近红外定量模型训练样本集,利用粒子群优化算法在粒子群搜索空间中对各算法的参数及预处理算法顺序进行优化;选择得到的全局最优解作为各算法的参数以及预处理算法顺序,对近红外光谱数据进行预处理、变量选择和建模,得到近红外定量模型。极大降低对研究人员数据建模经验基础上,可简单、高效地获得高质量的定量模型,降低了建模要求。降低了建模要求。降低了建模要求。

【技术实现步骤摘要】
近红外定量模型构建方法、装置及存储介质


[0001]本专利技术涉及化学计量学领域,尤其涉及一种基于粒子群算法的近红外定量模型构建方法、装置及存储介质。

技术介绍

[0002]近红外光谱技术具有分析速度快、对样品无损等优点,在农业、食品、石油化工、烟草等诸多行业广泛应用。然而,受到测量条件和样品状态等外界因素影响,导致量测信号中不可避免的包含与量测目标本身无关的信号与噪声,影响近红外光谱数据的建模效果,需要采取数据增强、导数分析、标准正态变换、多元散射校正等诸多方法对近红外光谱数据进行处理,以消除光谱中的噪声影响。由于,近红外数据建模分析的流程长,算法及参数众多,且相关算法参数与预处理算法顺序间存在复杂的相互影响关系,导致近红外数据的预处理、变量选择与建模工作已成为近红外研究领域亟待解决的问题。
[0003]当前,近红外光谱预处理算法及其参数的确定方法,仍以人工经验法为主,部分辅以网格搜索等局部优化方法。前者根据研究者的过往经验来确定合适的光谱预处理分析方案,严重依赖研究者对某种类型近红外光谱分析的预处理经验;后者则以网格搜索算法为例,往往需要对大量网格节点进行实验分析,整体性能较低。
[0004]基于此,本专利技术研究基于粒子群优化方法的近红外定量模型的智能构建及优化方案。该方案基于粒子群方法的全局优化搜索思想,在近红外定量模型构建中系列预处理算法、变量选择算法、建模算法参数,以及预处理算法顺序所构成的全域空间中进行快速搜索,以最终确定与近红外数据特征相匹配的相关算法参数,与预处理算法顺序优选,达到提高近红外模型的预测能力和稳健性的目的。

技术实现思路

[0005]针对现有技术的不足之处,本专利技术提供了一种近红外定量模型构建方法、装置及存储介质,以解决现有的近红外定量模型构建整体性能不高且效率低的问题。
[0006]第一方面,提供了一种近红外定量模型构建方法,包括:
[0007]获取近红外光谱数据,构建近红外定量模型训练样本集;
[0008]构建粒子群搜索空间,获取多种近红外光谱数据预处理算法、变量选择算法及建模算法及其参数的取值范围,构建由这些参数以及其中多种红外光谱数据预处理算法顺序组成的粒子群搜索空间;
[0009]基于近红外定量模型训练样本集,利用粒子群优化算法在粒子群搜索空间中对多种近红外光谱数据预处理算法、变量选择算法及建模算法的参数及多种红外光谱数据预处理算法顺序进行优化;其中每个粒子为各算法的参数及多种红外光谱数据预处理算法顺序构成的向量;
[0010]根据粒子群迭代输出结果,选择得到的全局最优解作为各算法的参数以及多种红外光谱数据预处理算法顺序,对近红外光谱数据进行预处理、变量选择和建模,得到近红外
定量模型。
[0011]进一步地,所述粒子群搜索空间构建过程如下:
[0012]构建近红外光谱数据预处理算法、变量选择算法和建模算法集合A={A1,A2,

,A
m
},其中,为m

2个近红外光谱数据预处理算法,A
m
‑1为变量选择算法,A
m
为建模算法;
[0013]对于算法A
i
(i∈{1,2,

,m})的参数记为P
i
={P
i1
,P
i2
,

,P
iki
},其中参数P
ij
(i∈{1,2,

,m},j∈{1,2,

,k
i
})的取值范围记为则由所有算法的参数,以及近红外光谱数据预处理算法顺序构建一个n=n'+m

2维的搜索空间S
n
,其中:表示近红外光谱数据预处理算法、变量选择算法、建模算法的参数总数,m

2表示m

2个预处理算法的顺序;
[0014]搜索空间S
n
中的每个位置,使用一个n维数据向量P=(p1,p2,

,p
n'
,p
n'+1
,p
n'+2
,

,p
n'+m
‑2)表示;其中,在前n'维中,每一个维度的取值范围为对应算法参数的取值范围;后m

2维子向量中,每一个维度的取值范围均为{1,2,

,m

2},且该后m

2维子向量中每一分量的取值与其它分量取值互异,用于表示对应近红外光谱数据预处理算法在系列预处理过程中的执行顺序号;
[0015]假设搜索空间S
n
的外包络面所围区域为O,在空间O内的非搜索区域记为Φ,则有粒子群搜索空间S
n
为:
[0016]S
n
=O

Φ。
[0017]进一步地,所述基于近红外定量模型训练样本集,利用粒子群优化算法在粒子群搜索空间中对多种近红外光谱数据预处理算法、变量选择算法及建模算法的参数及多种红外光谱数据预处理算法顺序进行优化,具体包括:
[0018]A1:设定粒子速度迭代策略,采用基于线性递减权值方法设定粒子飞行速度迭代策略;
[0019]A2:设定粒子位置迭代策略,基于粒子飞行速度,计算迭代后粒子位置,并根据多种近红外光谱数据预处理算法、变量选择算法及建模算法的参数取值范围及多种红外光谱数据预处理算法顺序取值范围,对粒子位置进行验证,并确定最终的迭代后粒子位置;
[0020]A3:粒子群初始化,初始化粒子群个数,各粒子初始位置和初始速度,以及粒子迭代退出机制;其中,粒子的位置用多种近红外光谱数据预处理算法、变量选择算法及建模算法的参数及多种红外光谱数据预处理算法顺序构成的向量表示;
[0021]A4:粒子群位置检验和调整,判断所有粒子所在位置是否为可行的近红外预处理算法、变量选择算法、建模算法的参数与可行的红外光谱数据预处理算法顺序;若是,则计算粒子与最优解间距离;否则,对粒子所在位置进行调整与优化后,再计算其所在位置与最优解距离;
[0022]A5:粒子迭代,若满足粒子迭代退出机制,则将历史全局最优位置作为粒子群优化算法的最优解输出;否则,按照粒子飞行速度迭代策略和粒子位置迭代策略计算粒子下一步飞行位置,并返回到步骤A4。
[0023]进一步地,所述步骤A1中,粒子飞行速度迭代公式如下式所示:
[0024][0025]式中,表示第t次迭代时第i个粒子飞行速度,c1、c2均表示学习因子,rand()表示(0,1)间随机数,表示第i个粒子搜索历史过程中的最优位置,gbest
(t)
表示所有粒子搜索历史过程中的最优位置,表示第t次迭代时第i个粒子位置;ω
(t)
表示第t次迭代时粒子惯性权值,其计算公式如下:
[00本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种近红外定量模型构建方法,其特征在于,包括:获取近红外光谱数据,构建近红外定量模型训练样本集;构建粒子群搜索空间,获取多种近红外光谱数据预处理算法、变量选择算法及建模算法及其参数的取值范围,构建由这些参数以及其中多种红外光谱数据预处理算法顺序组成的粒子群搜索空间;基于近红外定量模型训练样本集,利用粒子群优化算法在粒子群搜索空间中对多种近红外光谱数据预处理算法、变量选择算法及建模算法的参数及多种红外光谱数据预处理算法顺序进行优化;其中每个粒子为各算法的参数及多种红外光谱数据预处理算法顺序构成的向量;根据粒子群迭代输出结果,选择得到的全局最优解作为各算法的参数以及多种红外光谱数据预处理算法顺序,对近红外光谱数据进行预处理、变量选择和建模,得到近红外定量模型。2.根据权利要求1所述的近红外定量模型构建方法,其特征在于,所述粒子群搜索空间构建过程如下:构建近红外光谱数据预处理算法、变量选择算法和建模算法集合A={A1,A2,

,A
m
},其中,为m

2个近红外光谱数据预处理算法,A
m
‑1为变量选择算法,A
m
为建模算法;对于算法A
i
(i∈{1,2,

,m})的参数记为其中参数P
ij
(i∈{1,2,

,m},j∈{1,2,

,k
i
})的取值范围记为则由所有算法的参数,以及近红外光谱数据预处理算法顺序构建一个n=n'+m

2维的搜索空间S
n
,其中:表示近红外光谱数据预处理算法、变量选择算法、建模算法的参数总数,m

2表示m

2个预处理算法的顺序;搜索空间S
n
中的每个位置,使用一个n维数据向量P=(p1,p2,

,p
n'
,p
n'+1
,p
n'+2
,

,p
n'+m
‑2)表示;其中,在前n'维中,每一个维度的取值范围为对应算法参数的取值范围;后m

2维子向量中,每一个维度的取值范围均为{1,2,

,m

2},且该后m

2维子向量中每一分量的取值与其它分量取值互异,用于表示对应近红外光谱数据预处理算法在系列预处理过程中的执行顺序号;假设搜索空间S
n
的外包络面所围区域为O,在空间O内的非搜索区域记为Φ,则有粒子群搜索空间S
n
为:S
n
=O

Φ。3.根据权利要求1或2所述的近红外定量模型构建方法,其特征在于,所述基于近红外定量模型训练样本集,利用粒子群优化算法在粒子群搜索空间中对多种近红外光谱数据预处理算法、变量选择算法及建模算法的参数及多种红外光谱数据预处理算法顺序进行优化,具体包括:A1:设定粒子速度迭代策略,采用基于线性递减权值方法设定粒子飞行速度迭代策略;A2:设定粒子位置迭代策略,基于粒子飞行速度,计算迭代后粒子位置,并根据多种近红外光谱数据预处理算法、变量选择算法及建模算法的参数取值范围及多种红外光谱数据
预处理算法顺序取值范围,对粒子位置进行验证,并确定最终的迭代后粒子位置;A3:粒子群初始化,初始化粒子群个数,各粒子初始位置和初始速度,以及粒子迭代退出机制;其中,粒子的位置用多种近红外光谱数据预处理算法、变量选择算法及建模算法的参数及多种红外光谱数据预处理算法顺序构成的向量表示;A4:粒子群位置检验和调整,判断所有粒子所在位置是否为可行的近红外预处理算法、变量选择算法、建模算法的参数与可行的红外光谱数据预处理算法顺序;若是,则计算粒子与最优解间距离;否则,对粒子所在位置进行调整与优化后,再计算其所在位置与最优解距离;A5:粒子迭代,若满足粒子...

【专利技术属性】
技术研发人员:孔波蔡佳校钟科军曾仲大陈爱明庹苏行伍毅子李燕春卢红兵杨华武刘金云
申请(专利权)人:湖南中烟工业有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1