当前位置: 首页 > 专利查询>温州大学专利>正文

一种基于近红外光谱技术分析物质浓度的方法及系统技术方案

技术编号:33771114 阅读:15 留言:0更新日期:2022-06-12 14:23
本发明专利技术提供一种基于近红外光谱技术分析物质浓度的方法,包括获取原始域已知样本和目标域已知样本的近红外光谱数据,以得到原始域已知样本和目标域已知样本的光谱矩阵和浓度矩阵;将原始域已知样本和目标域已知样本的光谱矩阵进行预处理;针对原始域已知样本的近红外光谱数据,计算海赛矩阵和各样本的下降梯度;基于海赛矩阵和各样本的下降梯度,计算原始域已知样本对目标域已知样本的影响力;根据影响力的情况进行子采样,构建相应的PLS回归模型;获取目标域未知样本的光谱数据,并基于PLS回归模型,计算出目标域未知样本的浓度向量矩阵,以实现浓度预测。实施本发明专利技术,通过解决传统PLS建模中分布漂移的问题,使得分析结果更加准确。更加准确。更加准确。

【技术实现步骤摘要】
一种基于近红外光谱技术分析物质浓度的方法及系统


[0001]本专利技术涉及近红外光谱识别
,尤其涉及一种基于近红外光谱技术分析物质浓度的方法及系统。

技术介绍

[0002]近红外光谱技术是一种简单、快速、可靠的检测技术。它综合运用了光谱技术、计算机技术、模式识别等多个学科的研究成果,以其独特的优势在多个领域得到了日益广泛的应用,并已逐渐得到大众的普遍接受和官方的认可。
[0003]近红外光谱分析是一种间接的分析方法,往往需要构造反映近红外光谱数据和待分析样本属性关系的回归模型。其中,偏最小二乘(PLS)回归模型是最最常用的多元回归模型。PLS不仅能对光谱矩阵进行处理,还能对浓度矩阵进行同样的处理,因此能够消除光谱矩阵以及浓度矩阵里的噪声信息,取得较好的预测效果。其计算过程为,对光谱矩阵以及浓度矩阵进行分解,通过交互校验法确定其最佳主成分数,最后建立光谱矩阵与浓度矩阵的数学模型关系。
[0004]随着采集的数据增多或者异常样本的混入,会导致校正集种的数据中的分布估计不同于验证集中的数据。从而导致验证集的模型不够适合于校正集的数据,使得预测精度不够理想。这里,将校正集的近光谱数据称为源域数据,验证集的近光谱数据称为目标域数据。利用子采样和影响函数,可以从校正集中选出一个和验证集的分布最为接近的子集。然后,用这个子集进行建模得到适合于验证集的模型。影响函数在评估样本的影响力十分的方便,快速,不需要重复建模。在子集上建模得到的新模型能够明显提高预测性能。
[0005]因此,研究一种基于影响函数和PLS的子采样建模方法对于近红外光谱分析技术的成功应用有着重要意义。尤其是,基于近红外光谱技术分析物质浓度时,通过解决传统PLS建模中分布漂移的问题,使得分析结果更加准确。

技术实现思路

[0006]本专利技术实施例所要解决的技术问题在于,提供一种基于近红外光谱技术分析物质浓度的方法及系统,通过解决传统PLS建模中分布漂移的问题,使得分析结果更加准确。
[0007]为了解决上述技术问题,本专利技术实施例提供了一种基于近红外光谱技术分析物质浓度的方法,包括以下步骤:
[0008]在采用近红外光谱分析待测物质时,确定待测物质的原始域已知样本及目标域已知样本的近红外光谱数据,并根据所述原始域已知样本及所述目标域已知样本的近红外光谱数据,构建出所述原始域已知样本的光谱矩阵和浓度向量矩阵,以及所述目标域已知样本的光谱矩阵和浓度向量矩阵;
[0009]对所述原始域已知样本及所述目标域已知样本的光谱矩阵均进行预处理;
[0010]构造基于PLS的海赛矩阵以及所述海赛矩阵中各样本的下降梯度;
[0011]基于所述海赛矩阵及对应的下降梯度,并结合所述原始域已知样本及所述目标域
已知样本进行预处理后的光谱矩阵,以及所述原始域已知样本及所述目标域已知样本的浓度向量矩阵,计算出所述原始域已知样本对所述目标域已知样本的影响力;
[0012]根据所述影响力,对所述原始域已知样本的光谱数据进行子采样,以得到用于构建PLS回归模型的最优模型参数,并根据所得到的最优模型参数,构建 PLS回归模型;
[0013]获取待测物质中目标域未知样本的光谱数据,以构建所述目标域未知样本的光谱矩阵,并将所述目标域未知样本的光谱矩阵导入所述PLS回归模型进行分析,得到所述目标域未知样本的浓度向量矩阵,以实现所述目标域未知样本的浓度预测。
[0014]其中,所述对所述原始域已知样本及所述目标域已知样本的光谱矩阵均进行预处理的步骤,具体为:
[0015]将所述原始域已知样本的光谱矩阵和所述目标域已知样本的光谱矩阵分别减去各自的行向量均值。
[0016]其中,所述基于所述海赛矩阵及对应的下降梯度,并结合所述原始域已知样本及所述目标域已知样本进行预处理后的光谱矩阵,以及所述原始域已知样本及所述目标域已知样本的浓度向量矩阵,计算出所述原始域已知样本对所述目标域已知样本的影响力的具体步骤包括:
[0017]确定预处理后的原始域已知样本的光谱矩阵X
s
,原始域已知样本的浓度向量矩阵y
s
,预处理后的目标域已知样本的光谱矩阵X
t
,目标域已知样本的浓度向量矩阵y
t

[0018]通过公式计算原始域已知样本z
i
对回归系数θ的影响
[0019]通过公式计算原始域已知样本z
i
对目标域已知样本z的损失影响
[0020]通过公式计算原始域已知样本z
i
对目标域已知样本数据集中所有样本的损失影响φ
i

[0021]其中,所述根据所述影响力,对所述原始域已知样本的光谱数据进行子采样,以得到用于构建PLS回归模型的最优模型参数的步骤,具体为:
[0022]对于给定的原始域已知样本z
i
,从训练集中筛选出影响最负面的100*α的样本,增加α直到RMSEV曲线收敛;其中,所述原始域已知样本z
i
的权值表示为threshold
α
表示阈值;O
i
=0表示需要移除的样本;α∈(0,1);RMSEV表示在目标域上的均方根误差,且
[0023]给定潜在变量数量A∈[1,MaxLV],分别对每一个A建立相应的模型,并找出对应最小RMSEV时的α值,且进一步将对应最小RMSEV时的α和A为PLS 回归模型的最优模型参数输出;其中,MaxLV表示最大的潜在变量的数目。
[0024]本专利技术实施例还提供了一种基于近红外光谱技术分析物质浓度的系统,包括:
[0025]已知样本光谱获取单元,用于在采用近红外光谱分析待测物质时,确定待测物质的原始域已知样本及目标域已知样本的近红外光谱数据,并根据所述原始域已知样本及所述目标域已知样本的近红外光谱数据,构建出所述原始域已知样本的光谱矩阵和浓度向量矩阵,以及所述目标域已知样本的光谱矩阵和浓度向量矩阵;
[0026]已知样本光谱矩阵处理单元,用于对所述原始域已知样本及所述目标域已知样本的光谱矩阵均进行预处理;
[0027]海赛矩阵构建单元,用于构造基于PLS的海赛矩阵以及所述海赛矩阵中各样本的下降梯度;
[0028]不利数据去除单元,用于基于所述海赛矩阵及对应的下降梯度,并结合所述原始域已知样本及所述目标域已知样本进行预处理后的光谱矩阵,以及所述原始域已知样本及所述目标域已知样本的浓度向量矩阵,计算出所述原始域已知样本对所述目标域已知样本的影响力;
[0029]模型参数最优查找单元,用于根据所述影响力,对所述原始域已知样本的光谱数据进行子采样,以得到用于构建PLS回归模型的最优模型参数,并根据所得到的最优模型参数,构建PLS回归模型;
[0030]浓度预测单元,用于获取待测物质中目标域未知样本的光谱数据,以构建所述目标域未知样本的光谱矩阵,并将所述目标域未知样本的光谱矩阵导入所述P本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于近红外光谱技术分析物质浓度的方法,其特征在于,包括以下步骤:在采用近红外光谱分析待测物质时,确定待测物质的原始域已知样本及目标域已知样本的近红外光谱数据,并根据所述原始域已知样本及所述目标域已知样本的近红外光谱数据,构建出所述原始域已知样本的光谱矩阵和浓度向量矩阵,以及所述目标域已知样本的光谱矩阵和浓度向量矩阵;对所述原始域已知样本及所述目标域已知样本的光谱矩阵均进行预处理;构造基于PLS的海赛矩阵以及所述海赛矩阵中各样本的下降梯度;基于所述海赛矩阵及对应的下降梯度,并结合所述原始域已知样本及所述目标域已知样本进行预处理后的光谱矩阵,以及所述原始域已知样本及所述目标域已知样本的浓度向量矩阵,计算出所述原始域已知样本对所述目标域已知样本的影响力;根据所述影响力,对所述原始域已知样本的光谱数据进行子采样,以得到用于构建PLS回归模型的最优模型参数,并根据所得到的最优模型参数,构建PLS回归模型;获取待测物质中目标域未知样本的光谱数据,以构建所述目标域未知样本的光谱矩阵,并将所述目标域未知样本的光谱矩阵导入所述PLS回归模型进行分析,得到所述目标域未知样本的浓度向量矩阵,以实现所述目标域未知样本的浓度预测。2.如权利要求1所述的基于近红外光谱技术分析物质浓度的方法,其特征在于,所述对所述原始域已知样本及所述目标域已知样本的光谱矩阵均进行预处理的步骤,具体为:将所述原始域已知样本的光谱矩阵和所述目标域已知样本的光谱矩阵分别减去各自的行向量均值。3.如权利要求1所述的基于近红外光谱技术分析物质浓度的方法,其特征在于,所述基于所述海赛矩阵及对应的下降梯度,并结合所述原始域已知样本及所述目标域已知样本进行预处理后的光谱矩阵,以及所述原始域已知样本及所述目标域已知样本的浓度向量矩阵,计算出所述原始域已知样本对所述目标域已知样本的影响力的具体步骤包括:确定预处理后的原始域已知样本的光谱矩阵X
s
,原始域已知样本的浓度向量矩阵y
s
,预处理后的目标域已知样本的光谱矩阵X
t
,目标域已知样本的浓度向量矩阵y
t
;通过公式计算原始域已知样本z
i
对回归系数θ的影响通过公式计算原始域已知样本z
i
对目标域已知样本z的损失影响通过公式计算原始域已知样本z
i
对目标域已知样本数据集中所有样本的损失影响φ
i
。4.如权利要求3所述的基于近红外光谱技术分析物质浓度的方法,其特征在于,所述根据所述影响力,对所述原始域已知样本的光谱数据进行子采样,以得到用于构建PLS回归模型的最优模型参数的步骤,具体为:对于给定的原始域已知样本z
i
,从训练集中筛选出影响最负面的100*α的样本...

【专利技术属性】
技术研发人员:陈孝敬黄光造石文袁雷明陈熙蒋成玺
申请(专利权)人:温州大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1