【技术实现步骤摘要】
一种基于近红外光谱技术分析物质浓度的方法及系统
[0001]本专利技术涉及近红外光谱识别
,尤其涉及一种基于近红外光谱技术分析物质浓度的方法及系统。
技术介绍
[0002]近红外光谱技术是一种简单、快速、可靠的检测技术。它综合运用了光谱技术、计算机技术、模式识别等多个学科的研究成果,以其独特的优势在多个领域得到了日益广泛的应用,并已逐渐得到大众的普遍接受和官方的认可。
[0003]近红外光谱分析是一种间接的分析方法,往往需要构造反映近红外光谱数据和待分析样本属性关系的回归模型。其中,偏最小二乘(PLS)回归模型是最最常用的多元回归模型。PLS不仅能对光谱矩阵进行处理,还能对浓度矩阵进行同样的处理,因此能够消除光谱矩阵以及浓度矩阵里的噪声信息,取得较好的预测效果。其计算过程为,对光谱矩阵以及浓度矩阵进行分解,通过交互校验法确定其最佳主成分数,最后建立光谱矩阵与浓度矩阵的数学模型关系。
[0004]随着采集的数据增多或者异常样本的混入,会导致校正集种的数据中的分布估计不同于验证集中的数据。从而导致验证集的模型不够适合于校正集的数据,使得预测精度不够理想。这里,将校正集的近光谱数据称为源域数据,验证集的近光谱数据称为目标域数据。利用子采样和影响函数,可以从校正集中选出一个和验证集的分布最为接近的子集。然后,用这个子集进行建模得到适合于验证集的模型。影响函数在评估样本的影响力十分的方便,快速,不需要重复建模。在子集上建模得到的新模型能够明显提高预测性能。
[0005]因此,研究一种基于影响函数和 ...
【技术保护点】
【技术特征摘要】
1.一种基于近红外光谱技术分析物质浓度的方法,其特征在于,包括以下步骤:在采用近红外光谱分析待测物质时,确定待测物质的原始域已知样本及目标域已知样本的近红外光谱数据,并根据所述原始域已知样本及所述目标域已知样本的近红外光谱数据,构建出所述原始域已知样本的光谱矩阵和浓度向量矩阵,以及所述目标域已知样本的光谱矩阵和浓度向量矩阵;对所述原始域已知样本及所述目标域已知样本的光谱矩阵均进行预处理;构造基于PLS的海赛矩阵以及所述海赛矩阵中各样本的下降梯度;基于所述海赛矩阵及对应的下降梯度,并结合所述原始域已知样本及所述目标域已知样本进行预处理后的光谱矩阵,以及所述原始域已知样本及所述目标域已知样本的浓度向量矩阵,计算出所述原始域已知样本对所述目标域已知样本的影响力;根据所述影响力,对所述原始域已知样本的光谱数据进行子采样,以得到用于构建PLS回归模型的最优模型参数,并根据所得到的最优模型参数,构建PLS回归模型;获取待测物质中目标域未知样本的光谱数据,以构建所述目标域未知样本的光谱矩阵,并将所述目标域未知样本的光谱矩阵导入所述PLS回归模型进行分析,得到所述目标域未知样本的浓度向量矩阵,以实现所述目标域未知样本的浓度预测。2.如权利要求1所述的基于近红外光谱技术分析物质浓度的方法,其特征在于,所述对所述原始域已知样本及所述目标域已知样本的光谱矩阵均进行预处理的步骤,具体为:将所述原始域已知样本的光谱矩阵和所述目标域已知样本的光谱矩阵分别减去各自的行向量均值。3.如权利要求1所述的基于近红外光谱技术分析物质浓度的方法,其特征在于,所述基于所述海赛矩阵及对应的下降梯度,并结合所述原始域已知样本及所述目标域已知样本进行预处理后的光谱矩阵,以及所述原始域已知样本及所述目标域已知样本的浓度向量矩阵,计算出所述原始域已知样本对所述目标域已知样本的影响力的具体步骤包括:确定预处理后的原始域已知样本的光谱矩阵X
s
,原始域已知样本的浓度向量矩阵y
s
,预处理后的目标域已知样本的光谱矩阵X
t
,目标域已知样本的浓度向量矩阵y
t
;通过公式计算原始域已知样本z
i
对回归系数θ的影响通过公式计算原始域已知样本z
i
对目标域已知样本z的损失影响通过公式计算原始域已知样本z
i
对目标域已知样本数据集中所有样本的损失影响φ
i
。4.如权利要求3所述的基于近红外光谱技术分析物质浓度的方法,其特征在于,所述根据所述影响力,对所述原始域已知样本的光谱数据进行子采样,以得到用于构建PLS回归模型的最优模型参数的步骤,具体为:对于给定的原始域已知样本z
i
,从训练集中筛选出影响最负面的100*α的样本...
【专利技术属性】
技术研发人员:陈孝敬,黄光造,石文,袁雷明,陈熙,蒋成玺,
申请(专利权)人:温州大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。