一种近红外定性分析模型的建立方法技术

技术编号:11083436 阅读:117 留言:0更新日期:2015-02-26 09:58
本发明专利技术公开了一种近红外定性分析模型的建立方法,该方法包括:步骤1:采集样本的近红外光谱数据,并确定建模样本数据;步骤2:对建模样本数据进行预处理;步骤3:对建模样本数据进行偏最小二乘特征提取;步骤4:对建模样本数据进行正交线性判别分析特征提取;步骤5:用支持向量机方法建立定性分析模型。本发明专利技术提供的方法准确、高效、快捷,并且无须专业人士操作。

【技术实现步骤摘要】

本专利技术涉及近红外定性分析领域中的建模方法,特别是一种近红外定性分析模型 的建立方法。
技术介绍
近红外光谱(Near Infrared Spectroscopy, NIRS)分析是利用近红外光谱区包含 的物质信息,用于有机物定性定量分析的一种分析方法,具有快速、无污染、样品不需预处 理和同时可检测多种成分等优点。近红外光谱技术是一种间接分析技术,是通过定标模型 的建立实现对未知样本的定性或定量分析。作为一种绿色、多能的分析技术,近红外光谱技 术广泛被应用于农业、食品、石油化工、医药、林业、纺织业、矿物学和化妆品等领域。 随着分析技术的快速发展,基于近红外光谱的各类检测技术也得到了广泛的应 用,例如在食品安全领域,近红外光谱分析技术可以检测鲜肉的贮藏时间以判断鲜肉的新 鲜程度;可以检测奶粉中某些特殊物质的含量以确保食用安全等。在药品安全领域,近红外 光谱分析技术可以分析某种药物中的某些物质的含量,可以鉴别中草药、中草药中的有效 成分测定等。可见近红外光谱分析技术的应用会越来越广泛,尤其是近红外光谱定性分析 技术,会在今后的食品卫生领域会发挥越来越重要的作用。 在近红外光谱定性分析中,通常包含几个步骤,包括采集样本光谱、训练模型、分 类鉴别等。近红外光谱定性分析模型的准确性将决定分类效果的好坏。比如在奶粉的有害 物质检测中,如果所建立的定性模型不能区分三聚氰胺和蛋白质(两者包含成分相同),则 会造成很严重的食品安全后果。 目前近红外光谱在定性分析领域中的研究与应用较少,涉及的近红外定性分析模 型的建立方法更少,因此急需一种操作简单、快速高效、准确率高的定性分析模型建立方 法。因此,为了解决上述问题,本方法提供了。
技术实现思路
(一)要解决的技术问题 有鉴于此,本专利技术的主要目的是为了提供一种简单可行的建立近红外定性分析模 型的方法。 (二)技术方案 为达到上述目的,本专利技术提供了,该方法包 括: 步骤1 :采集样本的近红外光谱数据,并确定建模样本数据; 步骤2 :对建模样本数据进行预处理; 步骤3 :对建模样本数据进行偏最小二乘(PLS)特征提取; 步骤4 :对建模样本数据进行正交线性判别分析(OLDA)特征提取; 步骤5 :采用支持向量机(SVM)方法建立定性分析模型。 上述方案中,步骤1中所述采集样本的近红外光谱数据,是采用近红外光谱仪在 不同时间采集样本的近红外光谱数据。所述近红外光谱仪是测试单粒样本的微型光谱仪, 或者是测试整杯样本的普通光谱仪,采集方式包括漫反射或透射。如果有相同型号的多台 近红外光谱仪,则在采集样本的近红外光谱数据时,多台近红外光谱仪所处的外部环境相 同;对同一份样本,在相同的测量时间点要求在不同的近红外光谱仪上进行测量,得到对应 的多条光谱数据。 上述方案中,步骤1中所述的确定建模样本数据,是将能够对一些不确定信息进 行包容的数据作为建模样本数据,以减小光谱的变动影响模型对光谱鉴别的准确性,该些 不确定信息是指样本自身属性不同、光谱采集时间不同和/或光谱采集仪器不同。 上述方案中,步骤2中所述对建模样本数据进行预处理,是去除或降低不确定的 背景信息对光谱数据的噪声干扰,采用的预处理方法包括数据归一化处理、导数法处理、平 滑处理或中心化及标准化处理。所述不确定的背景信息是指受近红外光谱仪仪器状态、测 定条件与环境影响的信息。 上述方案中,步骤3中所述对建模样本数据进行偏最小二乘特征提取,具体包括: 步骤31 :对建模集数据进行偏最小二乘特征提取,得到偏最小二乘特征矩阵; 步骤32 :利用得到的偏最小二乘特征矩阵,将经过预处理之后的建模集数据变换 到偏最小二乘空间中。 上述方案中,步骤3中所述建模样本数据,是指经过预处理之后的建模样本数据。 上述方案中,步骤31中所述进行偏最小二乘特征提取,得到偏最小二乘特征矩阵 的过程如下: 步骤311 :对样本数据进行标准化处理,即令样本的各个变量的均值为0,方差为 1 ;令样本矩阵为Xtl,类别信息矩阵为Ytl ;其中,Xtl定义为n条光谱p个数据点的原始光谱矩 阵,Ytl为对应的类别属性矩阵: 本文档来自技高网
...

【技术保护点】
一种近红外定性分析模型的建立方法,其特征在于,该方法包括:步骤1:采集样本的近红外光谱数据,并确定建模样本数据;步骤2:对建模样本数据进行预处理;步骤3:对建模样本数据进行偏最小二乘特征提取;步骤4:对建模样本数据进行正交线性判别分析特征提取;步骤5:采用支持向量机方法建立定性分析模型。

【技术特征摘要】
1. 一种近红外定性分析模型的建立方法,其特征在于,该方法包括: 步骤1 :采集样本的近红外光谱数据,并确定建模样本数据; 步骤2 :对建模样本数据进行预处理; 步骤3 :对建模样本数据进行偏最小二乘特征提取; 步骤4 :对建模样本数据进行正交线性判别分析特征提取; 步骤5 :采用支持向量机方法建立定性分析模型。2. 根据权利要求1所述的近红外定性分析模型的建立方法,其特征在于,步骤1中所 述采集样本的近红外光谱数据,是采用近红外光谱仪在不同时间采集样本的近红外光谱数 据。3. 根据权利要求2所述的近红外定性分析模型的建立方法,其特征在于,所述近红外 光谱仪是测试单粒样本的微型光谱仪,或者是测试整杯样本的普通光谱仪,采集方式包括 漫反射或透射。4. 根据权利要求2所述的近红外定性分析模型的建立方法,其特征在于,如果有相同 型号的多台近红外光谱仪,则在采集样本的近红外光谱数据时,多台近红外光谱仪所处的 外部环境相同;对同一份样本,在相同的测量时间点要求在不同的近红外光谱仪上进行测 量,得到对应的多条光谱数据。5. 根据权利要求1所述的近红外定性分析模型的建立方法,其特征在于,步骤1中所述 的确定建模样本数据,是将能够对一些不确定信息进行包容的数据作为建模样本数据,以 减小光谱的变动影响模型对光谱鉴别的准确性,该些不确定信息是指样本自身属性不同、 光谱采集时间不同和/或光谱采集仪器不同。6. 根据权利要求1所述的近红外定性分析模型的建立方法,其特征在于,步骤2中所述 对建模样本数据进行预处理,是去除或降低不确定的背景信息对光谱数据的噪声干扰,采 用的预处理方法包括数据归一化处理、导数法处理、平滑处理或中心化及标准化处理。7. 根据权利要求6所述的近红外定性分析模型的建立方法,其特征在于,所述不确定 的背景信息是指受近红外光谱仪仪器状态、测定条件与环境影响的信息。8. 根据权利要求1所述的近红外定性分析模型的建立方法,其特征在于,步骤3中所述 对建模样本数据进行偏最小二乘特征提取,具体包括: 步骤31 :对建模集数据进行偏最小二乘特征提取,得到偏最小二乘特征矩阵; 步骤32 :利用得到的偏最小二乘特征矩阵,将经过预处理之后的建模集数据变换到偏 最小二乘空间中。9. 根据权利要求8所述的近红外定性分析模型的建立方法,其特征在于,步骤3中所述 建模样本数据,是指经过预处理之后的建模样本数据。10. 根据权利要求8所述的近红外定性分析模型的建立方法,其特征在于,步骤31中所 述进行偏最小二乘特征提取,得到偏最小二乘特征矩阵的过程如下: 步骤311 :对样本数据进行标准化处理,即令样本的各个变量的均值为0,方差为1 ;令 样本矩阵为Xtl,类别信息矩阵为Ytl ;其中,Xtl定义为η条光谱p个数据点的原始光谱矩阵, Ytl为对应的类别属性矩阵:Y(i中,yu = 1表示第i条光谱属于第j类,yu = O表示第i条光谱不属于第j类; 步骤312:求矩阵Γ Jtl的协方差矩阵C = X' A),协方差矩阵常数舍弃; 步骤313 :求得协方差矩阵C的特征值以及对应的特征向量,并将特征向量按照特征值 的大小排列,取最大的η维特征值对应的特征向量组成投影矩阵W1^ ; 步骤314 :得到新的特征向量为:x' i = XiW' PIjS。11. 根据权利要求1所述的近红外定性分析模型的建立方法,其特征在于,步骤4中所 述对建模样本数据进行正交线性判别分析特征提取,具体包括...

【专利技术属性】
技术研发人员:董肖莉李卫军覃鸿张丽萍
申请(专利权)人:中国科学院半导体研究所
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1