一种基于加权相关系数的近红外光谱识别模型制造技术

技术编号:15090915 阅读:113 留言:0更新日期:2017-04-07 19:22
本发明专利技术建立了一种近红外光谱识别模型,采用近红外光谱仪扫描一系列正常同类产品的光谱,计算平均光谱作为参考光谱;然后计算产品光谱与参考光谱的加权相关系数,通过加权相关系数的平均值和标准偏差计算识别区间,建立识别模型。与传统的色谱、质谱等仪器分析相比,具有绿色、环保,简单快捷,易于操作的优点,且所建模型识别精确度高,检测效率高,成本低,为卷烟企业的产品稳定性分析及真伪识别提供技术保障。

A near infrared spectrum recognition model based on weighted correlation coefficient

The invention provides a near infrared spectral identification model of near infrared spectrometer by scanning a series of series of similar products, calculate the average spectrum as a reference spectrum; weighted correlation coefficient and then calculate the product spectrum and the reference spectrum, the average and standard deviation of weighted correlation coefficient calculation to identify interval recognition model. With the traditional instruments such as chromatography and mass spectrometry analysis compared with green, environmentally friendly, simple and quick, easy operation, and the model of high recognition accuracy, high detection efficiency, low cost, and provide technical support for product stability analysis of cigarette enterprises and the authenticity of identification.

【技术实现步骤摘要】

本专利技术涉及近红外光谱
,具体是一种基于加权相关系数的近红外光谱识别模型,可用于卷烟产品真伪鉴别和质量稳定性分析。
技术介绍
近红外光谱技术具有分析过程高效、绿色、环保的现代分析特征,因而成为近年来发展较快、引人注目的光谱分析技术之一。根据美国实验和材料协会(ASTM)的规定,其波长范围为780~2526mn。分子在NIR区的吸收主要由C-H、0-H、N-H和C=0等基团的合频吸收与倍频吸收组成,此区的吸收强度低、谱带复杂、重叠严重,无法使用经典定性、定量的方法,必须借助化学计量学中的多元统计、曲线拟合、聚类分析等方法进行定标建模,并结合合适的模型实现快速多组分分析。近红外光谱技术具有快速、无损、实时检测等优点,已经成为工业产品分析的强有力工具。然而,近红外光谱攒在特征弱、数据量大,视觉识别以及传统匹配算法难以获得可靠结果的弱点。因此,迫切需要开发一种有效、快速、自动化程度高的识别算法。长期以来,卷烟产品内在质量表征主要通过感官评吸的方法,缺乏直观形象的定量描述方法。随着产品市场竞争的日趋激烈及工业企业生产自动化程度的日益提高,产品质量的稳定性及控制日趋凸显,迫切需要快速、高效、简便的分析方法用于卷烟产品质量稳定性的评价与控制。本专利技术针对上述问题,提出了一种基于加权相关系数的识别模型。该模型以一系列正常同类产品的近红外光谱为基础,通过加权相关系数建立识别模型。在模型应用中,被判定为正常同类产品的近红外光谱又可以添加到模型中,从而实现对识别模型的更新,使其适应性更强,结果更准确。本专利技术中通过加权相关系数来衡量光谱的相似性,加权相关系数能够有效地将光谱特征用于相似性的计算,从而提高了结果的可靠性。上述正常同类产品的近红外光谱与参考光谱高度相似,但又存在不同;既体现了共同特性,也反映了个体差异。由此确定出一个光谱相似性的区间,在此区间中的产品为同类产品,否则为非同类产品或者异常产品。
技术实现思路
为进一步提高模型的识别精度,本专利技术提出了一种基于加权相关系数方法提取特征光谱。本专利技术提出的识别模型由参考光谱和识别区间组成。本专利技术利用近红外光谱仪将一系列正常同类产品的光谱进行扫描,然后提取每个光谱的特征数据,以平均光谱作为参考光谱;计算产品光谱与参考光谱的加权相关系数,通过加权相关系数的平均值和标准偏差计算识别区间,建立识别模型,该识别模型由参考光谱和识别区间组成。具体建模步骤如下:(1)首先对m个不同批次生产的同类样品进行前处理,采用近红外对样品光谱进行扫描,以向量si表示第i个样本的光谱数据(i=1,2,...,m),每个光谱包含n个数据点。(2)以光谱向量si为行向量,整理出如下形式的数据矩阵S,S=s1s2...smm×n]]>通过下式计算出平均光谱s‾=aS]]>其中,a=[1m,1m,...1m]1×m.]]>(3)计算所有光谱s与的加权相关系数wcc,其中w为权重wcc=Σwj·sj·s‾j-Σwj·sjΣwj·s‾j/Σwj(Σwj·sj2-(Σwj·si)2/Σwj)(Σwj·s‾j2-(Σwj·s‾j)2/Σwj)]]>其中,sj和分别表示光谱s和的第j个数据点;wj表示权重向量w的第j个数据点。(4)步骤3中的权重向量w通过下式计算得到w=|s‾|1+d]]>其中,向量d通过下式计算得到d=|s-ks‾|]]>其中,上标T表示矩阵转置。(5)计算wcc的均值和标准偏差,分别表示为和d。建立识别区间其中k为比例系数,根据校正集数据设定,以使所有wcc均大于将作为该类产品的识别区间。对于未知产品,首先扫描其近红外光谱,以sx表示,然后通过步骤3中的公式计算加权相关系数wccx。判断wccx是否处于识别区间如果是,那么认为该未知产品与校正集产品相同;将sx添加到校正集中,重复步骤1-4,更新识别区间。如果否,那么认为该未知产品与校正集产品不同。应用加权相关系数计算公式,算出所有同类光谱的加权相关系数wcc的均值和标准偏差,其中均值用来表示,标准偏差用d来表示,建立识别区间其中k为比例系数。根据加权相关系数计算出的识别区间和校正集数据设定,所有同类光谱的加权相关系数wcc均大于该类产品的识别区间为在对模型进行应用时,通过扫描待分析样品的光谱,计算加权相关系数wccx,若该系数落入识别区间可判定其为同类正常产品。该模型以一系列正常同类产品的近红外光谱为基础,通过加权相关系数建立识别模型。所述的基于加权相关系数的近红外光谱识别模型:包括扫描前步骤将样品粉碎为40-80目。所属样品为烟丝、烟梗/或烟末。在模型应用中,被判定为正常同类产品的近红外光谱又可以添加到模型中,从而实现对识别模型的补充与更新,使模型适应性更强,预测结果更精确。相对于现有技术,本专利技术具有以下显著优点:1、本专利技术提出的一种基于加权相关系数建立产品真伪及稳定性识别模型的方法,加权相关系数能够有效地将光谱特征用于相似性的计算,极大的提高了识别模型的可靠性。2、通过加权相关系数,确定出一个光谱相似性的区间,既可体现出每个光谱的共同特性,又反映了个体差异。利用正常同类产品的近红外光谱与参考光谱高度相似性,建立区域空间,样品扫描光谱落在此区间为同类产品,区间外的为非同类产品或者异常产品,可有效避免判断不准确的现象,提高了模型识别精度,为卷烟生产企业的产品的质量稳定性分析及真伪鉴别,提供技术保障。3、所采用近红外光谱技术,与传统的色谱、质谱等仪器分析相比,整个分析过程中不使用化学试剂,具有绿色、环保,简单快捷,易于操作的优点,模型建立中应用矩阵、加权相关系数等化学计量学工具,所建模型识别精确度高,检测效率高,成本低。附图说明:图1是本专利技术的建模流程图;图2是卷烟烟丝的近红外扫描原始谱图;图3是A牌号卷烟烟丝近红外光谱建立的识别模型;图4是A、B牌号分类识别模型;具体实施方式:下面结合附图对本专利技术的具体实施方式作进一步详细说明。本专利技术及实施例的建模流程如下:首先进行实验本文档来自技高网
...

【技术保护点】
一种基于加权相关系数的近红外光谱识别模型,其特征在于:利用近红外光谱仪将一系列正常同类产品的光谱进行扫描,然后提取每个光谱的特征数据,以平均光谱作为参考光谱;计算产品光谱与参考光谱的加权相关系数,通过加权相关系数的平均值和标准偏差计算识别区间,建立识别模型,该识别模型由参考光谱和识别区间组成。

【技术特征摘要】
1.一种基于加权相关系数的近红外光谱识别模型,其特征在于:利用近红外光谱仪将
一系列正常同类产品的光谱进行扫描,然后提取每个光谱的特征数据,以平均光谱作为参
考光谱;计算产品光谱与参考光谱的加权相关系数,通过加权相关系数的平均值和标准偏
差计算识别区间,建立识别模型,该识别模型由参考光谱和识别区间组成。
2.根据权利要求1所述的基于加权相关系数的近红外光谱识别模型,其特征在于,所述
模型建立包括如下步骤:
(1)光谱扫描:对待测样品进行近红外光谱扫描,提取特征光谱;
(2)建立数据矩阵:以向量si表示第i个样本的光谱数据(i=1,2,...,m),每个光谱包含
n个数据点。以光谱向量si为行向量,光谱数据矩阵S形式如下,
S=s1s2...smm×n]]>(3)计算平均光谱:在步骤(2)矩阵公式基础上计算如下:
s‾=aS]]>式中,a=[1m,1m,...1m]1×m,]]>(4)计算所有光谱s与的加权相关系数,以wcc表示,公式如下:
wcc=Σwj·sj·s‾j-Σwj·sjΣwj·s‾j/Σwj(Σwj·sj2-(Σwj·si)2/Σwj)(Σwj·s‾j2-(Σwj·s‾...

【专利技术属性】
技术研发人员:徐雪芹李小兰刘鸿黄善松贾海江周芸邵利民周艳枚潘玉灵
申请(专利权)人:广西中烟工业有限责任公司
类型:发明
国别省市:广西;45

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1