基于近红外光谱波数K均值聚类的烟草化学值定量方法技术

技术编号：12478508 阅读：111 留言：0更新日期：2015-12-10 15:00

本发明专利技术公开了一种基于近红外光谱波数K均值聚类的烟草化学值定量方法，包括如下步骤：建立训练集和测试集，采集训练集中所有烟草样本的近红外光谱，以及目标成分含量；采用K均值聚类对训练集中各烟草样本的近红外光谱的波数进行聚类；每一次聚类完成后，利用PLS分别建立各子类谱段与目标成分含量的关系模型，并计算各关系模型的交叉验证均方根误差；以各关系模型对应的交叉验证均方根误差之和最小的聚类数作为最优聚类数，并将最优聚类数对应的各关系模型进行加权求和，得到全谱模型；采集测试集中各烟草样本的近红外光谱，并依据全谱模型，得到测试集中各烟草样本的目标成分含量。本发明专利技术与现有的PLS方法相比，能显著降低模型的预测误差。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及烟草的理化检测
，具体涉及一种基于近红外光谱波数K均值聚类的烟草化学值定量方法。
技术介绍
烟草中的主要化学成分如总糖、烟碱、还原糖、总氮等对烟叶品质具有重要影响，是决定烟气劲头，醇和度等的主要因素。在烟草工业中，常规化学成分的分析测定对卷烟成品质量的控制具有重要的意义。近红外光谱能够表征待测物中多种含氢基团信息，具有采样方便、无损伤、无污染、能够在线检测等优点，非常适合用于各种复杂混合物的检测。近红外光谱检测技术目前已广泛应用于烟草领域，例如打叶复烤中基于烟碱含量的均质化加工及卷烟生产中的质量监测等。应用近红外分析技术，可以较好的预测烟叶中烟碱，总糖，总氮等主要化学成分含量，对烟叶质量进行快速初步的评价有极大地帮助。目前基于近红外的烟叶主要化学成分建模主要是通过偏最小二乘算法 (PartialLeastSquares，PLS)来实现，PLS是为了弥补最小二乘在计算强共线性数据时的缺陷而提出的（参见文献 H. Martens, S. A. Jensen, and P. Geladi, "Multivariate linearity transformations for near infrared reflectance spectroscopy, '，in Proc. Nordic Symp. Applied Statistics, 1983, pp.205 - 234.)〇考虑一组因变量Y= {yi，y2，…，yq}和一组自变量X= {Xl，x2, ···，&}，在X存在严重多重相关性或...

【技术保护点】
一种基于近红外光谱波数K均值聚类的烟草化学值定量方法，其特征在于，包括如下步骤：(1)建立训练集和测试集，采集训练集中所有烟草样本的近红外光谱，并测量训练集中各烟草样本的目标成分含量；(2)采用K均值聚类对训练集中各烟草样本的近红外光谱的波数进行聚类；(3)每一次聚类完成后，利用偏最小二乘法分别建立各子类谱段与目标成分含量的关系模型，并计算各关系模型的交叉验证均方根误差；(4)以各关系模型对应的交叉验证均方根误差之和最小的聚类数作为最优聚类数，并将最优聚类数对应的各关系模型进行加权求和，得到全谱模型；(5)采集测试集中各烟草样本的近红外光谱，并依据全谱模型，得到测试集中各烟草样本的目标成分含量。

【技术特征摘要】

【专利技术属性】
技术研发人员：毕一鸣，储国海，周国俊，夏琛，吴继忠，袁凯龙，史春云，夏骏，
申请(专利权)人：浙江中烟工业有限责任公司，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人