当前位置: 首页 > 专利查询>暨南大学专利>正文

一种基于贝叶斯分类的光谱波长选择方法技术

技术编号:27287323 阅读:21 留言:0更新日期:2021-02-06 11:55
本发明专利技术公开了一种基于贝叶斯分类的光谱波长选择方法:分别收集需要进行光谱判别分析的每类样品;测试所述样品的光谱,用于光谱判别分析的建模和检验;将每一类样品随机/均匀划分为建模集和检验集;建模集随机/均匀划分为定标集和预测集;对任意的波长模型提取相应的光谱数据,用于贝叶斯多分类判别分析。针对任意波长模型的光谱,构建贝叶斯多分类判别分析模型;基于单波长吸光度服从正态分布和概率独立性假设,并采用概率乘法及其对数,计算测量到相应光谱的条件概率,并把样品判断为条件概率的最大值所对应的类别;采用适当的波长模型选择方法,构建所有波长模型,依据贝叶斯多分类判别分析模型的总预测准确率最大兼顾各类预测准确率的标准偏差最小,获得最优波长模型。本发明专利技术具有应用范围宽、方法简便、预测效果好等优点。好等优点。好等优点。

【技术实现步骤摘要】
一种基于贝叶斯分类的光谱波长选择方法


[0001]本专利技术涉及光谱分析的波长筛选
,特别涉及一种基于贝叶斯分类的光谱波长选择方法。

技术介绍

[0002]分子光谱主要包括紫外-可见、近红外、中红外等谱区。随着检测技术和化学计量学的发展,分子光谱已经成为样品快速检测的一类有效技术手段。特别是近红外(NIR)光谱,它反映分子的含氢官能基团X-H(如C-H、N-H、O-H等)振动的倍频和合频吸收,对大多数类型的样品,不需要进行预处理(或者简单处理)便可进行测量。
[0003]光谱多分类判别分析是重要的应用方向。目前,全波段通用型近红外光谱仪器对于复杂分析物的判别分析,尚缺乏依据统计学概率分布及光谱种群特征进行波长选择,提升判别效果的技术。

技术实现思路

[0004]本专利技术的目的在于克服现有技术的缺点与不足,提出一种针对光谱(紫外-可见、近红外、中红外等)的基于贝叶斯分类的光谱波长选择方法,具有应用范围宽、方法简便、预测效果好等优点,为光谱判别分析专用仪器的分光系统设计提出有效的解决方案。
[0005]本专利技术的目的通过下述技术方案实现:一种基于贝叶斯分类的光谱波长选择方法,包括如下步骤:
[0006]S1、分别收集需要进行光谱判别分析的每类样品;测试所述样品的光谱,用于光谱判别分析的建模和检验;
[0007]S2、分别将每一类样品随机/均匀划分为建模集和检验集;建模集随机/均匀划分为定标集和预测集,汇总得到包含各类样品的定标、预测、检验样品集;
[0008]S3、对任意的波长模型提取相应的光谱数据,用于构建贝叶斯多分类判别分析模型;
[0009]S4、构建贝叶斯多分类判别分析模型:基于单波长吸光度服从正态分布和概率独立性,并采用概率乘法及其对数,计算每一类样品测量到相应光谱的条件概率,并把样品判断为条件概率的最大值所对应的类别;计算贝叶斯多分类判别分析模型的总预测准确率,各类预测准确率及其标准偏差;
[0010]S5、采用适当的波长模型选择方法,构建所有波长模型;对所有波长模型,按照S3、S4的步骤完成贝叶斯多分类判别分析模型;依据贝叶斯多分类判别分析模型的总预测准确率最大兼顾各类预测准确率的标准偏差最小,获得最优波长模型。
[0011]进一步的,在对任意的波长模型提取相应的光谱数据,用于贝叶斯多分类判别分析前,可对光谱进行预处理。
[0012]进一步的,在针对任意波长模型的光谱,构建贝叶斯多分类判别分析模型前,需要确定波长模型的搜索范围,它可以为全扫描谱区,也可根据实际对象的光谱特征,确定为某
一特定的波长范围;在此波长搜索范围内,对任意的波长模型提取相应的光谱数据,用于贝叶斯多分类判别分析。
[0013]进一步的,根据贝叶斯公式,计算样品测量到相应光谱时,判别为第k类样品的后验概率:
[0014][0015]进一步的,先验概率的计算方法:或每一类样品赋予等概率,或依据定标集中各类样品数量的比例分配概率,或采用其他概率计算方法。
[0016]更进一步的,条件概率的计算方法:设相应的波长模型包含s个波长,记为λ1,


s
,假设每类定标集样品在每个单波长下的吸光度服从正态分布,分别计算每类定标集样品在每个单波长下吸光度的数学期望和标准差;在此基础上,在每个波长λ
i
处,利用随机变量的概率密度,计算预测集样品属于第k类样品时,出现相应吸光度值的条件概率;假设对应波长模型的每个波长的吸光度概率具有独立性,根据独立性假设,采用概率乘法,计算需测样品属于第k类样品的条件下测量到相应光谱的条件概率。
[0017]更进一步的,采用概率的对数相加作为最后的条件概率判别值。
[0018]更进一步的,把需测样品判断为后验概率的最大值所对应的类别,实际上对应为条件概率的最大值所对应的类别。
[0019]进一步的,在依据贝叶斯多分类判别分析模型的总预测准确率最大兼顾各类预测准确率的标准偏差最小,获得最优波长模型时,需要采用等间隔组合的波长选择方法,或移动窗口的波长选择方法,或其他波长选择方法,进行波长模型选择。
[0020]更进一步的,以等间隔组合的波长选择方法为例,采用起点波长I、波长个数N和波长间隔数G作为波长筛选的循环参数,构建所有波长组合,并对所有波长组合分别建立贝叶斯多分类判别分析模型,根据总预测准确率最大兼顾各类预测准确率的标准偏差最小,优选模型参数,获得最优波长模型。
[0021]本专利技术与现有技术比较,具有如下优点和有益效果:
[0022]1、本专利技术基于单波长吸光度服从正态分布和概率独立性假设,构建贝叶斯多分类判别分析模型,提出一种简单的光谱条件概率计算方法。在此基础上,结合波长选择方法进一步提升贝叶斯分类效果,提升了光谱种群的同类相似性和异类差异性特征,从而提高仪器分析的判别准确率,优于没有进行波长选择的全谱模型,显著降低了波长模型复杂度;
[0023]2、虽然有基于单波长吸光度服从正态分布和概率独立性假设,构建贝叶斯多分类判别分析模型的应用研究,但是没有进行波长模型优选,概率独立性难以成立,贝叶斯分类效果不好。本专利技术的创新性在于:不仅基于单波长吸光度服从正态分布和概率独立性假设,提出一种简单的光谱条件概率计算方法,构建了贝叶斯多分类判别分析模型,而且还集成了有效的波长模型选择方法(如,等间隔波长组合法),克服波长相关性,提升概率模型独立性,从而大幅提升贝叶斯分类效果,使得这种简单的贝叶斯光谱分类方法真正可以得到应用。
[0024]3、本专利技术具有应用范围宽、方法简便、预测效果好等优点,可以为新型专用光谱仪器的分光系统设计提供依据。
附图说明
[0025]图1是实施例方法流程图。
具体实施方式
[0026]一种基于贝叶斯分类的光谱波长选择方法,包括如下步骤:
[0027]1、假设有m类样品需要进行光谱判别分析,分别简称1-样品,

,m-样品;分别收集到每类样品各若干,并测试样品的光谱,用于光谱判别分析的建模和检验;
[0028]2、分别将每一类样品的全体随机(或均匀)划分为建模集和检验集,建模集进一步随机(或均匀)划分为定标集和预测集,然后汇总;定标集和预测集用于优选模型及参数,检验集用于评价模型;
[0029]3、采用适当的方法对光谱进行预处理,或根据实际情况不进行光谱预处理;
[0030]4、确定波长模型的搜索范围,它可以为全扫描谱区,也可根据实际对象的光谱特征,确定为某一特定的波长范围;在此波长搜索范围内,对任意的波长模型提取相应的光谱数据,用于贝叶斯多分类判别分析。
[0031]5、针对任意波长模型的光谱,构建贝叶斯多分类判别分析模型。根据贝叶斯公式,计算未知样品属于第k类的概率(后验概率),如下:
[0032][0033]其中,P(Class=k|Spectrum)为测量到相应光谱时,判别为第k类样品的概率(后验概本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于贝叶斯分类的光谱波长选择方法,其特征在于包括如下步骤:S1、分别收集需要进行光谱判别分析的每类样品,测试所述样品的光谱;S2、分别将每一类样品随机划分为建模集和检验集,建模集随机划分为定标集和预测集,汇总得到包含各类样品的定标、预测、检验样品集;S3、对任意的波长模型提取相应的光谱数据,用于构建贝叶斯多分类判别分析模型;S4、构建贝叶斯多分类判别分析模型:基于单波长吸光度服从正态分布和概率独立性,并采用概率乘法及其对数,计算每一类样品测量相应光谱的条件概率,并把样品判断为条件概率的最大值所对应的类别;计算贝叶斯多分类判别分析模型的总预测准确率,各类预测准确率及其标准偏差;S5、采用适当的波长模型选择方法,构建所有波长模型;对所有波长模型,按照S3、S4的步骤完成贝叶斯多分类判别分析模型;依据贝叶斯多分类判别分析模型的总预测准确率最大兼顾类预测准确率的标准偏差最小,获得最优波长模型。2.根据权利要求1所述的基于贝叶斯分类的光谱波长选择方法,其特征在于在所述步骤S3对任意的波长模型提取相应的光谱数据,用于贝叶斯多分类判别分析前,可对光谱进行预处理。3.根据权利要求1所述的基于贝叶斯分类的光谱波长选择方法,其特征在于在所述步骤S4针对任意波长模型的光谱,构建贝叶斯多分类判别分析模型前,需要确定波长模型的搜索范围,它可以为全扫描谱区,也可根据实际对象的光谱特征,确定为某一特定的波长范围;在此波长搜索范围内,对任意的波长模型提取相应的光谱数据,用于贝叶斯多分类判别分析。4.根据权利要求1所述的基于贝叶斯分类的光谱波长选择方法,其特征在于在所述步骤S4针对任意波长模型的光谱,构建贝叶斯多分类判别分析模型时,根据贝叶斯公式,计算样品测量到相应光谱时,判别为第k类样品的后验概率:5.根据权利要求4所述的基于贝叶斯分类的光谱波长选择方法,其特征在于,先验概率的计算方...

【专利技术属性】
技术研发人员:潘涛李佳琪常乃良陈洁梅
申请(专利权)人:暨南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1