基于支持向量机模型的实测光谱曲线中异常光谱剔除方法技术

技术编号:10465922 阅读:271 留言:0更新日期:2014-09-24 18:01
本发明专利技术公开了一种基于支持向量机模型的实测光谱曲线中异常光谱的剔除方法,利用机器学习理论中支持向量机分类方法思想设置阈值剔除异常光谱,通过交叉验证方法自动参数寻优找出最佳模型参数进而对光谱数据进行分类,避免了人工设置阈值或不断调整阈值的主观性、低效率等问题,能规模化应用于大量光谱数据的处理,并且有效提高了精度和准确性。本发明专利技术选取的RBF核函数具有泛化能力强、收敛速度快的特点。本发明专利技术还增加了对惩罚系数C、RBF核函数中的间隔参数γ进行寻优的参数选取步骤,结合训练光谱建立SVM二分类算法模型也即支持向量机模型,更进一步的优化了最后异常光谱剔除的结果。

【技术实现步骤摘要】

本专利技术涉及一种实测光谱曲线中异常光谱的剔除方法,具体涉及一种基于支持向 量机分类方法原理设置阈值剔除异常光谱的方法。
技术介绍
光谱分析技术在地质遥感、农林生态、土壤调查、污染监测、食品检测、计量化学等 领域应用广泛,在测量过程中,由于仪器噪声、外界环境干扰、操作不当及其他偶发因素的 影响,采集到的光谱数据中往往存在异常光谱,如果直接使用这些数据进行建模分析,势必 会影响模型的准确性和稳定性。因此,有必要识别出异常光谱并将其剔除。 国内外许多专家学者对异常光谱识别做了相应的研究,陈斌等利用PCA结合马氏 距离对光谱异常样品进行剔除;包鑫等利用马氏距离的平均值加两倍马氏距离的标准差作 为阈值来剔除异常光谱;Patrick Wiegand等通过偏最小二乘法(PLS)建模,根据光谱数据 与所建模型预测值残差大小来判断是否为异常光谱;淡图南等在PLS建模的基础上,采用 留一步交叉检验法确定异常光谱数据;ZhiChao Liu等利用蒙特卡洛交叉验证建立一定数 量的PLS模型后,按照预测误差平方和排序,并根据光谱在不同模型中出现频次来完成异 常光谱的识别。综合国内外研究现状,异常光谱识别基本思想均为大量统计数据分析建模, 人为设置阈值或者不断调整阈值后建立预测模型,以相关系数、均方差、平均相对误差等统 计参数作为异常样品剔除模型的评价指标,得到不同阈值下的预测精度直至满足要求。上 述处理方法存在着两个缺陷,一是运用马氏距离等常规相似性度量方法比较光谱间的差 异,不能完全区分开光谱差异;二是人为设置阈值或不断调整阈值的方法,阈值设置依赖处 理者的经验,主观性太大,且效率不高,难以应用于大量光谱数据的处理。为了克服上述问 题,需要引入新的技术方法和思路。
技术实现思路
: 本专利技术要解决的技术问题是提供一种基于支持向量机模型的实测光谱曲线中异 常光谱的剔除方法,用核函数、惩罚系数和训练光谱建立支持向量机模型,从实测光谱曲线 中剔除异常光谱。 为了解决上述技术问题,本专利技术的技术方案为: ,包括如下步骤:1)获 取实测光谱数据,并对其进行预处理;2)依据经预处理的实测光谱数据,获取光谱的二维 平面散点图;3)将位于二维平面散点图中上方离集群中心较远的离散点标记为总离散点, 将二维平面散点图中下方除去了离散点之外的集群点标记为总集群点,总离散点和总集群 点共同构成训练光谱;4)选取核函数和惩罚系数C,结合训练光谱建立SVM二分类算法模 型;5)将二维平面散点图输入支持向量机模型,在高维空间得到最优分类超平面函数表达 式,最优分类超平面函数表达式即为异常光谱阈值线;6)二维平面散点图位于异常光谱阈 值线上方的光谱点即为异常光谱,剔除异常光谱。 较佳地,步骤1)预处理包括三个步骤11)去除水汽影响波段,12)采用多项式平滑 滤波,滤除原始光谱中高频噪声,13)包络线去除。 较佳地,步骤2)中的二维平面散点图是通过以下方法得到的:计算经预处理的实 测光谱数据与标准光谱集平均光谱之间的局部度量,包括欧氏距离ED和余弦角CA,并归一 化到0-1之间;计算经预处理的实测光谱数据与标准光谱集平均光谱之间的整体度量,包 括光谱信息散度SID,并归一化到0-1之间;光谱编号结合归一化后的欧氏距离ED、余弦角 CA、光谱信息散度SID和表达式(EDX SID)/CA的值,得到二维平面下的ED散点图、CA散点 图、SID散点图和(EDXSID)/CA散点图;二维平面散点图包括ED散点图和/或CA散点图 和/或SID散点图和/或(ED X SID) /CA散点图。 较佳地,二维平面下的ED散点图、CA散点图、SID散点图和(EDXSID)/CA散点 图的建立方法为:以光谱编号为横轴,以归一化后的欧氏距离ED、余弦角CA、光谱信息散度 SID和表达式(EDXSID)/CA的值为纵轴建立二维平面的ED散点图、CA散点图、SID散点图 和(EDXSID)/CA散点图。 较佳地,步骤4)中的核函数为RBF核函数,本文档来自技高网
...
<a href="http://www.xjishu.com/zhuanli/55/201410264086.html" title="基于支持向量机模型的实测光谱曲线中异常光谱剔除方法原文来自X技术">基于支持向量机模型的实测光谱曲线中异常光谱剔除方法</a>

【技术保护点】
基于支持向量机模型的实测光谱曲线中异常光谱剔除方法,其特征在于,包括如下步骤:1)获取实测光谱数据,并对其进行预处理;2)依据经预处理的所述实测光谱数据,获取光谱的二维平面散点图;3)将位于所述二维平面散点图中上方离集群中心较远的离散点标记为总离散点,将二维平面散点图中下方除去了离散点之外的集群点标记为总集群点,总离散点和总集群点共同构成训练光谱;4)选取核函数和惩罚系数C,结合所述训练光谱建立SVM二分类算法模型;5)将所述二维平面散点图输入所述支持向量机模型,在高维空间得到最优分类超平面函数表达式,最优分类超平面函数表达式即为异常光谱阈值线;6)所述二维平面散点图位于异常光谱阈值线上方的光谱点即为异常光谱,剔除所述异常光谱。

【技术特征摘要】
1. 基于支持向量机模型的实测光谱曲线中异常光谱剔除方法,其特征在于,包括如下 步骤: 1) 获取实测光谱数据,并对其进行预处理; 2) 依据经预处理的所述实测光谱数据,获取光谱的二维平面散点图; 3) 将位于所述二维平面散点图中上方离集群中心较远的离散点标记为总离散点,将二 维平面散点图中下方除去了离散点之外的集群点标记为总集群点,总离散点和总集群点共 同构成训练光谱; 4) 选取核函数和惩罚系数C,结合所述训练光谱建立SVM二分类算法模型; 5) 将所述二维平面散点图输入所述支持向量机模型,在高维空间得到最优分类超平面 函数表达式,最优分类超平面函数表达式即为异常光谱阈值线; 6) 所述二维平面散点图位于异常光谱阈值线上方的光谱点即为异常光谱,剔除所述异 常光谱。2. 根据权利要求1所述的基于支持向量机模型的实测光谱曲线中异常光谱剔除方法, 其特征在于:所述步骤1)预处理包括三个步骤11)去除水汽影响波段,12)采用多项式平 滑滤波,滤除原始光谱中高频噪声,13)包络线去除。3. 根据权利要求1所述的基于支持向量机模型的实测光谱曲线中异常光谱剔除方法, 其特征在于,所述步骤2)中所述的二维平面散点图是通过以下方法得到的: 计算经预处理的实测光谱数据与标准光谱集平均光谱之间的局部度量,包括欧氏距离 ED和余弦角CA,并归一化到0-1之间;计算经预处理的实测光谱数据与标准光谱集平均光 谱之间的整体度量,包括光谱信息散度SID,并归一化到0-1之间; 光谱编号结合归一化后的欧氏距离ED、余弦角CA、光谱信息散度SID和表达式 (ED X SID)/CA的值,得到二维平面下的ED散点图、CA散点图、SID散点图和(ED X SID)/CA 散点图; 所述二维平面散点图包括所述ED散点图和/或CA散点图和/或SID散点图和/或 (EDXSID)/CA 散点图。4. 根据权利要求3...

【专利技术属性】
技术研发人员:詹云军苏余斌黄解军余晨邓安鑫朱捷缘
申请(专利权)人:武汉理工大学
类型:发明
国别省市:湖北;42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1