本发明专利技术提供了一种煤质成分预测方法,属于煤质检测领域,包括:采集煤质近红外光谱数据,得到原始样本数据;对原始样本数据进行拆分,得到待处理数据;对待处理数据进行预处理操作;采用基于高斯核的支持向量机回归结合XGBoost算法对煤质近红外光谱数据进行建模,获得预测模型;利用预测模型对预处理后的样本数据的煤质成分进行预测。该方法在基于现有成熟的煤质近红外光谱建模及预测技术,建模过程中采用XGBoost算法,所得结果既满足预测数据准确也在保证样本数据不被损坏的情况下进行,也可以适合大量样本数据的测定,可以较好应对数据分布不均衡样本建模,提高预测模型准确率。率。率。
【技术实现步骤摘要】
一种煤质成分预测方法
[0001]本专利技术属于煤质检测领域,具体涉及一种煤质成分预测方法。
技术介绍
[0002]煤质的好坏影响电厂的安全经济运行,若能及时提供入炉煤的含量测定结果,工作人员据此进行相应调整,对保证锅炉安全稳定运行有重要意义。早期传统的煤质分析均采用人工采样制样,低效大量实验进行实际操作与测试和后期低效预测也一直是关于煤质成分预测的重要工作,传统方法对于煤质成分测定操作复杂、速度慢、消耗大,一批煤样分析周期约6
‑
8h,大多数电厂要第二天才能出分析报告,且样本在测试过程中会被损坏。
[0003]20世纪80年代以来随着近红外光谱技术快速发展,有关近红外光谱分析技术应用于工业研究,多在理论与方法讨论。近红外是指波长在780
‑
2500nm范围内的光线,当近红外照射在要分析的物体上时,由于组成物体的化学键的不同,会产生某些特征波长的吸收,吸收度的多少与成分含量的大小有密切关系,由于固体对近红外波长的吸收较弱,因此适用于漫反射技术,根据其漫反射光谱可以分析物体成分。
[0004]因此,在实际中实现煤质的快速在线监测及预测是非常必要的。
技术实现思路
[0005]为了克服上述现有技术存在的不足,本专利技术提供了一种煤质成分预测方法。
[0006]为了实现上述目的,本专利技术提供如下技术方案:
[0007]一种煤质成分预测方法,包括以下步骤:
[0008]采集煤质近红外光谱数据,得到原始样本数据;
[0009]对原始样本数据进行拆分,得到待处理数据;
[0010]对所述待处理数据进行预处理操作;
[0011]采用基于高斯核的支持向量机回归结合XGBoost算法对煤质近红外光谱数据进行建模,获得预测模型;
[0012]利用预测模型对预处理后的样本数据的煤质成分进行预测。
[0013]优选地,在不同位置进行六次采样得到所述煤质近红外光谱数据。
[0014]优选地,将原始样本数据中的热量、水分、灰分、挥发分四种成分含量对应的样本数据进行拆分,得到待处理数据。
[0015]优选地,所述煤质近红外光谱数据数据由12个波长值构成自变量,四种成分构成因变量;
[0016]其中,12个波长值分别为2.36,2.21,2.16,2.06,1.94,1.84,1.76,1.66,1.55,1.51,1.45,1.31,单位:103cm
‑1。
[0017]优选地,所述将四种成分含量对应的样本数据进行拆分,得到待处理数据方便建模的数据格式具体操作为:将数据表拆分成含有12个自变量和一个成分数据的建模形式,最终得到四个数据表用于之后对四种不同成分分别建模及预测。
[0018]优选地,对所述待处理数据采用不同的预处理方法进行处理,对比不同预处理方法获得的均方误差和R2等值,根据比较结果选择预处理方法。
[0019]优选地,所述不同的预处理方法包括中心化、标准化、多元散射矫正、标准正态变换和一阶差分、二阶差分。
[0020]本专利技术提供的煤质成分预测方法具有以下有益效果:
[0021]本专利技术对煤质常规指标(热量、水分、灰分、挥发分)进行快速检测时,对于大量高维样本数据采用XGBoost算法对煤质近红外光谱数据进行建模和预测,建模前对工厂传回数据进行清洗,剔除不好的数据从而使预测结果达到最佳,可以在保证效率和应对大数据情况下对煤质成分数据有很好的预测效果。
附图说明
[0022]为了更清楚地说明本专利技术实施例及其设计方案,下面将对本实施例所需的附图作简单地介绍。下面描述中的附图仅仅是本专利技术的部分实施例,对于本领域普通技术人员来说,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0023]图1为本专利技术实施例1提供的煤质成分预测方法的流程图。
具体实施方式
[0024]为了使本领域技术人员更好的理解本专利技术的技术方案并能予以实施,下面结合附图和具体实施例对本专利技术进行详细说明。以下实施例仅用于更加清楚地说明本专利技术的技术方案,而不能以此来限制本专利技术的保护范围。
[0025]实施例1
[0026]本专利技术提供了一种煤质成分预测方法,具体如图1所示,包括以下步骤:
[0027]S1、采集煤质近红外光谱数据,得到原始样本数据;同一样品考虑均一性以及近红外重复性弱等特点,本实施例对不同位置样本采样六次得到工厂传回的实时煤质近红外光谱数据,目的在于获得稳定的光谱信息。
[0028]其中,原始样本数据由12个波长值(2.36,2.21,2.16,2.06,1.94,1.84,1.76,1.66,1.55,1.51,1.45,1.31,单位:10^3cm
‑1)构成自变量,4种成分(热量、水分、灰分、挥发分)构成因变量。
[0029]S2、对原始样本数据进行拆分,得到待处理数据。
[0030]具体为将原始样本数据中的热量、水分、灰分、挥发分四种成分含量对应的样本数据进行拆分,得到方便建模的数据格式。这四种成分为煤炭的重要煤质指标,对煤的生产、加工利用均有重要意义,大部分煤质快速检测均以这四种指标为主,若增加评价指标则可不限制于四种成分。本实施例将数据表拆分成含有十二个自变量和一个成分数据的便于建模形式,最终得到四个数据表用于之后对四种不同成分分别建模及预测。例:对于灰分值(Ad),用于训练和预测的数据表构成一共十四列,分别是第一列样本序号,第二至十三列为十二个不同波长下的光谱吸收度,第十四列为每个样本对应的灰分含量值;具体拆分过程是直接从灰分表里面去除其余三列成分值即可。
[0031]S3、对待处理数据进行预处理,对比不同预处理方法的均方误差和R2等值,根据比较结果择优选择适合此类样本数据的预处理方法。
[0032]本实施例中预处理方法选用中心化、标准化、多元散射矫正、标准正态变换和一阶、二阶差分进行对比,建模过程择优选择,保证数据最大程度的有效性。例:在实验中每次选取同一个样品的多张光谱作为测试集,其余样本作为训练集,能够使得训练样本尽可能的覆盖所有的区间;在进行抽样时,采用的方法是按照样本序号标签3
‑
6位上的样本序号(例:0001)进行相同标签归类;对于不同的预处理方法后的数据建立模型带入验证集之后,得到的均方误差(MSE)是估计值与真值之差平方的期望值,据此可以评价数据的变化程度,MSE的值越小,说明预测模型描述实验数据具有更好的精确度;同样地,R2的含义是预测值解释了真值方差的多大比例,即衡量了预测值对于真值的拟合好坏程度,R2越接近于1模型拟合效果越好,所以根据不同于处理结果下的数据生成模型的MSE和R2,按照MSE越小和R2接近于1的要求选择更好的方法作为之后建模前的预处理方法。
[0033]S4、采用基于高斯核的支持向量机回归结合XGBoost算法对煤质近红外光谱数据进行建模,获得预测模型。
[0034]S5、利用预测模型对预处理后的本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种煤质成分预测方法,其特征在于,包括以下步骤:采集煤质近红外光谱数据,得到原始样本数据;对原始样本数据进行拆分,得到待处理数据;对所述待处理数据进行预处理操作;采用基于高斯核的支持向量机回归结合XGBoost算法对煤质近红外光谱数据进行建模,获得预测模型;利用预测模型对预处理后的样本数据的煤质成分进行预测。2.根据权利要求1所述的煤质成分预测方法,其特征在于,在不同位置进行六次采样得到所述煤质近红外光谱数据。3.根据权利要求1所述的煤质成分预测方法,其特征在于,将原始样本数据中的热量、水分、灰分、挥发分四种成分含量对应的样本数据进行拆分,得到待处理数据。4.根据权利要求3所述的煤质成分预测方法,其特征在于,所述煤质近红外光谱数据数据由12个波长值构成自变量,四种成分构成因变量;其中,12个波长值分别为2.36,...
【专利技术属性】
技术研发人员:李华,荣婕妤,贾雪,何洪流,刘洁,黄家福,
申请(专利权)人:长春大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。