一种基于决策树算法的变压器色谱峰定性方法和系统技术方案

技术编号:22973527 阅读:21 留言:0更新日期:2019-12-31 22:59
本发明专利技术公开了一种基于决策树算法的变压器色谱峰定性方法和系统,方法包括以下步骤:S10:数据准备与选取:从现场变压器油色谱在线监测装置中提取获得训练样本集、测试样本集以及特征属性集;S20:决策树模型构建:利用决策树算法对所述训练样本集进行训练,构建决策树,构建过程包括训练样本集的特征属性阈值自适应、决策树结点特征属性的选取以及依据特征属性阈值和结点特征属性递归形成决策树;S30:结果测试:利用所述测试样本集测试所述决策树,查看结果是否符合预设标准,若符合,则使用所述决策树用于变压器色谱峰定性。本发明专利技术构建简单,抗漂移性能好,能够有效剔除假峰,能够实现有效色谱峰的正确分类,分类快且容错性好。

A qualitative method and system of transformer chromatographic peak based on decision tree algorithm

【技术实现步骤摘要】
一种基于决策树算法的变压器色谱峰定性方法和系统
本专利技术涉及变压器色谱峰定性领域,尤其涉及一种基于决策树算法的变压器色谱峰定性方法和系统。
技术介绍
电力变压器色谱技术是目前检测油中溶解气体最有效的方法之一,在线色谱技术是实现电力变压器在线实时监测的关键技术,电力变压器在线色谱技术与实验室离线色谱技术的本质区别是:没有人工的干扰,需要自动地采集色谱数据,进行色谱峰辨识、辨别对应色谱峰的成分和扣除基线,最后算出每个色谱成分的浓度含量;由于现场环境很恶劣,温度、湿度等变化较大,容易出现峰辨识缺陷、基线漂移等问题,要求色谱仪抗各种因素的干扰性要强。正是由于在线色谱的特点,就对色谱算法提出了很高的要求,要求算法容错性大,在没有人工的辅助下自动、准确地完成这些工作。目前变压器在线色谱一般采用的定性技术是根据保留时间设定每个成分的变动区间来进行成分定性,有辨识范围较小,对峰漂移容错性不好,抗假峰能力差的缺点。电力变压器在线色谱由于安装在现场,所以环境非常恶劣,有各种电磁噪声干扰、温度湿度的变化等,这些环境因素不可避免地使每次采集的色谱成分的峰位不一样,产生峰位的漂移,在温差大的环境漂移会很大。针对上述这些问题,现有技术中有的把模糊技术引入了电力变压器色谱定性,也有的基于BP神经网络进行峰辨识和峰定性。但是其环境适应性较差,无法根据不同现场环境、不同浓度、不同设备的现场实际状况产生阈值,准确度有限。
技术实现思路
本专利技术要解决的技术问题是针对上述现有技术的不足,提供一种能够自适应阈值,抗漂移性能好,能够有效剔除假峰,能够实现有效色谱峰的正确分类,容错性好的基于决策树算法的变压器色谱峰定性方法和系统。为了实现上述目的,本专利技术采用的技术方案为:一种基于决策树算法的变压器色谱峰定性方法,包括以下步骤:S10:数据准备与选取:从现场变压器油色谱在线监测装置中提取获得训练样本集、测试样本集以及特征属性集;S20:决策树模型构建:利用决策树算法对所述训练样本集进行训练,构建决策树,构建过程包括训练样本集的特征属性阈值自适应、决策树结点特征属性的选取以及依据特征属性阈值和结点特征属性递归形成决策树;S30:结果测试:利用所述测试样本集测试所述决策树,查看结果是否符合预设标准,若符合,则使用所述决策树用于变压器色谱峰定性。上述方案中,利用决策树算法来进行变压器色谱峰定性,算法构建简单便利,抗漂移性能好,能够有效剔除假峰,能够实现变压器色谱峰中有效色谱峰的正确分类,定性正确度高,容错性好,尤其是可以自适应阈值,即能够根据不同现场环境、不同浓度、不同设备的现场实际状况产生阈值。进一步地,所述步骤S30之后还包括:S40:决策树模型重构建:用于若测试结果不符合预设标准,则添加训练样本进入所述训练样本集,并重复步骤S10之后的步骤直至步骤S30判断出测试结果符合预设标准。进一步地,所述训练样本集的特征属性阈值自适应包括以下步骤:S211:利用二分法处理所述训练样本集,获取训练样本集的每个特征属性的候选划分点集合;S212:从每个特征属性的所述候选划分点集合中选取最优划分点作为该特征属性的阈值。进一步地,所述步骤S212中包括:计算每个特征属性的所述候选划分点集合中的每个候选划分点对训练样本集进行划分所获得的信息增益;选取信息增益最大的候选划分点作为该特征属性的阈值。进一步地,所述决策树结点特征属性的选取包括:S221:计算每个特征属性阈值的增益率;S222:选取增益率最大的所述特征属性作为决策树结点。进一步地,所述依据特征属性阈值和结点特征属性递归形成决策树包括:重复执行步骤S211、S212、S221以及S222,确定决策树的根结点和每个分支的结点,直至数据分类结束,形成最终的决策树。进一步地,所述特征属性集至少包括峰高、峰宽、峰面积以及峰位置。进一步地,所述步骤S20还包括在所述决策树形成后对所述决策树进行修剪。一种基于决策树算法的变压器色谱峰定性系统,包括:数据准备与选取模块,用于从现场变压器油色谱在线监测装置中提取获得训练样本集、测试样本集以及特征属性集;决策树模型构建模块,用于利用决策树算法对所述训练样本集进行训练,构建决策树,构建过程包括训练样本集的特征属性阈值自适应、决策树结点特征属性的选取以及依据特征属性阈值和结点特征属性递归形成决策树;结果测试模块,用于利用所述测试样本集测试所述决策树,查看结果是否符合预设标准,若符合,则使用所述决策树用于变压器色谱峰定性。进一步地,所述决策树模型构建模块包括:二分处理单元,用于利用二分法处理所述训练样本集,获取训练样本集的每个特征属性的候选划分点集合;阈值自适应单元,用于从每个特征属性的所述候选划分点集合中选取最优划分点作为该特征属性的阈值;结点确认单元,用于计算每个特征属性阈值的增益率,选取增益率最大的所述特征属性作为决策树结点。采用上述技术方案后,本专利技术的有益效果是:通过决策树的构建,建立了优良的分类标准,算法构建简单方便,能够根据不同现场环境、不同浓度、不同设备的现场实际状况自适应产生阈值,抗漂移性能好,容错性好,能够有效剔除假峰,有利于准确率高的分类变压器色谱峰中的有效峰。附图说明为了更清楚地说明本专利技术实施例或现有技术的技术方案,附图如下:图1为本专利技术实施例1提供的一种基于决策树算法的变压器色谱峰定性方法流程图;图2为本专利技术实施例1提供的优选的基于决策树算法的变压器色谱峰定性方法流程图;图3为本专利技术实施例2提供的优选的一种基于决策树算法的变压器色谱峰定性系统框图;图4为本专利技术实施例2提供的一具体实施方式下系统生成的决策树结构示意图。具体实施方式以下是本专利技术的具体实施例并结合附图,对本专利技术的技术方案作进一步的描述,但本专利技术并不限于这些实施例。实施例1如图1所示,本实施例提供一种基于决策树算法的变压器色谱峰定性方法,包括以下步骤:S10:数据准备与选取:从现场变压器油色谱在线监测装置中提取获得训练样本集、测试样本集以及特征属性集;数据准备与选取具体利用的算法现有技术有很多,主要是为了获得相对有效性较高的色谱峰数据,以便获得精炼样本,此处不予赘述,经过数据准备及数据选取之后,将得到训练样本集D,测试样本集Q以及特征属性集U,充分利用特征属性集U,选择最优的特征属性进行组合,建立相应分类规则,就能准确分类出有效峰;例如选取特征属性集U中包含峰高、峰宽以及峰位置三个特征属性;S20:决策树模型构建:利用决策树算法对所述训练样本集进行训练,构建决策树,构建过程包括训练样本集的特征属性阈值自适应、决策树结点特征属性的选取以及依据特征属性阈值和结点特征属性递归形成决策树;训练样本集的特征属性阈值自适应过程中,特征属性可能都是连续值本文档来自技高网...

【技术保护点】
1.一种基于决策树算法的变压器色谱峰定性方法,其特征在于,包括以下步骤:/nS10:数据准备与选取:从现场变压器油色谱在线监测装置中提取获得训练样本集、测试样本集以及特征属性集;/nS20:决策树模型构建:利用决策树算法对所述训练样本集进行训练,构建决策树,构建过程包括训练样本集的特征属性阈值自适应、决策树结点特征属性的选取以及依据特征属性阈值和结点特征属性递归形成决策树;/nS30:结果测试:利用所述测试样本集测试所述决策树,查看结果是否符合预设标准,若符合,则使用所述决策树用于变压器色谱峰定性。/n

【技术特征摘要】
1.一种基于决策树算法的变压器色谱峰定性方法,其特征在于,包括以下步骤:
S10:数据准备与选取:从现场变压器油色谱在线监测装置中提取获得训练样本集、测试样本集以及特征属性集;
S20:决策树模型构建:利用决策树算法对所述训练样本集进行训练,构建决策树,构建过程包括训练样本集的特征属性阈值自适应、决策树结点特征属性的选取以及依据特征属性阈值和结点特征属性递归形成决策树;
S30:结果测试:利用所述测试样本集测试所述决策树,查看结果是否符合预设标准,若符合,则使用所述决策树用于变压器色谱峰定性。


2.根据权利要求1所述的一种基于决策树算法的变压器色谱峰定性方法,其特征在于,所述步骤S30之后还包括:
S40:决策树模型重构建:用于若测试结果不符合预设标准,则添加训练样本进入所述训练样本集,并重复步骤S10之后的步骤直至步骤S30判断出测试结果符合预设标准。


3.根据权利要求1所述的一种基于决策树算法的变压器色谱峰定性方法,其特征在于,所述训练样本集的特征属性阈值自适应包括以下步骤:
S211:利用二分法处理所述训练样本集,获取训练样本集的每个特征属性的候选划分点集合;
S212:从每个特征属性的所述候选划分点集合中选取最优划分点作为该特征属性的阈值。


4.根据权利要求3所述的一种基于决策树算法的变压器色谱峰定性方法,其特征在于,所述步骤S212中包括:
计算每个特征属性的所述候选划分点集合中的每个候选划分点对训练样本集进行划分所获得的信息增益;
选取信息增益最大的候选划分点作为该特征属性的阈值。


5.根据权利要求3或4所述的一种基于决策树算法的变压器色谱峰定性方法,其特征在于,所述决策树结点特征属性的选取包括:
S221:计算每个特征属性阈值的增益率;
...

【专利技术属性】
技术研发人员:单杰陈昊旻张政国卜冠南
申请(专利权)人:福建工程学院
类型:发明
国别省市:福建;35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1