一种基于决策树算法的质量管理方法技术

技术编号:27271841 阅读:17 留言:0更新日期:2021-02-06 11:37
本发明专利技术公开了一种基于决策树算法的质量管理方法,包括以下步骤:第一步,建立训练样本数据库S,第二步,判断所述训练样本数据库S中样本是否是质量改进机会,构建“是质量改进机会”和“不是质量改进机会”的目标属性;第三步,基于ID3决策树算法构建识别引起质量改进机会原因的识别模型;第四步,将所述识别模型识别的引起质量改进机会的原因推送相应的责任部门。本发明专利技术基于ID3决策树算法建识别引起质量改进机会原因的识别模型,一定程度提高智能自主识别模型的准确率,可帮助企业对造成产品质量缺陷进行责任分析和自动诊断,降低生产中的不合格率。不合格率。不合格率。

【技术实现步骤摘要】
一种基于决策树算法的质量管理方法


[0001]本专利技术属于质量管理
,具体地说,涉及一种基于决策树算法的质量管理方法。

技术介绍

[0002]传统的轨道交通质量管理方法致力于质量的控制和诊断,主要是事后处理。另一方面,随着制造业信息化的深入,企业从日常的生产活动中,收集到大量的、杂乱的数据未能得到充分利用,大多只停留在对数据的简单统计与图表的显示,缺少进一步的挖掘及利用隐藏在数据背后的有用信息,不能利用科学的数据计算模型自动给出改进机会,无法对公司质量改进活动提供支撑。
[0003]有鉴于此,特提出本专利技术。

技术实现思路

[0004]本专利技术要解决的技术问题在于克服现有技术的不足,提供一种基于决策树算法的质量管理方法,可帮助企业对造成产品质量缺陷进行责任分析和自动诊断,降低生产中的不合格率。
[0005]为解决上述技术问题,本专利技术采用技术方案的基本构思是:
[0006]一种基于决策树算法的质量管理方法,包括以下步骤:
[0007]第一步,建立训练样本数据库S,
[0008]第二步,判断所述训练样本数据库S中样本是否是质量改进机会,构建“是质量改进机会”和“不是质量改进机会”的目标属性;
[0009]第三步,基于ID3决策树算法构建识别引起质量改进机会原因的识别模型;
[0010]第四步,将所述识别模型识别的引起质量改进机会的原因推送相应的责任部门。
[0011]进一步的,第三步中包括
[0012]步骤S31,所述训练样本数据库S中的数据按照“是质量改进机会”和“不是质量改进机会”的目标属性被分为“是质量改进机会”或“不是质量改进机会”两个类别标签,其中“是质量改进机会”为S1,“不是质量改进机会”为S2,
[0013]步骤S32,计算对所述训练样本数据库S按照目标属性分类所需的信息熵、每个类别的信息熵,获取每个类别的信息增益,
[0014]步骤S33,选取所有类别中最大的信息增益作为决策树的根节点,建立从根节点到叶节点的决策树,直到节点特征中的数据在类别上取值都相同或没有类别可再供划分使用,以此构建识别模型。
[0015]进一步的,步骤S32中包括
[0016]①
计算所述训练样本数据库S按照目标属性分类所需的信息熵;
[0017]②
根据数据类型的不同,所述训练样本数据库包括n个不同的类别,分别为类别C1、类别C2、类别C
i
、...,类别C
n
,1<i<n,
[0018]假设类别C
i
具有k个不同的特征,分别为特征a1,特征a2,特征a
j
...,特征a
k
,1<j<k,
[0019]分别获取类别C
i
中特征a1,特征a2,特征a
j
...,特征a
k
的信息熵,再计算类别C
i
的平均信息期望;
[0020]③
计算类别C
i
的信息增益Gain(C
i
)。
[0021]进一步的,第三步中还包括步骤S34,
[0022]步骤S34,对所述识别模型进行评价及验证,采用决策准确率来表示识别模型的可正确分类概率,其中,正确决策样本数为正确得预测出是否是质量改进机会得样本数,测试样本总数为测试所用的总的样本数,即包括正确与不正确得预测出是否是质量改进机会得样本总数,计算公式为:
[0023][0024]根据计算公式获得如下表格:
[0025][0026]表中,TP为:将正例预测为正例(的数目),真实为0,预测也为0;
[0027]FP为:将负例预测为正例(的数目),真实为1,预测为0;
[0028]FN为:将正例预测为负例(的数目),真实为0,预测为1;
[0029]TN为:将负例预测为负例(的数目),真实为1,预测也为1。
[0030]进一步的,第二步中包括
[0031]从产品缺陷维度构建规则模型,通过数据池字段,构建当月不良占当月总累计不良比率、当月不良占季度累计不良比率、累计季度不良占当年总不良比率、同比增长率及环比增长率来评价产品缺陷的比率;
[0032]从时间维度构建规则模型,将历史年份发生缺陷的数量,对比当年各月的缺陷数量,对质量改进机会进行评价,构建标准总月均不良数量、标准各环节月均总不良数量、当月总不良数量、各环节当月总不良数量、当月不良数量、累计季度总不良数量一系列评价指标;
[0033]获取质量改进机会综合指标,构建“是质量改进机会”和“不是质量改进机会”的目标属性。
[0034]进一步的,获取质量改进机会综合指标,构建“是质量改进机会”和“不是质量改进机会”的目标属性包括
[0035]①
假设所述训练样本数据库S有n

行记录,m

个变量,训练样本数据库可以用一个n
’×
m

的矩阵A表示:A=[x1...x
m

][0036]②
将矩阵A中的数据归一化处理;
[0037]③
计算第j

个变量下第i

行记录所占比重,1<j

<m

,1<i

<n


[0038]④
计算第j

个变量的熵值、差异系数和权重,获取每一行记录的质量改进机会综合指标的数据分布;
[0039]⑤
判断所述质量改进机会综合指标的数据分布是否满足正态分布,若是,依据
3sigma原则,将质量改进机会综合指标偏离均值3个标准差以外的数据判定为质量改进机会动态阈值,若否,依据切比雪夫不等式原理将分布概率低于10%区间内的数据判定为质量改进机会动态阈值;
[0040]⑥
判断每一行记录的质量改进机会综合指标是否大于质量改进机会动态阈值,若是,则“是质量改进机会”,若否,则“不是质量改进机会”。
[0041]采用上述技术方案后,本专利技术与现有技术相比具有以下有益效果。
[0042]1.本专利技术利用分类决策树数据挖掘算法,构建智能识别轨道交通中自动识别质量改进机会,具有独创性;
[0043]2.本专利技术构建动态阈值,动态评价指标,模型结果更具有实时性和准确性;
[0044]3.本专利技术实现了面向质量管理改进模型构建过程的封装,具有系统化思维和高度可迁移性;
[0045]4.本专利技术提出的智能识别质量改进机会的模型,可帮助企业对造成产品质量缺陷进行责任分析和自动诊断,降低生产中的不合格率。
[0046]5.本专利技术具有较强的可借鉴性,对于其他质量管理改进和提高产品质量具有较强的指导意义,可复制性强。
[0047]下面结合附图对本专利技术的具体实本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于决策树算法的质量管理方法,其特征在于:包括以下步骤:第一步,建立训练样本数据库S,第二步,判断所述训练样本数据库S中样本是否是质量改进机会,构建“是质量改进机会”和“不是质量改进机会”的目标属性;第三步,基于ID3决策树算法构建识别引起质量改进机会原因的识别模型;第四步,将所述识别模型识别的引起质量改进机会的原因推送相应的责任部门。2.根据权利要求1所述的一种基于决策树算法的质量管理方法,其特征在于:第三步中包括步骤S31,所述训练样本数据库S中的数据按照“是质量改进机会”和“不是质量改进机会”的目标属性被分为“是质量改进机会”或“不是质量改进机会”两个类别标签,其中“是质量改进机会”为S1,“不是质量改进机会”为S2,步骤S32,计算对所述训练样本数据库S按照目标属性分类所需的信息熵、每个类别的信息熵,获取每个类别的信息增益,步骤S33,选取所有类别中最大的信息增益作为决策树的根节点,建立从根节点到叶节点的决策树,直到节点特征中的数据在类别上取值都相同或没有类别可再供划分使用,以此构建识别模型。3.根据权利要求2所述的一种基于决策树算法的质量管理方法,其特征在于:步骤S32中包括

计算所述训练样本数据库S按照目标属性分类所需的信息熵;

根据数据类型的不同,所述训练样本数据库包括n个不同的类别,分别为类别C1、类别C2、类别C
i
、...,类别C
n
,1<i<n,假设类别C
i
具有k个不同的特征,分别为特征a1,特征a2,特征a
j
...,特征a
k
,1<j<k,分别获取类别C
i
中特征a1,特征a2,特征a
j
...,特征a
k
的信息熵,再计算类别C
i
的平均信息期望;

计算类别C
i
的信息增益Gain(C
i
)。4.根据权利要求3所述的一种基于决策树算法的质量管理方法,其特征在于:第三步中还包括步骤S34,步骤S34,对所述识别模型进行评价及验证,采用决策准确率来表示识别模型的可正确分类概率,其中,正确决策样本数为正确得预测出是否是质量改进机会得样本数,测试样本总数为测试所用的总的样本数,即包括正确与不正确得预测出是否是质量改进机会得样本总数,计算公式为:根据计算公式获得如下表格:表中,TP为...

【专利技术属性】
技术研发人员:李亮亮李彦林王西山董绪琪李艳
申请(专利权)人:中车青岛四方机车车辆股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1