一种非结构化设备故障知识的分类及知识萃取方法技术

技术编号:33385919 阅读:15 留言:0更新日期:2022-05-11 23:00
本发明专利技术公开了一种非结构化设备故障知识的分类及知识萃取方法,该方法包括:采集待诊断设备的故障诊断知识并分类;基于故障诊断知识的分类,建立对应的知识萃取方法,进行第一次知识萃取,抽取概念、属性和不同概念属性之间的关联关系,形成局部知识;对局部知识进行第二次知识萃取,将得到的浅知识和深知识整合为复合式知识,形成全局知识库,实现多源信息的集成与融合。本发明专利技术的方法有效解决了目前设备故障诊断领域中对经验、资源重用率较低的问题,将大量非结构化故障数据和经验知识转换为机器可处理的诊断维护知识,实现了故障诊断中隐性知识显性化,显性知识规范化,具有完备、一致性好和精确的优点,以提高后续诊断准确度和维护决策效率。维护决策效率。维护决策效率。

【技术实现步骤摘要】
一种非结构化设备故障知识的分类及知识萃取方法


[0001]本专利技术属于设备故障诊断
,尤其涉及一种非结构化设备故障知识的分类及知识萃取方法。

技术介绍

[0002]随着设备大型化、结构复杂化、运行自动化和智能化等特点的突出、设备相关数据量的增加以及人工智能技术的迅速发展,设备故障诊断进入“大数据”和智能化管理时代。
[0003]知识萃取是从结构化和非结构化源中创建知识,所产生的知识需要采用机器可读和机器可解释的格式,并需要以一种人类也便于理解及逻辑推断的方式来表示。知识萃取应用于设备故障诊断领域,能够有效缩短故障诊断的响应时间,协助决策,提升设备维护的可操作性,提升设备诊断维修策略的可靠性和有效性。
[0004]但目前设备诊断中对经验、资源重用率较低且故障诊断知识存在非规范性,因此如何将经验数据、专家知识和知识萃取技术等结合在一起,更科学高效地萃取大量非结构化故障数据和经验知识,并转换为机器可处理的诊断维护知识,实现隐性知识显性化,显性知识规范化,提高诊断准确度和维护决策效率亟待研究。
[0005]在设备故障诊断领域,知识萃取有两个亟待解决的瓶颈问题:
[0006]1)故障领域知识的多源异构性
[0007]故障领域知识内涵丰富,具有多源异构的特征,设备故障知识分布于不同企业、不同部门、不同维修人员当中,同时也以多种形式存在如设备运行状态数据、维护记录、故障诊断经验、设备结构资料、各部件工艺参数,这些知识具有多样性、复杂性、经验性和非规范性等特点,如何对该领域知识进一步分类,从而能够选择出智能故障诊断系统的关键知识,是提高知识萃取效率的关键。
[0008]2)可获取知识的非规范性
[0009]故障领域知识具有较强的非规范性,在相当程度上増加了对故障诊断知识进行有效的归纳、整理、挖掘和应用的难度,同时也降低了其可重用性和可集成性,为智能故障诊断的有效开展实施带来了困难。如何减小和降低故障领域知识的非规范性的不利影响,准确的提取关键知识,实现面向智能诊断的故障领域知识快速有效获取、处理、传播和应用,是知识萃取研究的另一个难点。
[0010]从知识萃取的研究现状来看,目前针对隐性知识萃取和显性知识萃取的研究都受到了学者的关注。学者针对知识的不同应用场景和不同的领域设计了隐性知识萃取方法。针对显性知识萃取的方法目前研究较多,基于机器学习的知识萃取方法逐渐朝着人工智能的方向发展,基于自然语言分析的知识抽取方法朝着语义和本体结合的方向发展。基于专家经验的知识获取方法重在获取专家头脑中的隐性知识,基于数据挖掘的知识获取方法重在获取设备检测数据中的隐性知识。但目前关于设备故障诊断领域的知识获取方面的研究多集中在基于数据挖掘的知识获取,还存在对经验、资源重用率较低的特点且故障诊断知识的非规范性即不完备性、不一致性和不精确性。
[0011]因此亟需探索适用于设备智能故障诊断与维护的知识萃取的理论、技术和方法,能够将经验数据、专家知识和特征提取等技术等结合在一起,使隐性设备知识显性化、半结构化和结构化的显性知识(如文档、标准、模型、工具、参数等)标准化。所以,针对知识、经验资源的特点,利用知识萃取进行特征提取和专家经验挖掘相结合的研究设备诊断知识建模和服务方式亟需研究。

技术实现思路

[0012]本专利技术的目的在于克服现有技术缺陷,提出了一种非结构化设备故障知识的分类及知识萃取方法。
[0013]为了实现上述目的,本专利技术提出了一种非结构化设备故障知识的分类及知识萃取方法,所述方法包括:
[0014]步骤1)采集待诊断设备的故障诊断知识;
[0015]步骤2)对故障诊断知识进行分类;
[0016]步骤3)基于故障诊断知识的分类,建立对应的知识萃取方法,进行第一次知识萃取,抽取概念、属性和不同概念属性之间的关联关系,形成局部知识;
[0017]步骤4)对局部知识进行第二次知识萃取,将得到的浅知识和深知识整合为复合式知识形成全局知识库,实现多源信息的集成与融合。
[0018]作为上述方法的一种改进,所述步骤1)具体包括:
[0019]收集检修专家的重要信息反馈、故障日报、分析报告和专家结论;
[0020]收集应急故障手册、修程修制、用户手册和检修技术条件;
[0021]采集设备实时检测得到的基础数据、运行数据、故障统计和其他设备实时信息。
[0022]作为上述方法的一种改进,所述步骤2)具体包括:
[0023]对故障诊断知识进行分类,其中,
[0024]将检修专家的重要信息反馈、故障日报、分析报告和专家结论归为检修专家历史经验知识;
[0025]将应急故障手册、修程修制、用户手册和检修技术条件归为检修专业技术文档;
[0026]将设备实时检测采集的基础数据、运行数据、故障统计和其他设备实时信息归为设备实时检测采集信息。
[0027]作为上述方法的一种改进,所述步骤3)具体包括:
[0028]对于检修专家历史经验知识和检修专业技术文档,采用基于深度学习的命名实体识别技术进行设备故障的特征提取,以结构化形式呈现;
[0029]对于设备实时检测采集的状态信息,采用Apriori算法进行关联规则挖掘,获得故障信息与状态信息的关联关系。
[0030]作为上述方法的一种改进,所述对于检修专家历史经验知识和检修专业技术文档,采用基于深度学习的命名实体识别技术进行设备故障的特征提取,以结构化形式呈现;具体包括:
[0031]对于检修专家历史经验知识和检修专业技术文档,将文档中的事故故障文本转换为段落,将段落转换为句子,将句子转化为人工标注的序列;
[0032]通过word2vec将标注的序列转换为词向量,构建基于深度学习和统计学习的事故
故障文本特征提取混合模型,提取出事故故障文本的关键特征,从而实现将非结构化事故故障文本数据转换为结构化数据。
[0033]作为上述方法的一种改进,所述事故故障文本特征提取混合模型包括依次连接的Bi

LSTM层、CRF层和输出层,模型的输入为词向量,输出为事故故障文本的关键特征,所述关键特征包括故障原因、故障维修人员、故障模块、故障症状、解决方案和影响因素。
[0034]作为上述方法的一种改进,所述对于设备实时检测采集的状态信息,采用Apriori算法进行关联规则挖掘,获得故障信息与状态信息的关联关系;具体包括:
[0035]通过设备实时检测采集的状态信息建立事务数据库;
[0036]通过迭代检索得到事务数据库中包含的所有频繁项集;
[0037]由频繁项集产生该状态信息对应的强关联规则,从而获得故障信息与状态信息的关联关系。
[0038]作为上述方法的一种改进,所述通过迭代检索得到事务数据库中包含的所有频繁项集;具体包括:
[0039]使用最小支持度作为判断频繁项集的标准,找出满足最小支持度的频繁1项集L1,对L1的自身连接生成的集合本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种非结构化设备故障知识的分类及知识萃取方法,所述方法包括:步骤1)采集待诊断设备的故障诊断知识;步骤2)对故障诊断知识进行分类;步骤3)基于故障诊断知识的分类,建立对应的知识萃取方法,进行第一次知识萃取,抽取概念、属性和不同概念属性之间的关联关系,形成局部知识;步骤4)对局部知识进行第二次知识萃取,将得到的浅知识和深知识整合为复合式知识形成全局知识库,实现多源信息的集成与融合。2.根据权利要求1所述的非结构化设备故障知识的分类及知识萃取方法,其特征在于,所述步骤1)具体包括:收集检修专家的重要信息反馈、故障日报、分析报告和专家结论;收集应急故障手册、修程修制、用户手册和检修技术条件;采集设备实时检测得到的基础数据、运行数据、故障统计和其他设备实时信息。3.根据权利要求2所述的非结构化设备故障知识的分类及知识萃取方法,其特征在于,所述步骤2)具体包括:对故障诊断知识进行分类,其中,将检修专家的重要信息反馈、故障日报、分析报告和专家结论归为检修专家历史经验知识;将应急故障手册、修程修制、用户手册和检修技术条件归为检修专业技术文档;将设备实时检测采集的基础数据、运行数据、故障统计和其他设备实时信息归为设备实时检测采集信息。4.根据权利要求3所述的非结构化设备故障知识的分类及知识萃取方法,其特征在于,所述步骤3)具体包括:对于检修专家历史经验知识和检修专业技术文档,采用基于深度学习的命名实体识别技术进行设备故障的特征提取,以结构化形式呈现;对于设备实时检测采集的状态信息,采用Apriori算法进行关联规则挖掘,获得故障信息与状态信息的关联关系。5.根据权利要求4所述的非结构化设备故障知识的分类及知识萃取方法,其特征在于,所述对于检修专家历史经验知识和检修专业技术文档,采用基于深度学习的命名实体识别技术进行设备故障的特征提取,以结构化形式呈现;具体包括:对于检修专家历史经验知识和检修专业技术文档,将文档中的事故故障文本转换为段落,将段落转换为句子,将句子转化为人工标注的序列;通过word2vec将标注的序列转换为词向量,构建基于深度学习和统计学习的...

【专利技术属性】
技术研发人员:张玲玲肖潇季续国
申请(专利权)人:中国科学院大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1