一种基于知识图谱的辅助维修决策方法技术

技术编号:27773250 阅读:37 留言:0更新日期:2021-03-23 12:59
本发明专利技术公开了一种基于知识图谱的辅助维修决策方法,包括实体关系抽取、知识图谱构建、循环神经网络训练,使用结构化数据实体、关系构建特征向量,使用循环神经网络序列标注,根据标注结果完成知识单元关系识别,将具有不同标识实体单代表同一对象的实体归并为具有全局唯一标识的实体对象添加到知识图谱中,通过使用循环神经网络自动提取设备特征,将故障信息映射到同一个向量空间,使用相似度计算,计算故障相似度并得到故障处理方案推荐。提出了适用设备维护领域的特征的知识图谱方案,保证抽取出的知识单元和单元关系准确性和全面性。

【技术实现步骤摘要】
一种基于知识图谱的辅助维修决策方法
本专利技术涉及一种基于知识图谱的辅助维修决策方法,尤其是一种用于轨道交通综合监控系统的基于知识图谱的辅助维修决策方法。
技术介绍
随着轨道交通行业的发展,新线路不断并网与运行,大量城市轨道交通设备及其控制装置的接入,暴露了以传统方式对轨道交通设备维护维修的调度、调控、控制等方面存在诸多问题。传统方式由于维护设备种类众多、数量庞大、故障内容多样化,维保人员现场排查故障设备效率不高,设备故障处理不及时。如单个设备重复上报故障,问题多次排查影响工效。地铁设备的传统维修模式暴露出问题处理不及时、维修方式不合理等缺陷,故障设备的响应不够及时,维修方式过于单一。预防维修、状态维修等方式也受到传统方式的局限,从而不能很好的应用,一线维修人员依靠经验以及行业规程指定的维修决策进行维修,前者过于武断,过于依靠个人,后者则不够灵活,采用设备管理系统和维修支持决策系统的方式少之又少。
技术实现思路
本专利技术要解决的技术问题是:地铁设备的传统维修模式依赖经验或行业规程指定导致维修方式不合理的问题。为了解决上述问题,本专利技术的技术方案是提供了一种基于知识图谱的辅助维修决策方法,其特征在于,包括如下步骤:步骤1:采集设备结构化数据及非结构化数据,根据地铁设备维护知识,构建地铁设备领域的专业词典,用于对专业术语添加特殊词性以及词性标注;对采集到的设备数据使用HanLP自然语言处理工具进行分词处理,将设备结构化数据及非结构化数据转为单词/词性序列。步骤2:将采集到的设备数据中的结构化数据及非结构化数据抽取分成知识抽取实体及关系抽取两步进行,训练适用于设备维护的神经网络;通过对实体的构造得到实体特征向量,根据序列标注的结果对训练集进行标注,得到一个可以对非结构化数据分词得到的词进行标注的循环神经网络,根据标注结果完成知识单元关系识别;将具有不同标识实体单代表同一对象的实体归并为具有全局唯一标识的实体对象添加到知识图谱中,以有明确尾实体的头实体作为神经网络的输入,根据尾实体输出结果进行权重调整,对重要的实体进行加权操作;将结构化数据通过D2R转换建立设备维护数据实体-关系-实体三元组,抽取为相应的实体关系。过滤重复的实体关系,直到未出现重复实体关系,将抽取到的无重复的实体关系存入NEO4J图数据库;步骤3:将循环神经网络自动提取的设备特征及故障信息映射到同一个向量空间,使用相似度得分计算,得到相似度得分排行,完成处理方案推荐。步骤4:设计轨道交通设备故障诊断与辅助决策系统,用于设备故障诊断及故障辅助决策,包括设备故障内容录入、设备信息明细、故障维修决策返回、故障填报、设备定位、故障处理推荐。优选地,所述步骤2非结构化数据抽取包括抽取文本中原子信息元素,具体为定义一套种子模板,定义两个实体为X1、X2,关系为Y,则实体关系为(X1,Y,X2),实体Xn+1、Xn+2,关系为Yn,则实体关系为(Xn+1,Yn,Xn+2);将实体Xn+1、关系Yn、实体Xn+2中的关系Yn添加为触发词,根据触发词分别找出关系Yn在专业词典中添加的实体的参与方Xn+1,Xn+2;通过完成触发词的关系抽取,构建RDF格式的实体与关系的数据集;提取数据中所有候选实体,构建包含候选实体A、关系、候选实体B的三元组关系。优选地,所述步骤2中训练设备神经网络包括:分词后根据词性标注为A、B、C,标注完成构成训练数据集,采用训练数据集对神经网络模型进行训练,以两个实体词向量和其分别在句子窗口中的词向量连接起来作为神经网络模型的输入,以这两个实体关系中的一位有效编码标识向量作为神经网络模型的输出,判断神经网络模型输出数据的正确率,预期效果为正确率大于预设阈值,未达到预期效果时,进行权重调整,将训练好的神经网络模型保存为可用模型。优选地,所述权重调整包括计算当前神经网络模型的输出,然后根据输出与预期之前的差值,采用多次多样本的迭代算法,具体在所有样本输入后,计算网络的总误差,根据总误差计算各层误差信号,反方向改变前面各层的权值,再次采用迭代算法,将多样本输入,计算网络总误差,验证权值是否达到预期,重复此步骤直至网络收敛稳定,达到预期效果。优选地,所述步骤3中相似度计算的过程为:令数据库中实体组的符号为β,关系为R,则RDF三元组的形式为β=(A,R,B),A∈β位于头实体,R∈β表示A与B的关系,B∈β位于尾实体,将数据集中每个实体对(A,B)定义一个潜在的关系向量RAB来表示实体向量A到实体向量B之间的关联,具体形式为RAB=B-A;则三元组(A,R,B)可以定义成:((A,R,B),θR,θE),其中θR为模型关系参数,θE为模型实体参数;将上述模型用于链路预测,将其中的θE、θR对应实体中所有关系嵌入,将(A,R,B)作为预测模型的输入,相似的,对于所有关系RAB中不同的头实体、尾实体允许不对称建模,依此嵌入评分函数可以方便的交叉验证,来进行预测实体之间的联系或者多边关系,构建用于接收实体对,并将实体对在知识图谱中相似度计算的神经网络。优选地,所述轨道交通设备故障诊断与辅助决策系统设计成WEB页面,包含查询功能、检索具体设备的设备信息、设备维修历史、设备厂商信息,能够输入并识别用户输入语句,根据用户输入语句分词处理并得到设备名、故障名、车站名、位置名、故障内容信息,通过相似度计算,按照相似度排行返回故障处理方案的推荐。与现有技术相比,本专利技术的有益效果是:本专利技术使用结构化数据实体、关系构建特征向量,使用循环神经网络序列标注,根据标注结果完成知识单元关系识别,将具有不同标识实体单代表同一对象的实体归并为具有全局唯一标识的实体对象添加到知识图谱中。通过使用循环神经网络自动提取设备特征,将故障信息映射到同一个向量空间,使用相似度计算,计算故障相似度并得到故障处理方案推荐。本专利技术使用的迭代算法为多次多样本的迭代算法,单次单样本训练遵循的是只顾眼前样本数据产生的误差而进行的权重调整,后果是当训练数据很多时,计算量就会急剧增加,导致收敛速度过慢,样本数据的单一导致数据误差的问题。本专利技术包含故障维修查询功能,可以检索具体设备的设备信息、设备维修历史、设备厂商信息。可以识别输入语句中的故障内容,查找同类故障处理,给维护人员提供具有价值的参考信息。本专利技术垂直于设备维护领域,提出适用设备维护领域的特征的知识图谱方案,保证抽取出的知识单元和单元关系准确性和全面性。附图说明图1为本专利技术实施例中构建的知识图谱关系图;图2为神经网络模型训练流程图。具体实施方式为使本专利技术更明显易懂,兹以优选实施例,并配合附图作详细说明如下。如图1所示,本专利技术一种基于知识图谱的辅助维修决策方法包括知识抽取、知识图谱构建、循环神经网络训练。知识抽取是指从非结构化或半结构化文本数据中抽取出各个实体之间的关系。本实施例中具体是指从设备领域的描述文本中抽取出设备类型、设备信息、设备故障历史、设备维修记录之间的对应关本文档来自技高网...

【技术保护点】
1.一种基于知识图谱的辅助维修决策方法,其特征在于,包括如下步骤:/n步骤1:采集设备结构化数据及非结构化数据,根据地铁设备维护知识,构建地铁设备领域的专业词典,用于对专业术语添加特殊词性以及词性标注;对采集到的设备数据使用HanLP自然语言处理工具进行分词处理,将设备结构化数据及非结构化数据转为单词/词性序列;/n步骤2:将采集到的设备数据中的结构化数据及非结构化数据抽取分成知识抽取实体及关系抽取两步进行,训练适用于设备维护的神经网络;通过对实体的构造得到实体特征向量,根据序列标注的结果对训练集进行标注,得到一个可以对非结构化数据分词得到的词进行标注的循环神经网络,根据标注结果完成知识单元关系识别;将具有不同标识实体单代表同一对象的实体归并为具有全局唯一标识的实体对象添加到知识图谱中,以有明确尾实体的头实体作为神经网络的输入,根据尾实体输出结果进行权重调整,对重要的实体进行加权操作;将结构化数据通过D2R转换建立设备维护数据实体-关系-实体三元组,抽取为相应的实体关系;过滤重复的实体关系,直到未出现重复实体关系,将抽取到的无重复的实体关系存入NEO4J图数据库;/n步骤3:将循环神经网络自动提取的设备特征及故障信息映射到同一个向量空间,使用相似度得分计算,得到相似度得分排行,完成处理方案推荐;/n步骤4:设计轨道交通设备故障诊断与辅助决策系统,用于设备故障诊断及故障辅助决策,包括设备故障内容录入、设备信息明细、故障维修决策返回、故障填报、设备定位、故障处理推荐。/n...

【技术特征摘要】
1.一种基于知识图谱的辅助维修决策方法,其特征在于,包括如下步骤:
步骤1:采集设备结构化数据及非结构化数据,根据地铁设备维护知识,构建地铁设备领域的专业词典,用于对专业术语添加特殊词性以及词性标注;对采集到的设备数据使用HanLP自然语言处理工具进行分词处理,将设备结构化数据及非结构化数据转为单词/词性序列;
步骤2:将采集到的设备数据中的结构化数据及非结构化数据抽取分成知识抽取实体及关系抽取两步进行,训练适用于设备维护的神经网络;通过对实体的构造得到实体特征向量,根据序列标注的结果对训练集进行标注,得到一个可以对非结构化数据分词得到的词进行标注的循环神经网络,根据标注结果完成知识单元关系识别;将具有不同标识实体单代表同一对象的实体归并为具有全局唯一标识的实体对象添加到知识图谱中,以有明确尾实体的头实体作为神经网络的输入,根据尾实体输出结果进行权重调整,对重要的实体进行加权操作;将结构化数据通过D2R转换建立设备维护数据实体-关系-实体三元组,抽取为相应的实体关系;过滤重复的实体关系,直到未出现重复实体关系,将抽取到的无重复的实体关系存入NEO4J图数据库;
步骤3:将循环神经网络自动提取的设备特征及故障信息映射到同一个向量空间,使用相似度得分计算,得到相似度得分排行,完成处理方案推荐;
步骤4:设计轨道交通设备故障诊断与辅助决策系统,用于设备故障诊断及故障辅助决策,包括设备故障内容录入、设备信息明细、故障维修决策返回、故障填报、设备定位、故障处理推荐。


2.如权利要求1所述的一种基于知识图谱的辅助维修决策方法,其特征在于:所述步骤2非结构化数据抽取包括抽取文本中原子信息元素,具体为定义一套种子模板,定义两个实体为X1、X2,关系为Y,则实体关系为(X1,Y,X2),实体Xn+1、Xn+2,关系为Yn,则实体关系为(Xn+1,Yn,Xn+2);将实体Xn+1、关系Yn、实体Xn+2中的关系Yn添加为触发词,根据触发词分别找出关系Yn在专业词典中添加的实体的参与方Xn+1,Xn+2;
通过完成触发词的关系抽取,构建RDF格式的实体与关系的数据集;提取数据中所有候选实体,构建包含候选实体A、关系、候选实体B的三元组关系。


3.如权利要求1所述的一种基于知识图谱的辅助维修决策方法,其特征在...

【专利技术属性】
技术研发人员:杜建飞司春宁陈成王克斌沈峰
申请(专利权)人:上海电科智能系统股份有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1