一种基于电机故障知识的众包采集系统及方法技术方案

技术编号:33090233 阅读:63 留言:0更新日期:2022-04-15 11:02
本发明专利技术请求保护一种基于电机故障知识的众包采集系统及方法,属于知识图谱技术领域。系统包括数据采集模块:通过人机交互收集专家的答案,并完成众包采集的任务。人机交互部分主要分为三大模块:小程序部分、故障调查问卷部分、论文知识抽取部分。模型训练模块:使用的模型是BERT模型,主要用来进行命名实体识别任务,从文章中提取关键实体,并将这些实体匹配,构建电机故障知识图谱。知识构建模块:在系统知识训练之后,根据谓词和编辑距离进行匹配,将故障描述与故障的元件,故障解决方式,故障原因对应起来。通过以上技术,成功设计和实现电机故障知识众包知识采集系统,能够从各种文件格式中抽取电机故障知识,并构建电机故障知识库和知识图谱。识库和知识图谱。识库和知识图谱。

【技术实现步骤摘要】
一种基于电机故障知识的众包采集系统及方法


[0001]本专利技术属于知识图谱
,具体是涉及一种基于电机故障知识的众包采集方法及系统。

技术介绍

[0002]随着科技的不断进步和发展,各领域用到的电动机自动化程度逐渐提高,电动机的内部结构也逐渐趋于复杂化,针对不同场景的发电机的种类越来越多。包括水力发电机,涡轮发电机等,同时会有很多不同的型号的发电机。针对上述各种电机的维护与诊断是当下的难题。同时,电机作为各种生产领域内重要的动力设备,具有价格低廉、整体结构相对简单,较为可靠等优点,承担了现代工业、农业生产过程中80%以上的动能输出。尤其是在冶金、采矿、机械加工、轨道交通等工业生产领域,装机量巨大,应用广泛。电机及其相关的动力设备是企业的重要资产,其在运行过程中可靠性和稳定性是保障机械设备长时间安全、稳定运行的关键。
[0003]目前,许多电机的维护只有相关领域的专家才能掌握其对应电机的知识。这些知识碎片化,没有相关规范和行业标准,不具有相关领域的认证,无法正常使用,甚至会对发电机的故障知识整理与诊断造成严重的干扰。并且客户无法自身电机出现的问题提问并得到响应,在最短的时间内解决问题,来保证电机的安全性和运行稳定,减少由于电机故障而造成的损失。
[0004]因此,如何通过电机故障知识的众包采集方法及系统,科学的、快速的及准确的解决电机中的故障是非常有意义的。
[0005]经过检索,申请公开号CN112000791A,一种电机故障知识抽取系统及方法,尤其涉及神经网络模型对电机故障判断的技术领域。目的是为了解决现有技术中电机故障种类繁多导致相关人员电机故障知识抽取困难等问题,本专利技术应用BERT模型构建软件系统,其中包括数据采集模块,数据预处理模块,辅助训练工具模块、模型训练模块和知识融合模块,用户和管理员通过电机故障知识抽取系统的使用,为用户电机故障维护服务提供更加科学化的技术支持,发电机故障知识抽取,目的在于故障知识库的构建,方便用户可以快速解决电机中的故障,并更加便捷与准确,也可提升相关业务人员水平,大幅度提高电机故障解决效率。该技术使用BERT是在seq2seq模型基础上提出来的,同样存在encoder(编码)机制和decoder(解码)机制,每一层encoder的过程都是将上一层的编码输出作为下一层的编码输入,最终得到编码结果,然后将这些编码结果作为decoder的输入,一步一步的进行解码,然而在这些解码编码的过程中容易损失一些信息,导致获取不到更优的精确率和召回率。本专利技术增加残差模块,通过减少残差来增强模型的准确度,同时进行归一化,并利用softmax激活函数,通过较小的反向学习率防止梯度消失或者爆炸,解决了不仅仅只把结果作为输入传递给下一层,同时将中间计算数据传给下一层结构,从而得到更优的精确度和召回率。
[0006]申请公开号CN110414680A,基于众包标注的知识加工系统,包括:粗知识管理模块,其用于导入待标注知识;任务发布模块,其用于生成标注任务并发布,所述标注任务包
括待标注知识、标注员、审核员和标注字段;知识标注模块,其用于对所述标注任务进行标注处理,并将已处理的标注任务生成审核任务;知识审核模块,其用于对所述审核任务对应的标注结果进行审核处理。本专利技术采用众包标注的形式进行知识加工,加工过程辅以机器学习进行自动抽取,通过人机结合的知识加工过程,形成有效的综合知识库。该技术只是将获取得到的知识进行标注处理,利用机器学习进行抽取,然而在抽取之后并未对抽取的碎片化知识进行归纳,如抽取的实体中存在相同的实体,只是表达方式不同。“电机”与“发电机”,二者指代的是同一实体,这时就需要进行本体对齐的操作,使二者进行合并为之后的知识融合做准备,从而得到更高的知识质量。本技术增加了本体对齐和知识融合技术,最终形成标准化、规范化的电机故障知识库。

技术实现思路

[0007]本专利技术旨在解决以上现有技术的问题。提出了一种提高电机故障解决效率的基于电机故障知识的众包采集系统及方法。本专利技术的技术方案如下:
[0008]一种基于电机故障知识的众包采集系统,其包括:数据采集模块、模型训练模块及知识构建模块;其中,
[0009]所述数据采集模块,用于通过人机交互收集专家关于电机故障知识的答案,并完成众包采集(通过多种途径收集数据)的任务;
[0010]所述模型训练模块:用于采用BIO标注:将每个元素标注为“B

X”、“I

X”或者“O”。其中,“B

X”表示此元素所在的片段属于X类型并且此元素在此片段的开头,“I

X”表示此元素所在的片段属于X类型并且此元素在此片段的中间位置,“O”表示不属于任何类型。标注法对爬取的电机故障文章进行标注并采用BERT(Transformer的双向编码器表征)模型进行训练,进行命名实体识别操作,从文章中提取关键实体,并将这些实体进行匹配,构建电机故障知识图谱;
[0011]所述知识构建模块:用于在系统知识训练之后,根据谓词(一种简单的库,用于解析,评估)和编辑距离进行匹配,将故障描述、故障元件、故障原因、故障解决方式、原文进行匹配,存入附表当中展示给用户,用户对这些抽取后的知识进行修改、增加、删除,用户确认修改后,将确认后的信息添加到数据库当中,形成故障知识库,将多种相同的故障的描述进行本体对齐,采用加权平均的方式将多个故障描述信息进行融合。
[0012]进一步的,所述数据采集模块中,人机交互部分主要分为三大模块:小程序部分、故障调查问卷部分、论文知识抽取部分。小程序部分用于用户手动或语音输入电机故障描述信息,故障调查问卷部分用于在网站上传故障描述文件并存入服务器,论文知识抽取部分用于将预测的知识抽取出来,将结果交给数据存储层。
[0013]进一步的,所述数据采集模块中小程序部分采用的是微信开发者工具进行开发,利用js开发方式,可以方便专家或者用户利用语音进行输入,一段故障描述性语句输入后直接存储到数据库中;
[0014]在管理员进行基础信息配置后,系统可以根据这些配置形成电机故障知识问卷;论文抽取部分通过django框架进行开发,通过上传文章采用BERT模型进行抽取之后,展示在网页界面之上,用户可以在网页上进行编辑,将最终结果存储到电机故障知识图谱中。
[0015]进一步的,所述模型训练模块中,采用BIO标注:将每个元素标注为“B

X”、“I

X”或
者“O”。其中,“B

X”表示此元素所在的片段属于X类型并且此元素在此片段的开头,“I

X”表示此元素所在的片段属于X类型并且此元素在此片段的中间位置,“O”表示不属于任何类型。标注法对爬取的电机故障文章进行标注并采用BERT(Transformer的双向编码器表征)模型进行训练,具体包括:
[0016]利用YEDDA标注工具将故障元件标注为B

ele,I
‑<本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于电机故障知识的众包采集系统,其特征在于,包括:数据采集模块、模型训练模块及知识构建模块;其中,所述数据采集模块,用于通过人机交互收集专家关于电机故障知识的答案,并完成众包采集即通过多种途径收集数据的任务;所述模型训练模块:用于采用BIO标注:将每个元素标注为“B

X”、“I

X”或者“O”,其中,“B

X”表示此元素所在的片段属于X类型并且此元素在此片段的开头,“I

X”表示此元素所在的片段属于X类型并且此元素在此片段的中间位置,“O”表示不属于任何类型;标注法对采集的电机故障文章进行标注并采用BERT Transformer的双向编码器表征模型进行训练,进行命名实体识别操作,从文章中提取关键实体,并将这些实体进行匹配,构建电机故障知识图谱;所述知识构建模块:用于在系统知识训练之后,根据谓词和编辑距离进行匹配,谓词是一种简单的库,用于解析和评估;将故障描述、故障元件、故障原因、故障解决方式、原文进行匹配,存入附表当中展示给用户,用户对这些抽取后的知识进行修改、增加、删除,用户确认修改后,将确认后的信息添加到数据库当中,形成故障知识库,将多种相同的故障的描述进行本体对齐,采用加权平均的方式将多个故障描述信息进行融合。2.根据权利要求1所述的一种基于电机故障知识的众包采集系统,其特征在于,所述数据采集模块中,人机交互部分主要分为三大模块:小程序部分、故障调查问卷部分、论文知识抽取部分;小程序部分用于用户手动或语音输入电机故障描述信息,故障调查问卷部分用于在网站上传故障描述文件并存入服务器,论文知识抽取部分用于将预测的知识抽取出来,将结果交给数据存储层。3.根据权利要求2所述的一种基于电机故障知识的众包采集系统,其特征在于,所述数据采集模块中小程序部分采用的是微信开发者工具进行开发,利用js开发方式,可以方便专家或者用户利用语音进行输入,一段故障描述性语句输入后直接存储到数据库中;在管理员进行基础信息配置后,系统可以根据这些配置形成电机故障知识问卷;论文抽取部分通过django框架进行开发,通过上传文章采用BERT Transformer的双向编码器表征模型进行抽取之后,展示在网页界面之上,用户可以在网页上进行编辑,将最终结果存储到电机故障知识图谱中。4.根据权利要求1所述的一种基于电机故障知识的众包采集系统,其特征在于,所述模型训练模块中,采用BIO标注:将每个元素标注为“B

X”、“I

X”或者“O”。其中,“B

X”表示此元素所在的片段属于X类型并且此元素在此片段的开头,“I

X”表示此元素所在的片段属于X类型并且此元素在此片段的中间位置,“O”表示不属于任何类型,标注法对采集的电机故障文章进行标注并采用BERT模型进行训练,具体包括:利用YEDDA标注工具将故障元件标注为B

ele,I

ele;故障描述标记为B

des,I

des;故障解决方案标注为B

solu,I

solu,其他标注为O;将文章中的信息标注后,导入BERT模型。BERT语言模型训练中,每个词都会赋予一个向量值;在模型训练初始阶段,会利用one

hot编码,随机为每个词赋一个初始值;这时模型会利用这个值进行矩阵计算,在维护三个矩阵的同时,三个矩阵也在进行点乘计算,计算结果与目标结果比对,两者的差距值作为损失,采用反向递归的方式逐步求导,并修改初始的赋值,最终得到每个词的词向量;矩阵计算公式如下所示:
MultiHead(Q,K,V)=Concat(head1,

,head
n
)w
o
其中,Q,K,V分别代表一个矩阵,每个字都在维护的三个矩阵。5.根据...

【专利技术属性】
技术研发人员:耿道渠周雷李海洋王平
申请(专利权)人:重庆邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1