一种基于电机故障知识的众包采集系统及方法技术方案

技术编号：33090233 阅读：63 留言：0更新日期：2022-04-15 11:02

本发明专利技术请求保护一种基于电机故障知识的众包采集系统及方法，属于知识图谱技术领域。系统包括数据采集模块：通过人机交互收集专家的答案，并完成众包采集的任务。人机交互部分主要分为三大模块：小程序部分、故障调查问卷部分、论文知识抽取部分。模型训练模块：使用的模型是BERT模型，主要用来进行命名实体识别任务，从文章中提取关键实体，并将这些实体匹配，构建电机故障知识图谱。知识构建模块：在系统知识训练之后，根据谓词和编辑距离进行匹配，将故障描述与故障的元件，故障解决方式，故障原因对应起来。通过以上技术，成功设计和实现电机故障知识众包知识采集系统，能够从各种文件格式中抽取电机故障知识，并构建电机故障知识库和知识图谱。识库和知识图谱。识库和知识图谱。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于电机故障知识的众包采集系统及方法

[0001]本专利技术属于知识图谱
，具体是涉及一种基于电机故障知识的众包采集方法及系统。

技术介绍

[0002]随着科技的不断进步和发展，各领域用到的电动机自动化程度逐渐提高，电动机的内部结构也逐渐趋于复杂化，针对不同场景的发电机的种类越来越多。包括水力发电机，涡轮发电机等，同时会有很多不同的型号的发电机。针对上述各种电机的维护与诊断是当下的难题。同时，电机作为各种生产领域内重要的动力设备，具有价格低廉、整体结构相对简单，较为可靠等优点，承担了现代工业、农业生产过程中80％以上的动能输出。尤其是在冶金、采矿、机械加工、轨道交通等工业生产领域，装机量巨大，应用广泛。电机及其相关的动力设备是企业的重要资产，其在运行过程中可靠性和稳定性是保障机械设备长时间安全、稳定运行的关键。
[0003]目前，许多电机的维护只有相关领域的专家才能掌握其对应电机的知识。这些知识碎片化，没有相关规范和行业标准，不具有相关领域的认证，无法正常使用，甚至会对发电机的故障知识整理与诊断造成严重的干扰。并且客户无法自身电机出现的问题提问并得到响应，在最短的时间内解决问题，来保证电机的安全性和运行稳定，减少由于电机故障而造成的损失。
[0004]因此，如何通过电机故障知识的众包采集方法及系统，科学的、快速的及准确的解决电机中的故障是非常有意义的。
[0005]经过检索，申请公开号CN112000791A，一种电机故障知识抽取系统及方法，尤其涉及神经网络模型对电机故障判断的技术领...

【技术保护点】

【技术特征摘要】
1.一种基于电机故障知识的众包采集系统，其特征在于，包括：数据采集模块、模型训练模块及知识构建模块；其中，所述数据采集模块，用于通过人机交互收集专家关于电机故障知识的答案，并完成众包采集即通过多种途径收集数据的任务；所述模型训练模块：用于采用BIO标注：将每个元素标注为“B
‑
X”、“I
‑
X”或者“O”，其中，“B
‑
X”表示此元素所在的片段属于X类型并且此元素在此片段的开头，“I
‑
X”表示此元素所在的片段属于X类型并且此元素在此片段的中间位置，“O”表示不属于任何类型；标注法对采集的电机故障文章进行标注并采用BERT Transformer的双向编码器表征模型进行训练，进行命名实体识别操作，从文章中提取关键实体，并将这些实体进行匹配，构建电机故障知识图谱；所述知识构建模块：用于在系统知识训练之后，根据谓词和编辑距离进行匹配，谓词是一种简单的库，用于解析和评估；将故障描述、故障元件、故障原因、故障解决方式、原文进行匹配，存入附表当中展示给用户，用户对这些抽取后的知识进行修改、增加、删除，用户确认修改后，将确认后的信息添加到数据库当中，形成故障知识库，将多种相同的故障的描述进行本体对齐，采用加权平均的方式将多个故障描述信息进行融合。2.根据权利要求1所述的一种基于电机故障知识的众包采集系统，其特征在于，所述数据采集模块中，人机交互部分主要分为三大模块：小程序部分、故障调查问卷部分、论文知识抽取部分；小程序部分用于用户手动或语音输入电机故障描述信息，故障调查问卷部分用于在网站上传故障描述文件并存入服务器，论文知识抽取部分用于将预测的知识抽取出来，将结果交给数据存储层。3.根据权利要求2所述的一种基于电机故障知识的众包采集系统，其特征在于，所述数据采集模块中小程序部分采用的是微信开发者工具进行开发，利用js开发方式，可以方便专家或者用户利用语音进行输入，一段故障描述性语句输入后直接存储到数据库中；在管理员进行基础信息配置后，系统可以根据这些配置形成电机故障知识问卷；论文抽取部分通过django框架进行开发，通过上传文章采用BERT Transformer的双向编码器表征模型进行抽取之后，展示在网页界面之上，用户可以在网页上进行编辑，将最终结果存储到电机故障知识图谱中。4.根据权利要求1所述的一种基于电机故障知识的众包采集系统，其特征在于，所述模型训练模块中，采用BIO标注：将每个元素标注为“B
‑
X”、“I
‑
X”或者“O”。其中，“B
‑
X”表示此元素所在的片段属于X类型并且此元素在此片段的开头，“I
‑
X”表示此元素所在的片段属于X类型并且此元素在此片段的中间位置，“O”表示不属于任何类型，标注法对采集的电机故障文章进行标注并采用BERT模型进行训练，具体包括：利用YEDDA标注工具将故障元件标注为B
‑
ele,I
‑
ele；故障描述标记为B
‑
des,I
‑
des；故障解决方案标注为B
‑
solu,I
‑
solu,其他标注为O；将文章中的信息标注后，导入BERT模型。BERT语言模型训练中，每个词都会赋予一个向量值；在模型训练初始阶段，会利用one
‑
hot编码，随机为每个词赋一个初始值；这时模型会利用这个值进行矩阵计算，在维护三个矩阵的同时，三个矩阵也在进行点乘计算，计算结果与目标结果比对，两者的差距值作为损失，采用反向递归的方式逐步求导，并修改初始的赋值，最终得到每个词的词向量；矩阵计算公式如下所示：
MultiHead(Q,K,V)＝Concat(head1,
…
,head
n
)w
o
其中，Q,K,V分别代表一个矩阵，每个字都在维护的三个矩阵。5.根据...

【专利技术属性】
技术研发人员：耿道渠，周雷，李海洋，王平，
申请(专利权)人：重庆邮电大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人