【技术实现步骤摘要】
一种电机故障知识抽取系统及方法
本专利技术是一种电机故障知识抽取系统及方法,尤其涉及神经网络模型对电机故障判断的
技术介绍
研究分析国内外大型设备故障诊断技术和应用现状的基础上,为了提供给客户更好的技术支持。为了保证客户的问题能够得到快速的解决,推出电机故障知识抽取系统,客户可以根据自身电机出现的问题提问并得到响应,在最短的时间内解决客户的问题,保证了电机的安全性和运行稳定,减少由于电机故障而造成的损失。在上述背景下,结合当下流行的自然语言处理技术、谷歌新提出的Bert模型、以及其他相关技术开发一套“电机故障知识抽取系统”。随着我国当下电力事业的大力发展,电机的种类越来越多,构造也越来越复杂,无论是电机的硬件参数还是容量都大幅度得到了提升,因此电机安全维护的要求越来越高,难度也越来越大。项目主要任务是为哈电集团搭建与用户交互平台,可以针对用户的不同需求做出应答,在远程为客户提供服务。本课题也是该项目中的核心部分,通过采集当下已有的电机故障知识形成故障知识库,为电机的安全和稳定提供了技术上的支持。本专利技术的目的为电机故障知识抽取,类属于基于知识的诊断方法,国内外也有类似的研究,但大多数都采用陈旧的训练模型比如word2vec,或者之前的神经网络模型,而谷歌最近新出的Bert模型大大提高的训练的精准度和召回率,在电机故障诊断方面还没有融入,而本专利技术就是运用此模型的优势来强化已有的故障诊断系统。当下电机故障知识库知识构建主要来源于相关专业人士的实际工作经验,但这些经验往往有所不同,并 ...
【技术保护点】
1.一种电机故障知识抽取系统,其特征在于:该系统包括数据采集模块,数据预处理模块,辅助训练工具模块、模型训练模块和知识融合模块;/n所述的数据采集模块负责采集故障数据后发送给数据预处理模块;/n所述的数据预处理模块将采集后的数据进行预处理;/n所述的辅助训练工具模块抽取相关的系统配套程序;/n所述的模型训练模块与数据预处理模块连接,将预处理的数据进行模型训练;/n所述的模型训练模块和所述的知识融合模块连接,将预处理的数据进行最后的融合处理。/n
【技术特征摘要】
1.一种电机故障知识抽取系统,其特征在于:该系统包括数据采集模块,数据预处理模块,辅助训练工具模块、模型训练模块和知识融合模块;
所述的数据采集模块负责采集故障数据后发送给数据预处理模块;
所述的数据预处理模块将采集后的数据进行预处理;
所述的辅助训练工具模块抽取相关的系统配套程序;
所述的模型训练模块与数据预处理模块连接,将预处理的数据进行模型训练;
所述的模型训练模块和所述的知识融合模块连接,将预处理的数据进行最后的融合处理。
2.根据权利要求1所述的一种电机故障知识抽取系统,其特征在于:数据采集模块与手机端和PC端两部分建立连接,PC端为手机端提供接口,其中手机端主要采用了微信小程序开发,主要包含业务逻辑模块、知识展示模块和知识作答模块三大主要功能模块:
业务逻辑模块,主要包含电机相关专家业务注册、登录等业务;
知识展示模块,向用户展示电机故障知识问卷,同时包括已经作答的问卷;
知识作答模块,支持用户选择自己感兴趣电机故障知识问卷并作答,作答结果提交后保存到后台。
3.根据权利要求1所述的一种电机故障知识抽取系统,其特征在于:
所述的数据采集模块包括注册信息模块、用户数据采集模块和文献数据采集模块;
其中用户数据采集模块所需的用户部分的数据从注册信息模块采集;
所述的数据预处理模块包括文本格式转换模块,文本编码转换模块和文本规范化模块;
所述的辅助训练工具模块包括文本分类工具、数据标注工具、数据库监听工具和数据爬取工具;
所述的模型训练模块中的模型为BERT模型;
所述的知识融合模块包括知识预处理模块、属性相似度连接模块和知识嵌入及分块匹配模块。
4.根据权利要求3所述的一种电机故障知识抽取系统,其特征在于:所述的知识预处理模块包括语法预处理模块和文本预处理模块两部分。
5.一种电机故障知识抽取方法,由上述权利要求1-4任一一项所述的系统作为支持而实现的,其特征在于:方法步骤如下:
步骤一,所述的数据采集模块中,用户和管理员通过所述的注册信息模块对各自的信息进行注册,用户上传个人信息或对问卷的答案至所述的用户数据采集模块由管理员进行处理,所述的文献数据采集模块选择资料中的数据作为该系统的训练模型支持;
步骤二,所述的数据预处理模块中,文本格式转换模块将不同种类的电机故障的文本格式进行统一处理,所述的文本编码转换模块将不同种类的文本编码进行统一编码,所述的文本规范化模块将文本用标签进行标注后通过辅助训练工具模块进行处理;
步骤三,通过所述的辅助训练工具模块对步骤二中得到的标签进行降低开发难度的处理,包括所述的文本分类工具进行文本中噪音降噪、用户通过所述的数据标注工具进行回答、所述的数据库监听工具对用户的回答进行数据监听以及所述的数据爬取工具对电机故障的文章的爬取;
步骤四,所述的模型训练模块中模型,利用BERT模型的底层结构Transformer结构模型,通过自注意力机制进行电机故障知识抽取结果对比分析;
步骤五,所述的知识融合模块在数据对齐后进行实体匹配,其包括所述的知识预处理模块对上述获得的知识数据进行预处理,所述的属性相似度连接模块对知识数据的相似度进行计算,以及知识嵌入及分块匹配模块进行实体匹配、过滤从而完备知识图谱。
6.根据权利要求5所述的一种电机故障知识抽取方法,其特征在于:所述的数据采集模块包括注册信息、用户数据采集和文献数据采集功能构成,具体步骤如下:
步骤一一,所述的注册信息模块具有相同的后台的手机端和PC端,无论用户在PC端或在手机端都是使用相同的ID和相同的登录注册信息,共享相关数据并使用相同的ID,每一次系统都会根据这个ID进行判断,并根据这个ID进行登记和保存;
当管理员在PC端配置好相关基本信息之后,同时形成标准问卷,这些前期准备工作两者同时使用,虽然管理员只能在PC端进行配置,但配置结果同时在PC端和手机端两个部分使用;
步骤一二,所述的用户数据采集主要方式为用户通过微信小程序上传自己问卷的答案,用户通过回答问卷的方式作答,由PC端支持文件进行上传,或者用语音说出故障的解决方案,语音输入由微信小程序支持进行上传;
步骤一三,管理员还需要提醒用户在规定时间内完成电机故障知识问卷,采用邮件通知的方式,及时发放和收集问卷;调用电机故障知识抽取系统的接口进行处理;所有用户的答案都需要管理员确认,同时所有用户都会收到管理员的通知信息,无论在手机端或PC端上回答问卷之后都会进行保存上传,提交至后台,所以用户只需任选一个平台仅作答一次即可,在作答之后都会交给管理员进行审核,审核之后决定是否通过并融合到知识库当中;
步骤一四,所述的文献数据采集模块,知识数据的来源除了电机故障专家的答案之外还包括已有的专业化文献,这些文献提供的电机故障知识,用来训练模型。
7.根据权利要求5所述的一种电机故障知识抽取方法,其特征在于:所述的数据预处理模块中包括文本格式转换、文本编码转换和文本规范化功能,具体步骤如下:
步骤二一,所述的文本格式转换模块将来源为《大电机技术》文章的数据,通过爬虫工具采集近三年与电机故障有关的文章,并将文章格式统一转换成数字化的txt格式,将文件进行数字化处理,形成符合标准的数字化格式文件,并交给模型进行处理;
步骤二二,所述的文本编码转换模块将文本统一进行转码处理,在转码过程中需要先利用原有的编码方式进行解码,变成统一的编码格式,最终形成标准统一的编码格式,以便后续步骤的数据处理;
步骤二三,所述的文本规范化模块中,为了制作模型的tfrecord,要按照模型的输入进行文本格式的修改,在训练之前在每一个字的上面打一个标签,中间以空格隔开,作为模型的输入,这些标签分别代表需要抽取的故障描述、故障元件和故障解决方式,在标注并按照对应格式输入之后模型开始训练。
8.根据权利要求5所述的一种电机故障知识抽取方法,其特征在于:所述的辅助训练工具模块中包括文本分类工具、数据标注工具、数据库监听工具和数据爬取工具,具体操作步骤如下:
步骤三一,所述的文本分类工具为了去除文本中相关干扰项,首先系统核心是抽取文本中相关电机故障,鉴定为干扰项的杂音,利用TF-IDF模型利用其二分类的任务对文章进行初筛而剔除,将上传的文本分类为相关文本和不相关文本;
步骤三二,在得出该文本为不相关文本时,提醒用户并且不会继续向下进行;当该文本为...
【专利技术属性】
技术研发人员:王克剑,毛静轩,苗东旭,姜漫利,曲晓峰,赵明,傅磊,张德阳,
申请(专利权)人:哈电发电设备国家工程研究中心有限公司,
类型:发明
国别省市:黑龙江;23
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。