基于卷积神经网络的盾构机故障类型构建及故障诊断方法技术

技术编号:36982990 阅读:13 留言:0更新日期:2023-03-25 18:01
本发明专利技术公开了一种基于卷积神经网络的盾构机故障类型构建及故障诊断方法,该方法从半结构化的盾构机故障记录文本开始,形式化盾构机故障记录文本数据;其次利用正则表达式分割故障记录文本,实现盾构机故障记录文本的语料库结构化存储;其三对故障记录文本做谱聚类,分析每一故障簇数据的共同点并制定合适的标签,其四,提出EDA与回译串行混增数据增强方法对有标签的故障记录文本做数据增强,以增加数据量,解决故障特征不平衡问题;最后实现基于word2vec的CNN盾构机故障文本分类模型,完成对盾构机故障记录文本的智能分类。本发明专利技术方法可用于盾构故障文本记录文本数据的结构化存储和智能分类。储和智能分类。储和智能分类。

【技术实现步骤摘要】
基于卷积神经网络的盾构机故障类型构建及故障诊断方法


[0001]本专利技术涉及故障类型构建及故障诊断,更特别地说,是指一种基于卷积神经网络的盾构机故障类型构建及故障诊断方法。

技术介绍

[0002]盾构隧道掘进机,简称盾构机(Shield Machine)。它是一种软土隧道掘进的专用工程机械。随着我国城市化建设的需要,各大城市陆续开展地铁建设工程。盾构法因有对周围环境影响小、掘进速度快、工程质量高、作业安全环保、适用范围广等优势,在地铁隧道建设中得到了广泛应用。由于盾构机系统(如图1所示)复杂,工作环境恶劣,在工程作业中积累了很多盾构机故障数据。盾构机故障数据一般以半结构化的盾构机故障记录文本的形式保存,然而以文本(text)为载体的盾构故障记录数据难以有效进行语料库(corpus)中存储和分析,这就迫切需要通过统计自然语言处理技术(Natural Language Processing,NLP)和文本数据分析技术实现盾构故障文本记录数据的结构化存储和智能分类。
[0003]目前针对盾构机故障记录文本的存储和分类主要依靠人工进行,人工在处理盾构机故障记录文本数据时存在以下三点不足:
[0004](A)速度缓慢,人工操作进行盾构机故障记录文本数据的存储和分类远低于计算机处理速度,会耗费大量时间。
[0005](B)准确度较低,盾构机故障记录文本数据按不同的标准可以分为多种类别,且受限于工作人员的知识水平,正确分类每一条故障文本数据是十分困难的,且长时间重复性工作会降低人的判断能力,进一步增加错误分类的风险。
[0006](C)一致性较差,不同工作人员的认知与知识上的差异会使得盾构机故障记录数据存储与分类呈现多样性的结果,不利于后续的文本数据分析工作。
[0007]综上所述,目前人工处理盾构机故障记录文本数据尚无法完成高效率的结构化统一存储和分类。

技术实现思路

[0008]为了解决人工处理盾构机故障记录文本数据效率低,效果差的问题,另外人工处理的盾构机故障数据无法实现在语料库中进行自动学习的问题。本专利技术提出一种基于卷积神经网络的盾构机故障类型构建及故障诊断方法。本专利技术构建盾构机故障类型方法首先通过正则表达式(Regular Expression,RE)将故障文本按内容分割为固定条目,进行结构化故障类存储;其次,采用谱聚类(Spectral Clustering)算法对盾构机故障记录文本数据进行聚类,获得不同分类的故障数据簇;其三,对聚类产生的各类故障数据簇进行打标签;其四,针对各故障数据簇数据量不平衡的问题,采用简易数据增强(Easy Data Augmentation,EDA)与回译串行混合增强方法将各类标签数据增强到同一数量,得到训练数据集;其五,将故障训练数据集喂入卷积神经网络(Convolutional Neural Networks,CNN)进行故障文本分类模型的训练,得到盾构机故障分类模型FSM;最后利用盾构机故障分
类模型FSM对盾构机故障记录文本数据进行智能分类并按类存储。
[0009]本专利技术的一种基于卷积神经网络的盾构机故障类型的构建方法,其包括的步骤有:
[0010]步骤一,形式化盾构机故障记录文本;
[0011]任意一个盾构机故障记录文本TEXT
i
记录着盾构机故障的相关信息;一个故障记录文本TEXT
i
记录着一个故障内容情况或多个故障内容情况;因此,一个故障记录文本TEXT
i
由一条故障内容或多条故障内容组成;
[0012]故障内容,记为CONTENT;任意一个故障记录文本TEXT
i
中存在的故障内容采用集合形式表示为故障内容集且
[0013]步骤二,基于正则表达式的盾构机故障记录文本结构化存储;
[0014]将所述包含的字段内容记为故障-字段内容
[0015]所述
[0016]将故障-字段内容作为正则表达式构建内
容的元素,设置的故障-正则表达式内容记为
[0017]步骤三,谱聚类分析盾构机故障记录文本数据;
[0018]通过调用scikit

learn的类库中的sklearn.cluster.SpectralClustering实现了基于Ncut的谱聚类;
[0019]输入层为盾构机故障记录文本数据集FTS={TEXT1,TEXT2,

,TEXT
i
,

,TEXT
m
};
[0020]基于Ncut的谱聚类需要调整的参数有:
[0021]谱聚类的维数为x;
[0022]全连接法的聚类为affinity;
[0023]核函数参数为gm;
[0024]谱聚类的输出结果中,采用集合的形式表达被划分为同一故障簇的盾构机故障记录文本数据集标记为{C},同一故障簇的划分集合,记为CTS
x
,且CTS
x
={{C1},{C2},

,{C
x
}};
[0025]步骤四,打标盾构机故障;
[0026]盾构机故障记录文本数据包含多种标签,采用集合形式表达标签集为T_LABEL,且T_LABEL={LABEL1,LABEL2,

,LABEL
k
,

,LABEL
z
};
[0027]对聚类结果CTS
x
={{C1},{C2},

,{C
x
}}中的每一故障簇数据进行分析,归纳出同一故障簇盾构机故障记录数据蕴含的共同点,为各故障簇数据设定符合的LABEL;则有,标注完好的盾构机故障记录文本数据集,记为CTS_LABEL
x
,且
[0028]步骤五,基于EDA与回译的盾构机故障记录文本数据混合增强;
[0029]步骤501,将一个有标签的盾构机故障记录文本作为输入,为避免增强过程中文本的标签信息被改变,首先将的标签摘除,分为TEXT
i
和LABEL
k
两部分;
[0030]步骤502,将TEXT
i
输入到EDA增强模块中进行数据增强,得到的一次增强数据输入到回译增强模块进行二次增强,二次增强后得到的故障文本数据以集合形式表达为AUG_TEXTS,且AUG_TEXTS={TEXT
i_1
,TEXT
i_2
,

,TEXT
i_19
,TEXT
i_ω
},ω表示二次增强的故障条数;
[0031]步骤503,将原标签LABEL
k
添加至AUG_TEXTS中的每个文本中,得到的有标签的盾构机故障记录文本增强数据以集合的形式表达为且
[0032]任意中包含的文本的数量本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于卷积神经网络的盾构机故障类型的构建方法,其特征在于包括的步骤有:步骤一,形式化盾构机故障记录文本;任意一个盾构机故障记录文本TEXT
i
记录着盾构机故障的相关信息;一个故障记录文本TEXT
i
记录着一个故障内容情况或多个故障内容情况;因此,一个故障记录文本TEXT
i
由一条故障内容或多条故障内容组成;故障内容,记为CONTENT;任意一个故障记录文本TEXT
i
中存在的故障内容采用集合形式表示为故障内容集且且表示属于TEXT
i
的第1条故障内容;表示属于TEXT
i
的第2条故障内容;表示属于TEXT
i
的第j条故障内容;下角标j表示故障内容的标识号;表示属于TEXT
i
的最后一条故障内容;下角标n表示故障内容的总数;步骤二,基于正则表达式的盾构机故障记录文本结构化存储;将所述包含的字段内容记为故障-字段内容所述project表示项目名称,即故障记录所属的项目名称;shield_num表示盾构机编号,即故障记录中的盾构机编号;problem表示问题(故障)名称,即故障记录中的问题(故障)名称;description表示简要描述,即故障记录中对故障的简要描述;analysis表示原因分析,即故障记录中对故障的原因分析;solution表示解决过程及措施,即对故障的解决过程及措施;partner表示主要参与人员,即故障处理的主要参与人员;summary表示小结,即故障记录的小结;recorder表示记录人,即故障记录文本的记录人;
将故障-字段内容作为正则表达式构建内容的元素,设置的故障-正则表达式内容记为步骤三,谱聚类分析盾构机故障记录文本数据;通过调用scikit

learn的类库中的sklearn.cluster.SpectralClustering实现了基于Ncut的谱聚类;输入层为盾构机故障记录文本数据集FTS={TEXT1,TEXT2,

,TEXT
i
,

,TEXT
m
};基于Ncut的谱聚类需要调整的参数有:谱聚类的维数为x;全连接法的聚类为affinity;核函数参数为gm;谱聚类的输出结果中,采用集合的形式表达被划分为同一故障簇的盾构机故障记录文本数据集标记为{C},同一故障簇的划分集合,记为CTS
x
,且CTS
x
={{C1},{C2},

,{C
x
}};{C1}表示被聚类为第一故障簇的盾构机故障记录文本数据的集合;{C2}表示被聚类为第二故障簇的盾构机故障记录文本数据的集合;{C
x
}表示被聚类为第x故障簇的盾构机故障记录文本数据的集合;步骤四,打标盾构机故障;盾构机故障记录文本数据包含多种标签,采用集合形式表达标签集为T_LABEL,且T_LABEL={LABEL1,LABEL2,

,LABEL
k
,

,LABEL
z
};LABEL1表示第一类盾构机故障标签;LABEL2表示第二类盾构机故障标签;LABEL
k
表示第k类盾构机故障标签;LABEL
z
表示最后一类盾构机故障标签;
对聚类结果CTS
x
={{C1},{C2},

,{C
x
}}中的每一故障簇数据进行分析,归纳出同一故障簇盾构机故障记录数据蕴含的共同点,为各故障簇数据设定符合的LABEL;则有,标注完好的盾构机故障记录文本数据集,记为CTS_LABEL
x
,且,且表示标签LABEL1赋予{C1}中的每个故障文本;表示标签LABEL2赋予{C2}中每个故...

【专利技术属性】
技术研发人员:魏巍姜川
申请(专利权)人:北京航空航天大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1