当前位置: 首页 > 专利查询>东北大学专利>正文

基于遗传算法优化神经网络的露天矿知识图谱构建方法技术

技术编号:30546154 阅读:23 留言:0更新日期:2021-10-30 13:24
本发明专利技术公开了一种基于遗传算法优化神经网络的露天矿知识图谱构建方法,属于露天矿山稳定性评估技术领域。包括:获取露天矿灾害相关数据并对其进行处理构建命名实体识别数据集;利用遗传算法对现有BERT

【技术实现步骤摘要】
基于遗传算法优化神经网络的露天矿知识图谱构建方法


[0001]本专利技术属于露天矿山稳定性评估
,具体涉及一种基于遗传算法优化神经网络的露天矿知识图谱构建方法。

技术介绍

[0002]露天矿边坡稳定性是露天开采领域研究的关键问题。如何针对不同的露天矿提出合理的边坡设计及稳定性控制方案,是采矿工程科学技术人员亟待解决的问题。露天矿边坡稳定性受多种因素的影响,灾害模式也比较复杂。露天矿边坡安全设计、管理和灾害预警防控目前存在诸多问题。大量的类比案例没有形成数据库和深度分析归纳,缺乏智能化的分析理论,或者给矿山的生产带来安全隐患,或者导致成本增加。因此需要构建案例库、知识库和专家系统,建立一种灾害多因素多模式识别数学模型例如深度学习知识图谱开展分析案例,进行案例聚类和模式匹配。
[0003]构建露天矿稳定性领域的灾害多因素模式的知识图谱的难点在于如何高效、高质量、快速地搭建。由于目前对矿业信息的获取大多来源于非结构的文本数据,所以想要搭建高质量的知识图谱就需要从非结构的文本数据中获取到准确的实体、关系和属性。准确地获取实体、关系和属性取决于命名实体识别模型和关系抽取模型的好坏。因此,设计出好的神经网络模型是非常关键的。神经网络模型的结构和超参数对模型效果起着关键的作用,大多数神经网络模型的结构和超参数都是通过手动设计的,对于没有专业知识的人员来说,很难设计出最佳的神经网络模型。

技术实现思路

[0004]针对现有技术中存在的问题,本专利技术提供一种基于遗传算法优化神经网络的露天矿知识图谱构建方法。
[0005]本专利技术的技术方案是:
[0006]一种基于遗传算法优化神经网络的露天矿知识图谱构建方法,该方法包括如下步骤:
[0007]步骤1:获取露天矿灾害相关数据,包括灾害发生的原因、灾害发生的形式、灾害治理措施,灾害预防措施;
[0008]步骤2:对露天矿灾害相关数据进行处理,构建命名实体识别数据集;
[0009]步骤3:利用遗传算法对现有的BERT

BILSTM

CRF模型的结构和超参数进行优化,并利用所述命名实体识别数据集中的数据训练优化的BERT

BILSTM

CRF模型,获得命名实体识别模型;
[0010]步骤4:根据所述露天矿灾害相关数据和所述命名实体识别模型,构建关系抽取标注数据集;
[0011]步骤5:利用遗传算法对现有的BILSTM模型的结构和超参数进行优化,并利用所述关系抽取标注数据集中的数据训练优化的BILSTM模型,获得关系抽取模型;
[0012]步骤6:将待抽取的露天矿灾害相关数据依次输入到所述命名实体识别模型和所述关系抽取模型进行实体关系抽取得到三元组,并存入Neo4j图数据库,构建露天矿知识图谱。
[0013]进一步地,根据所述的基于遗传算法优化神经网络的露天矿知识图谱构建方法,所述对露天矿灾害相关数据进行处理,构建命名实体识别数据集的方法为:首先过滤掉露天矿灾害相关数据中的无效词汇以及敏感词汇;然后将数据处理为单个字存入数据集Word中;再然后采用BIO标注方式对数据集Word中的每个字分别标注,标签存入数据集Label中;最后将数据集Word中的每个字和数据集Label中与数据集Word中的每个字对应的标签分别打包成元组后组合在一起构成命名实体识别数据集。
[0014]进一步地,根据所述的基于遗传算法优化神经网络的露天矿知识图谱构建方法,所述步骤3包括如下具体步骤:
[0015]步骤3.1:为现有的BERT-BILSTM-CRF模型的每一个超参数设置初始化范围;
[0016]步骤3.2:设置遗传算法的最大迭代次数与设置种群规模;
[0017]步骤3.3:初始化个体:随机从上述每一个超参数的初始化范围内生成一个数值,利用所有生成的超参数的数值组成一个集合,表示一个个体;
[0018]步骤3.4:通过构建与每个个体相对应的BERT

BILSTM

CRF模型确定每个个体的适应度;
[0019]步骤3.5:根据每个个体的适应度,采用锦标赛选择算法选择出预设数量的优秀个体进入下一代;
[0020]步骤3.6:每次从优秀个体中选择两个个体进行交叉操作;
[0021]步骤3.7:对交叉操作后得到的新个体进行突变操作;
[0022]步骤3.8:重复执行步骤3.4至步骤3.7,直到达到最大迭代次数,选取最大的适应度对应的BERT

BILSTM

CRF模型,获得命名实体识别模型。
[0023]进一步地,根据所述的基于遗传算法优化神经网络的露天矿知识图谱构建方法,所述BERT-BILSTM-CRF模型的超参数包括结构超参数和训练超参数,其中结构超参数包括BILSTM层数和BILSTM隐藏层神经元数量,训练超参数包括时期epochs、批大小batch size、学习率和优化器。
[0024]进一步地,根据所述的基于遗传算法优化神经网络的露天矿知识图谱构建方法,所述确定每个个体的适应度的方法为:在确定每个个体的适应度时,首先将个体中的数值解析成BERT

BILSTM

CRF模型对应部分的超参数,根据解析出的超参数及其对应的数值构建出与每个个体相对应的BERT

BILSTM

CRF模型;然后,利用命名实体识别数据集中的数据对每个个体所对应的BERT

BILSTM

CRF模型进行训练、验证与测试,每个个体所对应的BERT

BILSTM

CRF模型测试后都会得到F1值,将每个F1值作为对应个体的适应度。
[0025]进一步地,根据所述的基于遗传算法优化神经网络的露天矿知识图谱构建方法,所述每次从优秀个体中选择两个个体进行交叉操作的方法为:采用两点交叉方式,随机生成两个交叉点作为个体交叉的开始位置和个体交叉的结束位置,然后对在两个交叉点之间的部分染色体进行交叉操作。
[0026]进一步地,根据所述的基于遗传算法优化神经网络的露天矿知识图谱构建方法,所述对交叉操作后的新个体进行突变操作的方法为:首先设置个体中每个对应位置的超参
数的突变概率为P、针对每个对应位置的超参数生成一个[0,1]的随机数,如果生成的随机数小于或者等于P,则对当前位置的超参数进行突变操作,突变方式为从预设的每一个超参的初始化范围内重新生成一个随机数代替当前位置的超参数值;如果生成的随机数大于P,则不对当前位置的超参数进行突变操作。
[0027]进一步地,根据所述的基于遗传算法优化神经网络的露天矿知识图谱构建方法,所述步骤4包括如下具体步骤:
[0028]步骤4.1:将露天矿灾害相关数据中的文本拆分成单个句子得到相应的句子数据集Sentence={sente本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于遗传算法优化神经网络的露天矿知识图谱构建方法,其特征在于,该方法包括如下步骤:步骤1:获取露天矿灾害相关数据,包括灾害发生的原因、灾害发生的形式、灾害治理措施,灾害预防措施;步骤2:对露天矿灾害相关数据进行处理,构建命名实体识别数据集;步骤3:利用遗传算法对现有的BERT

BILSTM

CRF模型的结构和超参数进行优化,并利用所述命名实体识别数据集中的数据训练优化的BERT

BILSTM

CRF模型,获得命名实体识别模型;步骤4:根据所述露天矿灾害相关数据和所述命名实体识别模型,构建关系抽取标注数据集;步骤5:利用遗传算法对现有的BILSTM模型的结构和超参数进行优化,并利用所述关系抽取标注数据集中的数据训练优化的BILSTM模型,获得关系抽取模型;步骤6:将待抽取的露天矿灾害相关数据依次输入到所述命名实体识别模型和所述关系抽取模型进行实体关系抽取得到三元组,并存入Neo4j图数据库,构建露天矿知识图谱。2.根据权利要求1所述的基于遗传算法优化神经网络的露天矿知识图谱构建方法,其特征在于,所述对露天矿灾害相关数据进行处理,构建命名实体识别数据集的方法为:首先过滤掉露天矿灾害相关数据中的无效词汇以及敏感词汇;然后将数据处理为单个字存入数据集Word中;再然后采用BIO标注方式对数据集Word中的每个字分别标注,标签存入数据集Label中;最后将数据集Word中的每个字和数据集Label中与数据集Word中的每个字对应的标签分别打包成元组后组合在一起构成命名实体识别数据集。3.根据权利要求1所述的基于遗传算法优化神经网络的露天矿知识图谱构建方法,其特征在于,所述步骤3包括如下具体步骤:步骤3.1:为现有的BERT-BILSTM-CRF模型的每一个超参数设置初始化范围;步骤3.2:设置遗传算法的最大迭代次数与设置种群规模;步骤3.3:初始化个体:随机从上述每一个超参数的初始化范围内生成一个数值,利用所有生成的超参数的数值组成一个集合,表示一个个体;步骤3.4:通过构建与每个个体相对应的BERT

BILSTM

CRF模型确定每个个体的适应度;步骤3.5:根据每个个体的适应度,采用锦标赛选择算法选择出预设数量的优秀个体进入下一代;步骤3.6:每次从优秀个体中选择两个个体进行交叉操作;步骤3.7:对交叉操作后得到的新个体进行突变操作;步骤3.8:重复执行步骤3.4至步骤3.7,直到达到最大迭代次数,选取最大的适应度对应的BERT

BILSTM

CRF模型,获得命名实体识别模型。4.根据权利要求3所述的基于遗传算法优化神经网络的露天矿知识图谱构建方法,其特征在于,所述BERT-BILSTM-CRF模型的超参数包括结构超参数和训练超参数,其中结构超参数包括BILSTM层数和BILSTM隐藏层神经元数量,训练超参数包括时期epochs、批大小batch size、学习率和优化器。5.根据权利要求3所述的基于遗传算法优化神经网络的露天矿知识图谱构建方法,其
特征在于,所述确定每个个体的适应度的方法为:在确定每个个体的适应度时,首先将个体中的数值解析成BERT

BILSTM

CRF模型对应部分的超参数,根据解析出的超参数及其对应的数值构建出与每个个体相对应的BERT

BILSTM

CRF模型;然后,利用命名实体识别数据集中的数据对每个个体所...

【专利技术属性】
技术研发人员:马连博尹海源王经纬王兴伟黄敏
申请(专利权)人:东北大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1