【技术实现步骤摘要】
基于遗传算法优化神经网络的露天矿知识图谱构建方法
[0001]本专利技术属于露天矿山稳定性评估
,具体涉及一种基于遗传算法优化神经网络的露天矿知识图谱构建方法。
技术介绍
[0002]露天矿边坡稳定性是露天开采领域研究的关键问题。如何针对不同的露天矿提出合理的边坡设计及稳定性控制方案,是采矿工程科学技术人员亟待解决的问题。露天矿边坡稳定性受多种因素的影响,灾害模式也比较复杂。露天矿边坡安全设计、管理和灾害预警防控目前存在诸多问题。大量的类比案例没有形成数据库和深度分析归纳,缺乏智能化的分析理论,或者给矿山的生产带来安全隐患,或者导致成本增加。因此需要构建案例库、知识库和专家系统,建立一种灾害多因素多模式识别数学模型例如深度学习知识图谱开展分析案例,进行案例聚类和模式匹配。
[0003]构建露天矿稳定性领域的灾害多因素模式的知识图谱的难点在于如何高效、高质量、快速地搭建。由于目前对矿业信息的获取大多来源于非结构的文本数据,所以想要搭建高质量的知识图谱就需要从非结构的文本数据中获取到准确的实体、关系和属性。准确地获取实体、关系和属性取决于命名实体识别模型和关系抽取模型的好坏。因此,设计出好的神经网络模型是非常关键的。神经网络模型的结构和超参数对模型效果起着关键的作用,大多数神经网络模型的结构和超参数都是通过手动设计的,对于没有专业知识的人员来说,很难设计出最佳的神经网络模型。
技术实现思路
[0004]针对现有技术中存在的问题,本专利技术提供一种基于遗传算法优化神经网络的露天矿知识图谱构建方 ...
【技术保护点】
【技术特征摘要】
1.一种基于遗传算法优化神经网络的露天矿知识图谱构建方法,其特征在于,该方法包括如下步骤:步骤1:获取露天矿灾害相关数据,包括灾害发生的原因、灾害发生的形式、灾害治理措施,灾害预防措施;步骤2:对露天矿灾害相关数据进行处理,构建命名实体识别数据集;步骤3:利用遗传算法对现有的BERT
‑
BILSTM
‑
CRF模型的结构和超参数进行优化,并利用所述命名实体识别数据集中的数据训练优化的BERT
‑
BILSTM
‑
CRF模型,获得命名实体识别模型;步骤4:根据所述露天矿灾害相关数据和所述命名实体识别模型,构建关系抽取标注数据集;步骤5:利用遗传算法对现有的BILSTM模型的结构和超参数进行优化,并利用所述关系抽取标注数据集中的数据训练优化的BILSTM模型,获得关系抽取模型;步骤6:将待抽取的露天矿灾害相关数据依次输入到所述命名实体识别模型和所述关系抽取模型进行实体关系抽取得到三元组,并存入Neo4j图数据库,构建露天矿知识图谱。2.根据权利要求1所述的基于遗传算法优化神经网络的露天矿知识图谱构建方法,其特征在于,所述对露天矿灾害相关数据进行处理,构建命名实体识别数据集的方法为:首先过滤掉露天矿灾害相关数据中的无效词汇以及敏感词汇;然后将数据处理为单个字存入数据集Word中;再然后采用BIO标注方式对数据集Word中的每个字分别标注,标签存入数据集Label中;最后将数据集Word中的每个字和数据集Label中与数据集Word中的每个字对应的标签分别打包成元组后组合在一起构成命名实体识别数据集。3.根据权利要求1所述的基于遗传算法优化神经网络的露天矿知识图谱构建方法,其特征在于,所述步骤3包括如下具体步骤:步骤3.1:为现有的BERT-BILSTM-CRF模型的每一个超参数设置初始化范围;步骤3.2:设置遗传算法的最大迭代次数与设置种群规模;步骤3.3:初始化个体:随机从上述每一个超参数的初始化范围内生成一个数值,利用所有生成的超参数的数值组成一个集合,表示一个个体;步骤3.4:通过构建与每个个体相对应的BERT
‑
BILSTM
‑
CRF模型确定每个个体的适应度;步骤3.5:根据每个个体的适应度,采用锦标赛选择算法选择出预设数量的优秀个体进入下一代;步骤3.6:每次从优秀个体中选择两个个体进行交叉操作;步骤3.7:对交叉操作后得到的新个体进行突变操作;步骤3.8:重复执行步骤3.4至步骤3.7,直到达到最大迭代次数,选取最大的适应度对应的BERT
‑
BILSTM
‑
CRF模型,获得命名实体识别模型。4.根据权利要求3所述的基于遗传算法优化神经网络的露天矿知识图谱构建方法,其特征在于,所述BERT-BILSTM-CRF模型的超参数包括结构超参数和训练超参数,其中结构超参数包括BILSTM层数和BILSTM隐藏层神经元数量,训练超参数包括时期epochs、批大小batch size、学习率和优化器。5.根据权利要求3所述的基于遗传算法优化神经网络的露天矿知识图谱构建方法,其
特征在于,所述确定每个个体的适应度的方法为:在确定每个个体的适应度时,首先将个体中的数值解析成BERT
‑
BILSTM
‑
CRF模型对应部分的超参数,根据解析出的超参数及其对应的数值构建出与每个个体相对应的BERT
‑
BILSTM
‑
CRF模型;然后,利用命名实体识别数据集中的数据对每个个体所...
【专利技术属性】
技术研发人员:马连博,尹海源,王经纬,王兴伟,黄敏,
申请(专利权)人:东北大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。