岩石描述文本的质检方法、装置、设备及介质制造方法及图纸

技术编号:35696144 阅读:15 留言:0更新日期:2022-11-23 14:47
本申请公开了一种岩石描述文本的质检方法、装置、设备及介质,其中,该方法包括:获取待检测岩石描述文本;将待检测岩石描述文本输入岩石知识提取模型,用于获取岩石类型信息和岩石知识三元组;基于岩石知识图谱,对岩石知识三元组进行一致性比对,获取岩石知识比对结果;若岩石知识比对结果为比对结果一致,则基于岩石知识图谱,获取同时具备岩石类型信息中记载的所有特征的岩石类型匹配数目;若岩石类型匹配数目的结果为一,则确认待检测岩石描述文本为质检合格文本;若所述岩石类型匹配数目的结果大于一,则推送匹配岩石类型间的鉴定知识。该方法可有效保障岩石观察描述文本的完整性和准确性。性和准确性。性和准确性。

【技术实现步骤摘要】
岩石描述文本的质检方法、装置、设备及介质


[0001]本专利技术涉及地球科学
,尤其涉及一种岩石描述文本的质检方法、装置、设备及介质。

技术介绍

[0002]地质调查(geological survey),泛指一切以地质现象(岩石以及矿产等)为对象,以地质学及其相关科学为指导,以观察研究为基础的调查工作。地质调查工作成果,是制定国家和地区地质工作计划,满足如矿产预测、矿产普查、水文地质、工程地质、环境地质、地质勘查等社会需求,以及为国土开发、整治、规划等提供重要依据。
[0003]岩石描述文本质检是实现地质调查高质量发展的重要一环,其中野外岩石描述文本的实时自动质检对于提高野外地质调查质量具有重要意义。
[0004]地质调查专业性强。一般合格的地质调查人员均需要较长时间的培养。同时,野外地质现象变化大,涉及的知识点广,地质调查人员难以实现专业知识的全面覆盖。以往地质调查过程中产生的岩石描述文本采用人工审核且随机抽检的方式。但随机抽检的方式往往以偏概全,质控效果不佳且不具实时性。

技术实现思路

[0005]本专利技术实施例提供一种岩石描述文本的质检方法、装置、设备及介质,以解决采用人工审核且随机抽检方式的岩石描述文本的质控效果不佳且不具实时性的问题。
[0006]一种岩石描述文本的质检方法,包括:获取待检测岩石描述文本;将待检测岩石描述文本输入岩石知识提取模型,用于获取岩石类型信息和岩石知识三元组;基于岩石知识图谱,对岩石知识三元组进行一致性比对,获取岩石知识比对结果;若岩石知识比对结果为比对结果一致,则基于岩石知识图谱,获取同时具备岩石类型信息中记载的所有特征的岩石类型匹配数目;若岩石类型匹配数目的结果为一,则确认待检测岩石描述文本为质检合格文本;若所述岩石类型匹配数目的结果大于一,则推送匹配岩石类型间的鉴定知识。
[0007]进一步地,该岩石描述文本的质检方法中,在获取岩石类型信息和岩石知识三元组之前,还包括:获取岩石知识提取模型输出的待检测岩石命名实体信息;基于待检测岩石命名实体信息,对待检测岩石描述文本进行实体位置标记,获取实体位置标记结果;将待检测岩石描述文本和实体位置标记结果输入实体间关系分类模型,用于获取待检测命名实体间关系信息。
[0008]进一步地,该岩石描述文本的质检方法中,实体间关系分类模型包括基于增强
BERT的已训练关系分类模型;在将待检测岩石描述文本和实体位置标记结果输入实体间关系分类模型之前,还包括:获取第一训练集,第一训练集包括输入岩石描述语料和实体间预期关系分类结果;将第一训练集中的输入岩石描述语料输入待训练关系分类模型中,用于获取关系分类模型响应输出的关系分类预测结果;通过第一损失函数比较预测关系分类结果和实体间预期关系分类结果是否一致;迭代调整待训练关系分类模型各节点的可训练参数,直至第一损失函数达到最小值时结束,用于获取已训练关系分类模型。
[0009]进一步地,该岩石描述文本的质检方法中,将待检测岩石描述文本输入岩石知识提取模型,用于获取岩石类型信息和岩石知识三元组,包括:将待检测岩石描述文本输入岩石知识提取模型,用于获取待检测岩石命名实体信息;基于待检测岩石命名实体信息,获取待检测命名实体间关系信息;将待检测岩石命名实体信息进行复杂实体分离和基于字典的实体信息过滤,获取信息过滤结果;将信息过滤结果与待检测命名实体间关系信息进行重组,形成待检测岩石描述文本的岩石类型信息和岩石知识三元组。
[0010]进一步地,该岩石描述文本的质检方法中,将待检测岩石命名实体信息进行复杂实体分离,包括:确定待检测岩石命名实体信息的构造实体类型,获取确认结果;若确认结果为双构造实体,则将待检测岩石命名实体信息通过基于规则的复杂实体分离方法进行双构造实体分离;若确认结果为多结构实体,则将待检测岩石命名实体信息通过复杂实体分离方法进行多结构实体分离。
[0011]进一步地,该岩石描述文本的质检方法中,岩石知识提取模型包括:基于BERT的已训练序列标注模型;在获取待检测岩石描述文本之前,还包括:获取第二训练集,第二训练集包括:用于输入模型的岩石描述语料和实体序列预期标注结果;将第二训练集中的岩石描述语料输入待训练序列标注模型,用于获取待训练序列标注模型响应输出的实体序列预测标注结果;通过第二损失函数比较实体序列预期标注结果和实体序列预测标注结果是否一致;迭代调整待训练序列标注模型各节点的可训练参数,直至第二损失函数达到最小值时结束,用于获得已训练序列标注模型作为岩石知识提取模型。
[0012]进一步地,该岩石描述文本的质检方法中,在获取岩石知识比对结果之后,还包括:若存在一条以上岩石知识三元组不存在,则确定待检测岩石描述文本为质检不合格;当待检测岩石描述文本为质检不合格时,推送非标岩石知识三元组。
[0013]进一步地,该岩石描述文本的质检方法中,在获取同时具备岩石类型信息中记载的所有特征的岩石类型匹配数目之后,还包括:
若岩石类型匹配数目的结果为大于一,则提供匹配岩石类型间的鉴定知识。
[0014]进一步地,该岩石描述文本的质检方法中,在岩石知识比对结果为比对结果一致之后,还包括:根据待检测岩石描述文本,提取岩石类型信息对应的新鲜色、所具结构、所具构造、主要矿物和次要矿物等描述特征。
[0015]一种岩石描述文本的质检装置,包括:获取描述文本模块,用于获取待检测岩石描述文本;获取知识三元组模块,用于将待检测岩石描述文本输入岩石知识提取模型,用于获取岩石类型信息和岩石知识三元组;获取知识比对结果模块,用于基于岩石知识图谱,对岩石知识三元组进行一致性比对,获取岩石知识比对结果;获取匹配数目模块,用于若岩石知识比对结果为比对结果一致,则基于岩石知识图谱,获取同时具备岩石类型信息中记载的所有特征的岩石类型匹配数目;确认质检合格模块,用于若岩石类型匹配数目的结果为一,则确认待检测岩石描述文本为质检合格文本;鉴定知识推荐模块,用于若所述岩石类型匹配数目的结果大于一,则推送匹配岩石类型间的鉴定知识。
[0016]一种设备,包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述岩石描述文本的质检方法。
[0017]一种计算机可读介质,所述计算机可读介质存储有计算机程序,所述计算机程序被处理器执行时实现上述岩石描述文本的质检方法。
[0018]上述岩石描述文本的质检方法、装置、设备及介质,通过分析待检测岩石描述文本,将待检测岩石描述文本输入岩石知识提取模型,可最终确认待检测岩石描述文本是否为质检合格文本,可实时对野外地质调查产生的岩石描述文本进行有效监督,便于及时规范地质调查人员的野外岩石观察描述记录行为,实时对描述文本给出准确的指引,可有效保障地质调查文本的完整性和准确性。
附图说明
[0019]为了更清楚地说明本专利技术实施例的技术方案,下面将对本专利技术实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种岩石描述文本的质检方法,其特征在于,包括:获取待检测岩石描述文本;将所述待检测岩石描述文本输入岩石知识提取模型,用于获取岩石类型信息和岩石知识三元组;基于岩石知识图谱,对所述岩石知识三元组进行一致性比对,获取岩石知识比对结果;若所述岩石知识比对结果为比对结果一致,则基于所述岩石知识图谱,获取同时具备所述岩石类型信息中记载的所有特征的岩石类型匹配数目;若所述岩石类型匹配数目的结果为一,则确认所述待检测岩石描述文本为质检合格文本;若所述岩石类型匹配数目的结果大于一,则推送匹配岩石类型间的鉴定知识。2.根据权利要求1所述的一种岩石描述文本的质检方法,其特征在于,在所述获取岩石类型信息和岩石知识三元组之前,还包括:获取所述岩石知识提取模型输出的待检测岩石命名实体信息;基于所述待检测岩石命名实体信息,对所述待检测岩石描述文本进行实体位置标记,获取实体位置标记结果;将所述待检测岩石描述文本和所述实体位置标记结果输入实体间关系分类模型,用于获取待检测命名实体间关系信息。3.根据权利要求2所述的一种岩石描述文本的质检方法,其特征在于,所述实体间关系分类模型包括基于增强BERT的已训练关系分类模型;在所述将所述待检测岩石描述文本和所述实体位置标记结果输入实体间关系分类模型之前,还包括:获取第一训练集,所述第一训练集包括输入岩石描述语料和实体间预期关系分类结果;将所述的第一训练集中的输入岩石描述语料输入待训练关系分类模型中,用于获取所述关系分类模型响应输出的关系分类预测结果;通过第一损失函数比较所述预测关系分类结果和所述实体间预期关系分类结果是否一致;迭代调整所述待训练关系分类模型各节点的可训练参数,直至所述第一损失函数达到最小值时结束,用于获取所述已训练关系分类模型。4.根据权利要求1所述的一种岩石描述文本的质检方法,其特征在于,所述将所述待检测岩石描述文本输入岩石知识提取模型,用于获取岩石类型信息和岩石知识三元组,包括:将所述待检测岩石描述文本输入岩石知识提取模型,用于获取待检测岩石命名实体信息;基于所述待检测岩石命名实体信息,获取待检测命名实体间关系信息;将所述待检测岩石命名实体信息进行复杂实体分离和基于字典的实体信息过滤,获取信息过滤结果;将所述信息过滤结果与所述待检测命名实体间关系信息进行重组,形成所述待检测岩石描述文本的所述岩石类型信息和所述岩石知识三元组。5.根据权利要求4所述的一种岩石描述文本的质检方法,其特征在于,所述将所述待检
测岩石命名实体信息进行复杂实体分离,包括:确定所述待检测岩石命名实体信息的构造实体类型,获取确认结果;若所述确认结果为双构造实体,则将所述待检测岩石命名实体信息通...

【专利技术属性】
技术研发人员:陈忠良王翔吴衡方懿孙书婕
申请(专利权)人:安徽省地质调查院安徽省地质科学研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1