实体关系抽取方法技术

技术编号:39659250 阅读:20 留言:0更新日期:2023-12-09 11:28
本申请涉及一种实体关系抽取方法

【技术实现步骤摘要】
实体关系抽取方法、装置、终端及存储介质


[0001]本申请涉及自然语言处理领域,尤其是涉及一种利用全局指针网络增强的实体关系抽取方法

装置

终端及存储介质


技术介绍

[0002]在自然语言处理
(Natural Language Processing,NLP)
领域中,实体关系抽取是一项关键任务,旨在从非结构化文本中抽取出具有特定语义关系的实体对

实体关系抽取在许多场景中都具有重要的应用价值,如信息提取

问题回答

知识图谱构建等

[0003]以往的实体关系抽取方案通常只关注于头实体

尾实体和实体关系这三个要素,抽取结果的表现形式也多为一个关系三元组
(
头实体

关系

尾实体
)
,就抽取结果本身而言,其完全忽略了实体的类型信息

但是在后续的应用场景中,实体的类型信息可以在理解实体关系时发挥巨大的作用,因此上述传统的实体关系抽取方案在结果的完整性方面都有待提高

[0004]因此,如何提出一种全新的实体关系抽取方案,在实体关系抽取的过程中实现对实体类型的细致处理,提高实体关系抽取的准确性和可解释性,也就成为了本领域内技术人员亟待解决的问题


技术实现思路

[0005]为了改进现有的实体关系抽取方案,本申请提供了一种实体关系抽取方法

装置

终端及存储介质

本申请的方案充分利用了全局指针网络,实现了实体关系抽取过程中对于实体类型的细致处理,提高了实体关系抽取的准确性和可解释性

[0006]第一方面,本申请提供了一种实体关系抽取方法,采用如下所述的技术方案

[0007]一种实体关系抽取方法,包括如下步骤:
[0008]对所获取的文本信息进行序列化处理

得到文本序列,将所述文本序列输入经过预训练的编码模型中

得到文本编码结果;
[0009]依据所述文本编码结果分别计算得到所述文本序列中的头实体跨度及尾实体跨度,依据所述头实体跨度进行头实体预测

得到头实体的首尾位置及对应的头实体类型,依据所述尾实体跨度进行尾实体预测

得到尾实体的首尾位置及对应的尾实体类型;
[0010]对所述头实体的首尾位置及所述尾实体的首尾位置进行对齐匹配,依据对齐匹配结果确定头尾实体之间的关系;
[0011]对所述头实体的首尾位置

所述头实体类型

所述头尾实体之间的关系

所述尾实体的首尾位置

所述尾实体类型进行信息汇总

形成实体关系抽取结果并将其作为针对所述文本信息的输出

[0012]通过采用上述技术方案,利用全局指针网络的技术架构,有效地捕获并利用头

尾实体类型去增强实体关系抽取过程中地全局信息

相较于现有方案中局部上下文的实体关系抽取,全局指针网络能够更准确地识别头实体

尾实体,并在全局范围内完成实体对齐,
最大限度地保证了实体关系抽取结果的精度

[0013]此外,上述技术方案与现有的标注工具具有较高的适配性,所输出的实体关系抽取结果可以直接导入至标注工具中,为专业人士后续的审核和修订提供了便利,进一步提高了实体关系抽取的效率和可用性

[0014]优选地,所述对所获取的文本信息进行序列化处理

得到文本序列,将所述文本序列输入经过预训练的编码模型中

得到文本编码结果,具体包括如下步骤:
[0015]获取文本信息,对所述文本信息进行序列化处理并在文本的首尾分别添加相对应的标记

得到文本序列;
[0016]将所述文本序列输入经过预训练的编码模型中

将所述编码模型的输出作为文本编码结果,所述标记与所述编码模型相适配,所述编码模型为
BERT

Encoder
模型

[0017]通过采用上述技术方案,进一步明确了方法中文本编码结果的生成过程,为方法后续的各项处理提供了基础的技术支持

[0018]优选地,所述依据所述文本编码结果分别计算得到所述文本序列中的头实体跨度及尾实体跨度,依据所述头实体跨度进行头实体预测

得到头实体的首尾位置及对应的头实体类型,依据所述尾实体跨度进行尾实体预测

得到尾实体的首尾位置及对应的尾实体类型,具体包括如下步骤:
[0019]依据所述文本编码结果分别计算得到所述文本序列中的头实体跨度及尾实体跨度,所述头实体跨度中包含有头实体的开始索引及结束索引,所述尾实体跨度中包含有尾实体的开始索引及结束索引;
[0020]依据所述头实体的开始索引及结束索引,分别得到头实体的开始位置与头实体的结束位置,依据所述头实体的开始位置及所述头实体的结束位置,计算得到所述头实体作为特定头实体类型的得分并据此确定所述头实体对应的头实体类型;
[0021]依据所述尾实体的开始索引及结束索引,分别得到尾实体的开始位置与头实体的结束位置,依据所述尾实体的开始位置及所述尾实体的结束位置,计算得到所述尾实体作为特定尾实体类型的得分并据此确定所述尾实体对应的尾实体类型

[0022]通过采用上述技术方案,实现了在头实体

尾实体抽取过程中对于实体类型信息的兼顾,其中的头实体预测及尾实体预测过程可以针对特定的实体类型进行精确识别,增强了方法整体对于实体的判别能力,降低了误抽取的风险

[0023]优选地,所述对所述头实体的首尾位置及所述尾实体的首尾位置进行对齐匹配,依据对齐匹配结果确定头尾实体之间的关系,具体包括如下步骤:
[0024]依据所述头实体的开始位置及所述尾实体的开始位置,计算得到特定关系下所述头实体与所述尾实体二者开始索引的匹配得分并将其作为第一对齐匹配结果;
[0025]依据所述头实体的结束位置及所述尾实体的结束位置,计算得到特定关系下所述头实体与所述尾实体二者结束索引的匹配得分并将其作为第二对齐匹配结果;
[0026]综合所述第一对齐匹配结果及所述第二对齐匹配结果,完成所述头实体与所述尾实体之间的关系对齐,确定与所述头实体及所述尾实体相对应的所述头尾实体之间的关系

[0027]通过采用上述技术方案,快速且准确的获知了头实体与尾实体之间的关联并预测了二者间的关系,其中对于头实体与尾实体二者语义关联的考虑,使得基于本方法的装置
或模本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种实体关系抽取方法,其特征在于,包括如下步骤:对所获取的文本信息进行序列化处理

得到文本序列,将所述文本序列输入经过预训练的编码模型中

得到文本编码结果;依据所述文本编码结果分别计算得到所述文本序列中的头实体跨度及尾实体跨度,依据所述头实体跨度进行头实体预测

得到头实体的首尾位置及对应的头实体类型,依据所述尾实体跨度进行尾实体预测

得到尾实体的首尾位置及对应的尾实体类型;对所述头实体的首尾位置及所述尾实体的首尾位置进行对齐匹配,依据对齐匹配结果确定头尾实体之间的关系;对所述头实体的首尾位置

所述头实体类型

所述头尾实体之间的关系

所述尾实体的首尾位置

所述尾实体类型进行信息汇总

形成实体关系抽取结果并将其作为针对所述文本信息的输出
。2.
根据权利要求1所述的实体关系抽取方法,其特征在于,所述对所获取的文本信息进行序列化处理

得到文本序列,将所述文本序列输入经过预训练的编码模型中

得到文本编码结果,具体包括如下步骤:获取文本信息,对所述文本信息进行序列化处理并在文本的首尾分别添加相对应的标记

得到文本序列;将所述文本序列输入经过预训练的编码模型中

将所述编码模型的输出作为文本编码结果,所述标记与所述编码模型相适配,所述编码模型为
BERT

Encoder
模型
。3.
根据权利要求2所述的实体关系抽取方法,其特征在于,所述依据所述文本编码结果分别计算得到所述文本序列中的头实体跨度及尾实体跨度,依据所述头实体跨度进行头实体预测

得到头实体的首尾位置及对应的头实体类型,依据所述尾实体跨度进行尾实体预测

得到尾实体的首尾位置及对应的尾实体类型,具体包括如下步骤:依据所述文本编码结果分别计算得到所述文本序列中的头实体跨度及尾实体跨度,所述头实体跨度中包含有头实体的开始索引及结束索引,所述尾实体跨度中包含有尾实体的开始索引及结束索引;依据所述头实体的开始索引及结束索引,分别得到头实体的开始位置与头实体的结束位置,依据所述头实体的开始位置及所述头实体的结束位置,计算得到所述头实体作为特定头实体类型的得分并据此确定所述头实体对应的头实体类型;依据所述尾实体的开始索引及结束索引,分别得到尾实体的开始位置与头实体的结束位置,依据所述尾实体的开始位置及所述尾实体的结束位置,计算得到所述尾实体作为特定尾实体类型的得分并据此确定所述尾实体对应的尾实体类型
。4.
根据权利要求3所述的实体关系抽取方法,其特征在于,所述对所述头实体的首尾位置及所述尾实体的首尾位置进行对齐匹配,依据对齐匹配结果确定头尾实体之间的关系,具体包括如下步骤:依据所述头实体的开始位置及所述尾实体的开始位置,计算得到特定关系下所述头实体与所述尾实体二者开始索引的匹配得分并将其作为第一对齐匹配结果;依据所述头实体的结束位置及所述尾实体的结束位置,计算得到特定关系下所述头实体与所述尾实体二者结束索引的匹配得分并将其作为第二对齐匹配结果;综合所述第一对齐匹配结果及所述第二对齐匹配结果,完成所述头...

【专利技术属性】
技术研发人员:龙如山刘志远吴俣马学中胡德斌
申请(专利权)人:苏州维众数据技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1