【技术实现步骤摘要】
实体关系抽取方法、装置、终端及存储介质
[0001]本申请涉及自然语言处理领域,尤其是涉及一种利用全局指针网络增强的实体关系抽取方法
、
装置
、
终端及存储介质
。
技术介绍
[0002]在自然语言处理
(Natural Language Processing,NLP)
领域中,实体关系抽取是一项关键任务,旨在从非结构化文本中抽取出具有特定语义关系的实体对
。
实体关系抽取在许多场景中都具有重要的应用价值,如信息提取
、
问题回答
、
知识图谱构建等
。
[0003]以往的实体关系抽取方案通常只关注于头实体
、
尾实体和实体关系这三个要素,抽取结果的表现形式也多为一个关系三元组
(
头实体
、
关系
、
尾实体
)
,就抽取结果本身而言,其完全忽略了实体的类型信息
。
但是在后续的应用场景中,实体的类型信息可以在理解实体关系时发挥巨大的作用,因此上述传统的实体关系抽取方案在结果的完整性方面都有待提高
。
[0004]因此,如何提出一种全新的实体关系抽取方案,在实体关系抽取的过程中实现对实体类型的细致处理,提高实体关系抽取的准确性和可解释性,也就成为了本领域内技术人员亟待解决的问题
。
技术实现思路
[0005]为了改进现有的实体关系抽取方案,本申请提供了一种实体关 ...
【技术保护点】
【技术特征摘要】
1.
一种实体关系抽取方法,其特征在于,包括如下步骤:对所获取的文本信息进行序列化处理
、
得到文本序列,将所述文本序列输入经过预训练的编码模型中
、
得到文本编码结果;依据所述文本编码结果分别计算得到所述文本序列中的头实体跨度及尾实体跨度,依据所述头实体跨度进行头实体预测
、
得到头实体的首尾位置及对应的头实体类型,依据所述尾实体跨度进行尾实体预测
、
得到尾实体的首尾位置及对应的尾实体类型;对所述头实体的首尾位置及所述尾实体的首尾位置进行对齐匹配,依据对齐匹配结果确定头尾实体之间的关系;对所述头实体的首尾位置
、
所述头实体类型
、
所述头尾实体之间的关系
、
所述尾实体的首尾位置
、
所述尾实体类型进行信息汇总
、
形成实体关系抽取结果并将其作为针对所述文本信息的输出
。2.
根据权利要求1所述的实体关系抽取方法,其特征在于,所述对所获取的文本信息进行序列化处理
、
得到文本序列,将所述文本序列输入经过预训练的编码模型中
、
得到文本编码结果,具体包括如下步骤:获取文本信息,对所述文本信息进行序列化处理并在文本的首尾分别添加相对应的标记
、
得到文本序列;将所述文本序列输入经过预训练的编码模型中
、
将所述编码模型的输出作为文本编码结果,所述标记与所述编码模型相适配,所述编码模型为
BERT
‑
Encoder
模型
。3.
根据权利要求2所述的实体关系抽取方法,其特征在于,所述依据所述文本编码结果分别计算得到所述文本序列中的头实体跨度及尾实体跨度,依据所述头实体跨度进行头实体预测
、
得到头实体的首尾位置及对应的头实体类型,依据所述尾实体跨度进行尾实体预测
、
得到尾实体的首尾位置及对应的尾实体类型,具体包括如下步骤:依据所述文本编码结果分别计算得到所述文本序列中的头实体跨度及尾实体跨度,所述头实体跨度中包含有头实体的开始索引及结束索引,所述尾实体跨度中包含有尾实体的开始索引及结束索引;依据所述头实体的开始索引及结束索引,分别得到头实体的开始位置与头实体的结束位置,依据所述头实体的开始位置及所述头实体的结束位置,计算得到所述头实体作为特定头实体类型的得分并据此确定所述头实体对应的头实体类型;依据所述尾实体的开始索引及结束索引,分别得到尾实体的开始位置与头实体的结束位置,依据所述尾实体的开始位置及所述尾实体的结束位置,计算得到所述尾实体作为特定尾实体类型的得分并据此确定所述尾实体对应的尾实体类型
。4.
根据权利要求3所述的实体关系抽取方法,其特征在于,所述对所述头实体的首尾位置及所述尾实体的首尾位置进行对齐匹配,依据对齐匹配结果确定头尾实体之间的关系,具体包括如下步骤:依据所述头实体的开始位置及所述尾实体的开始位置,计算得到特定关系下所述头实体与所述尾实体二者开始索引的匹配得分并将其作为第一对齐匹配结果;依据所述头实体的结束位置及所述尾实体的结束位置,计算得到特定关系下所述头实体与所述尾实体二者结束索引的匹配得分并将其作为第二对齐匹配结果;综合所述第一对齐匹配结果及所述第二对齐匹配结果,完成所述头...
【专利技术属性】
技术研发人员:龙如山,刘志远,吴俣,马学中,胡德斌,
申请(专利权)人:苏州维众数据技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。