System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 三元组关系抽取方法、装置、设备和存储介质制造方法及图纸_技高网

三元组关系抽取方法、装置、设备和存储介质制造方法及图纸

技术编号:39997389 阅读:15 留言:0更新日期:2024-01-09 02:54
本申请的一种三元组关系抽取方法,包括:获取待测语句。对待测语句进行编码,得到语句向量。根据语句向量初始化全局矩阵,全局矩阵用于描述语句主语和语句宾语的对齐关系。将语句向量和关系语义向量输入PRGC模型的关系预测模块进行关系预测,得到关系预测子集。根据关系预测标签调节关系预测子集。将语句向量和调节后的关系预测子集输入PRGC模型的主语宾语标注模块进行计算,得到语句主语和语句宾语。将语句主语和语句宾语输入PRGC模型的主语宾语对齐模块进行对齐,基于对齐结果对全局矩阵进行裁剪,得到三元组关系。相比于基于原始PRGC模型的三元组抽取方法,本申请方法能够加强子任务间的耦合,具有更高的准确率和运算效率。

【技术实现步骤摘要】

本申请涉及语义解析,例如涉及一种三元组关系抽取方法、装 置、设备和存储介质。


技术介绍

1、关系型三元组通常以主语、关系谓语和宾语的三元形式表示,其中主语、 宾语为有意义的命名实体,而关系谓语通常是预定义的若干种关系类型之一。 三元组关系抽取指的是从非结构化的文本中提取结构化的三元组,它是文本 信息抽取的重要任务之一。

2、prgc模型将三元组关系抽取建模为三个学习任务,即:关系预测、主宾 语序列标注和主宾语对齐三个任务。prgc的缺点有两个:(1)各个任务过 于独立,在关系预测任务中,关系语义向量没有参与计算。(2)关系预测任 务在训练和推理阶段存在不匹配的情况,训练过程将多分类视为多个二分类 问题,推理过程中则视为排序问题。


技术实现思路

1、本申请目的在于:提供一种三元组关系抽取方法、装置、设备和介质, 其能够加强关系预测子任务间的耦合,具有更高的三元组关系抽取准确率和 运算效率。

2、为达到上述目的,本申请提供了一种三元组关系抽取方法,包括:

3、获取待测语句;对所述待测语句进行编码,得到语句向量;

4、根据所述语句向量初始化全局矩阵,所述全局矩阵用于描述语句主语和 语句宾语的对齐关系;

5、将所述语句向量和关系语义向量输入prgc模型的关系预测模块进行关 系预测,得到关系预测子集;根据关系预测标签调节所述关系预测子集;其 中,所述prgc模型由损失函数训练得到;

6、将所述语句向量和调节后的所述关系预测子集输入prgc模型的主语宾 语标注模块进行计算,得到所述语句主语和所述语句宾语;

7、将所述语句主语和所述语句宾语输入prgc模型的主语宾语对齐模块进 行对齐,基于对齐结果对所述全局矩阵进行裁剪,得到三元组关系。

8、所述将所述语句向量和关系语义向量输入prgc模型的关系预测模块进 行关系预测,得到关系预测子集,包括:

9、获取所述关系语义向量,所述关系语义向量为d维向量,共有r种关系;

10、将所述关系语义向量按列拼接得到关系语义矩阵;

11、将所述语句向量右乘所述关系语义矩阵,得到关系预测子集;其中,所 述关系预测子集为r维向量。

12、所述损失函数包括:第一损失函数、第二损失函数和第三损失函数;

13、所述第一损失函数为所述关系预测模块的损失函数;

14、所述第二损失函数为所述主语宾语标注模块的损失函数;

15、所述第三损失函数为所述主语宾语对齐模块的损失函数。

16、所述根据所述关系预测标签调节所述关系预测子集,包括:

17、获取关系预测中产生的关系预测标签,所述关系预测标签的数值为0或1;

18、使得数值为1的所述关系预测标签对应的关系预测向量大于关系预测阈 值,使得数值为0的所述关系预测标签对应的关系预测向量小于所述关系预测 阈值;其中,所述关系预测向量为组成所述关系预测子集的向量。

19、所述prgc模型由损失函数训练得到,包括:

20、根据所述第一损失函数、所述第二损失函数和所述第三损失函数训练所 述prgc模型,更新所述prgc模型的参数。

21、所述将所述语句向量和调节后的所述关系预测子集输入prgc模型的主 语宾语标注模块进行计算,得到所述语句主语和所述语句宾语,包括:

22、根据调节后的所述关系预测子集,通过所述主语宾语标注模块分别提取 所述语句向量的主语和宾语,得到所述语句主语和所述语句宾语。

23、所述将所述语句主语和所述语句宾语输入prgc模型的主语宾语对齐模 块进行对齐,基于对齐结果对所述全局矩阵进行裁剪,得到三元组关系,包 括:

24、对齐得到所有可能的主语宾语配对,所述主语宾语配对由所述语句主语 和对应的所述语句宾语组成;

25、将所述全局矩阵中配对可信度小于配对阈值的所述主语宾语配对剔除, 保留所述全局矩阵中所述配对可信度大于或等于所述配对阈值的所述主语宾 语配对,得到所述三元组关系。

26、本申请还提供了一种三元组关系抽取装置,包括:

27、待测语句获取模块,用于获取待测语句;

28、待测语句编码模块,用于对所述待测语句进行编码,得到语句向量;

29、初始化全局矩阵模块,用于根据所述语句向量初始化全局矩阵,所述全 局矩阵用于描述语句主语和语句宾语的对齐关系;

30、关系预测模块,用于将所述语句向量和关系语义向量输入prgc模型的关 系预测模块进行关系预测,得到关系预测子集;

31、关系预测子集调节模块,用于根据所述关系预测标签调节所述关系预测 子集;其中,所述prgc模型由损失函数训练得到;

32、主语宾语标注模块,用于将所述语句向量和调节后的所述关系预测子集 输入prgc模型的主语宾语标注模块进行计算,得到所述语句主语和所述语句 宾语;

33、主语宾语对齐模块,用于将所述语句主语和所述语句宾语输入prgc模型 的主语宾语对齐模块进行对齐,基于对齐结果对所述全局矩阵进行裁剪,得 到三元组关系。

34、本申请还提供一种计算机设备,包括存储器和处理器,所述存储器中存 储有计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述的 一种三元组关系抽取方法和/或上述任一项所述的三元组关系抽取方法的步 骤。

35、本申请还提供一种计算机可读存储介质,其上存储有计算机程序,所述 计算机程序被处理器执行时实现上述任一项所述的一种三元组关系抽取方法 和/或上述任一项所述的三元组关系抽取方法的步骤。

36、本申请的一种三元组关系抽取方法,获取待测语句,对所述待测语句进 行编码,得到语句向量。将所述语句向量和关系语义向量输入prgc模型的关 系预测模块进行关系预测,得到关系预测子集。对所述关系预测子集的关系 预测值进行调节。其中,所述prgc模型由损失函数训练得到。将所述语句向 量和所述关系预测子集输入prgc模型的主语宾语标注模块进行计算,得到所 述语句主语和所述语句宾语。将所述语句主语和所述语句宾语输入prgc模型 的主语宾语对齐模块进行对齐,对所述全局矩阵进行裁剪,得到三元组关系。 通过使用关系语义向量参与关系预测任务,能够加强子任务间的耦合,同时 对语句向量和关系语义向量起到监督的作用。通过调节关系预测子集能够将 关系预测任务转换为排序任务,使得训练和推理阶段一致。相比于基于原始 prgc模型的三元组关系抽取方法,本申请提供的方法具有更高的准确率和运 算效率。

本文档来自技高网...

【技术保护点】

1.一种三元组关系抽取方法,其特征在于,包括:

2.根据权利要求1所述的三元组关系抽取方法,其特征在于,所述将所述语句向量和关系语义向量输入PRGC模型的关系预测模块进行关系预测,得到关系预测子集,包括:

3.根据权利要求1所述的三元组关系抽取方法,其特征在于,所述损失函数包括:第一损失函数、第二损失函数和第三损失函数;

4.根据权利要求2所述的三元组关系抽取方法,其特征在于,所述根据关系预测标签调节所述关系预测子集,包括:

5.根据权利要求3所述的三元组关系抽取方法,其特征在于,所述PRGC模型由损失函数训练得到,包括:

6.根据权利要求1所述的三元组关系抽取方法,其特征在于,所述将所述语句向量和调节后的所述关系预测子集输入PRGC模型的主语宾语标注模块进行计算,得到所述语句主语和所述语句宾语,包括:

7.根据权利要求1所述的三元组关系抽取方法,其特征在于,所述将所述语句主语和所述语句宾语输入PRGC模型的主语宾语对齐模块进行对齐,基于对齐结果对所述全局矩阵进行裁剪,得到三元组关系,包括:

8.一种三元组关系抽取装置,其特征在于,包括:

9.一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的三元组关系抽取方法的步骤。

10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的三元组关系抽取方法的步骤。

...

【技术特征摘要】

1.一种三元组关系抽取方法,其特征在于,包括:

2.根据权利要求1所述的三元组关系抽取方法,其特征在于,所述将所述语句向量和关系语义向量输入prgc模型的关系预测模块进行关系预测,得到关系预测子集,包括:

3.根据权利要求1所述的三元组关系抽取方法,其特征在于,所述损失函数包括:第一损失函数、第二损失函数和第三损失函数;

4.根据权利要求2所述的三元组关系抽取方法,其特征在于,所述根据关系预测标签调节所述关系预测子集,包括:

5.根据权利要求3所述的三元组关系抽取方法,其特征在于,所述prgc模型由损失函数训练得到,包括:

6.根据权利要求1所述的三元组关系抽取方法,其特征在于,所述将所述语句向量和调节后的所述关系预测子集输...

【专利技术属性】
技术研发人员:张似衡
申请(专利权)人:广州视源电子科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1