文本关系识别方法、装置及计算机可读存储介质制造方法及图纸

技术编号:37802048 阅读:12 留言:0更新日期:2023-06-09 09:32
本申请公开了一种文本关系识别方法、装置及计算机可读存储介质。该方法包括:获取待处理文本,待处理文本至少包括第一文本和第二文本;利用识别模型获取第一文本和第二文本之间的隐藏矩阵表示和注意力矩阵表示;基于隐藏矩阵表示获取第一文本对应的第一句法依赖图表示,基于隐藏矩阵表示获取第二文本对应的第二句法依赖图表示;基于第一句法依赖图表示和第二句法依赖图表示得到第一文本和第二文本之间的相互依赖图表示;利用隐藏矩阵表示、注意力矩阵表示和相互依赖图表示确定第一文本和第二文本的辩论关系。通过上述方式,本申请能够提高文本关系识别的准确度,算法更具鲁棒性。性。性。

【技术实现步骤摘要】
文本关系识别方法、装置及计算机可读存储介质


[0001]本申请涉及自然语言处理领域,特别是涉及文本关系识别方法、装置及计算机可读存储介质。

技术介绍

[0002]论辩挖掘旨在从非结构化的文本中提取论点并判断其类型与逻辑关系的研究领域,最终目的是将非结构化的文本数据转化为可供计算机处理的结构化数据。论辩挖掘任务一般可包括:从输入文本中提取带有论辩性的文本片段或句子,称为论辩部件;对提取的论点部件进行分类,一般可将这些单元分为“主张”和“前提”;识别论辩部件之间是否存在逻辑关系;对存在的逻辑关系进行分类,通常分为支持关系和反对关系。

技术实现思路

[0003]本申请主要提供一种文本关系识别方法、装置及计算机可读存储介质,解决了现有技术中文本之间关系识别不准确的问题。
[0004]为解决上述技术问题,本申请第一方面提供了一种文本关系识别方法,包括:获取待处理文本,所述待处理文本至少包括第一文本和第二文本;利用识别模型获取所述第一文本和所述第二文本之间的隐藏矩阵表示和注意力矩阵表示;基于所述隐藏矩阵表示获取所述第一文本对应的第一句法依赖图表示,基于所述隐藏矩阵表示获取所述第二文本对应的第二句法依赖图表示;基于所述第一句法依赖图表示和所述第二句法依赖图表示得到所述第一文本和所述第二文本之间的相互依赖图表示;利用所述隐藏矩阵表示、所述注意力矩阵表示和所述相互依赖图表示确定所述第一文本和所述第二文本的辩论关系。
[0005]为解决上述技术问题,本申请第二方面提供了文本关系识别装置,装置包括相互耦接的处理器和存储器;所述存储器中存储有计算机程序,所述处理器用于执行所述计算机程序以实现上述第一方面提供的文本关系识别方法。
[0006]为解决上述技术问题,本申请第三方面提供了一种计算机可读存储介质,计算机可读存储介质存储有程序数据,所述程序数据被处理器执行时,实现上述第一方面提供的文本关系识别方法。
[0007]本申请的有益效果是:区别于现有技术的情况,本申请利用识别模型获取第一文本和第二文本之间的隐藏矩阵表示和注意力矩阵表示;基于隐藏矩阵表示获取第一文本对应的第一句法依赖图表示,基于隐藏矩阵表示获取第二文本对应的第二句法依赖图表示;基于第一句法依赖图表示和第二句法依赖图表示得到第一文本和第二文本之间的相互依赖图表示;利用隐藏矩阵表示、注意力矩阵表示和相互依赖图表示确定第一文本和第二文本的辩论关系,本申请能够更好地识别文本内部的语义和句法结构信息,以便更好地推断文本对之间的关系,提高文本关系识别的准确度,算法更具鲁棒性。
附图说明
[0008]为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0009]图1是本申请文本关系识别方法一实施例的流程示意框图;
[0010]图2是本申请步骤S12一实施例的流程示意框图;
[0011]图3是本申请步骤S22一实施例的流程示意框图;
[0012]图4是本申请步骤S13一实施例的流程示意框图;
[0013]图5是本申请步骤S14一实施例的流程示意框图;
[0014]图6是本申请步骤S15一实施例的流程示意框图;
[0015]图7是本申请注意力矩阵表示一实施例的结构示意框图;
[0016]图8是本申请步骤S52一实施例的流程示意框图;
[0017]图9是本申请步骤S53一实施例的流程示意框图;
[0018]图10是本申请步骤S54一实施例的流程示意框图;
[0019]图11是本申请步骤S55一实施例的流程示意框图;
[0020]图12是本申请步骤S56一实施例的流程示意框图;
[0021]图13是本申请人机交互界面一实施例示意图;
[0022]图14是本申请文本关系识别装置一实施例的结构示意框图;
[0023]图15是本申请计算机可读存储介质一实施例的结构示意框图。
具体实施方式
[0024]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请的一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0025]本申请中的术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。本申请的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
[0026]在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解是,本文所描述的实施例可以与其他实施例结合。
[0027]现有的文本关系预测工作通过引入外部知识对论辩部件对之间的细粒度语义相关特征(如词)进行建模,仅关注论辩部件对之间的语义级相似性,忽略了论辩部件对的复
杂互动,不能有效地对论辩关系进行深入推理。
[0028]一个论证文本的内部结构包含几个论辩部件(Argumentation Component,AC),论辩部件由前提文本和主张文本组成,主张是一个有争议的陈述,前提是支持或反对主张的理由。论辩部件之间可能存在有向的论辩关系,该关系表述一个论辩部件对另一个论辩部件的支持或反对。本申请提出一种文本关系识别方法,用于确定文本之间的论辩关系为支持或反对,具体方案请参见后文。
[0029]请参阅图1,图1是本申请文本关系识别方法一实施例的流程示意框图。需注意的是,若有实质上相同的结果,本实施例并不以图1所示的流程顺序为限。本实施例包括以下步骤:
[0030]步骤S11:获取待处理文本,待处理文本至少包括第一文本和第二文本。
[0031]其中,待处理文本可以是论辩部件对(P,Q),第一文本表示为P=(p1,p2,

,p
m
),第二文本表示为Q=(q1,q2,

,q
n
),分别由m和n个词组成。第一文本为论辩部件中的主张文本或前提文本中的一者,第二文本为论辩部件中的主张文本或前提文本中的另一者。
[0032]下文以论辩部件对(P,Q)为例本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文本关系识别方法,其特征在于,所述方法包括:获取待处理文本,所述待处理文本至少包括第一文本和第二文本;利用识别模型获取所述第一文本和所述第二文本之间的隐藏矩阵表示和注意力矩阵表示;基于所述隐藏矩阵表示获取所述第一文本对应的第一句法依赖图表示,基于所述隐藏矩阵表示获取所述第二文本对应的第二句法依赖图表示;基于所述第一句法依赖图表示和所述第二句法依赖图表示得到所述第一文本和所述第二文本之间的相互依赖图表示;利用所述隐藏矩阵表示、所述注意力矩阵表示和所述相互依赖图表示确定所述第一文本和所述第二文本的辩论关系。2.根据权利要求1所述的方法,其特征在于,所述利用识别模型获取所述第一文本和所述第二文本之间的隐藏矩阵表示和注意力矩阵表示,包括:将所述第一文本和所述第二文本输入至所述识别模型,探测所述第一文本和所述第二文本在所述识别模型中对应的隐藏向量和注意力向量;利用所述隐藏向量和所述注意力向量确定所述隐藏矩阵表示和所述注意力矩阵表示;其中,所述隐藏向量和所述注意力向量包括词级别、论辩部件级别、论辩部件对级别中至少一种。3.根据权利要求2所述的方法,其特征在于,所述利用所述隐藏向量和所述注意力向量确定所述隐藏矩阵表示和所述注意力矩阵表示,包括:对所述隐藏向量进行池化操作,得到池化后的隐藏向量表示;对所述注意力向量进行池化操作,得到池化后的注意力向量表示;基于第一归一化注意力权重和所述隐藏向量表示得到所述隐藏矩阵表示;基于第二归一化注意力权重和所述注意力向量表示得到所述注意力矩阵表示。4.根据权利要求1所述的方法,其特征在于,所述基于所述隐藏矩阵表示获取所述第一文本对应的第一句法依赖图表示,包括:对所述第一文本进行句法依赖解析,得到第一依赖树;构建第一初始依赖图,并利用所述隐藏矩阵表示作为所述第一初始依赖图相应的第一节点表示;利用所述第一依赖树对应的邻接矩阵对所述第一节点表示进行更新,得到所述第一句法依赖图表示的第二节点表示;所述基于所述隐藏矩阵表示获取所述第二文本对应的第二句法依赖图表示,包括:对所述第二文本进行句法依赖解析,得到第二依赖树;构建第二初始依赖图,并利用所述隐藏矩阵表示作为所述第二初始依赖图相应的第三节点表示;利用所述第二依赖树对应的邻接矩阵对所述第三节点表示进行更新,得到所述第二句法依赖图表示的第四节点表示。5.根据权利要求1所述的方法,其特征在于,所述隐藏矩阵表示包括第一隐藏矩阵表示和第二隐藏矩阵表示,所述第一隐藏矩阵表示对应所述第一文本,所述第二隐藏矩阵表示对应所述第二文本,所述利用所述隐藏矩阵表示、所述注意力矩阵表示和所述相互依赖图
表示确定所述第一文本和所述第二文本的辩论关系,包括:基于所述注意力矩阵表示确定第一子注意力矩阵表示、第二子注意力矩阵表示、第三子注意力矩阵表示、第四子注意力矩阵表示;其中,所述第一子注意力矩阵表示为所述第一文本内的邻接矩阵;所述第二子注意力矩阵表示为所述第二文本内的邻接矩阵;所述第三子注意力矩阵表示为所述第一文本和所述第二文本之间的邻接矩阵;所述第四子注意力矩阵表示为所述第二文本和所述第一文本之间的邻接矩阵;利用所述第一子注意力矩阵表示和所述第一隐藏矩阵表示确定所述第一文本对应的第一探测内图表示;其中,所述第一隐藏矩阵表示作为所述第一探测内图表示的节点表示;利用所述第二子注意力矩阵表示和所述第二隐藏矩...

【专利技术属性】
技术研发人员:徐睿峰孙洋梁斌鲍建竹杨敏
申请(专利权)人:哈尔滨工业大学深圳
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1