System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及自然语言处理,特别是涉及一种角色消歧方法、系统和相关装置。
技术介绍
1、在同一文学作品、科技文献或新闻报道等文本中,常常会出现同一角色存在多个别名的情况,为便于根据文本中的角色进行相应内容的创作,需要对文本中的多个角色名进行消歧。现有的角色消歧主要依赖于固定的规则进行判断,比如根据角色的姓氏和称谓等判断是否属于同一角色,但在较多场景下,利用该方式得到的消歧结果准确性较低。
2、有鉴于此,如何提出一种准确性较高的角色消歧方法,成为亟待解决的问题。
技术实现思路
1、本申请主要解决的技术问题是提供一种角色消歧方法、系统和相关装置,能够提高角色消歧的准确性。
2、为解决上述技术问题,本申请采用的一个技术方案是:提供一种角色消歧方法,包括:获取待处理图;其中,所述待处理图的节点是基于多个待处理角色名得到的,所述待处理图的边是基于任意两个所述待处理角色名对应的待处理段落得到的,所述待处理段落中的两个所述待处理角色名间隔的字符的数量小于第一阈值;将所述待处理图输入图神经网络,得到每条边所连接的两个节点对应的待处理角色名之间的分类结果;其中,所述图神经网络用于对所述待处理图中的边所连接的节点之间的关联关系进行分类,所述分类结果包括同属于一个角色和分属于两个角色中的一者。
3、为解决上述技术问题,本申请采用的另一个技术方案是:提供一种角色消歧系统,包括:获取模块,用于获取待处理图;其中,所述待处理图的节点是基于多个待处理角色名得到的,所述待处理图的边
4、为解决上述技术问题,本申请采用的另一个技术方案是:提供一种电子设备,包括:相互耦接的存储器和处理器,所述储存器中存储有程序指令,所述处理器用于执行所述程序指令以实现如上述技术方案中提到的角色消歧方法。
5、为解决上述技术问题,本申请采用的另一个技术方案是:提供一种计算机可读存储介质,其上存储有程序指令,所述程序指令被处理器执行时实现如上述技术方案中提到的角色消歧方法。
6、本申请的有益效果是:区别于现有技术的情况,本申请提出的角色消歧方法,通过获取待处理文本中的待处理角色名,并根据任意两个待处理角色名间隔的字符数量确定对应的待处理段落。以及,根据待处理段落得到待处理图中的边,将该待处理段落对应的两个待处理角色名分别作为待处理图中的节点。将得到的待处理图输入至图神经网络,以使得图神经网络能够准确对待处理文本进行分析,得到分类结果,从而准确地对待处理文本中不同角色名进行准确区分。
本文档来自技高网...【技术保护点】
1.一种角色消歧方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述获取待处理图,包括:
3.根据权利要求2所述的方法,其特征在于,所述从所述待处理文本中提取任意两个所述待处理角色名匹配的所述待处理段落,包括:
4.根据权利要求2所述的方法,其特征在于,所述利用两个所述待处理角色名匹配的所有所述待处理段落的所述段落语义,构建所述待处理图中对应的两个节点的边,包括:
5.根据权利要求2所述的方法,其特征在于,所述将所述待处理图输入图神经网络,得到每条边所连接的两个节点对应的待处理角色名之间的分类结果之后,还包括:
6.根据权利要求5所述的方法,其特征在于,所述待处理文本包括源文本中的部分内容,所述源文本对应有多个所述待处理文本,每个所述待处理文本对应有所述待处理图;
7.根据权利要求1所述的方法,其特征在于,所述图神经网络对所述待处理图中的边所连接的节点之间的关联关系进行分类时配置有约束规则,所述约束规则是基于所述待处理角色名中的至少部分字符构建的。
8.一种角色消歧系统,其特征
9.一种电子设备,其特征在于,包括:相互耦接的存储器和处理器,所述储存器中存储有程序指令,所述处理器用于执行所述程序指令以实现如权利要求1-7中任一项所述的角色消歧方法。
10.一种计算机可读存储介质,其上存储有程序指令,其特征在于,所述程序指令被处理器执行时实现如权利要求1-7中任一项所述的角色消歧方法。
...【技术特征摘要】
1.一种角色消歧方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述获取待处理图,包括:
3.根据权利要求2所述的方法,其特征在于,所述从所述待处理文本中提取任意两个所述待处理角色名匹配的所述待处理段落,包括:
4.根据权利要求2所述的方法,其特征在于,所述利用两个所述待处理角色名匹配的所有所述待处理段落的所述段落语义,构建所述待处理图中对应的两个节点的边,包括:
5.根据权利要求2所述的方法,其特征在于,所述将所述待处理图输入图神经网络,得到每条边所连接的两个节点对应的待处理角色名之间的分类结果之后,还包括:
6.根据权利要求5所述的方法,其特征在于,所述待处理文本包括源文本中的部...
【专利技术属性】
技术研发人员:殷锋,刘霞,陈凌辉,刘丹,刘权,王士进,刘聪,胡国平,
申请(专利权)人:科大讯飞股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。