当前位置: 首页 > 专利查询>清华大学专利>正文

常识知识评分和排序方法及装置制造方法及图纸

技术编号:34437992 阅读:13 留言:0更新日期:2022-08-06 16:23
本发明专利技术提供一种常识知识评分和排序方法及装置,其中,常识知识评分方法包括:获取待评分常识三元组对象和与待评分常识三元组对象对应的义原树组;将待评分常识三元组对象和义原树组输入至评分模型,获得评分模型输出的投票结果;其中,评分模型是基于样本组以及对应的投票标签进行训练后得到的,样本组包括常识三元组样本以及与常识三元组样本对应的义原树组样本,投票标签是根据样本组预先确定的,并与样本组一一对应。本发明专利技术提供的常识知识评分和排序方法及装置通过结合三元组自身信息和外部知识库的义原信息,实现了对待评分常识三元组对象进行综合评分,提高了常识知识评分和排序的准确率。和排序的准确率。和排序的准确率。

【技术实现步骤摘要】
常识知识评分和排序方法及装置


[0001]本专利技术涉及计算机
,尤其涉及一种常识知识评分和排序方法及装置。

技术介绍

[0002]现有技术中,通常使用语言模型来验证常识。例如使用BERT模型来验证ConceptNet三元组的正确性。而这种方法只使用三元组自身的上下文信息,导致验证信息的来源单一,致使常识评分正确率低,从而导致常识知识排序正确率低。

技术实现思路

[0003]本专利技术提供一种常识知识评分和排序方法及装置,用以解决现有技术中常识知识评分和排序正确率低的缺陷,提高常识知识评分和排序正确率。
[0004]第一方面,本专利技术提供一种常识知识评分方法,包括:
[0005]获取待评分常识三元组对象和与所述待评分常识三元组对象对应的义原树组;
[0006]将所述待评分常识三元组对象和所述义原树组输入至评分模型,获得所述评分模型输出的投票结果;
[0007]其中,所述评分模型是基于样本组以及对应的投票标签进行训练后得到的,所述样本组包括常识三元组样本以及与所述常识三元组样本对应的义原树组样本,所述投票标签是根据所述样本组预先确定的,并与所述样本组一一对应。
[0008]可选地,所述待评分常识三元组对象包括头实体、关系类型和尾实体;
[0009]获取与所述待评分常识三元组对象对应的义原树组包括:
[0010]获取与所述头实体对应的头义原树、与所述尾实体对应的尾义原树以及与所述头义原树和所述尾义原树之间的义原路径。
[0011]可选地,所述评分模型包括:第一解析模块、第二解析模块、第三解析模块和投票模块;
[0012]所述将所述待评分常识三元组对象和所述义原树组输入至评分模型,获得所述评分模型输出的投票结果,包括:
[0013]将所述待评分常识三元组对象输入至所述第一解析模块,获得所述第一解析模块输出的第一向量;
[0014]将所述义原树组输入至所述第二解析模块,获得所述第二解析模块输出的第二向量;
[0015]将所述待评分常识三元组对象和所述义原树组输入至所述第三解析模块,获得所述第三解析模块输出的第三向量;
[0016]将所述第一向量、所述第二向量和所述第三向量输入至所述投票模块,获得所述投票模块输出的所述投票结果。
[0017]可选地,所述投票模块包括第一概率单元、第二概率单元、第三概率单元和投票单元;
[0018]所述将所述第一向量、所述第二向量和所述第三向量输入至所述投票模块,获得所述投票模块输出的投票结果,包括:
[0019]将所述第一向量输入至所述第一概率单元,获得第一概率单元输出的、用于表示所述待评分常识三元组对象正确概率的第一概率;
[0020]将所述第二向量输入至所述第二概率单元,获得第二概率单元输出的、用于表示所述义原数组正确概率的第二概率;
[0021]将所述第三向量输入至所述第三概率单元,获得第三概率单元输出的、用于表示所述待评分常识三元组对象和所述义原数组的组合正确概率的第三概率;
[0022]将所述第一概率、所述第二概率和所述第三概率输入至所述投票单元,获得所述投票单元基于预设投票公式输出的所述投票结果。
[0023]可选地,所述预设投票公式为:
[0024][0025][0026]其中,表示投票结果,τ表示阈值,表示所述第一概率,表示所述第二概率,表示所述第三概率。
[0027]可选地,所述常识三元组样本包括常识三元组正样本和基于所述常识三元组正样本获得的所述常识三元组负样本;
[0028]所述样本组包括正样本组和负样本组;
[0029]所述正样本组包括所述常识三元组正样本、与所述常识三元组正样本对应的义原树组正样本以及根据所述常识三元组正样本预先确定的正投票标签;
[0030]所述负样本组包括所述常识三元组负样本、与所述常识三元组负样本对应的义原树组负样本以及根据所述常识三元组负样本预先确定的负投票标签;
[0031]对所述评分模型按照如下方法进行训练:
[0032]基于所述正样本组、所述负样本组和损失函数对所述评分模型进行训练。
[0033]第二方面,本专利技术还提供一种常识知识排序方法,包括:基于上述第一方面所述常识知识评分方法,对多个待评分常识三元组对象进行评分,获得每个所述待评分常识三元组对象对应的投票结果;
[0034]基于所述投票结果对待评分常识三元组对象进行排序。
[0035]第三方面,本专利技术还提供一种常识知识评分装置,包括:
[0036]获取单元,用于获取待评分常识三元组对象和与所述待评分常识三元组对象对应的义原树组;
[0037]处理单元,用于将所述待评分常识三元组对象和所述义原树组输入至评分模型,获得所述评分模型输出的投票结果;
[0038]其中,所述评分模型是基于样本组以及对应的投票标签进行训练后得到的,所述样本组包括常识三元组样本以及与所述常识三元组样本对应的义原树组样本,所述投票标
签是根据所述样本组预先确定的,并与所述样本组一一对应。
[0039]第四方面,本专利技术还提供一种常识知识排序装置,包括:
[0040]评分单元,用于基于如第一方面所述常识知识评分方法,对多个待评分常识三元组对象进行评分,获得每个所述待评分常识三元组对象对应的投票结果;
[0041]排序单元,用于基于所述投票结果对所述多个待评分常识三元组对象进行排序。
[0042]第五方面,本专利技术还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如第一方面所述常识知识评分方法或如第二方面所述常识知识排序方法。
[0043]第六方面,本专利技术还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如第一方面所述常识知识评分方法或如第二方面所述常识知识排序方法。
[0044]第七方面,本专利技术还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如第一方面所述常识知识评分方法或如第二方面所述常识知识排序方法。
[0045]本专利技术提供的常识知识评分方法及装置通过结合三元组和义原,使得评分模型不仅能够从待评分常识三元组对象的自身信息中捕获共现信息,还能够从待评分常识三元组对象对应的义原数组中获得非共现的语义抽象知识,实现对待评分常识三元组对象进行综合评分,提高了常识知识评分的准确率,从而有利于常识知识排序的准确性。
附图说明
[0046]为了更清楚地说明本专利技术或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0047]图1是本专利技术实施例提供的常识知识评分方法的流程示意图;
[0048]图2是本本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种常识知识评分方法,其特征在于,包括:获取待评分常识三元组对象和与所述待评分常识三元组对象对应的义原树组;将所述待评分常识三元组对象和所述义原树组输入至评分模型,获得所述评分模型输出的投票结果;其中,所述评分模型是基于样本组以及对应的投票标签进行训练后得到的,所述样本组包括常识三元组样本以及与所述常识三元组样本对应的义原树组样本,所述投票标签是根据所述样本组预先确定的,并与所述样本组一一对应。2.根据权利要求1所述的常识知识评分方法,其特征在于,所述待评分常识三元组对象包括头实体、关系类型和尾实体;获取与所述待评分常识三元组对象对应的义原树组包括:获取与所述头实体对应的头义原树、与所述尾实体对应的尾义原树以及与所述头义原树和所述尾义原树之间的义原路径。3.根据权利要求1所述的常识知识评分方法,其特征在于,所述评分模型包括:第一解析模块、第二解析模块、第三解析模块和投票模块;所述将所述待评分常识三元组对象和所述义原树组输入至评分模型,获得所述评分模型输出的投票结果,包括:将所述待评分常识三元组对象输入至所述第一解析模块,获得所述第一解析模块输出的第一向量;将所述义原树组输入至所述第二解析模块,获得所述第二解析模块输出的第二向量;将所述待评分常识三元组对象和所述义原树组输入至所述第三解析模块,获得所述第三解析模块输出的第三向量;将所述第一向量、所述第二向量和所述第三向量输入至所述投票模块,获得所述投票模块输出的所述投票结果。4.根据权利要求3所述的常识知识评分方法,其特征在于,所述投票模块包括第一概率单元、第二概率单元、第三概率单元和投票单元;所述将所述第一向量、所述第二向量和所述第三向量输入至所述投票模块,获得所述投票模块输出的投票结果,包括:将所述第一向量输入至所述第一概率单元,获得第一概率单元输出的、用于表示所述待评分常识三元组对象正确概率的第一概率;将所述第二向量输入至所述第二概率单元,获得第二概率单元输出的、用于表示所述义原数组正确概率的第二概率;将所述第三向量输入至所述第三概率单元,获得第三概率单元输出的、用于表示所述待评分常识三元组对象和所述义原数组的组合正确概率的第三概率;将所述第一概率、所述第二概率和所述第三概率输入至所述投票单元,获得所述投票单元基于预设投票公式输出的所述投票结果。5.根据权利要求1

【专利技术属性】
技术研发人员:李涓子朱洪银刘宝巨吕鑫侯磊张鹏唐杰许斌
申请(专利权)人:清华大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1