上下位关系获取方法、装置、电子设备及存储介质制造方法及图纸

技术编号:34469408 阅读:16 留言:0更新日期:2022-08-10 08:43
本申请实施例提供了上下位关系获取方法、装置、电子设备及存储介质方法,该方法包括:从多个数据对中获取目标数据对,数据对包括:第一对象、第二对象,目标数据对包括:目标第一对象、目标第二对象;将目标数据对输入到上下位关系判断模型中,得到指示目标第一对象与目标第二对象是否具有上下位关系的第一判断结果,上下位关系判断模型被配置为:利用预训练语言模型生成目标第一对象与目标第二对象之间的关系型表示;利用图神经网络基于预设图,生成目标第一对象的结构型表示和目标第二对象的结构型表示;基于关系型表示、目标第一对象的结构型表示、目标第二对象的结构型表示,生成目标数据对的目标表示,基于目标表示,生成第一判断结果。一判断结果。一判断结果。

【技术实现步骤摘要】
上下位关系获取方法、装置、电子设备及存储介质


[0001]本申请涉及自然语言处理领域,具体涉及上下位关系获取方法、装置、电子设备及存储介质。

技术介绍

[0002]对象之间的上下位关系被广泛应用于诸如推荐系统、搜索系统的系统中,以用于向用户推荐对象、理解用户搜索意图等。目前,通常是利用诸如“...是一种...”的模板从文本中获取对象之间的上下位关系。
[0003]然而,由于对象之间的上下位关系最终被应用在依赖于用户的行为的诸如推荐系统、搜索系统的系统中,对象之间是否存在上下位关系是与用户的与对象相关的行为高度关联的,利用模板从文本中获取对象之间的上下位关系,没有考虑对象之间是否存在上下位关系与用户的与对象相关的行为的关联性,获取出至少部分上下位关系与用户行为无关联,导致获取到的对象之间的上下位关系的准确性较低。

技术实现思路

[0004]本申请提供上下位关系获取方法、装置、电子设备及存储介质。
[0005]根据本申请实施例的第一方面,提供一种上下位关系获取方法,包括:
[0006]从多个数据对中获取目标数据对,所述数据对包括:第一对象、第二对象,其中,所述第二对象出现在预设时间段内以所述第一对象为搜索词进行搜索而返回的搜索结果中并且所述搜索结果被用户点击过,所述目标数据对包括:目标第一对象、目标第二对象;
[0007]将目标数据对输入到上下位关系判断模型中,得到指示所述目标第一对象与所述目标第二对象是否具有上下位关系的第一判断结果,其中,所述上下位关系判断模型被配置为:
[0008]利用预训练语言模型生成所述目标第一对象与所述目标第二对象之间的关系型表示;
[0009]获取预设图,所述预设图包括:指示对象之间的已知的上下位关系的上下位关系图谱、所述多个数据对,其中,在所述预设图中,所述数据对中的第一对象与所述数据对中的第二对象之间的边的权重基于所述第二对象在所述第一对象下的点击次数确定;
[0010]利用图神经网络基于所述预设图,生成所述目标第一对象的结构型表示和所述目标第二对象的结构型表示;
[0011]基于所述关系型表示、所述目标第一对象的结构型表示、所述目标第二对象的结构型表示,生成所述目标数据对的目标表示;
[0012]基于所述目标表示,生成所述第一判断结果。
[0013]根据本申请实施例的第二方面,提供一种上下位关系获取装置,包括:
[0014]获取单元,被配置为从多个数据对中获取目标数据对,所述数据对包括:第一对象、第二对象,其中,所述第二对象出现在预设时间段内以所述第一对象为搜索词进行搜索
而返回的搜索结果中并且所述搜索结果被用户点击过,所述目标数据对包括:目标第一对象、目标第二对象;
[0015]判断单元,被配置为将目标数据对输入到上下位关系判断模型中,得到指示所述目标第一对象与所述目标第二对象是否具有上下位关系的第一判断结果,其中,所述上下位关系判断模型被配置为:利用预训练语言模型生成所述目标第一对象与所述目标第二对象之间的关系型表示;获取预设图,所述预设图包括:指示对象之间的已知的上下位关系的上下位关系图谱、所述多个数据对,其中,在所述预设图中,所述数据对中的第一对象与所述数据对中的第二对象之间的边的权重基于所述第二对象在所述第一对象下的点击次数确定;利用图神经网络基于所述预设图,生成所述目标第一对象的结构型表示和所述目标第二对象的结构型表示;基于所述关系型表示、所述目标第一对象的结构型表示、所述目标第二对象的结构型表示,生成所述目标数据对的目标表示;基于所述目标表示,生成所述第一判断结果。
[0016]本申请实施例提供的上下位关系获取方法、装置,在获取对象之间的上下位关系时,针对的目标数据对与用户行为相关,即目标数据对中的第二对象出现在预设时间段内以目标数据对中的第一对象为搜索词进行搜索而返回的搜索结果中并且搜索结果被用户点击过,同时,预设图包括第一对象与第二对象之间的边、第一对象与第二对象之间的边的权重,预设图也与用户行为相关。相应的,生成的目标第一对象与目标第二对象之间的关系型表示与用户行为相关,同时,基于预设图,生成的目标第一对象的结构型表示、目标第二对象的结构型表示与用户行为相关。基于目标第一对象与目标第二对象之间的关系型表示、目标第一对象的结构型表示、目标第二对象的结构型表示,生成目标数据对的目标表示,基于目标数据对的目标表示,生成第一判断结果。从而,在考虑对象之间是否存在上下位关系与用户的行为的关联性的情况下,获取对象之间的上下位关系,提升得到的对象之间的上下位关系的准确性。
附图说明
[0017]此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
[0018]图1示出了本申请实施例提供的上下位关系获取方法的一个的流程图;
[0019]图2示出了示出了上下位关系图谱的一个示意图;
[0020]图3示出了生成对象的结构型表示的示意图;
[0021]图4示出了本申请实施例提供的上下位关系获取装置的一个结构示意图。
具体实施方式
[0022]下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关专利技术,而非对该专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关专利技术相关的部分。
[0023]需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
[0024]图1是本申请实施例提供的上下位关系获取方法的一个的流程图,该方法包括以
下步骤:
[0025]步骤101,从多个数据对中获取目标数据对。
[0026]预设时间段为结束时刻在执行步骤101的时刻之前,预设时间段的起始时刻和时长可以预先设置。
[0027]在本申请中,数据对中的第一对象、数据对中的第二对象均不特指某一个对象。
[0028]将每一个数据对中的为搜索词的对象统一称之为第一对象,每一个数据对中的除了为搜索词的对象之外的对象统一称之为第二对象。
[0029]对于一个数据对和另一个数据对,该一个数据对中的第一对象和另一个数据对中的第一对象可能相同,也可能不同。
[0030]对于任意两个数据对,该任意两个数据对中的每一个数据对包括的第二对象不同。
[0031]在本申请中,对于一个数据对,该数据对中第二对象出现在预设时间段内以该数据对中的第一对象为搜索词进行搜索而返回的搜索结果中并且该搜索结果被用户点击过。
[0032]例如,第一对象为“面包”,“土司”出现在预设时间段内,以“面包”为搜索词进行搜索返回的搜索结果“...牌土司”中并且“...牌土司”被用户点击过,“土司”可以作为一个第二对象,“面包”和“土司”可以构成一个数据对。例如,第一对象为“面包”,“大理石餐包”出现在预设时间段内,以“面包”为搜索词进行搜本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种上下位关系获取方法,其特征在于,所述方法包括:从多个数据对中获取目标数据对,所述数据对包括:第一对象、第二对象,其中,所述第二对象出现在预设时间段内以所述第一对象为搜索词进行搜索而返回的搜索结果中并且所述搜索结果被用户点击过,所述目标数据对包括:目标第一对象、目标第二对象;将目标数据对输入到上下位关系判断模型中,得到指示所述目标第一对象与所述目标第二对象是否具有上下位关系的第一判断结果,其中,所述上下位关系判断模型被配置为:利用预训练语言模型生成所述目标第一对象与所述目标第二对象之间的关系型表示;获取预设图,所述预设图包括:指示对象之间的已知的上下位关系的上下位关系图谱、所述多个数据对,其中,在所述预设图中,所述数据对中的第一对象与所述数据对中的第二对象之间的边的权重基于所述第二对象在所述第一对象下的点击次数确定;利用图神经网络基于所述预设图,生成所述目标第一对象的结构型表示和所述目标第二对象的结构型表示;基于所述关系型表示、所述目标第一对象的结构型表示、所述目标第二对象的结构型表示,生成所述目标数据对的目标表示;基于所述目标表示,生成所述第一判断结果。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:在从多个数据对中获取目标数据对之前,基于所述第二对象在所述第一对象下的点击次数、所述第二对象的出现次数,确定所述第一对象与所述第二对象之间的边的权重,其中,所述第二对象的出现次数为所述预设时间段内,包括所述第二对象的搜索结果被返回的次数,所述包括所述第二对象的搜索结果基于在所述预设时间段内,以相应的搜索词进行搜索而返回,所述点击次数的多少与所述边的权重的大小正相关,所述出现次数的多少与所述边的权重的大小负相关。3.根据权利要求1所述的方法,其特征在于,利用预训练语言模型生成所述目标第一对象与所述目标第二对象之间的关系型表示包括:从领域知识数据中获取所述目标第一对象的特征数据和所述目标第二对象的特征数据,其中,所述领域知识数据包括所述目标第一对象和所述目标第二对象所属的领域中的多个对象的特征数据;利用预训练语言模型基于所述目标第一对象的特征数据和所述目标第二对象的特征数据,生成所述目标第一对象与所述目标第二对象之间的关系型表示。4.根据权利要求1所述的方法,其特征在于,利用图神经网络基于所述预设图,生成所述目标第一对象的结构型表示和所述目标第二对象的结构型表示包括:利用图神经网络基于所述预设图、目标向量表示集合,生成所述目标第一对象的结构型表示和目标第二对象的结构型表示,目标向量表示集合包括:目标第一对象的目标向量表示、目标第一对象的每一个第一相邻对象的目标向量表示、目标第二对象的目标向量表示、目标第二对象的每一个第二相邻对象的目标向量表示,其中,所述目标第一对象与所述第一相邻对象之间存在边,所述目标第二对象与所述第二相邻对象之间存在边;以及所述方法还包括:在从多个数据对中获取目标数据对之前,利用图神经网络基于所述预设图,生成预设图中的每一个对象的初始向量表示;
基于所述每一个对象的初始向量表示,进行向量表示调整,得到所述每一个对象的目标向量表示,其中,所述向量表示调整用于:对于所述预设图中的每一个对象,减小所述对象的向量表示与所述对象的相邻对象的向量表示之间的距离并且增大所述对象的向量表示与所述对象的非相邻对象的向量表示之间的距离,在所述预设图...

【专利技术属性】
技术研发人员:程思婕许慧敏张福宝王宗宇谢睿武威肖仰华
申请(专利权)人:北京三快在线科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1