知识图谱的更新方法和装置、存储介质及电子设备制造方法及图纸

技术编号:35057678 阅读:17 留言:0更新日期:2022-09-28 11:07
本申请公开了一种知识图谱的更新方法和装置、存储介质及电子设备。其中,该方法包括:获取待更新的第一时序知识图谱,根据第一时序知识图谱构建第一函数和第二函数,根据第一函数和第二函数构建目标评价函数,根据目标评价函数,在第二组四元组中确定出待补入的四元组,并将待补入的四元组添加至第一时序知识图谱中,得到第二时序知识图谱。本申请实施例可应用于云技术、人工智能、智慧交通、辅助驾驶等各种场景,本申请解决了时序知识图谱的利用效率较低的技术问题。率较低的技术问题。率较低的技术问题。

【技术实现步骤摘要】
知识图谱的更新方法和装置、存储介质及电子设备


[0001]本申请涉及计算机领域,具体而言,涉及一种知识图谱的更新方法 和装置、存储介质及电子设备。

技术介绍

[0002]目前,时序知识图谱指包含时间信息的知识图谱。知识图谱通常以 三元组的形式储存知识,形如(e1,r,e2),其中e1,e2为知识图谱中的实体 节点,r为图中的关系边。时序知识图谱通常以四元组的形式储存知识, 形如(e1,r,e2,t),其中t是时间信息,可以为具体时间节点,如“2021

12
‑ꢀ
01”,也可以为时间段,如“1995年至2021年”或“自2020年开始”。
[0003]但是,由于现实世界知识的丰富性,时序知识图谱中的知识往往呈 现稀疏性,使得时序知识图谱中部分实体之间的关系难以确定,在需要 更新知识图谱时,只能人为增加对应的四元组,导致时序知识图谱的利 用效率较低,进而影响依赖于时序知识图谱的下游模型。
[0004]针对上述的问题,目前尚未提出有效的解决方案。

技术实现思路

[0005]本申请实施例提供了一种知识图谱的更新方法和装置、存储介质及 电子设备,以至少解决时序知识图谱的利用效率较低的技术问题。
[0006]根据本申请实施例的一个方面,提供了一种知识图谱的更新方法, 包括:获取待更新的第一时序知识图谱,其中,所述第一时序知识图谱 包括第一组四元组,所述第一组四元组中的每个四元组包括第一实体、 所述第一实体与第二实体的第一关系、所述第二实体、以及第一时间信 息;根据所述第一时序知识图谱构建第一函数和第二函数,其中,所述 第一函数用于表示所述第一组四元组中的实体在时间信息上的分布,所 述第二函数用于表示所述第一组四元组中的关系在时间信息上的分布; 根据所述第一函数和所述第二函数构建目标评价函数,其中,所述目标 评价函数用于对待处理的四元组确定目标参数的取值,所述目标参数的 取值用于表示第一分布与第二分布之间的距离,所述第一分布为所述待 处理的四元组中的两个实体在时间信息上的分布,所述第二分布为所述 待处理的四元组中的关系在时间信息上的分布;根据所述目标评价函数, 在第二组四元组中确定出待补入的四元组,并将所述待补入的四元组添 加至所述第一时序知识图谱中,得到第二时序知识图谱,其中,所述第 二组四元组中的每个四元组中的两个实体为所述第一时序知识图谱中已 有的实体,所述第二组四元组中的每个四元组中的时间信息为所述第一 时序知识图谱中已有的时间信息,所述第二组四元组中的每个四元组与 所述第一组四元组中的四元组不同。
[0007]根据本申请实施例的另一方面,还提供了一种知识图谱的更新装置, 包括:获取模块,用于获取待更新的第一时序知识图谱,其中,所述第 一时序知识图谱包括第一组四元组,所述第一组四元组中的每个四元组 包括第一实体、所述第一实体与第二实体的第一
关系、所述第二实体、 以及第一时间信息;第一构建模块,用于根据所述第一时序知识图谱构 建第一函数和第二函数,其中,所述第一函数用于表示所述第一组四元 组中的实体在时间信息上的分布,所述第二函数用于表示所述第一组四 元组中的关系在时间信息上的分布;第二构建模块,用于根据所述第一 函数和所述第二函数构建目标评价函数,其中,所述目标评价函数用于 对待处理的四元组确定目标参数的取值,所述目标参数的取值用于表示 第一分布与第二分布之间的距离,所述第一分布为所述待处理的四元组 中的两个实体在时间信息上的分布,所述第二分布为所述待处理的四元 组中的关系在时间信息上的分布;处理模块,用于根据所述目标评价函 数,在第二组四元组中确定出待补入的四元组,并将所述待补入的四元 组添加至所述第一时序知识图谱中,得到第二时序知识图谱,其中,所 述第二组四元组中的每个四元组中的两个实体为所述第一时序知识图谱 中已有的实体,所述第二组四元组中的每个四元组中的时间信息为所述 第一时序知识图谱中已有的时间信息,所述第二组四元组中的每个四元 组与所述第一组四元组中的四元组不同。
[0008]可选地,所述第二构建模块,包括:第一生成单元,用于根据所述 第一时序知识图谱生成正样本四元组集合和负样本四元组集合,其中, 所述第一组四元组包括所述正样本四元组集合,所述负样本四元组集合 包括对所述正样本四元组集合中的部分或全部四元组中的所述第一实体 或所述第二实体进行替换得到的四元组;第一构建单元,用于根据所述 正样本四元组集合和所述负样本四元组集合构建所述第一函数和所述第 二函数,其中,所述正样本四元组集合和所述负样本四元组集合用于确 定所述第一函数和所述第二函数中的参数。
[0009]可选地,所述第一构建单元,包括:第一获取子单元,用于获取待 训练的第一初始函数和第二初始函数,其中,所述第一初始函数用于表 示所述正样本四元组集合与所述负样本四元组集合中的实体在所述时间 信息上的分布,所述第二初始函数用于表示所述正样本四元组集合与所 述负样本四元组集合中的关系在所述时间信息上的分布;更新子单元, 用于根据所述正样本四元组集合和所述负样本四元组集合对所述第一初 始函数和所述第二初始函数中的参数的取值进行更新,使得所述第一初 始函数和所述第二初始函数中的参数与所述正样本四元组集合和所述负 样本四元组集合构成的联合似然函数满足第一预设条件,将满足所述第 一预设条件时的所述第一初始函数和所述第二初始函数确定为所述第一 函数和所述第二函数。
[0010]可选地,所述装置用于通过如下方式根据所述正样本四元组集合和 所述负样本四元组集合对所述第一初始函数和所述第二初始函数中的参 数的取值进行更新,使得所述第一初始函数和所述第二初始函数中的参 数与所述正样本四元组集合和所述负样本四元组集合构成的联合似然函 数满足第一预设条件:根据所述正样本四元组集合和所述负样本四元组 集合对所述第一初始函数和所述第二初始函数中的参数的取值进行更新, 使得所述第一初始函数和所述第二初始函数中的参数与所述正样本四元 组集合和所述负样本四元组集合构成的联合似然函数的取值最大化。
[0011]可选地,所述装置用于通过如下方式根据所述正样本四元组集合和 所述负样本四元组集合对所述第一初始函数和所述第二初始函数中的参 数的取值进行更新:根据所述正样本四元组集合和所述负样本四元组集 合确定负样本采样率,其中,所述负样本采样率表示对所述正样本四元 组集合中每个正样本四元组采样得到的负样本四元组的数量;
获取预先 确定的训练轮数、目标间隔以及时序窗口长度,其中,所述训练轮数用 于表示将所述第一初始函数和所述第二初始函数训练为所述第一函数和 所述第二函数的训练次数,所述目标间隔用于表示所述正样本四元组集 合中的四元组对应的所述目标参数与所述负样本四元组集合中的四元组 对应的所述目标参数之间的预设差值,所述时序窗口长度用于表示在训 练过程中,每次从所述正样本四元组集合中采样正样本子集合进行训练 时,所述正样本子集合中四元组的时间跨度;根据所述正样本四元组集 合、所述负样本采样率、所述训本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种知识图谱的更新方法,其特征在于,包括:获取待更新的第一时序知识图谱,其中,所述第一时序知识图谱包括第一组四元组,所述第一组四元组中的每个四元组包括第一实体、第一实体与第二实体的第一关系、第二实体、以及第一时间信息;根据所述第一时序知识图谱构建第一函数和第二函数,其中,所述第一函数用于表示所述第一组四元组中的实体在时间信息上的分布,所述第二函数用于表示所述第一组四元组中的关系在时间信息上的分布;根据所述第一函数和所述第二函数构建目标评价函数,其中,所述目标评价函数用于对待处理的四元组确定目标参数的取值,所述目标参数的取值用于表示第一分布与第二分布之间的距离,所述第一分布为所述待处理的四元组中的两个实体在时间信息上的分布,所述第二分布为所述待处理的四元组中的关系在时间信息上的分布;根据所述目标评价函数,在第二组四元组中确定出待补入的四元组,并将所述待补入的四元组添加至所述第一时序知识图谱中,得到第二时序知识图谱,其中,所述第二组四元组中的每个四元组中的两个实体为所述第一时序知识图谱中已有的实体,所述第二组四元组中的每个四元组中的时间信息为所述第一时序知识图谱中已有的时间信息,所述第二组四元组中的每个四元组与所述第一组四元组中的四元组不同。2.根据权利要求1所述的方法,其特征在于,所述根据所述第一时序知识图谱构建第一函数和第二函数,包括:根据所述第一时序知识图谱生成正样本四元组集合和负样本四元组集合,其中,所述第一组四元组包括所述正样本四元组集合,所述负样本四元组集合包括对所述正样本四元组集合中的部分或全部四元组中的所述第一实体或所述第二实体进行替换得到的四元组;根据所述正样本四元组集合和所述负样本四元组集合构建所述第一函数和所述第二函数,其中,所述正样本四元组集合和所述负样本四元组集合用于确定所述第一函数和所述第二函数中的参数。3.根据权利要求2所述的方法,其特征在于,所述根据所述正样本四元组集合和所述负样本四元组集合构建所述第一函数和所述第二函数,包括:获取待训练的第一初始函数和第二初始函数,其中,所述第一初始函数用于表示所述正样本四元组集合与所述负样本四元组集合中的实体在所述时间信息上的分布,所述第二初始函数用于表示所述正样本四元组集合与所述负样本四元组集合中的关系在所述时间信息上的分布;根据所述正样本四元组集合和所述负样本四元组集合对所述第一初始函数和所述第二初始函数中的参数的取值进行更新,使得所述第一初始函数和所述第二初始函数中的参数与所述正样本四元组集合和所述负样本四元组集合构成的联合似然函数满足第一预设条件,将满足所述第一预设条件时的所述第一初始函数和所述第二初始函数确定为所述第一函数和所述第二函数。4.根据权利要求3所述的方法,其特征在于,所述根据所述正样本四元组集合和所述负样本四元组集合对所述第一初始函数和所述第二初始函数中的参数的取值进行更新,使得所述第一初始函数和所述第二初始函数中的参数与所述正样本四元组集合和所述负样本四元组集合构成的联合似然函数满足第一预设条件,包括:
根据所述正样本四元组集合和所述负样本四元组集合对所述第一初始函数和所述第二初始函数中的参数的取值进行更新,使得所述第一初始函数和所述第二初始函数中的参数与所述正样本四元组集合和所述负样本四元组集合构成的联合似然函数的取值最大化。5.根据权利要求3所述的方法,其特征在于,所述根据所述正样本四元组集合和所述负样本四元组集合对所述第一初始函数和所述第二初始函数中的参数的取值进行更新,包括:根据所述正样本四元组集合和所述负样本四元组集合确定负样本采样率,其中,所述负样本采样率表示对所述正样本四元组集合中每个正样本四元组采样得到的负样本四元组的数量;获取预先确定的训练轮数、目标间隔以及时序窗口长度,其中,所述训练轮数用于表示将所述第一初始函数和所述第二初始函数训练为所述第一函数和所述第二函数的训练次数,所述目标间隔用于表示所述正样本四元组集合中的四元组对应的所述目标参数与所述负样本四元组集合中的四元组对应的所述目标参数之间的预设差值,所述时序窗口长度用于表示在训练过程中,每次从所述正样本四元组集合中采样正样本子集合进行训练时,所述正样本子集合中四元组的时间跨度;根据所述正样本四元组集合、所述负样本采样率、所述训练轮数、所述目标间隔以及所述时序窗口长度,对所述第一初始函数和所述第二初始函数中的参数的取值进行更新,得到所述第一函数和所述第二函数。6.根据权利要求1所述的方法,其特征在于,所述根据所述目标评价函数,在第二组四元组中确定出待补入的四元组,包括:通过所述目标评价函数,对所述第二组四元组中的每个四元组确定所述目标参数的取值,其中,所述第二组四元组中的每个四元组包括当前实体、所述当前实体和目标实体的关系、所述目标实体、当前时间信息;根据所述第二组四元组中的每个四元组对应的所述目标参数的取值,在所述第二组四元组中确定出所述待补入的四元组,其中,所述待补入的四元组对应的所述目标参数的取值满足第二预设条件。7.根据权利要求6所述的方法,其特征在于,所述根据所述第二组四元组中的每个四元组对应的所述目标参数的取值,在所述第二组四元组中确定出所述待补入的四元组,包括:根据所述第二组四元组中的每个四元组对应的所述目标参数的取...

【专利技术属性】
技术研发人员:张林海周德宇张倩汶曹云波
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1