System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种顾及时间特征的地理知识图谱隐式推理模型构建方法技术_技高网

一种顾及时间特征的地理知识图谱隐式推理模型构建方法技术

技术编号:43296699 阅读:4 留言:0更新日期:2024-11-12 16:14
本发明专利技术涉及地理知识图谱嵌入技术领域,具体公开了一种顾及时间特征的地理知识图谱隐式推理模型构建方法,包括以下步骤:首先,实体编码器将任意一个包含时间信息的地理知识图谱嵌入到向量空间中;而后,投影算子执行链接预测操作,将实体与关系在空间上进行计算得到预测向量;通过交集算子处理逻辑查询中的逻辑与操作,在多个实体集合间找到共同的实体;构建最大边界损失函数用于模型训练;制定评价指标用于评价模型性能;最后,进行模型训练与参数设置。本发明专利技术采用上述的一种顾及时间特征的地理知识图谱隐式推理模型构建方法,对时间信息进行编码,将时间维度的信息转化为数值型特征,增强了地理知识图谱的表达能力并提高查询的准确度和效率。

【技术实现步骤摘要】

本专利技术涉及知识图谱嵌入,尤其是涉及一种顾及时间特征的地理知识图谱隐式推理模型构建方法


技术介绍

1、知识图谱中的逻辑查询是人工智能领域的一个核心任务,它使用户能够在知识图谱内进行复杂信息的检索和查询。知识图谱嵌入技术是通过深度学习或其他机器学习算法,将知识图谱中的实体和关系映射到低维向量空间。通过将知识图谱的查询图嵌入向量空间,通过计算得到目标节点的预测向量,进而有效地搜索出所需的目标节点。知识图谱嵌入不仅有助于克服传统符号逻辑方法在处理大规模数据面临的可扩展性和灵活性问题,还能增强模型对知识图谱潜在语义的把握能力。

2、然而,尽管知识图谱嵌入技术已取得了显著进展,但在地理知识图谱逻辑查询的研究中,时间特征的有效利用仍然是一个挑战。在当前的时间编码模型在处理时间点信息时,往往无法有效地提取和利用时间信息的特征,导致模型在预测和推理时可能出现不精确或偏差。此外,如何设计有效的编码和融合机制将时间特征整合到地理知识图谱嵌入中,以及如何在嵌入表示中平衡时间特征的权重和影响,是亟需解决的问题。


技术实现思路

1、本专利技术的目的是提供一种顾及时间特征的地理知识图谱隐式推理模型构建方法,解决了如何在地理逻辑查询问答系统中有效地编码和利用时间信息,以增强地理知识图谱的表达能力并提高查询的准确度和效率的问题;通过对时间点进行编码,能够将时间维度的信息转化为易于机器处理的数值型特征,从而在地理知识图谱框架下,实现对时间敏感任务的查询处理。

2、为实现上述目的,本专利技术提供了一种顾及时间特征的地理知识图谱隐式推理模型构建方法,包括以下步骤:

3、s1、利用实体编码器将任意一个包含时间信息的知识图谱嵌入到 d维的向量空间中;

4、s2、投影算子执行链接预测操作,将实体与关系在空间上进行计算得到预测向量;

5、s3、通过交集算子处理逻辑查询中的逻辑与操作,在多个实体集合之间找到共同的实体;

6、s4、构建最大边界损失函数用于模型训练;

7、s5、制定评价指标用于评价模型性能;

8、s6、模型训练与参数设置。

9、优选的,步骤s1中,所述实体编码器分为实体特征编码器和时间特征编码器,所述实体特征编码器将任意一个地理知识图谱中的实体嵌入到维的向量空间中;

10、对于任意一个实体,实体特征编码器将通过嵌入查找方法来计算实体的嵌入:

11、;

12、其中,是地理知识图谱中所有实体类型的嵌入矩阵,表示实体在地理知识图谱中的one-hot向量,因此,将进行嵌入查找操作,从相应的列中获得实体嵌入,表示l2范数。

13、优选的,所述时间特征编码器将任意一个实体的时间嵌入到向量空间中,所述时间信息包括时间点和时间段两种尺度,所述时间特征编码器用于处理时间不同尺度的信息:

14、若一个地理实体所包含的时间信息为时间点时,则采用其现代标准时间作为的输入;

15、若一个地理实体所包含的时间信息为时间段时,则采用降维的方式,将二维的时间段降维成一维的时间点,作为的输入;

16、对于地理知识图谱中非地理实体或者地理实体缺少时间信息的,时间特征将采用零向量进行补齐操作;

17、因此,对于任意一个地理知识图谱中的地理实体,时间特征编码器可以将地理实体的时间信息编码为,可以表示为以下公式:

18、;

19、其中,表示时间点,表示时间段降维后的时间点,且∈()。

20、优选的,所述降维方法包括首端采样、尾端采样和随机采样,所述首端采样表示采用时间段的开始时间来表示时间段,所述尾端采样表示采用时间段的结束时间来表示时间段,所述随机采样表示在时间段中随机选取一个时间点来表示该时间段,将时间段进行降维之后,采用时间点编码方式,对降维后的时间点进行编码表示。

21、优选的,所述实体编码器分为实体特征编码器和时间特征编码器,则步骤s1中,所述实体编码器将任意一个地理知识图谱中的实体嵌入到维的向量空间中表示为:

22、;

23、其中,[;]表示特征向量的拼接,。

24、优选的,步骤s2中,对于给定的地理知识图谱,投影算子执行链接预测操作,将实体与关系在空间上进行计算得到预测向量,根据输入对象的不同,投影算子分为两种类型:和;

25、处理的输入是一个三元组的头实体和关系,预测尾实体;处理的是逻辑查询中的基本图查询模型,是由存在量词约束的的向量嵌入,去预测的向量嵌入,

26、;

27、其中,和是可训练的关系矩阵,和的作用分别是特征嵌入和时间嵌入。

28、优选的,步骤s4中,所述模型训练包括地理知识图谱的训练阶段和地理知识图谱问答对的训练;

29、在地理知识图谱的训练阶段,训练的数据源为地理知识图谱g本身的结构,对于,任意一个节点:首先从地理知识图谱的三元组中获得节点所有的一度邻居节点,从负样本集中采样n组负样本,该阶段模型训练策略是预测出节点的嵌入最接近正样本的嵌入,并且远离负样本集中的每一个负样本的嵌入,即预测节点的嵌入越接近正样本越好,越远离负样本越好,由此构建出最大边界损失函数:

30、;

31、其中表示计算向量之间的距离;

32、在地理知识图谱问答对的训练阶段,训练的数据源为人工构建的地理知识图谱问答对,对于,任意一个问答对均遵循基本的查询子图模式,该阶段模型训练目标是将正确的答案节点嵌入最接近问题的预测嵌入,并且远离所有负样本集中的所有负样本节点的嵌入,因此,本阶段的训练损失函数采用以下最大边界损失:

33、。

34、优选的,步骤s5中,所述评价指标包括roc曲线下面积auc和平均百分位数排名apr;

35、所述auc通过计算roc曲线,并求取该曲线下的面积,衡量模型区分正确答案和随机负样本的能力;

36、所述apr通过计算正确答案在模型预测中的平均百分位排名,衡量模型在所有查询中给出正确答案的相对排序情况。

37、因此,本专利技术采用上述一种顾及时间特征的地理知识图谱隐式推理模型构建方法,有益效果如下:

38、(1)本专利技术通过深入分析现有的地理知识图谱嵌入技术,提出了一个顾及时间特征的隐式推理模型,解决了如何通过有效地提取时间特征来提高地理知识图谱中地理查询问答的准确性和效率的问题。

39、(2)本专利技术根据地理知识图谱中的逻辑查询基础和地理逻辑查询任务的特点,通过引入时间特征编码器,将时间信息编码为数值型的向量,与地理知识图谱的实体嵌入进行融合,明确了地理知识图谱逻辑查询中时间信息的重要性。

40、(3)本专利技术通过一系列实验验证了融合时间特征的地理逻辑查询模型能够提供更精确的查询结果。通过对比实验分析了不同的时间编码器和权重配置对模型性能的影响,结果表明时间本文档来自技高网...

【技术保护点】

1.一种顾及时间特征的地理知识图谱隐式推理模型构建方法,包括以下步骤:

2.根据权利要求1所述的一种顾及时间特征的地理知识图谱隐式推理模型构建方法,其特征在于,步骤S1中,所述实体编码器分为实体特征编码器和时间特征编码器,所述实体特征编码器将任意一个地理知识图谱中的实体嵌入到维的向量空间中;

3.根据权利要求2所述的一种顾及时间特征的地理知识图谱隐式推理模型构建方法,其特征在于,所述时间特征编码器将任意一个实体的时间嵌入到向量空间中,所述时间信息包括时间点和时间段两种尺度,所述时间特征编码器用于处理时间不同尺度的信息:

4.根据权利要求3所述的一种顾及时间特征的地理知识图谱隐式推理模型构建方法,其特征在于,所述降维方法包括首端采样、尾端采样和随机采样,所述首端采样表示采用时间段的开始时间来表示时间段,所述尾端采样表示采用时间段的结束时间来表示时间段,所述随机采样表示在时间段中随机选取一个时间点来表示该时间段,将时间段进行降维之后,采用时间点编码方式,对降维后的时间点进行编码表示。

5.根据权利要求4所述的一种顾及时间特征的地理知识图谱隐式推理模型构建方法,其特征在于,所述实体编码器分为实体特征编码器和时间特征编码器,则步骤S1中,所述实体编码器将任意一个地理知识图谱中的实体嵌入到维的向量空间中表示为:

6.根据权利要求5所述的一种顾及时间特征的地理知识图谱隐式推理模型构建方法,其特征在于,步骤S2中,对于给定的地理知识图谱,投影算子执行链接预测操作,将实体与关系在空间上进行计算得到预测向量,根据输入对象的不同,投影算子分为两种类型:和;

7.根据权利要求6所述的一种顾及时间特征的地理知识图谱隐式推理模型构建方法,其特征在于,步骤S4中,所述模型训练包括地理知识图谱的训练阶段和地理知识图谱问答对的训练;

8.根据权利要求7所述的一种顾及时间特征的地理知识图谱隐式推理模型构建方法,其特征在于,步骤S5中,所述评价指标包括ROC曲线下面积AUC和平均百分位数排名APR;

...

【技术特征摘要】

1.一种顾及时间特征的地理知识图谱隐式推理模型构建方法,包括以下步骤:

2.根据权利要求1所述的一种顾及时间特征的地理知识图谱隐式推理模型构建方法,其特征在于,步骤s1中,所述实体编码器分为实体特征编码器和时间特征编码器,所述实体特征编码器将任意一个地理知识图谱中的实体嵌入到维的向量空间中;

3.根据权利要求2所述的一种顾及时间特征的地理知识图谱隐式推理模型构建方法,其特征在于,所述时间特征编码器将任意一个实体的时间嵌入到向量空间中,所述时间信息包括时间点和时间段两种尺度,所述时间特征编码器用于处理时间不同尺度的信息:

4.根据权利要求3所述的一种顾及时间特征的地理知识图谱隐式推理模型构建方法,其特征在于,所述降维方法包括首端采样、尾端采样和随机采样,所述首端采样表示采用时间段的开始时间来表示时间段,所述尾端采样表示采用时间段的结束时间来表示时间段,所述随机采样表示在时间段中随机选取一个时间点来表示该时间段,将时间段进行降维之后,采用时间点...

【专利技术属性】
技术研发人员:张春菊徐兵王曙诸云强周康
申请(专利权)人:合肥工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1