一种关系挖掘方法、装置、设备及可读存储介质制造方法及图纸

技术编号:37315200 阅读:12 留言:0更新日期:2023-04-21 22:57
本申请公开了一种关系挖掘方法、装置、设备及可读存储介质,可应用于人工智能领域或金融领域。获取待测实体对和待测实体对的关系路径,待测实体对的关系路径为从待测头实体指向待测尾实体经过的边表示的关系的有序集合。将待测实体对和待测实体对的关系路径输入至待测关系的挖掘模型,得到待测关系的挖掘模型输出的挖掘结果,由于待测关系的挖掘模型用于依据待测实体对的关系路径以及预设实体类型的权重参数,获取待测实体对对应于各条关系路径的特征值,将实体类型的影响计入特征值的计算过程,消除了无关实体对特征值的不合理影响,提高特征值计算的合理性,进一步提高了挖掘结果的准确性。果的准确性。果的准确性。

【技术实现步骤摘要】
一种关系挖掘方法、装置、设备及可读存储介质


[0001]本申请涉及自然语言处理
,尤其涉及一种关系挖掘方法、装置、设备及可读存储介质。

技术介绍

[0002]电网数据的存储是进行各类数据分析的前提和基础,直接影响到后期查询分析、信息挖掘、状态评估等应用的性能、准确性和可用性。传统电网数据的存储方法主要使用企业级关系型数据库实现物理存储,主要存在的问题是支持的数据规模比较小、存储系统的扩展性较差、查询和复杂数据分析性能低下等。
[0003]知识图谱作为人工智能的大脑,已经被广泛运用到搜索引擎、公安、金融、医疗等领域。因此,构建基于电网数据的知识图谱是解决传统电网数据的存储效率低的重要手段。但是,随着电网数据的数据结构复杂以及数据量的与日增长,基于电网数据的知识图谱的规模逐渐扩大,如何准确地从知识图谱中挖掘电网数据间的潜在关系是目前亟待解决的问题。

技术实现思路

[0004]本申请提供了一种关系挖掘方法、装置、设备及可读存储介质,如下:
[0005]一种关系挖掘方法,包括:
[0006]获取待测实体对,所述待测实体对包括待测头实体和待测尾实体;
[0007]依据预先构建的知识图谱,获取所述待测实体对的关系路径,所述待测实体对的关系路径为从所述待测头实体指向所述待测尾实体经过的边表示的关系的有序集合;
[0008]将所述待测实体对和所述待测实体对的关系路径输入至待测关系的挖掘模型,得到所述待测关系的挖掘模型输出的挖掘结果;
[0009]其中,所述待测关系的挖掘模型用于依据所述待测实体对的关系路径以及预设实体类型的权重参数,获取所述待测实体对对应于各条关系路径的特征值,基于各个特征值获取所述待测头实体和所述待测尾实体之间所述待测关系成立的概率,并将所述待测关系成立的概率作为挖掘结果输出。
[0010]可选地,所述依据所述待测实体对的关系路径以及预设实体类型的权重参数,获取所述待测实体对对应于各条关系路径的特征值,包括:
[0011]基于改进的递归运算公式,获取所述待测实体对对应于关系路径的特征值,所述改进的递归运算公式通过在路径排序学习算法的每一步游走时为每一游走实体赋予预设实体类型的权重参数得到。
[0012]可选地,基于各个特征值获取所述待测头实体和所述待测尾实体之间所述待测关系成立的概率,包括:
[0013]依据各条所述待测实体对的关系路径的权重参数,将所述训练实体对对应于各条关系路径的特征值加权相加,得到所述待测实体对的特征得分,任意一条关系路径的权重
参数通过预先训练得到;
[0014]基于预先配置的Logistics函数以及所述待测实体对的特征得分,获取所述待测头实体和所述待测尾实体之间所述待测关系成立的概率。
[0015]可选地,本方法还包括:
[0016]基于所述知识图谱,获取所述待测关系的训练数据集合;
[0017]其中,所述待测关系的训练数据集合包括多条训练数据,所述训练数据包括训练实体对、所述训练实体对的关系路径、以及所述训练实体对的关系标注,所述训练实体对包括训练头实体和训练尾实体,所述训练实体对的关系路径为从所述训练头实体指向所述训练尾实体经过的关系的有序集合,所述训练实体对的关系标注用于指示所述训练头实体和所述训练尾实体是否存在所述待测关系;
[0018]将所述训练实体对和所述训练实体对的关系路径输入至所述分类模型,以使所述分类模型迭代执行参数更新流程,直至达到预设的训练条件,得到所述待测关系的挖掘模型;
[0019]其中,所述参数更新流程包括:
[0020]基于所述改进的递归运算公式以及预设实体类型的权重参数,获取所述训练实体对对应于各个关系路径的特征值;
[0021]基于各个特征值获取所述训练实体对的置信度,所述置信度用于表征所述训练头实体与所述训练尾实体之间所述待测关系成立的概率;
[0022]将各个所述训练实体对的置信度作为预测值,将各个所述训练实体对的关系标注作为真实值,利用预设的损失函数更新预设的模型参数,所述模型参数包括所述预设实体类型的权重参数。
[0023]可选地,模型参数还包括预设关系路径的权重参数;
[0024]所述基于各个特征值获取所述训练实体对的置信度,包括:
[0025]依据所述训练实体对的关系路径的权重参数,将所述训练实体对对应于各个关系路径的特征值加权相加,得到所述训练实体对的特征得分;
[0026]基于所述Logistics函数以及所述训练实体对的特征得分,获取所述训练实体对的置信度。
[0027]可选地,本方法还包括:
[0028]获取电网数据,所述电网数据包括电力数据和业务数据;
[0029]对所述电网数据进行预设的预处理,得到待处理数据,所述预处理的过程包括:利用正则表达式,去除所述电网数据中的不规则数据,和/或,通过对所述电网数据进行聚类得到异常数据,并去除异常数据;
[0030]将所述待处理数据依据多模数据存储的方式,存入关系型数据库;
[0031]基于所述关系型数据库生成所述待处理数据的三元组,作为候选三元组加入候选三元组集合;
[0032]对所述候选三元组集合进行预设的数据清洗,得到三元组数据集,所述数据清洗的过程包括:删除包括预设的不规范实体的候选三元组,和/或,对所述候选三元组集合中的各个候选三元组进行语义对齐;
[0033]基于所述三元组数据集构建所述知识图谱。
[0034]可选地,基于所述关系型数据库生成所述待处理数据的三元组,包括:
[0035]针对所述关系型数据库中的结构化数据,按照行名为头实体、列名为关系、数据为尾实体的规则映射得到三元组;
[0036]针对所述关系型数据库中的非结构化数据,将所述非结构化数据输入至预先训练好的实体关系抽取模型,得到所述实体关系抽取模型输出的三元组。
[0037]一种关系挖掘装置,包括:
[0038]待测数据获取单元,用于获取待测实体对,所述待测实体对包括待测头实体和待测尾实体;
[0039]路径获取单元,用于依据预先构建的知识图谱,获取所述待测实体对的关系路径,所述待测实体对的关系路径为从所述待测头实体指向所述待测尾实体经过的边表示的关系的有序集合;
[0040]挖掘结果获取单元,用于将所述待测实体对和所述待测实体对的关系路径输入至待测关系的挖掘模型,得到所述待测关系的挖掘模型输出的挖掘结果;
[0041]其中,所述待测关系的挖掘模型用于依据所述待测实体对的关系路径以及预设实体类型的权重参数,获取所述待测实体对对应于各条关系路径的特征值,基于各个特征值获取所述待测头实体和所述待测尾实体之间所述待测关系成立的概率,并将所述待测关系成立的概率作为挖掘结果输出。
[0042]一种关系挖掘设备,包括:存储器和处理器;
[0043]所述存储器,用于存储程序;
[0044]所述处理器,用于执行所本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种关系挖掘方法,其特征在于,包括:获取待测实体对,所述待测实体对包括待测头实体和待测尾实体;依据预先构建的知识图谱,获取所述待测实体对的关系路径,所述待测实体对的关系路径为从所述待测头实体指向所述待测尾实体经过的边表示的关系的有序集合;将所述待测实体对和所述待测实体对的关系路径输入至待测关系的挖掘模型,得到所述待测关系的挖掘模型输出的挖掘结果;其中,所述待测关系的挖掘模型用于依据所述待测实体对的关系路径以及预设实体类型的权重参数,获取所述待测实体对对应于各条关系路径的特征值,基于各个特征值获取所述待测头实体和所述待测尾实体之间所述待测关系成立的概率,并将所述待测关系成立的概率作为挖掘结果输出。2.根据权利要求1所述的方法,其特征在于,所述依据所述待测实体对的关系路径以及预设实体类型的权重参数,获取所述待测实体对对应于各条关系路径的特征值,包括:基于改进的递归运算公式,获取所述待测实体对对应于关系路径的特征值,所述改进的递归运算公式通过在路径排序学习算法的每一步游走时为每一游走实体赋予预设实体类型的权重参数得到。3.根据权利要求2所述的方法,其特征在于,所述基于各个特征值获取所述待测头实体和所述待测尾实体之间所述待测关系成立的概率,包括:依据各条所述待测实体对的关系路径的权重参数,将所述训练实体对对应于各条关系路径的特征值加权相加,得到所述待测实体对的特征得分,任意一条关系路径的权重参数通过预先训练得到;基于预先配置的Logistics函数以及所述待测实体对的特征得分,获取所述待测头实体和所述待测尾实体之间所述待测关系成立的概率。4.根据权利要求3所述的方法,其特征在于,所述方法还包括:基于所述知识图谱,获取所述待测关系的训练数据集合;其中,所述待测关系的训练数据集合包括多条训练数据,所述训练数据包括训练实体对、所述训练实体对的关系路径、以及所述训练实体对的关系标注,所述训练实体对包括训练头实体和训练尾实体,所述训练实体对的关系路径为从所述训练头实体指向所述训练尾实体经过的关系的有序集合,所述训练实体对的关系标注用于指示所述训练头实体和所述训练尾实体是否存在所述待测关系;将所述训练实体对和所述训练实体对的关系路径输入至所述分类模型,以使所述分类模型迭代执行参数更新流程,直至达到预设的训练条件,得到所述待测关系的挖掘模型;其中,所述参数更新流程包括:基于所述改进的递归运算公式以及预设实体类型的权重参数,获取所述训练实体对对应于各个关系路径的特征值;基于各个特征值获取所述训练实体对的置信度,所述置信度用于表征所述训练头实体与所述训练尾实体之间所述待测关系成立的概率;将各个所述训练实体对的置信度作为预测值,将各个所述训练实体对的关系标注作为真实值,利用预设的损失函数更新预设的模型参数,所述模型参数包括所述预设实体类型的...

【专利技术属性】
技术研发人员:罗鹏陕亮胡志广陈嘉翊王亮孙晨雨
申请(专利权)人:国网商用大数据有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1