【技术实现步骤摘要】
一种关系挖掘方法、装置、设备及可读存储介质
[0001]本申请涉及自然语言处理
,尤其涉及一种关系挖掘方法、装置、设备及可读存储介质。
技术介绍
[0002]电网数据的存储是进行各类数据分析的前提和基础,直接影响到后期查询分析、信息挖掘、状态评估等应用的性能、准确性和可用性。传统电网数据的存储方法主要使用企业级关系型数据库实现物理存储,主要存在的问题是支持的数据规模比较小、存储系统的扩展性较差、查询和复杂数据分析性能低下等。
[0003]知识图谱作为人工智能的大脑,已经被广泛运用到搜索引擎、公安、金融、医疗等领域。因此,构建基于电网数据的知识图谱是解决传统电网数据的存储效率低的重要手段。但是,随着电网数据的数据结构复杂以及数据量的与日增长,基于电网数据的知识图谱的规模逐渐扩大,如何准确地从知识图谱中挖掘电网数据间的潜在关系是目前亟待解决的问题。
技术实现思路
[0004]本申请提供了一种关系挖掘方法、装置、设备及可读存储介质,如下:
[0005]一种关系挖掘方法,包括:
[0006]获取待测实体对,所述待测实体对包括待测头实体和待测尾实体;
[0007]依据预先构建的知识图谱,获取所述待测实体对的关系路径,所述待测实体对的关系路径为从所述待测头实体指向所述待测尾实体经过的边表示的关系的有序集合;
[0008]将所述待测实体对和所述待测实体对的关系路径输入至待测关系的挖掘模型,得到所述待测关系的挖掘模型输出的挖掘结果;
[0009]其中,所述待测关系 ...
【技术保护点】
【技术特征摘要】
1.一种关系挖掘方法,其特征在于,包括:获取待测实体对,所述待测实体对包括待测头实体和待测尾实体;依据预先构建的知识图谱,获取所述待测实体对的关系路径,所述待测实体对的关系路径为从所述待测头实体指向所述待测尾实体经过的边表示的关系的有序集合;将所述待测实体对和所述待测实体对的关系路径输入至待测关系的挖掘模型,得到所述待测关系的挖掘模型输出的挖掘结果;其中,所述待测关系的挖掘模型用于依据所述待测实体对的关系路径以及预设实体类型的权重参数,获取所述待测实体对对应于各条关系路径的特征值,基于各个特征值获取所述待测头实体和所述待测尾实体之间所述待测关系成立的概率,并将所述待测关系成立的概率作为挖掘结果输出。2.根据权利要求1所述的方法,其特征在于,所述依据所述待测实体对的关系路径以及预设实体类型的权重参数,获取所述待测实体对对应于各条关系路径的特征值,包括:基于改进的递归运算公式,获取所述待测实体对对应于关系路径的特征值,所述改进的递归运算公式通过在路径排序学习算法的每一步游走时为每一游走实体赋予预设实体类型的权重参数得到。3.根据权利要求2所述的方法,其特征在于,所述基于各个特征值获取所述待测头实体和所述待测尾实体之间所述待测关系成立的概率,包括:依据各条所述待测实体对的关系路径的权重参数,将所述训练实体对对应于各条关系路径的特征值加权相加,得到所述待测实体对的特征得分,任意一条关系路径的权重参数通过预先训练得到;基于预先配置的Logistics函数以及所述待测实体对的特征得分,获取所述待测头实体和所述待测尾实体之间所述待测关系成立的概率。4.根据权利要求3所述的方法,其特征在于,所述方法还包括:基于所述知识图谱,获取所述待测关系的训练数据集合;其中,所述待测关系的训练数据集合包括多条训练数据,所述训练数据包括训练实体对、所述训练实体对的关系路径、以及所述训练实体对的关系标注,所述训练实体对包括训练头实体和训练尾实体,所述训练实体对的关系路径为从所述训练头实体指向所述训练尾实体经过的关系的有序集合,所述训练实体对的关系标注用于指示所述训练头实体和所述训练尾实体是否存在所述待测关系;将所述训练实体对和所述训练实体对的关系路径输入至所述分类模型,以使所述分类模型迭代执行参数更新流程,直至达到预设的训练条件,得到所述待测关系的挖掘模型;其中,所述参数更新流程包括:基于所述改进的递归运算公式以及预设实体类型的权重参数,获取所述训练实体对对应于各个关系路径的特征值;基于各个特征值获取所述训练实体对的置信度,所述置信度用于表征所述训练头实体与所述训练尾实体之间所述待测关系成立的概率;将各个所述训练实体对的置信度作为预测值,将各个所述训练实体对的关系标注作为真实值,利用预设的损失函数更新预设的模型参数,所述模型参数包括所述预设实体类型的...
【专利技术属性】
技术研发人员:罗鹏,陕亮,胡志广,陈嘉翊,王亮,孙晨雨,
申请(专利权)人:国网商用大数据有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。