知识图谱构建方法、装置、计算机系统及可读存储介质制造方法及图纸

技术编号:24574321 阅读:27 留言:0更新日期:2020-06-21 00:09
本发明专利技术公开了知识图谱构建方法、装置、计算机系统及可读存储介质,包括:从数据库中获取正常基础信息,提取正常基础信息的关键字并去重获得正常信息元;挖掘各正常信息元中具有正常有向关联关系的两个正常信息元,并将两个正常信息元认定为正常有向关联特征;挖掘各正常信息元中具有正常无向关联关系的两个正常信息元,并将两个正常信息元认定为正常无向关联特征;根据正常有向关联特征和正常无向关联特征,构建用于表达各正常信息元之间关联关系的知识图谱。本发明专利技术构建了反映各正常信息元之间充分不必要条件关系以及充分必要条件关系的知识图谱,实现了对数据关系的深层挖掘,使机构能够通过该知识图谱对不同区域角度的风险进行识别。

Construction method, device, computer system and readable storage medium of knowledge map

【技术实现步骤摘要】
知识图谱构建方法、装置、计算机系统及可读存储介质
本专利技术涉及大数据
,尤其涉及一种知识图谱构建方法、装置、计算机系统及可读存储介质。
技术介绍
风控模型是一种能够通过智能风控,为各地医保局识别欺诈骗保人员,减少风险敞口,保护医保基金安全的计算机程序。当前的风控模型通常是基于经验总结风险规律制定风控规则,以构建的用于识别风险的风控模型。然而这种风控模型因缺乏对数据关系深层挖掘的手段,造成风控模型的局限性较强,无法对不同区域角度的风险进行识别。
技术实现思路
本专利技术的目的是提供一种知识图谱构建方法、装置、计算机系统及可读存储介质,用于解决现有技术存在的因缺乏对数据关系深层挖掘的手段,造成风控模型的局限性较强,无法对不同区域角度的风险进行识别的问题。为实现上述目的,本专利技术提供一种基于大数据的知识图谱构建方法,包括:从数据库中获取正常基础信息,提取正常基础信息的关键字并对所述关键字去重,获得正常信息元;其中,所述正常基础信息反映了符合预设认证规则的虚拟主体的属性和/或行为,所述正常信息元反映了所述虚拟主体的任一属性或行为;挖掘各所述正常信息元中具有正常有向关联关系的两个正常信息元,并将所述两个正常信息元认定为正常有向关联特征;其中,所述正常有向关联关系是指具有充分不必要条件关系的两个正常信息元;挖掘各所述正常信息元中具有正常无向关联关系的两个正常信息元,并将所述两个正常信息元认定为正常无向关联特征;其中,所述正常无向关联关系是指具有充分必要条件关系的两个正常信息元;根据所述正常有向关联特征和正常无向关联特征,构建用于表达各正常信息元之间关联关系的知识图谱。上述方案中,提取正常基础信息的关键字并对所述关键字去重,获得正常信息元之后,还包括:从数据库中获取异常基础信息,提取异常基础信息的关键字并对所述关键字去重,获得异常信息元,其中,所述异常基础信息反映了不符合预设认证规则的虚拟主体的属性和/或行为,所述异常信息元反映了所述虚拟主体的任一属性或行为。上述方案中,挖掘各所述正常信息元中具有正常有向关联关系的两个正常信息元的步骤,包括:计算具有正常信息元的正常基础信息的数量,并将该数量作为所述正常信息元的样本数量;任意提取两个正常信息元,计算同时出现所述两个正常信息元的正常基础信息的数量作为关联总量;将所述关联总量分别与所述两个正常信息元的样本数量相除,分别获得第一关联值和第二关联值;若所述第一关联值和第二关联值分别大于预设的有向关联阈值时,则判定所述两个正常信息元之间具有关联关系;比较所述第一关联值和第二关联值;若所述第一关联值大于第二关联值,则判定第一关联值对应的正常信息元是第二关联值对应的正常信息元的充分不必要条件;若所述第二关联值大于第一关联值,则判定第二关联值对应的正常信息元是第一关联值对应的正常信息元的充分不必要条件。上述方案中,将所述两个正常信息元认定为正常有向关联特征之后,包括:挖掘各所述异常信息元中具有异常有向关联关系的两个异常信息元,并将所述两个异常信息元认定为异常有向关联特征;其中,所述异常有向关联关系是指具有充分不必要条件关系的两个异常信息元。上述方案中,挖掘各所述正常信息元中具有正常无向关联关系的两个正常信息元的步骤,包括:计算具有正常信息元的正常基础信息的数量,并将该数量作为所述正常信息元的样本数量;任意提取两个正常信息元作为内正常组合,并将除所述内正常信息元外其他正常信息元作为外正常组合;计算具有所述内正常组合的正常基础信息的数量作为内关联总量,将所述内关联总量依次与所述内正常组合中正常信息元的样本数量相除获得内信息熵;分别从内正常组合和外正常组合中提取一个正常信息元并组合形成内外正常组合,计算具有内外正常组合的正常基础信息的数量作为外关联总量,将所述外关联总量依次与所述内外正常组合中正常信息元的样本数量相除获得外信息熵;判断所述内信息熵是否超过预设的内信息阈值;若未超过所述内信息阈值,则判定所述内正常组合的正常信息元不具有正常无向关联关系;若超过所述内信息阈值,则判断所述外信息熵是否小于预设的外信息阈值;若不小于所述外信息阈值,则判定所述内正常组合的正常信息元不具有正常无向关联关系;若小于所述外信息阈值,则判定所述内正常判组合的正常信息元具有正常无向关联关系。上述方案中,将所述两个正常信息元认定为正常无向关联特征之后,包括:挖掘各所述异常信息元中具有异常无向关联关系的两个异常信息元,并将所述两个异常信息元认定为异常无向关联特征;其中,所述异常无向关联关系是指具有充分必要条件关系的两个异常信息元。上述方案中,构建用于表达各正常信息元之间关联关系的知识图谱之后,包括:根据所述异常有向关联特征和异常无向关联特征,在所述知识图谱中构建异常关系模型,以在所述知识图谱中反映异常的关联特征。为实现上述目的,本专利技术还提供一种基于大数据的知识图谱构建装置,包括:正常关键字提取模块,用于从数据库中获取正常基础信息,提取正常基础信息的关键字并对所述关键字去重,获得正常信息元;其中,所述正常基础信息反映了符合预设认证规则的虚拟主体的属性和/或行为,所述正常信息元反映了所述虚拟主体的任一属性或行为;正常有向关联模块,用于挖掘各所述正常信息元中具有正常有向关联关系的两个正常信息元,并将所述两个正常信息元认定为正常有向关联特征;其中,所述正常有向关联关系是指具有充分不必要条件关系的两个正常信息元;正常无向关联模块,用于挖掘各所述正常信息元中具有正常无向关联关系的两个正常信息元,并将所述两个正常信息元认定为正常无向关联特征;其中,所述正常无向关联关系是指具有充分必要条件关系的两个正常信息元;图谱构造模块,用于根据所述正常有向关联特征和正常无向关联特征,构建用于表达各正常信息元之间关联关系的知识图谱。为实现上述目的,本专利技术还提供一种计算机系统,其包括多个计算机设备,各计算机设备包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述多个计算机设备的处理器执行所述计算机程序时共同实现上述知识图谱构建方法的步骤。为实现上述目的,本专利技术还提供一种计算机可读存储介质,其包括多个存储介质,各存储介质上存储有计算机程序,所述多个存储介质存储的所述计算机程序被处理器执行时共同实现上述知识图谱构建方法的步骤。本专利技术提供的知识图谱构建方法、装置、计算机系统及可读存储介质,通过挖掘各所述正常信息元中具有正常有向关联关系的两个正常信息元,以及具有正常无向关联关系的两个正常信息元,为机构提供用于构建有方向关系规则以及无方向关系规则的知识支撑,通过正常有向关联特征和正常无向关联特征,构建了反映各正常信息元之间充分不必要条件关系以及充分必要条件关系的知识图谱,实现了对数据关系的深层挖掘,为机构提供了构建有方向关系规则以及无方向关系规则的知识支撑,使机构能够通过该知识图谱对不同区域角度的本文档来自技高网...

【技术保护点】
1.一种基于大数据的知识图谱构建方法,其特征在于,包括:/n从数据库中获取正常基础信息,提取正常基础信息的关键字并对所述关键字去重,获得正常信息元;其中,所述正常基础信息反映了符合预设认证规则的虚拟主体的属性和/或行为,所述正常信息元反映了所述虚拟主体的任一属性或行为;/n挖掘各所述正常信息元中具有正常有向关联关系的两个正常信息元,并将所述两个正常信息元认定为正常有向关联特征;其中,所述正常有向关联关系是指具有充分不必要条件关系的两个正常信息元;/n挖掘各所述正常信息元中具有正常无向关联关系的两个正常信息元,并将所述两个正常信息元认定为正常无向关联特征;其中,所述正常无向关联关系是指具有充分必要条件关系的两个正常信息元;/n根据所述正常有向关联特征和正常无向关联特征,构建用于表达各正常信息元之间关联关系的知识图谱。/n

【技术特征摘要】
1.一种基于大数据的知识图谱构建方法,其特征在于,包括:
从数据库中获取正常基础信息,提取正常基础信息的关键字并对所述关键字去重,获得正常信息元;其中,所述正常基础信息反映了符合预设认证规则的虚拟主体的属性和/或行为,所述正常信息元反映了所述虚拟主体的任一属性或行为;
挖掘各所述正常信息元中具有正常有向关联关系的两个正常信息元,并将所述两个正常信息元认定为正常有向关联特征;其中,所述正常有向关联关系是指具有充分不必要条件关系的两个正常信息元;
挖掘各所述正常信息元中具有正常无向关联关系的两个正常信息元,并将所述两个正常信息元认定为正常无向关联特征;其中,所述正常无向关联关系是指具有充分必要条件关系的两个正常信息元;
根据所述正常有向关联特征和正常无向关联特征,构建用于表达各正常信息元之间关联关系的知识图谱。


2.根据权利要求1所述的知识图谱构建方法,其特征在于,提取正常基础信息的关键字并对所述关键字去重,获得正常信息元之后,还包括:
从数据库中获取异常基础信息,提取异常基础信息的关键字并对所述关键字去重,获得异常信息元,其中,所述异常基础信息反映了不符合预设认证规则的虚拟主体的属性和/或行为,所述异常信息元反映了所述虚拟主体的任一属性或行为。


3.根据权利要求1所述的知识图谱构建方法,其特征在于,挖掘各所述正常信息元中具有正常有向关联关系的两个正常信息元的步骤,包括:
计算具有正常信息元的正常基础信息的数量,并将该数量作为所述正常信息元的样本数量;
任意提取两个正常信息元,计算同时出现所述两个正常信息元的正常基础信息的数量作为关联总量;
将所述关联总量分别与所述两个正常信息元的样本数量相除,分别获得第一关联值和第二关联值;
若所述第一关联值和第二关联值分别大于预设的有向关联阈值时,则判定所述两个正常信息元之间具有关联关系;
比较所述第一关联值和第二关联值;若所述第一关联值大于第二关联值,则判定第一关联值对应的正常信息元是第二关联值对应的正常信息元的充分不必要条件;若所述第二关联值大于第一关联值,则判定第二关联值对应的正常信息元是第一关联值对应的正常信息元的充分不必要条件。


4.根据权利要求1所述的知识图谱构建方法,其特征在于,将所述两个正常信息元认定为正常有向关联特征之后,包括:
挖掘各所述异常信息元中具有异常有向关联关系的两个异常信息元,并将所述两个异常信息元认定为异常有向关联特征;其中,所述异常有向关联关系是指具有充分不必要条件关系的两个异常信息元。


5.根据权利要求1所述的知识图谱构建方法,其特征在于,挖掘各所述正常信息元中具有正常无向关联关系的两个正常信息元的步骤,包括:
计算具有正常信息元的正常基础信息的数量,并将该数量作为所述正常信息元的样本数量;
任意提取两个正常信息元作为内正常组合,并将除所述内正常信息元外其他正常信息元作为外正常组合;
计算具有所述内正常组...

【专利技术属性】
技术研发人员:郭建福吴东辉
申请(专利权)人:平安医疗健康管理股份有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1