融合知识的异构图神经网络医保欺诈风险识别系统技术方案

技术编号:37182201 阅读:13 留言:0更新日期:2023-04-20 22:47
本发明专利技术涉及一种融合知识的异构图神经网络医保欺诈风险识别系统,利用数据节点之间的连接关系,进行多层特征聚合;更完善的构图方式,通过医学知识图谱,建立诊断和药品之间的联系,关系连接信息更丰富;基于关系感知的异构图神经网络模型,比同构图模型准确率效果更好;负采样方法,解决因正负样本极端不平衡导致的模型准确性下降问题,充分学习已有违规模式的知识,从而发现更多潜在的欺诈风险。从而发现更多潜在的欺诈风险。从而发现更多潜在的欺诈风险。

【技术实现步骤摘要】
融合知识的异构图神经网络医保欺诈风险识别系统


[0001]本专利技术涉及一种数据识别技术,特别涉及一种融合知识的异构图神经网络医保欺诈风险识别系统。

技术介绍

[0002]目前,基于医保政策和临床知识的规则系统仍是医保风控的主流手段。基于规则的风控引擎能从数据中有效筛选预定义的风险场景,为医保基金构筑第一道防线。然而,随着风控系统迭代,医保欺诈手段也在不断更新。规则类系统难以主动定位新型欺诈手段,因此在初版系统上线后,仍需要大量专家不断更新规则,以应对新暴露的欺诈场景。
[0003]随着大数据、人工智能等为代表的现代信息技术迅速发展,传统规则系统已很难满足所有需求,建设以机器学习为核心的医保风控系统成为当下主要发展方向。深度学习模型配合海量医保结算数据,让高效精准识别新型欺诈成为可能。现有医保数据缺乏正负样本标签,无法通过有监督学习的方法直接定位违规特征,大量研究将目光聚焦于无监督学习方法以聚类、异常点检测等为主要手段的来发现违规样本。
[0004]传统的规则系统或无监督模型,大多数专注与某种欺诈类型。当出现新的违规模式时,难以发现。

技术实现思路

[0005]针对挖掘医保数据下潜在风险问题,提出了一种融合知识的异构图神经网络医保欺诈风险识别系统,通过构建图神经网路,利用数据节点之间的连接关系,进行多层特征聚合,充分学习已有违规模式的知识,从而发现更多潜在的欺诈风险。
[0006]本专利技术的技术方案为:一种融合知识的异构图神经网络医保欺诈风险识别系统,包括对每个就诊节点风险进行预测的关系感知的异构图神经网络,所述关系感知的异构图神经网络结构:
[0007]患者就诊产生就诊、诊断、药物、机构各种不同类型数据,诊断和药物数据之间被知识图谱约束,利用医疗结算数据和医疗知识图谱构建异构图,一个异构图由一系列子图构成,一个子图对应一种关系;
[0008]在构建好的异构图上,用元路径的方式随机游走,训练下采样跳字模型提取每个节点的特征;
[0009]元路径特征和节点自身属性特征连接后,作为图神经网络模型的节点输入特征,使用就诊节点构图建模;
[0010]使用一个图卷积层学习每种异构图中关系图中学习唯一的节点表示,使用一个跨关系的信息传递模块来跨关系节点表示的交互,使用一个语义聚合模块来聚合关系感知节点表示,得到一个具有关系节点的表示,构成关系感知的异构图神经网络。
[0011]优选的,所述一个子图对应一种关系,所述关系由一个字符串三元组定义,包括源节点类型、边类型和目标节点类型。
[0012]优选的,所述就诊节点构图:以就诊为目标节点,构建患者、医疗机构、时间和诊断为源节点,边对应分别为就诊患者所属关系、就诊医疗机构发生关系;、就诊时间段关系、就诊的诊断信息的4种子图。
[0013]优选的,所述诊断和药物数据之间被知识图谱约束:把诊断和药品两两组合输入知识图谱,如果能在知识图谱中存在连接,诊断作为源节点,药物作为目标节点,边为诊断疾病使用的治疗药品的子图补入异构图中。
[0014]优选的,所述关系感知特征的图神经网络模型由关系限定的图卷积、加权残差连接、跨关系消息传递、关系表示学习四个模型构成一个关系感知的异构图神经网络层,通过堆叠L层,聚合L阶邻域的信息,每层提供目标节点v的关系感知节点表示,以及与源节点u关联的关系表示,通过一个语义融合模块来进行关系感知节点表示的聚合,获得重要度加权的方式得到节点表示作为下游任务的节点表示。
[0015]一种医保欺诈风险识别的关系感知特征的图神经网络模型的训练方法,构建关系感知特征的图神经网络模型,选取历史上用规则和无监督模型检出的违规就诊为正样本,其余为负样本,负样本为存在严重的类别不平衡现象的违规就诊;将正负样本作为训练样本送入关系感知特征的图神经网络模型进行训练,训练过程中采用批内负采样的方法,P为正样本,N为负样本,a为正样本数量,b为负样本数量,a<<b,训练的每个循环,从a中不放回采样n正样本,从b中放回采样2n个负样本,保证类别的相对均衡又完整地利用所有数据。
[0016]一种融合知识的医保欺诈风险关系识别方法,构建关系感知特征的图神经网络模型,将无标签的就诊数据送入关系感知特征的图神经网络模型进行识别,获得违规模式。
[0017]本专利技术的有益效果在于:本专利技术融合知识的异构图神经网络医保欺诈风险识别系统,更完善的构图方式,通过医学知识图谱,建立诊断和药品之间的联系,关系连接信息更丰富;基于关系感知的异构图神经网络模型,比同构图模型准确率效果更好;负采样方法,解决因正负样本极端不平衡导致的模型准确性下降问题。
附图说明
[0018]图1为本专利技术利用医疗结算数据和医疗知识构建异构图示意图;
[0019]图2为本专利技术异构图中节点特征获取示意图;
[0020]图3为本专利技术关系限定的图卷积图。
具体实施方式
[0021]下面结合附图和具体实施例对本专利技术进行详细说明。本实施例以本专利技术技术方案为前提进行实施,给出了详细的实施方式和具体的操作过程,但本专利技术的保护范围不限于下述的实施例。
[0022]一、图神经网路框架
[0023]1、构建融合知识的异构图:
[0024]患者就诊产生就诊、诊断、药物、机构各种不同类型数据,诊断和药物之间被知识图谱约束,利用医疗结算数据和医疗知识图谱构建异构图,如图1所示。
[0025]2、节点特征表示:
[0026](1)如图2所示节点特征获取示意图,在构建好的异构图上,用元路径的方式随机
游走,训练跳字模型提取每个节点的特征;
[0027](2)元路径特征和节点自身属性特征连接后,作为图神经网络模型的节点输入特征。
[0028]3、图神经网路模型设计:
[0029]考虑关系感知特征的图神经网络模型,是一种细粒度水平学习异构图上的节点表示。具体来说,首先使用一个图卷积层学习每种异构图中特定关系图中学习唯一的节点表示,然后使用一个跨关系的信息传递模块来提高跨关系节点表示的交互。此外,还设计了一个语义聚合模块来聚合关系感知节点表示,得到一个具有关系节点的表示。
[0030]4、风险识别方法:
[0031](1)用训练好的图神经网络模型对每个就诊节点的风险做预测。
[0032](2)排名风险分高的就诊交个业务专家审核。
[0033]二、融合知识的异构图神经网络医保欺诈风险识别系统:
[0034]1、数据预处理:
[0035]1.1、输入数据:
[0036](1)人员信息:年龄、性别、参保险种
[0037](2)就诊信息:医疗类别、住院天数、疾病诊断、住院天数、医疗总费用、统筹基金支付金额、个人账户支付金额、现金支付金额、疾病诊断、入院时间
[0038](3)医疗机构:医疗机构等级、医疗机构类别
[0039](4)医嘱信息:项目名称
[0040](5)是否违规标签:正样本为历史本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种融合知识的异构图神经网络医保欺诈风险识别系统,其特征在于,包括对每个就诊节点风险进行预测的关系感知的异构图神经网络,所述关系感知的异构图神经网络结构:患者就诊产生就诊、诊断、药物、机构各种不同类型数据,诊断和药物数据之间被知识图谱约束,利用医疗结算数据和医疗知识图谱构建异构图,一个异构图由一系列子图构成,一个子图对应一种关系;在构建好的异构图上,用元路径的方式随机游走,训练下采样跳字模型提取每个节点的特征;元路径特征和节点自身属性特征连接后,作为图神经网络模型的节点输入特征,使用就诊节点构图建模;使用一个图卷积层学习每种异构图中关系图中学习唯一的节点表示,使用一个跨关系的信息传递模块来跨关系节点表示的交互,使用一个语义聚合模块来聚合关系感知节点表示,得到一个具有关系节点的表示,构成关系感知的异构图神经网络。2.根据权利要求1所述融合知识的异构图神经网络医保欺诈风险识别系统,其特征在于,所述一个子图对应一种关系,所述关系由一个字符串三元组定义,包括源节点类型、边类型和目标节点类型。3.根据权利要求2所述融合知识的异构图神经网络医保欺诈风险识别系统,其特征在于,所述就诊节点构图:以就诊为目标节点,构建患者、医疗机构、时间和诊断为源节点,边对应分别为就诊患者所属关系、就诊医疗机构发生关系;、就诊时间段关系、就诊的诊断信息的4种子图。4.根据权利要求1至3中任意一项所述融合知识的异构图神经网络医保欺诈风险识别系统,其特征在于,所述诊断和药物数据之间...

【专利技术属性】
技术研发人员:赵蒙海向凌阳
申请(专利权)人:上海金仕达卫宁软件科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1