当前位置: 首页 > 专利查询>之江实验室专利>正文

车险欺诈识别方法、装置和存储介质制造方法及图纸

技术编号:39425846 阅读:12 留言:0更新日期:2023-11-19 16:12
本申请涉及一种车险欺诈识别方法、装置和存储介质。主要包括:构建车险结构化数据库;基于车险结构化数据库和车险理赔流程业务,得到候选一阶谓词;基于车险结构化数据库和候选一阶谓词构建知识图谱;利用规则挖掘算法对知识图谱进行挖掘,得到车险欺诈识别规则集;基于车险欺诈识别规则集,构建并训练随机过程模型,得到训练完备的随机过程模型;基于车险欺诈识别规则集,将待识别车险理赔数据进行实例化后输入至训练完备的随机过程模型中,输出车险欺诈识别结果。采用本方法能够实现规则的自动挖掘和车险欺诈识别的推理,解决了现有技术中车险欺诈识别过程不具备可解释性的问题,提高车险欺诈结果的准确率。高车险欺诈结果的准确率。高车险欺诈结果的准确率。

【技术实现步骤摘要】
车险欺诈识别方法、装置和存储介质


[0001]本申请涉及计算机
,特别是涉及一种车险欺诈识别方法、装置和存储介质。

技术介绍

[0002]车险欺诈是保险欺诈的重灾区,车险欺诈手法多样化、隐蔽化,欺诈人员团伙化、专业化、规模化,因此业界对快速、准确、自动化识别欺诈案件的方法和装置有着迫切的需求。除了对欺诈识别方法的准确度有要求外,对它的专家知识使用和可解释性方面也有很高的要求。
[0003]首先,专家知识一般来说有很强的方向性,但是一些细节层面的信息可能会有所缺失,专家的知识具有稳定性和通用性的特点,有效和合理的利用专家信息可以对提高方法的准确度、可靠性、可解释性,因此这是第一个挑战。其次在可解释性方面,因为在欺诈案件识别的目的是快速定位欺诈案件,并能解释案件中与欺诈高度相关的关键因子/因素,这样保险公司的工作人员就可以围绕关键因子/因素进行相应的调查工作,如果不能作相应的解释,则工作人员进行调查时就需要核实各种信息,工作的针对性和效率都会急剧下降,这是第二个挑战。例如如果判别为团队欺诈,那则可以重点围绕相关人员的资金往来进行调查,如果是虚假车祸,那则可以重点围绕着现场的痕迹方面进行调查。
[0004]对于专家知识的使用,目前的研究有两种方式,一种是完全不使用专家知识,另外一种是完全依赖于专家知识,前一种方式不能有效利用专家领域性的知识,第二种方法则过分依赖于专家的知识,专家的知识在整体方向性上非常可靠,但是一些细节层面则未必可以洞悉。
[0005]在专利《基于专家规则的人工智能模型结果溯源方法、系统、装置》中是通过专家设定的详细规则进行车险欺诈的溯源,其中有单车事故+标的+倾覆+估损金额+标的车龄+人伤

虚假车祸这种专家规则,首先虚假车祸肯定是和上述6个因素组合强相关,但是专家提供的评估金额和年龄岁数上的这种详细的参数性信息未必准确。在可解释性方面,当前针对车险欺诈识别主要采用机器学习的方法进行,但是黑箱算法不具备可解释性。例如专利《一种基于知识图谱的车险理赔欺诈风险识别方法和系统》通过解析、拆分历史车险案件的结构化数据,根据车险理赔反欺诈业务场景、理赔流程设计的本体,历史案件实例化为案件知识图谱后,使用子图关键节点筛选和图点集向量化,建立多个案件间高欺诈风险筛选模型。其中的关键子图是使用了RotatE、TransE、TransH、TransR和TransD模型进行向量嵌入化表示导致相应的算法黑箱化,不具备可解释性。

技术实现思路

[0006]基于此,有必要针对上述技术问题,提供一种能够高效、合理利用专家知识进行规则挖掘,同时基于挖掘的规则进行逻辑推理得到准确、可解释的车险欺诈结果的车险欺诈识别方法、装置和存储介质。
[0007]第一方面,本申请提供了一种车险欺诈识别方法,所述方法包括:基于车险理赔流程业务中产生的结构化历史数据,构建车险结构化数据库;对所述车险理赔流程业务进行梳理,得到相关一阶谓词,并基于所述车险结构化数据库,对所述相关一阶谓词进行筛选,得到候选一阶谓词;从所述车险结构化数据库中获取构建知识图谱的本体,从所述候选一阶谓词中获取所述本体对应的属性,基于所述本体和所述属性,构建所述知识图谱;利用规则挖掘算法对所述知识图谱进行挖掘,得到车险欺诈识别规则集;基于所述车险欺诈识别规则集,构建并训练随机过程模型,得到训练完备的随机过程模型;基于所述车险欺诈识别规则集,将待识别车险理赔数据进行实例化,并输入至所述训练完备的所述随机过程模型中,输出所述待识别车险理赔数据的车险欺诈识别结果。
[0008]在其中一个实施例中,所述候选一阶谓词包括阈值一阶谓词和直接一阶谓词,所述对所述车险理赔流程业务进行梳理,得到相关一阶谓词,并基于所述车险结构化数据库,对所述相关一阶谓词进行筛选,得到候选一阶谓词包括:对所述车险理赔流程业务进行梳理,得到所述相关一阶谓词;若所述车险结构化数据库中存在与所述相关一阶谓词相对应的字段,则对所述相关一阶谓词进行标注;若标注后的相关一阶谓词所对应的字段的缺失率小于设定阈值,则该所述标注后的相关一阶谓词为候选一阶谓词;若所述候选一阶谓词需要进行阈值计算,则将所述候选一阶谓词标记为所述阈值一阶谓词,反之,则将所述候选一阶谓词标记为所述直接一阶谓词。
[0009]在其中一个实施例中,所述车险结构化数据库包括处理流程数据和案件细节数据,所述从所述车险结构化数据库获取构建知识图谱的本体,从所述候选一阶谓词中获取所述本体对应的属性,基于所述本体和所述属性,构建所述知识图谱包括:基于所述处理流程数据,获取处理流程本体,基于所述直接一阶谓词,获取所述处理流程本体对应的流程属性;基于所述案件细节数据,获取案件细节本体,基于所述直接一阶谓词和所述阈值一阶谓词,获取所述案件细节本体对应的细节属性;基于所述处理流程本体和对应的所述流程属性、所述案件细节本体和对应的所述细节属性,获取构建所述知识图谱的点的实体;基于所述点的实体,获取构建所述知识图谱的关系,并基于所述关系,获取构建所述知识图谱的边的实体;基于所述处理流程本体和对应的所述流程属性、所述案件细节本体和对应的所述细节属性、所述点的实体和所述边的实体,构建得到所述知识图谱。
[0010]在其中一个实施例中,所述利用规则挖掘算法对所述知识图谱进行挖掘,得到车险欺诈识别规则集包括:基于所述候选一阶谓词,利用以下一阶逻辑表达式,得到所述一阶逻辑规则:w
i
:P1(C1)∧P2(C2)∧

P
i
(C
i
)

∧P
n
(C
n
)

P
h
(C
h
);其中,P
i
表示所述候选一阶谓词,C
i
表示与所述候选一阶谓词对应所述知识图谱中实体的集合,由P1到P
n
组成的合取范式为所述一阶逻辑规则的规则体,P
h
为所述一阶逻辑规
则的规则头,w
i
为所述一阶逻辑规则的规则权重;利用随机算法或贪心算法,对所述一阶逻辑规则进行初始化,得到初始规则集;基于所述初始规则集利用遗传算法或路径重连算法生成新规则,并基于所述新规则对所述初始规则集进行迭代更新,得到所述车险欺诈识别规则集。
[0011]在其中一个实施例中,所述基于所述新规则对所述初始规则集进行迭代更新,得到所述车险欺诈识别规则集包括:对所述初始规则集进行规则评估,得到评估后的初始规则集;将所述新规则插入所述评估后的初始规则集中,利用规则评估函数,对插入后的初始规则集进行适应度评估,删除所述插入后的初始规则集中质量小于设定阈值的规则,得到所述车险欺诈识别规则集。
[0012]在其中一个实施例中,所述将所述新规则插入评估后的初始规则集中,利用规则评估函数,对插入后的初始规则集进行适应度评估包括:利用以下公式(1),对所述初始规则集进行普遍性评估:;其中,hc表示普遍性评估值,表示规本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种车险欺诈识别方法,其特征在于,所述方法包括:基于车险理赔流程业务中产生的结构化历史数据,构建车险结构化数据库;对所述车险理赔流程业务进行梳理,得到相关一阶谓词,并基于所述车险结构化数据库,对所述相关一阶谓词进行筛选,得到候选一阶谓词;从所述车险结构化数据库中获取构建知识图谱的本体,从所述候选一阶谓词中获取所述本体对应的属性,基于所述本体和所述属性,构建所述知识图谱;利用规则挖掘算法对所述知识图谱进行挖掘,得到车险欺诈识别规则集;基于所述车险欺诈识别规则集,构建并训练随机过程模型,得到训练完备的随机过程模型;基于所述车险欺诈识别规则集,将待识别车险理赔数据进行实例化,并输入至所述训练完备的所述随机过程模型中,输出所述待识别车险理赔数据的车险欺诈识别结果。2.根据权利要求1所述的车险欺诈识别方法,其特征在于,所述候选一阶谓词包括阈值一阶谓词和直接一阶谓词,所述对所述车险理赔流程业务进行梳理,得到相关一阶谓词,并基于所述车险结构化数据库,对所述相关一阶谓词进行筛选,得到候选一阶谓词包括:对所述车险理赔流程业务进行梳理,得到所述相关一阶谓词;若所述车险结构化数据库中存在与所述相关一阶谓词相对应的字段,则对所述相关一阶谓词进行标注;若标注后的相关一阶谓词所对应的字段的缺失率小于设定阈值,则该所述标注后的相关一阶谓词为候选一阶谓词;若所述候选一阶谓词需要进行阈值计算,则将所述候选一阶谓词标记为所述阈值一阶谓词,反之,则将所述候选一阶谓词标记为所述直接一阶谓词。3.根据权利要求2所述的车险欺诈识别方法,其特征在于,所述车险结构化数据库包括处理流程数据和案件细节数据,所述从所述车险结构化数据库获取构建知识图谱的本体,从所述候选一阶谓词中获取所述本体对应的属性,基于所述本体和所述属性,构建所述知识图谱包括:基于所述处理流程数据,获取处理流程本体,基于所述直接一阶谓词,获取所述处理流程本体对应的流程属性;基于所述案件细节数据,获取案件细节本体,基于所述直接一阶谓词和所述阈值一阶谓词,获取所述案件细节本体对应的细节属性;基于所述处理流程本体和对应的所述流程属性、所述案件细节本体和对应的所述细节属性,获取构建所述知识图谱的点的实体;基于所述点的实体,获取构建所述知识图谱的关系,并基于所述关系,获取构建所述知识图谱的边的实体;基于所述处理流程本体和对应的所述流程属性、所述案件细节本体和对应的所述细节属性、所述点的实体和所述边的实体,构建得到所述知识图谱。4.根据权利要求1所述的车险欺诈识别方法,其特征在于,所述利用规则挖掘算法对所述知识图谱进行挖掘,得到车险欺诈识别规则集包括:基于所述候选一阶谓词,利用以下一阶逻辑表达式,得到所述一阶逻辑规则:w
i
:P1(C1)∧P2(C2)∧

P
i
(C
i
)

∧P
n
(C
n
)

P
h
(C
h
);其中,P
i
表示所述候选一阶谓词,C
i
表示与所述候选一阶谓词对应所述知识图谱中实体
的集合,由P1到P
n
组成的合取范式为所述一阶逻辑规则的规则体,P
h
为所述一阶逻辑规则的规则头,w
i
为所述一阶逻辑规则的规则权重;利用随机算法或贪心算法,对所述一阶逻辑规则进行初始化,得到...

【专利技术属性】
技术研发人员:姬朋立陆矜菁严笑然刘洋顾剑波侯炜华
申请(专利权)人:之江实验室
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1