一种健康险承保风险预测方法及其相关设备技术

技术编号:38947722 阅读:22 留言:0更新日期:2023-09-25 09:44
本申请实施例属于智能决策技术领域,涉及一种健康险承保风险预测方法及其相关设备,包括将预测样本集输入到第一层预测网络进行预测,获取每个风险等级影响因子所对应的承保风险权重预测值;将每个风险等级影响因子所对应的承保风险权重预测值作为输入值输入到预设的第二层预测网络,并结合预测样本集内每个样本对象具备的风险等级影响因子信息进行综合计算,获得综合风险权重;根据综合风险权重,确定所述预测样本集整体对应的健康险承保风险等级。通过两层预测网络预测,确定承保风险等级,较以往直接对所有影响因子进行统一处理的方式而言,更加科学化和合理化,也有利于对于不同的病人和病种群体设立不同的承保额,降低保司的承保风险。保司的承保风险。保司的承保风险。

【技术实现步骤摘要】
一种健康险承保风险预测方法及其相关设备


[0001]本申请涉及智能决策
,尤其涉及一种健康险承保风险预测方法及其相关设备。

技术介绍

[0002]由于国家提倡食品安全,为医疗保险高速发展带来了发展契机。保费和险种虽然快速增加,但由于健康险制度及奖罚系统不够完善,以及保险市场本来存在的信息不对称等主观与客观因素影响健康险的健康发展,风险因素导致保险的赔付率不断增加,使得保险公司经营压力增大。因此对健康险客群进行风险预测至关重要。
[0003]目前对健康险客群进行风险类别的识别模型都是对单个影响指标进行建模,或者直接根据多个影响因子建立一个预测模型。前者,仅仅对单个影响指标进行建模,无法保证模型适合所有的风险影响因子,而后者对多个影响因子建立一个预测模型,往往在数据量较大时,无法保证多影响因子间预测的解耦性以及数据间的独立预测性,从而导致了健康险保费的设置不够科学和合理,增加了保司的承保风险。因此,现有技术对健康险保费进行预测还存在不够科学和合理,易导致保司承保风险过高的问题。

技术实现思路

[0004]本申请实施例的目的在于提出一种健康险承保风险预测方法及其相关设备,以解决现有技术对健康险保费进行预测还存在不够科学和合理,易导致保司承保风险过高的问题。
[0005]为了解决上述技术问题,本申请实施例提供一种健康险承保风险预测方法,采用了如下所述的技术方案:
[0006]一种健康险承保风险预测方法,包括下述步骤:
[0007]获取预测样本集,其中,所述预测样本集为未标注承保风险等级的样本集,所述预测样本集内包含了每个样本对象具备的风险等级影响因子信息,所述样本对象具备的风险等级影响因子信息包括样本对象的年龄、投保病种、健康险种名称以及所述病种的投保额;
[0008]将所述预测样本集输入到预设的第一层预测网络进行预测,获取每个风险等级影响因子所对应的承保风险权重预测值,其中,所述预设的第一层预测网络中包含若干个基础预测节点以及与所述若干个基础预测节点等量的基础输出节点,每个基础预测节点分别采用K折交叉验证方式对不同的风险等级影响因子进行预测;
[0009]将所述每个风险等级影响因子所对应的承保风险权重预测值作为输入值输入到预设的第二层预测网络,并结合所述预测样本集内每个样本对象具备的风险等级影响因子信息进行综合计算,获得综合风险权重,其中,所述预设的第二层预测网络有且仅有一个输出节点,用于输出所述综合风险权重;
[0010]根据所述综合风险权重,确定所述预测样本集整体对应的健康险承保风险等级。
[0011]进一步的,在执行所述将所述预测样本集输入到预设的第一层预测网络进行预测
的步骤之前,所述方法还包括:
[0012]批量获取已标注承保风险等级的样本集,其中,每个已标注承保风险等级的样本集内都包含了每个样本对象具备的风险等级影响因子信息、每个风险等级影响因子所对应的承保风险权重以及所述每个已标注承保风险等级的样本集对应的承保风险等级,所述样本对象具备的风险等级影响因子信息包括样本对象的年龄、投保病种、健康险种名称以及所述病种的投保额;
[0013]按照预设的比例关系将所述样本集拆分为训练样本集和验证样本集;
[0014]根据预设的目标数量对所述训练样本集进行等比划分,获得目标数量的训练样本子集;
[0015]获取预先构建出的若干个基础预测器,其中,所述基础预测器为分别采用不同机器学习算法而构建出的强决策模型;
[0016]基于所述训练样本子集分别对预先构建的不同基础预测器进行训练,获得训练好的基础预测器;
[0017]将所述训练好的基础预测器部署到所述第一层预测网络内,完成对所述第一层预测网络的构建。
[0018]进一步的,所述基于所述训练样本子集分别对预先构建的不同基础预测器进行训练,获得训练好的基础预测器的步骤,具体包括:
[0019]步骤401,随机从所述目标数量的训练样本子集中筛选K个训练样本子集为当前基础预测器的验证集,其中,K为正整数;
[0020]步骤402,将未筛选出的训练样本子集作为待输入的训练集,输入到所述当前基础预测器内对所述当前基础预测器进行预训练,获得当前预训练完成的基础预测器;
[0021]步骤403,根据所述当前基础预测器的验证集对所述当前预训练完成的基础预测器进行输出结果验证;
[0022]步骤404,判断所述输出结果是否符合预设的验证通过条件;
[0023]步骤405,若所述输出结果不符合预设的验证通过条件,则更换一个其他基础预测器作为当前基础预测器,循环执行所述步骤401至所述步骤404,直到所有的基础预测器都预训练完成,终止循环;
[0024]步骤406,若所述输出结果符合预设的验证通过条件,则将所述当前预训练完成的基础预测器作为一个训练好的基础预测器。
[0025]进一步的,所述将未筛选出的训练样本子集作为待输入的训练集,输入到所述当前基础预测器内对所述当前基础预测器进行预训练,获得当前预训练完成的基础预测器的步骤,具体包括:
[0026]获取所述待输入的训练集中每个样本对象具备的风险等级影响因子信息以及每个风险等级影响因子所对应的承保风险权重;
[0027]对不同的风险等级影响因子信息进行矩阵阵列化整理,获取每个风险等级影响因子对应的N
×
M的影响因子信息矩阵,其中,N表示所述未筛选出的训练样本子集的数量,M表示所述未筛选出的训练样本子集内所包含的样本对象的最大数量,其中,N
×
M的影响因子信息矩阵指N行M列的影响因子信息矩阵;
[0028]对所述待输入的训练集中所述每个风险等级影响因子所对应的承保风险权重进
行矩阵阵列化整理,获得每个风险等级影响因子所对应的N
×
1的承保风险权重矩阵,其中,N表示所述未筛选出的训练样本子集的数量,其中,N
×
1的承保风险权重矩阵指N行1列的承保风险权重矩阵;
[0029]任选一个风险等级影响因子作为目标影响因子;
[0030]预先设置所述目标影响因子所对应的N
×
1的承保风险权重矩阵作为所述当前基础预测器的期望输出结果;
[0031]获取所述目标影响因子所对应的N
×
M的影响因子信息矩阵作为实际输入数据,将所述实际输入数据输入到所述当前基础预测器;
[0032]根据当前基础预测器对应的期望输出结果和实际输入数据,进行函数拟合,获得当前基础预测器对应的函数拟合结果。
[0033]进一步的,所述根据所述当前基础预测器的验证集对所述当前预训练完成的基础预测器进行输出结果验证的步骤,具体包括:
[0034]获取所述当前基础预测器的验证集中每个样本对象具备的风险等级影响因子信息以及每个风险等级影响因子所对应的承保风险权重;
[0035]对所述当前基础预测器的验证集中的目标影响因子信息进行矩阵阵本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种健康险承保风险预测方法,其特征在于,包括下述步骤:获取预测样本集,其中,所述预测样本集为未标注承保风险等级的样本集,所述预测样本集内包含了每个样本对象具备的风险等级影响因子信息,所述样本对象具备的风险等级影响因子信息包括样本对象的年龄、投保病种、健康险种名称以及所述病种的投保额;将所述预测样本集输入到预设的第一层预测网络进行预测,获取每个风险等级影响因子所对应的承保风险权重预测值,其中,所述预设的第一层预测网络中包含若干个基础预测节点以及与所述若干个基础预测节点等量的基础输出节点,每个基础预测节点分别采用K折交叉验证方式对不同的风险等级影响因子进行预测;将所述每个风险等级影响因子所对应的承保风险权重预测值作为输入值输入到预设的第二层预测网络,并结合所述预测样本集内每个样本对象具备的风险等级影响因子信息进行综合计算,获得综合风险权重,其中,所述预设的第二层预测网络有且仅有一个输出节点,用于输出所述综合风险权重;根据所述综合风险权重,确定所述预测样本集整体对应的健康险承保风险等级。2.根据权利要求1所述的健康险承保风险预测方法,其特征在于,在执行所述将所述预测样本集输入到预设的第一层预测网络进行预测的步骤之前,所述方法还包括:批量获取已标注承保风险等级的样本集,其中,每个已标注承保风险等级的样本集内都包含了每个样本对象具备的风险等级影响因子信息、每个风险等级影响因子所对应的承保风险权重以及所述每个已标注承保风险等级的样本集对应的承保风险等级,所述样本对象具备的风险等级影响因子信息包括样本对象的年龄、投保病种、健康险种名称以及所述病种的投保额;按照预设的比例关系将所述样本集拆分为训练样本集和验证样本集;根据预设的目标数量对所述训练样本集进行等比划分,获得目标数量的训练样本子集;获取预先构建出的若干个基础预测器,其中,所述基础预测器为分别采用不同机器学习算法而构建出的强决策模型;基于所述训练样本子集分别对预先构建的不同基础预测器进行训练,获得训练好的基础预测器;将所述训练好的基础预测器部署到所述第一层预测网络内,完成对所述第一层预测网络的构建。3.根据权利要求2所述的健康险承保风险预测方法,其特征在于,所述基于所述训练样本子集分别对预先构建的不同基础预测器进行训练,获得训练好的基础预测器的步骤,具体包括:步骤401,随机从所述目标数量的训练样本子集中筛选K个训练样本子集为当前基础预测器的验证集,其中,K为正整数;步骤402,将未筛选出的训练样本子集作为待输入的训练集,输入到所述当前基础预测器内对所述当前基础预测器进行预训练,获得当前预训练完成的基础预测器;步骤403,根据所述当前基础预测器的验证集对所述当前预训练完成的基础预测器进行输出结果验证;步骤404,判断所述输出结果是否符合预设的验证通过条件;
步骤405,若所述输出结果不符合预设的验证通过条件,则更换一个其他基础预测器作为当前基础预测器,循环执行所述步骤401至所述步骤404,直到所有的基础预测器都预训练完成,终止循环;步骤406,若所述输出结果符合预设的验证通过条件,则将所述当前预训练完成的基础预测器作为一个训练好的基础预测器。4.根据权利要求3所述的健康险承保风险预测方法,其特征在于,所述将未筛选出的训练样本子集作为待输入的训练集,输入到所述当前基础预测器内对所述当前基础预测器进行预训练,获得当前预训练完成的基础预测器的步骤,具体包括:获取所述待输入的训练集中每个样本对象具备的风险等级影响因子信息以及每个风险等级影响因子所对应的承保风险权重;对不同的风险等级影响因子信息进行矩阵阵列化整理,获取每个风险等级影响因子对应的N
×
M的影响因子信息矩阵,其中,N表示所述未筛选出的训练样本子集的数量,M表示所述未筛选出的训练样本子集内所包含的样本对象的最大数量,其中,N
×
M的影响因子信息矩阵指N行M列的影响因子信息矩阵;对所述待输入的训练集中所述每个风险等级影响因子所对应的承保风险权重进行矩阵阵列化整理,获得每个风险等级影响因子所对应的N
×
1的承保风险权重矩阵,其中,N表示所述未筛选出的训练样本子集的数量,其中,N
×
1的承保风险权重矩阵指N行1列的承保风险权重矩阵;任选一个风险等级影响因子作为目标影响因子;预先设置所述目标影响因子所对应的N
×
1的承保风险权重矩阵作为所述当前基础预测器的期望输出结果;获取所述目标影响因子所对应的N
×
M的影响因子信息矩阵作为实际输入数据,将所述实际输入数据输入到所述当前基础预测器;根据当前基础预测器对应的期望输出结果和实际输入数据,进行函数拟合,获得当前基础预测器对应的函数拟合结果。5.根据权利要求3所述的健康险承保风险预测方法,其特征在于,所述根据所述当前基础预测器的验证集对所述当前预训练完成的基础预测器进行输出结果验证的步骤,具体包括:获取所述当前基础预测器的验证集中每个样本对象具备的风险等级影响因子信息以及每个风险等级影响因子所对应的承保风险权重;对所述当前基础预测器的验证集中的目标影响因子信息进行矩阵阵列化整理,获取所述目标影响因子信息对应的K
×
M矩阵,其中,K表示所述当前基...

【专利技术属性】
技术研发人员:徐赛奕张振勇姚黎明朱磊俞丽娟
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1