风险评估方法及装置、设备和存储介质制造方法及图纸

技术编号:38627194 阅读:21 留言:0更新日期:2023-08-31 18:28
本申请实施例公开了一种风险评估方法及装置、设备和存储介质,其中,所述方法包括:获取待评估对象的当前用户数据;确定所述当前用户数据对应的目标样本类别;从多个已训练的风险评估模型中,确定与所述目标样本类别匹配的目标风险评估模型;其中,不同的所述风险评估模型对应不同的样本类别,并通过对应样本类别下的历史用户数据训练得到;基于所述当前用户数据和所述目标风险评估模型,确定所述待评估对象的当前风险等级。对象的当前风险等级。对象的当前风险等级。

【技术实现步骤摘要】
风险评估方法及装置、设备和存储介质


[0001]本申请实施例涉及数据处理技术,涉及但不限于一种风险评估方法及装置、设备和存储介质。

技术介绍

[0002]随着云计算技术和大数据技术的不断发展,诸如保险数据也朝着多维度、大数据量方向发展。目前,在保单生效后,客户常常因各种原因提出终止保险合同,即主动发起退保。保险公司每年有许多保单发生退保,客户退保无论是对客户还是对保险公司都会带来一定的损失。退保的发生存在较大的不可预见性,一般难以提前介入挽留客户。

技术实现思路

[0003]有鉴于此,本申请实施例提供一种风险评估方法及装置、设备和存储介质。
[0004]本申请实施例的技术方案是这样实现的:
[0005]第一方面,本申请实施例提供一种风险评估方法,所述方法包括:获取待评估对象的当前用户数据;确定所述当前用户数据对应的目标样本类别;从多个已训练的风险评估模型中,确定与所述目标样本类别匹配的目标风险评估模型;其中,不同的所述风险评估模型对应不同的样本类别,并通过对应样本类别下的历史用户数据训练得到;基于所述当前用户数据和所述目标风险评估模型,确定所述待评估对象的当前风险等级。
[0006]通过上述方式,能够提高用户数据风险等级评估的准确性,并提高评估效率。
[0007]在一些实施例中,所述风险评估模型通过以下步骤进行训练:设定不同的样本类别;确定所述不同的样本类别中每一样本类别下的历史用户数据;对所述每一样本类别下的历史用户数据进行浓缩处理,得到所述每一样本类别下浓缩后的历史用户数据;其中,浓缩后的历史用户数据的数据量小于浓缩前的历史用户数据的数据量;基于所述每一样本类别下浓缩后的历史用户数据,对对应样本类别下的待训练的风险评估模型进行训练,直至训练后的所述风险评估模型满足收敛条件。
[0008]通过上述方式,在不丢失样本的有用特征的同时减少各簇内的样本量,如此,在使用浓缩后的历史用户数据进行训练的情况下,能够保证信息有效性的同时节约计算资源和空间。
[0009]在一些实施例中,所述确定所述不同的样本类别中每一样本类别下的历史用户数据,包括:获取预设时间段内的历史用户数据;对所述预设时间段内的历史用户数据进行初始聚类,得到所述不同的样本类别的初始聚类中心;利用粒子群算法对所述不同的样本类别的初始聚类中心进行优化,得到优化后的聚类中心;基于所述优化后的聚类中心和所述预设时间段内的历史用户数据,确定所述不同的样本类别中每一样本类别下的历史用户数据。
[0010]通过上述方式,能够适用于高维量大的样本进行分簇,提升用户群预测分析的精细化程度,从而提高风险预测评估的准确性。
[0011]在一些实施例中,所述利用粒子群算法对所述不同的样本类别的初始聚类中心进行优化,得到优化后的聚类中心,包括:利用粒子群算法对所述预设时间段内的历史用户数据进行处理,得到每一所述历史用户数据的适应值;其中,所述粒子群算法中利用曼哈顿距离确定每一历史用户数据与其对应的初始聚类中心的相似度;对具有第一初始聚类中心的样本类别下的历史用户数据的适应值进行排序,得到第一排序结果;将所述第一排序结果中适应值最优的历史用户数据,确定为所述第一初始聚类中心对应的优化后的聚类中心。
[0012]通过上述方式,能够在优化聚类中心时使用曼哈顿距离计算样本相似度,从而仅需计算加减公式,较大提升计算效率。
[0013]在一些实施例中,所述基于所述优化后的聚类中心和所述预设时间段内的历史用户数据,确定所述不同的样本类别中每一样本类别下的历史用户数据,包括:确定所述预设时间段内的每一历史用户数据与优化后的聚类中心的相似度;根据所述相似度对所述预设时间段内的历史用户数据进行分簇,得到所述不同的样本类别中每一样本类别下的历史用户数据。
[0014]通过上述方式,能够使用优化有的聚类中心对预设时间段内的历史用户数据进行分簇,从而提高簇内样本的精确度,进而提高模型训练的准确性。
[0015]在一些实施例中,所述对所述每一样本类别下的历史用户数据进行浓缩处理,得到所述每一样本类别下浓缩后的历史用户数据,包括:确定所述每一样本类别下的历史用户数据的统计分布特征;将每一所述历史用户数据与其对应的统计分布特征进行比对,得到比对结果;其中,所述比对结果用于表明每一所述历史用户数据为浓缩样本或非浓缩样本;利用所述每一样本类别下的多个浓缩样本,确定所述每一样本类别下的新样本;根据所述新样本和所述每一样本类别下的非浓缩样本,确定所述每一样本类别下浓缩后的历史用户数据。
[0016]通过上述方式,能够充分利用样本群体性特征进行信息浓缩提取,并且使用样本相似度保证数据信息提取的质量,同时提升了最终模型的计算运行效率。
[0017]在一些实施例中,所述确定所述每一样本类别下的历史用户数据的统计分布特征,包括:确定所述每一样本类别下的历史用户数据的均值和标准差;对应地,所述将每一所述历史用户数据与其对应的统计分布特征进行比对,得到比对结果,包括:根据第一样本类别下的历史用户数据的均值和标准差,确定比对值;如果所述第一样本类别下的第一历史用户数据小于等于所述比对值,确定所述第一历史用户数据为浓缩样本;如果所述第一历史用户数据大于所述比对值,确定所述第一历史用户数据为非浓缩样本。
[0018]通过上述方式,首先进行样本分簇,并充分利用各簇类的群体特征,使用簇类中心分布期望计算为单样本替代与簇类中心相似度高的数据样本,对比现有技术此方法只需要计算一次簇类分布期望,计算资源消耗小,且因为利用了簇类分布特征,对相似度高的样本直接替代,能够更精确地提取浓缩数据信息。
[0019]在一些实施例中,所述利用所述每一样本类别下的多个浓缩样本,确定所述每一样本类别下的新样本,包括:确定所述每一样本类别下的多个浓缩样本的特征均值;根据所述多个浓缩样本的特征均值,确定所述每一样本类别下的新样本。
[0020]通过上述方式,能够利用多个浓缩样本的特征均值来进行样本浓缩,在保证特征的质量的同时提高运算效率。
[0021]在一些实施例中,所述方法还包括:基于所述每一样本类别下浓缩后的历史用户数据的风险等级标签和训练时风险评估模型输出的风险预测结果,构建损失函数;对应地,所述基于所述每一样本类别下浓缩后的历史用户数据,对对应样本类别下的待训练的风险评估模型进行训练,直至训练后的所述风险评估模型满足收敛条件,包括:基于所述每一样本类别下浓缩后的历史用户数据和所述浓缩后的历史用户数据的风险等级标签,对对应样本类别下的待训练的风险评估模型进行训练,直至利用所述损失函数确定出的损失小于预设阈值。
[0022]通过上述方式,能够减小由于用户数据和维度的增加导致的复杂程度的增加,同时在用户风险评级中提升评级模型的预测精准度。
[0023]在一些实施例中,所述待训练的风险评估模型通过以下步骤获得:对所述每一样本类别下浓缩后的历史用户数据进行特征提取,得到多个特征和所述多个特征中每一特征的重要程度;按照重要程度对所述多本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种风险评估方法,其特征在于,所述方法包括:获取待评估对象的当前用户数据;确定所述当前用户数据对应的目标样本类别;从多个已训练的风险评估模型中,确定与所述目标样本类别匹配的目标风险评估模型;其中,不同的所述风险评估模型对应不同的样本类别,并通过对应样本类别下的历史用户数据训练得到;基于所述当前用户数据和所述目标风险评估模型,确定所述待评估对象的当前风险等级。2.根据权利要求1所述的方法,其特征在于,所述风险评估模型通过以下步骤进行训练:设定不同的样本类别;确定所述不同的样本类别中每一样本类别下的历史用户数据;对所述每一样本类别下的历史用户数据进行浓缩处理,得到所述每一样本类别下浓缩后的历史用户数据;其中,浓缩后的历史用户数据的数据量小于浓缩前的历史用户数据的数据量;基于所述每一样本类别下浓缩后的历史用户数据,对对应样本类别下的待训练的风险评估模型进行训练,直至训练后的所述风险评估模型满足收敛条件。3.根据权利要求2所述的方法,其特征在于,所述确定所述不同的样本类别中每一样本类别下的历史用户数据,包括:获取预设时间段内的历史用户数据;对所述预设时间段内的历史用户数据进行初始聚类,得到所述不同的样本类别的初始聚类中心;利用粒子群算法对所述不同的样本类别的初始聚类中心进行优化,得到优化后的聚类中心;基于所述优化后的聚类中心和所述预设时间段内的历史用户数据,确定所述不同的样本类别中每一样本类别下的历史用户数据。4.根据权利要求3所述的方法,其特征在于,所述利用粒子群算法对所述不同的样本类别的初始聚类中心进行优化,得到优化后的聚类中心,包括:利用粒子群算法对所述预设时间段内的历史用户数据进行处理,得到每一所述历史用户数据的适应值;其中,所述粒子群算法中利用曼哈顿距离确定每一历史用户数据与其对应的初始聚类中心的相似度;对具有第一初始聚类中心的样本类别下的历史用户数据的适应值进行排序,得到第一排序结果;将所述第一排序结果中适应值最优的历史用户数据,确定为所述第一初始聚类中心对应的优化后的聚类中心。5.根据权利要求3或4所述的方法,其特征在于,所述基于所述优化后的聚类中心和所述预设时间段内的历史用户数据,确定所述不同的样本类别中每一样本类别下的历史用户数据,包括:确定所述预设时间段内的每一历史用户数据与优化后的聚类中心的相似度;
根据所述相似度对所述预设时间段内的历史用户数据进行分簇,得到所述不同的样本类别中每一样本类别下的历史用户数据。6.根据权利要求2所述的方法,其特征在于,所述对所述每一样本类别下的历史用户数据进行浓缩处理,得到所述每一样本类别下浓缩后的历史用户数据,包括:确定所述每一样本类别下的历史用户数据的统计分布特征;将每一所述历史用户数据与其对应的统计分布特征进行比对,得到比对结果;其中,所述比对结果用于表明每一所述历史用户数据为浓缩样本或非浓缩样本;利用所述每一样本类别下的多个浓缩样本,确定所述每一样本类别下的新样本;根据所述新样本和所述每一样本类别下的非浓缩样本,确定所述每一样本类别下浓缩后的历史用户数据。7.根据权利要求6所...

【专利技术属性】
技术研发人员:吉晶张泽余韦张帆杨猛
申请(专利权)人:中国移动通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1