一种融合顺序注意力和特征表征学习的核保结论预测方法技术

技术编号：41736114 阅读：16 留言：0更新日期：2024-06-19 12:55

本发明专利技术公开了一种融合顺序注意力和特征表征学习的核保结论预测方法，该方法包括获取基于历史保单数据的训练保单样本数据和测试保单样本数据；构建基于多轮决策的核保结论预测模型，并利用训练保单样本数据训练核保结论预测模型以得到训练好的核保结论预测模型；将测试保单样本数据输入至训练好的核保结论预测模型，以在每轮决策中通过顺序注意力模块得到掩码矩阵，并将掩码矩阵输入表征学习模块后输出单轮决策预测向量；在经过多轮决策后，将每轮决策得到的单轮决策预测向量集成后通过全连接层映射为测试保单样本数据中保单的核保结论预测值。本发明专利技术可以提升模型对保单历史数据的挖掘分析能力，实现更高精度的核保结论预测。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及人工智能、机器学习，特别是涉及一种融合顺序注意力和特征表征学习的核保结论预测方法。

技术介绍

1、保单核保是指保险公司核保人员依据被保人的年龄、性别、健康状况、职业以及医疗记录、体检报告等信息来评估风险和保险的可行性。根据风险评估结果，核保人员会做出核保结论。然而人工核保流程依赖于核保人员的专业知识和经验，不可避免会存在核保准确性和效率低下的问题。针对以上问题，采用大数据和机器学习分析、建模、预测保单核保结论成为一种可行的解决方法。

2、当前保险公司算法研究人员对保单核保结论预测的一般性方法为，利用大数据技术提取整合保单核保结论字段以及保单相关的投被保人、代理人信息。通过数据清洗和手动特征筛选提取入模特征。将数据集划分为训练集、测试集，分别训练机器学习算法如逻辑回归、随机森林、xgboost、lightgbm等模型，对比分析模型分类性能，选择分类准确率最高的模型进行核保结论预测。机器学习建模方法推动了保单核保业务的自动化进程，机器学习算法可以从历史数据中挖掘浅层特征表征进行预测，然而传统机器学习算法手动特征工程时耗较大、难以提取复杂非线性的特征表征且可解释性较差。

3、现有技术方案缺点如下：采用传统机器学习方法建模需要进行大量的手动特征工程进行特征选择，需要手动对每个特征进行分箱、计算iv值、计算相关性系数等处理来选择对预测有帮助的重要特征。然而手动特征工程存在耗时较大、缺乏泛化能力、难以处理高维数据等缺点。在训练传统机器学习模型的过程中，这类模型难以提取特征之间的复杂关联关系进行预测，且难

技术实现思路

1、本专利技术旨在至少在一定程度上解决相关技术中的技术问题之一。

2、为此，本专利技术提出了一种融合顺序注意力和特征表征学习的核保结论预测方法，实现了自动化特征选择且具有更强的非线性特征表征能力，进一步提升了保单核保结论可解释性和预测的精度。

3、本专利技术的另一个目的在于提出一种融合顺序注意力和特征表征学习的核保结论预测装置。

4、为达上述目的，本专利技术一方面提出一种融合顺序注意力和特征表征学习的核保结论预测方法，包括：

5、获取基于历史保单数据的训练保单样本数据和测试保单样本数据；

6、构建基于多轮决策的核保结论预测模型，并利用所述训练保单样本数据训练所述核保结论预测模型以得到训练好的核保结论预测模型；其中，所述核保结论预测模型，至少包括顺序注意力模块和表征学习模块；

7、将所述测试保单样本数据输入至所述训练好的核保结论预测模型，以在每轮决策中通过顺序注意力模块得到掩码矩阵，并将所述掩码矩阵输入所述表征学习模块后输出单轮决策预测向量；

8、在经过所述多轮决策后，将每轮决策得到的所述单轮决策预测向量集成后通过全连接层映射为测试保单样本数据中保单的核保结论预测值。

9、本专利技术实施例的融合顺序注意力和特征表征学习的核保结论预测方法还可以具有以下附加技术特征：

10、在本专利技术的一个实施例中，获取基于历史保单数据的训练保单样本数据和测试保单样本数据，包括：

11、从业务数据库中提取历史保单数据，并根据历史保单数据的核保结论字段构造目标字段；

12、根据历史保单数据中每个保单的投保人、被保人和代理人的所述目标字段进行多维度特征聚合以得到入模数据集；

13、将所述入模数据集划分为训练保单样本数据和测试保单样本数据。

14、在本专利技术的一个实施例中，所述核保结论预测模型，还包括第一归一化层；利用所述训练保单样本数据训练所述核保结论预测模型以得到训练好的核保结论预测模型，包括：

15、将所述训练保单样本数据输入所述批第一归一化层输出原始特征数据，并将所述原始特征数据输入表征学习模块以输出得到特征向量；

16、将所述特征向量进行拆分表征，并将拆分后的特征向量输入顺序注意力模块以基于特征的使用程度和重要性对特征分配不同权重值以构成掩码矩阵；

17、将所述掩码矩阵和所述原始特征数据输入表征学习模块以利用深度学习能力学习复杂非线性的特征表征输出用于训练的单轮决策预测向量；

18、对所述用于训练的单轮决策预测向量进行集成并映射为训练保单样本数据中保单的核保结论预测值，以得到训练好的核保结论预测模型。

19、在本专利技术的一个实施例中，所述顺序注意力模块，包括第一fc全连接网络、第二归一化层和sparsemax激活函数；将拆分后的特征表征输入顺序注意力模块以基于特征的使用程度对特征分配不同权重值以构成掩码矩阵，包括：

20、将拆分后的特征向量输入第一fc全连接网络和第二归一化层进行特征映射处理得到向量映射结果；

21、将基于所述向量映射结果和先验项得到的乘积结果输入所述sparsemax激活函数进行向量稀疏化以得到当前决策的掩码矩阵；其中，所述先验项，用于表示各个特征在之前决策的使用程度。

22、在本专利技术的一个实施例中，所述表征学习模块，包括两个网络层模块，其中，每个网络层模块，包括两组网络层，所述网络层，包括第二fc全连接网络、第三归一化层和glu神经网络；所述两个网络层模块之间利用残差连接。

23、在本专利技术的一个实施例中，将所述掩码矩阵和所述原始特征数据输入表征学习模块以利用深度学习能力学习复杂非线性的特征表征输出用于训练的单轮决策预测向量，包括：

24、将所述掩码矩阵和所述原始特征数据输入表征学习模块输出得到表征向量；

25、对所述表征向量进行结果拆分以输出得到当前决策输出向量和下一决策的顺序注意力模块的输入向量；

26、通过多轮决策后，将每轮的决策输出向量聚合为最终决策结果，并通过第二fc全连接网络将所述最终决策结果映射为用于训练的单轮决策预测向量。

27、为达上述目的，本专利技术另一方面提出一种融合顺序注意力和特征表征学习的核保结论预测装置，包括：

28、保单数据获取模块，用于获取基于历史保单数据的训练保单样本数据和测试保单样本数据；

29、核保模型训练模块，用于构建基于多轮决策的核保结论预测模型，并利用所述训练保单样本数据训练所述核保结论预测模型以得到训练好的核保结论预测模型；其中，所述核保结论预测模型，至少包括顺序注意力模块和表征学习模块；

30、预测向量输出模块，用于将所述测试保单样本数据输入至所述训练好的核保结论预测模型，以在每轮决策中通过顺序注意力模块得到掩码矩阵，并将所述掩码矩阵输入所述表征学习模块后输出单轮决策预测向量；

31、核保结论预测模块，用于在经过所述多轮决策后，将每轮决策得到的所述单轮决策预测向量集成后通过全连接层映射为测试保单样本本文档来自技高网...

【技术保护点】

1.一种融合顺序注意力和特征表征学习的核保结论预测方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，获取基于历史保单数据的训练保单样本数据和测试保单样本数据，包括：

3.根据权利要求2所述的方法，其特征在于，所述核保结论预测模型，还包括第一归一化层；利用所述训练保单样本数据训练所述核保结论预测模型以得到训练好的核保结论预测模型，包括：

4.根据权利要求3所述的方法，其特征在于，所述顺序注意力模块，包括第一FC全连接网络、第二归一化层和Sparsemax激活函数；将拆分后的特征表征输入顺序注意力模块以基于特征的使用程度对特征分配不同权重值以构成掩码矩阵，包括：

5.根据权利要求4所述的方法，其特征在于，所述表征学习模块，包括两个网络层模块，其中，每个网络层模块，包括两组网络层，所述网络层，包括第二FC全连接网络、第三归一化层和GLU神经网络；所述两个网络层模块之间利用残差连接。

6.根据权利要求5所述的方法，其特征在于，将所述掩码矩阵和所述原始特征数据输入表征学习模块以利用深度学习能力学习复杂非线性的特征

7.一种融合顺序注意力和特征表征学习的核保结论预测装置，其特征在于，包括：

8.根据权利要求7所述的装置，其特征在于，保单数据获取模块，还用于：

9.根据权利要求8所述的装置，其特征在于，所述核保结论预测模型，还包括第一归一化层；核保模型训练模块，包括：

10.根据权利要求9所述的装置，其特征在于，所述顺序注意力模块，包括第一FC全连接网络、第二归一化层和Sparsemax激活函数；所述掩码矩阵构造单元，还用于：

...

【技术特征摘要】

1.一种融合顺序注意力和特征表征学习的核保结论预测方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，获取基于历史保单数据的训练保单样本数据和测试保单样本数据，包括：

4.根据权利要求3所述的方法，其特征在于，所述顺序注意力模块，包括第一fc全连接网络、第二归一化层和sparsemax激活函数；将拆分后的特征表征输入顺序注意力模块以基于特征的使用程度对特征分配不同权重值以构成掩码矩阵，包括：

5.根据权利要求4所述的方法，其特征在于，所述表征学习模块，包括两个网络层模块，其中，每个网络层模块，包括两组网络层，所...

【专利技术属性】
技术研发人员：赵俊杰，温佳美，刘雨薇，
申请(专利权)人：人保信息科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人