System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及人工智能、机器学习技术,尤其涉及一种保单续期预测模型的训练方法、保单续期预测方法和设备。
技术介绍
1、保单续期是投保人继续缴纳保费以延续保险合同效力的行为,对保单续期的预测可以使保险公司有针对性地为客户提供更好的服务。
2、当前对保单续期的预测方案主要分为两类,一类是人工评估预测,另一类是基于机器学习的建模预测。人工评估预测的方法由于人为经验的主观性、低效性,难以有效处理海量的待续期保单。机器学习方法是采用预先训练的模型来预测保单是否续期,其中,模型训练是以大量的历史保单作为训练样本进行的。机器学习方法可以改善人工评估依赖主观经验所导致的问题,但是,由于训练样本中正负样本不平衡,训练得到的模型会更倾向于预测多数类样本,出现模型预测不准确的问题。
技术实现思路
1、本申请提供一种保单续期预测模型的训练方法、保单续期预测方法和设备,用以解决模型预测不准确的问题。
2、第一方面,本申请提供一种保单续期预测模型的训练方法,包括:
3、获取初始样本集,所述初始样本集中包括多个训练样本,所述训练样本包括保单信息以及用于表征保单是否续期的标签;
4、将所述初始样本集划分为正样本集和负样本集,其中,所述正样本集和负样本集中的一个为多数类样本集,另一个为少数类样本集;
5、对所述多数类样本集中的训练样本进行聚类,得到多个类簇,所述多个类簇的数量与所述少数类样本集中的训练样本的数量相同;
6、从每个所述类簇中分别选择一
7、基于训练样本集训练得到保单续期预测模型,保单续期预测模型用于基于待预测的保单信息输出是否续期的预测结果。
8、第二方面,本申请提供一种保单续期预测的方法,包括:
9、获取待预测的保单信息;
10、将所述保单信息输入保单续期预测模型中,得到所述保单续期预测模型输出的预测结果,所述预测结果用于表征保单是否续期,其中,所述保单续期预测模型是采用第一方面所述的方法得到的。
11、第三方面,本申请提供一种保单续期预测模型的训练装置,包括:
12、获取模块,用于获取初始样本集,所述初始样本集中包括多个训练样本,所述训练样本包括保单信息以及用于表征保单是否续期的标签;
13、划分模块,用于将所述初始样本集划分为正样本集和负样本集,其中,所述正样本集和负样本集中的一个为多数类样本集,另一个为少数类样本集;
14、聚类模块,用于对所述多数类样本集中的训练样本进行聚类,得到多个类簇,所述多个类簇的数量与所述少数类样本集中的训练样本的数量相同;
15、选择模块,用于从每个所述类簇中分别选择一个目标训练样本,将各所述类簇的目标训练样本和所述少数类样本集中的训练样本共同构成训练样本集;
16、训练模块,用于基于所述训练样本集训练得到所述保单续期预测模型,所述保单续期预测模型用于基于待预测的保单信息输出是否续期的预测结果。
17、第四方面,本申请提供一种保单续期预测装置,包括:
18、获取模块,用于获取待预测的保单信息;
19、预测模块,用于将所述保单信息输入保单续期预测模型中,得到所述保单续期预测模型输出的预测结果,所述预测结果用于表征保单是否续期,其中,所述保单续期预测模型是采用如第一方面中任一项所述的方法训练得到的。
20、第五方面,本申请提供一种电子设备,包括:存储器、处理器和收发器;
21、所述存储器存储计算机执行指令;
22、所述处理器执行所述存储器存储的计算机执行指令,以实现第一方面或第二方面所述的方法。
23、第六方面,本申请提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现第一方面或第二方面所述的方法。
24、第七方面,本申请提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现第一方面或第二方面所述的方法。
25、本申请提供的保单续期预测模型的训练方法、保单续期预测方法和设备,通过将初始样本集划分为正样本集和负样本集,正样本集和负样本其中的一个为多数类样本集,另一个为少数类样本集,对多数类样本集中的训练样本进行聚类,得到由多数类样本构成的多个类簇。由于聚类得到的各类簇中的训练样本为相似的训练样本,因此,从每个类簇中选择的目标训练样本,可以表征其所在的类簇中的训练样本所包含的信息。并且目标训练样本的数量与少数类样本集中的训练样本的数量相同,因此,将各类簇的目标训练样本和少数类样本集构成训练样本集,能够在保证各类簇中的信息不丢失的前提下,实现正负样本平衡,进而提高了基于该训练样本集训练得到的保单续期预测模型的预测准确性。
本文档来自技高网...【技术保护点】
1.一种保单续期预测模型的训练方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述从每个所述类簇中分别选择一个目标训练样本,包括:
3.根据权利要求1所述的方法,其特征在于,所述对所述多数类样本集中的训练样本进行聚类,得到多个类簇,包括:
4.根据权利要求1-3中任一项所述的方法,其特征在于,还包括:
5.根据权利要求4所述的方法,其特征在于,所述将所述多个测试样本按照所述续期概率进行排序,包括:
6.一种保单续期预测方法,其特征在于,包括:
7.根据权利要求6所述的方法,其特征在于,还包括:
8.一种保单续期预测模型的训练装置,其特征在于,包括:
9.一种保单续期预测装置,其特征在于,包括:
10.一种电子设备,包括:存储器、处理器和收发器;
11.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如权利要求1-7中任一项所述的方法。
12.一种计算机程序产
...【技术特征摘要】
1.一种保单续期预测模型的训练方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述从每个所述类簇中分别选择一个目标训练样本,包括:
3.根据权利要求1所述的方法,其特征在于,所述对所述多数类样本集中的训练样本进行聚类,得到多个类簇,包括:
4.根据权利要求1-3中任一项所述的方法,其特征在于,还包括:
5.根据权利要求4所述的方法,其特征在于,所述将所述多个测试样本按照所述续期概率进行排序,包括:
6.一种保单续期预测方法,其特征在于,包括:
7.根据...
【专利技术属性】
技术研发人员:赵俊杰,温佳美,李昊,杨颖慧,王腾,柳会彬,刘跃,李金兰,李天朋,姜峰,常宇航,
申请(专利权)人:中国人民人寿保险股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。