System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及数据处理领域,具体涉及一种基于混合模型的互联网保险评分预测方法及装置。
技术介绍
1、随着信息的爆炸式增长,用户越来越难以找到感兴趣的信息。个性化推荐是解决这一问题的有效工具。它通过分析用户的历史行为数据来确定用户偏好,然后推荐这些用户可能感兴趣的项目。在推荐算法中评分数据显得尤为重要,因为它能显式的反馈用户对项目的喜好程度,但由于其难以收集,导致评分数据普遍存在稀疏性问题。评分数据的稀疏性在互联网保险领域显的格外突出,因为保险用户普遍存在购买产品后并未评分这一现象。而评分预测方法可以利用用户-项目之间的隐含关系,对缺失的评分进行推断,从而实现对数据稀疏性问题的处理。那么如何利用评分预测方法解决上述现象导致的评分稀疏问题是互联网保险推荐中尤为关键的一项工作。
2、传统的评分预测算法包括矩阵分解、深度学习、基于协同过滤的评分预测和混合预测。最广泛使用的评分预测方法是基于协同过滤的预测方法。互联网保险行业随着数据规模的日益增长,传统的评分预测算法已经显得捉襟见肘。
3、目前,面对互联网保险评分预测场景,传统的评分预测方法都存在着一些问题:矩阵分解的方法主要依赖于用户和产品之间的交互信息,常用交互信息为用户的显式反馈信息,忽略了用户隐式反馈信息中的用户对项目的非线性偏好信息,这也导致了矩阵分解的评分预测的准确性并不理想。深度学习近年来在许多领域上都取得了重大突破,在评分预测领域也有着大量的研究。深度学习对于挖掘用户与项目之间的非线性关系有着重要作用。但深度学习的训练往往需要大量的数据,且解释性和对
技术实现思路
1、本申请的目的在于针对上述提到的技术问题提出一种基于混合模型的互联网保险评分预测方法及装置。
2、第一方面,本专利技术提供了一种基于混合模型的互联网保险评分预测方法,包括以下步骤:
3、获取互联网保险的订单数据,对订单数据进行清洗和转换,并进行特征提取和筛选,得到用户的特征数据和项目的特征数据,根据用户的特征数据和项目的特征数据分别生成用户嵌入矩阵和项目嵌入矩阵,基于用户的特征数据和项目的特征数据构建用户-项目评分矩阵和用户-项目购买交互矩阵;
4、分别构建第一多层感知机和第二多层感知机并分别训练,得到经训练的第一多层感知机和经训练的第二多层感知机;
5、在用户-项目购买交互矩阵中确定用户已购买但未评分的用户id和项目id,从用户-项目购买交互矩阵获取项目id对应的项目历史交互向量,从用户-项目购买交互矩阵获取用户id对应的用户历史交互向量,将项目历史交互向量输入经训练的第一多层感知机,得到项目的隐式嵌入向量;将用户历史交互向量输入经训练的第二多层感知机,得到用户的隐式嵌入向量;
6、构建评分预测模型并训练,得到经训练的评分预测模型,对用户-项目评分矩阵进行矩阵分解,得到项目的显式嵌入向量和用户的显式嵌入向量,将项目的显式嵌入向量和项目的隐式嵌入向量进行融合,得到融合的项目嵌入向量,将用户的隐式嵌入向量和用户的显式嵌入向量进行融合,得到融合的用户嵌入向量,将融合的项目嵌入向量和融合的用户嵌入向量输入经训练的评分预测模型,得到预测的评分数据。
7、作为优选,根据用户的特征数据和项目的特征数据分别生成用户嵌入矩阵和项目嵌入矩阵,具体包括:
8、用户的特征数据包括用户id、年龄、性别、籍贯,对用户的特征数据中的文本信息进行赋值,并构造成用户嵌入矩阵;
9、项目的特征数据包括项目id、项目价格、所属类型、所属保司,对项目的特征数据中的文本信息进行赋值,并构造成项目嵌入矩阵。
10、作为优选,基于用户的特征数据和项目的特征数据构建用户-项目评分矩阵和用户-项目购买交互矩阵,具体包括:
11、采用下式表示用户-项目购买交互矩阵:
12、;
13、其中,表示用户对项目的购买行为,当时表示用户对项目没有购买行为,当时表示用户对项目有购买行为;
14、采用下式表示用户-项目评分矩阵:
15、;
16、其中,表示用户对项目的评分数据,当时表示用户对项目存在对应的评分数据,当时表示用户对项目无评分数据。
17、作为优选,第一多层感知机的训练过程如下:
18、从训练数据中的用户嵌入矩阵中获取每个用户的用户嵌入向量;
19、将训练数据中的每个项目所对应的项目历史交互向量输入第一多层感知机中,得到每个项目的隐式嵌入向量,计算过程如下:
20、;
21、;
22、;
23、其中,表示用户-项目购买交互矩阵中的项目所对应的一列,表示激活函数,表示第一多层感知机中的第1层的正则项,表示第一多层感知机中的第1层的权重,表示第一多层感知机中的第1层的输出,表示第一多层感知机中的第l-1层的输出,表示第一多层感知机中的第l层的权重,表示第一多层感知机中的第l层的正则项,表示第一多层感知机中的第l层的输出,表示第一多层感知机的层数,表示第一多层感知机中的第l层的权重,表示第一多层感知机中的第l层的正则项,表示第一多层感知机中的第l-1层的输出,表示项目的隐式嵌入向量;
24、将每个用户的用户嵌入向量与每个项目的隐式嵌入向量内积,预测得到第一评分值,公式如下:
25、;
26、其中,表示用户的用户嵌入向量,而表示用户对项目的第一评分值;
27、构建如下的第一损失函数l1:
28、;
29、其中,表示用户对项目的真实评分值,表示用户嵌入向量,表示第一损失函数中的正则化系数,表示第一多层感知机中每一层的权重汇聚而成的权重矩阵,表示范数正则化;
30、采用第一损失函数对第一多层感知机训练,得到经训练的第一多层感知机。
31、作为优选,第二多层感知机的训练过程如下:
32、从训练数据中的项目嵌入矩阵中获取每个项目的项目嵌入向量;
33、将训练数据中的每个用户所对应的用户历史交互向量输入第二多层感知机中,得到每个项目的隐式嵌入向量,计算过程如下:
34、;
35、;
36、;
37、其中,表示用户-项目购买交互矩阵中的用户所对应的一行,表示激活函数,表示第二多层感知机中的第1层的正则项,表示第二多层感知机中的第1层的权重,表示第二多层感知机中的第1层的输出,表示第二多层感知机中的第g-1层的输出,本文档来自技高网...
【技术保护点】
1.一种基于混合模型的互联网保险评分预测方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于混合模型的互联网保险评分预测方法,其特征在于,所述根据所述用户的特征数据和项目的特征数据分别生成用户嵌入矩阵和项目嵌入矩阵,具体包括:
3.根据权利要求1所述的基于混合模型的互联网保险评分预测方法,其特征在于,所述基于所述用户的特征数据和项目的特征数据构建用户-项目评分矩阵和用户-项目购买交互矩阵,具体包括:
4.根据权利要求1所述的基于混合模型的互联网保险评分预测方法,其特征在于,所述第一多层感知机的训练过程如下:
5.根据权利要求1所述的基于混合模型的互联网保险评分预测方法,其特征在于,所述第二多层感知机的训练过程如下:
6.根据权利要求1所述的基于混合模型的互联网保险评分预测方法,其特征在于,所述对所述用户-项目评分矩阵进行矩阵分解,得到项目的显式嵌入向量和用户的显式嵌入向量,将所述项目的显式嵌入向量和项目的隐式嵌入向量进行融合,得到融合的项目嵌入向量,将所述用户的隐式嵌入向量和用户的显式嵌入向量进行融合,得到融合
7.根据权利要求1所述的基于混合模型的互联网保险评分预测方法,其特征在于,所述将所述融合的项目嵌入向量和融合的用户嵌入向量输入所述经训练的评分预测模型,得到预测的评分数据,具体包括:
8.一种基于混合模型的互联网保险评分预测方法,其特征在于,包括:
9.一种电子设备,包括:
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一所述的方法。
...【技术特征摘要】
1.一种基于混合模型的互联网保险评分预测方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于混合模型的互联网保险评分预测方法,其特征在于,所述根据所述用户的特征数据和项目的特征数据分别生成用户嵌入矩阵和项目嵌入矩阵,具体包括:
3.根据权利要求1所述的基于混合模型的互联网保险评分预测方法,其特征在于,所述基于所述用户的特征数据和项目的特征数据构建用户-项目评分矩阵和用户-项目购买交互矩阵,具体包括:
4.根据权利要求1所述的基于混合模型的互联网保险评分预测方法,其特征在于,所述第一多层感知机的训练过程如下:
5.根据权利要求1所述的基于混合模型的互联网保险评分预测方法,其特征在于,所述第二多层感知机的训练过程如下:
6.根据权利要求1所述的基于混合模型的互...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。