一种智慧文博下融合多因素的矩阵分解个性化推荐方法技术

技术编号:32519101 阅读:25 留言:0更新日期:2022-03-02 11:19
本发明专利技术公开了一种智慧文博下融合多因素的矩阵分解个性化推荐方法,该方法包括:对用户历史数据集进行初始化并分析处理,运用F

【技术实现步骤摘要】
一种智慧文博下融合多因素的矩阵分解个性化推荐方法


[0001]本专利技术涉及大数据推荐方法领域,尤其涉及一种智慧文博下融合多因素的矩阵分解个性化推荐方法。

技术介绍

[0002]随着近年来物联网技术飞速发展、人们生活水平不断提高、互联网用户规模快速增加、用户需求多样性,人们在海量数据中获取感兴趣的内容变得更加困难,如何准确捕捉用户感兴趣的内容是当前亟需解决的问题。
[0003]现在,人们生活离不开手机,网络信息呈现多样性和海量性,如果没有很好的依据给用户进行推送,那么很可能推送的大部分内容是用户不想看到的,大大降低了用户的体验感,因此研究精确的推荐算法非常有必要。推荐算法主要分为个性化推荐和大众化推荐。大众化推荐是基于相似信息的推荐,不能很好的表现出当前用户的特征,而个性化推荐能够更好的反映出用户的特征喜好,能提高推荐的准确度,存在着巨大的商业价值。融合多因素的矩阵分解个性化推荐算法可以帮助电子商务等行业进行更精准的商品推荐,减少用户浏览到重复或厌恶的信息带来的不利影响。
[0004]为了提高推荐的精确度,现有工作主要集中在解决稀疏数据情况、冷启动和对属性潜在关联的提取问题上。传统推荐算法在处理这些问题上效果不佳,比如:协同过滤推荐算法就存在冷启动、可扩展性不好、数据稀疏问题,因为训练期间未出现的项目,则无法将其嵌入到其他项目中进行预测。基于内容的推荐算法推荐结果比较直观,解释性强,也存在数据稀疏问题和不好对复杂属性进行处理,因为其要求内容容易抽取成有意义的特征,并且具有交换的结构性。基于规则的推荐虽然能发现用户的新兴趣点,但是对规则的抽取难、耗时、个性化程度低,因为商品名称的同义性会对关联规则的抽取产生很大的干扰。基于知识的推荐是静态的并且知识较难获得,因为它是基于一种推理,而不是建立在用户的偏好上,用户所用功能的知识也有差别。基于各种推荐算法的优缺点,融合多因素能够更好的挖掘用户的潜在关联特征,矩阵分解在解决数据稀疏性和冷启动上有很好的效果,个性化能更好的表现出用户的特征偏好。
[0005]考虑到目前推荐算法在海量数据中提取信息难、单一因素推荐效果不佳、数据稀疏、冷启动等问题。本专利技术提出基于多因素的矩阵分解个性化推荐算法,能够根据复杂多样的历史行为数据去提取用户与用户、用户与物品之间的潜在关联特征,能较好的处理数据稀疏和冷启动带来的影响,从而构建高准度的个性化推荐。

技术实现思路

[0006]本专利技术要解决的技术问题在于针对现有技术中的缺陷,提供一种智慧文博下融合多因素的矩阵分解个性化推荐方法。
[0007]本专利技术解决其技术问题所采用的技术方案是:
[0008]本专利技术提供智慧文博下融合多因素的矩阵分解个性化推荐方法,该方法包括以下
步骤:
[0009]步骤一、对用户历史数据集进行初始化并分析处理,得到用户

项目的评分矩阵R,并构建改进后的皮尔森相关系数F

PEARSON,运用F

PEARSON计算出用户与其他用户的相似性得分;
[0010]步骤二、根据基于机器学习的BERT模型训练用户历史数据集,预测出每个用户对项目的评分;
[0011]步骤三、构建F

SVD算法:根据用户

项目的评分矩阵R和输入的特征维度D转为用户的特征矩阵U和项目的特征矩阵V,并结合步骤一得到的用户相似性得分、步骤二得到的预测评分,构建得到融合多因素的预测评分公式和目标函数;
[0012]步骤四、输入待预测的用户数据,将其代入F

SVD算法的融合多因素的预测评分公式和目标函数中,运用随机梯度下降法进行求解,使得目标函数下降最快,得到预测评分。
[0013]进一步地,本专利技术的所述步骤一中F

PEARSON的具体方法为:
[0014]考虑到两个用户对电影评分的平均值,若用户评分的平均值越接近那么认为用户越相似,表示为:
[0015][0016]式中a
(u1,u2)
表示用户u1和用户u2关于平均评分的相似度,代表用户u1对所有电影评分的平均值,代表用户u2对所有电影评分的平均值,χ是调整超参数;
[0017]还考虑到两个用户共同评分的电影,其中包括共同评分电影的数量,共同评分电影的评分值,两个用户共同评分的电影越多代表两个用户的兴趣更接近;
[0018][0019]式中c
(u1,u2)
表示用户u1和用户u2在共同评分电影的相似度,r
(u1,i)
代表用户u1对电影i的评分,r
(u2,i)
代表用户u2对电影i的评分,代表用户u1的平均评分,代表用户u2的平均评分;
[0020]统计用户多长时间评价一部电影,考虑到两个用户评分电影的频率,评分频率越接近认为他们更相似,对取到的用户频繁频率进行归一化处理:
[0021][0022]式中f
(u1,u2)
表示两个用户关于评分频率的相似度,代表用户u1最近一次评分电影的时间戳,代表用户u1最早一次评价电影的时间戳,代表用户u2最近一次评分电影的时间戳,代表用户u2最早一次评价电影的时间戳,γ是调整超参数;
[0023]综合以上因素,最终用户的相似度计算公式为:
[0024][0025]式中Su表示F

PEARSON相似度。
[0026]进一步地,本专利技术的所述用户历史数据集中包括:电影id,movieId;用户id,userId;评分,rating;电影类型,genres;时间戳,timestamp;标签,tags。
[0027]进一步地,本专利技术的所述步骤二中BERT模型训练方法为:
[0028]根据权利要求1所述的融合多因素的矩阵分解个性化推荐方法,其特征在于,所述步骤二中BERT模型训练的方法为:
[0029]加入BERT模型对历史数据进行训练,输入为提取的信息,包括:itemId,项目id;userId,用户id;rating,评分;genres,类别;输出为用户对电影的预测评分,最后取前k个用户的预测评分均值,计算公式表示为用户的预测评分均值,计算公式表示为为用户对某个年代某种类型项目的评分。
[0030]进一步地,本专利技术的所述步骤三中构建得到融合多因素的预测评分公式和目标函数的具体方法为:
[0031]相似度排序:将计算的用户相似度得分进行排序,排序后的数据为json格式:{"key":[[userId,S
u
],

[userId,S
u
]],

},key为当前用户ID,userId为其他用户ID,S
u
为其他用户与当前用户的相似度得分;
[0032]电影分类:将电影分成多种分类,分别用分类对应的数字进行标识;
[0033]用户在分类电影中的均分:获取数据集里面的mo本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种智慧文博下融合多因素的矩阵分解个性化推荐方法,其特征在于,该方法包括以下步骤:步骤一、对用户历史数据集进行初始化并分析处理,根据输入的特征维度构建用户

项目的评分矩阵R,并构建改进后的皮尔森相关系数F

PEARSON,运用F

PEARSON计算出用户与其他用户的相似性得分;步骤二、根据基于机器学习的BERT模型训练用户历史数据集,预测出每个用户对不同年代不同类型电影的评分;步骤三、构建F

SVD算法:根据用户

项目的评分矩阵R和输入的特征维度D转为用户的特征矩阵U和项目的特征矩阵V,并结合步骤一得到的用户相似性得分、步骤二得到的预测评分,构建得到融合多因素的预测评分公式和目标函数;步骤四、输入待预测的用户数据,将其代入F

SVD算法的融合多因素的预测评分公式和目标函数中,运用随机梯度下降法进行求解,使得目标函数下降最快,得到预测评分。2.根据权利要求1所述的融合多因素的矩阵分解个性化推荐方法,其特征在于,所述步骤一中F

PEARSON的具体方法为:考虑到两个用户对电影评分的平均值,若用户评分的平均值越接近那么认为用户越相似,表示为:式中a
(u1,u2)
表示用户u1和用户u2关于平均评分的相似度,代表用户u1对所有电影评分的平均值,代表用户u2对所有电影评分的平均值,χ是调整超参数;还考虑到两个用户共同评分的电影,其中包括共同评分电影的数量,共同评分电影的评分值,两个用户共同评分的电影越多代表两个用户的兴趣更接近;式中c
(u1,u2)
表示用户u1和用户u2在共同评分电影的相似度,r
(u1,i)
代表用户u1对电影i的评分,r
(u2,i)
代表用户u2对电影i的评分,代表用户u1的平均评分,代表用户u2的平均评分;统计用户多长时间评价一部电影,考虑到两个用户评分电影的频率,评分频率越接近认为他们更相似,对取到的用户频繁频率进行归一化处理:式中f
(u1,u2)
表示两个用户关于评分频率的相似度,代表用户u1最近一次评分电影的时间戳,代表用户u1最早一次评价电影的时间戳,代表用户u2最近一次评分电影的时间戳,代表用户u2最早一次评价电影的时间戳,γ是调整超参数;综合以上因素,最终用户的相似度计算公式为:
式中Su表示F

PEARSON相似度。3.根据权利要求1所述的智慧文博下融合多因素的矩阵分解个性化推荐方法,其特征在于,所述用户历史数据集中包括:电影id,movieId;用户id,userId;评分,rating;电影类型,genres;时间戳,timestamp;标签,tags。4.根据权利要求3所述的智慧文博下融合多因素的矩阵分解个性化推荐方法,其特征在于,所述步骤二中BERT模型训练的具体方法为:加入BERT模型对历史数据进行训练,输入为提取的信息,包括:itemId,项目id;userId,用户id;rating,评分;genres,类别;输出为用户对电影的预测评分,最后取前k个用户的预测评分均值,计算公式表示为用户的预测评分均值,计算公式表示为为用户对某个年代某种类型项目的评分。5.根据权利要求1所述的智慧文博下融合多因素的矩阵分解个性化推荐方法,其特征在于,所述步骤三中构建得到融合多因素的预测评分公式...

【专利技术属性】
技术研发人员:朱容波金焕章王俊
申请(专利权)人:中南民族大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1