一种概率矩阵分解推荐方法技术

技术编号:12516070 阅读:87 留言:0更新日期:2015-12-16 14:11
本发明专利技术给出一种概率矩阵分解推荐方法,该方法基于显性与隐性反馈信息同时结合概率矩阵分解技术帮助用户给商品评分,首先对用户信任关系矩阵进行概率矩阵分解,然后对用户的商品评分矩阵和隐性反馈信息进行概率矩阵分解,综合两次分解的结果,求出隐含用户特征矩阵、隐含商品特征矩阵以及隐性反馈信息特征向量,最后计算出给用户推荐的评分。本发明专利技术能够很好地利用在线社交网络帮助用户推荐商品的评分,缓解社交网络中数据稀疏问题和冷启动问题,有着很好的推荐效果,同时能运用于有大规模数据集的推荐系统。

【技术实现步骤摘要】

本专利技术涉及在线社交网络的交互方法,建立一种新型推荐方法,结合显性与隐性 反馈信息,利用概率矩阵分解原理进行准确的评分预测,属于软件工程、人机交互、互联网 交叉技术应用领域。
技术介绍
近年来,在线社交网络逐渐流行,吸引了成千上万的用户,已经成为当今信息的传 播与分享的主要平台之一。由于商品规模越来越庞大,用户很难快速准确地找到自己感兴 趣的商品,推荐系统的任务就是帮助用户快速准确地找到喜欢的商品。在线社交网络中,朋 友的推荐很重要,它可以给用户提供准确的建议,使用户能够快速地找到理想中的商品。供 应商们也很愿意利用推荐系统给他们潜在的客户推荐需要的商品,并且希望把客户变成真 正的买家。 为了获得更准确的推荐,需要对未知的商品进行评分的预测,除了朋友的推荐之 外,其它的信息也很重要,如显性反馈和隐性反馈信息。显性反馈信息是指用户给出的显性 倾向,如评分信息、用户与用户之间的信任关系等。隐性反馈信息是指用户不直接表现出的 隐性倾向,如购买了哪些商品、给哪些电影评分了等。近年来,基于协同过滤的显性反馈的 推荐系统普遍增多,很多推荐系统都是结合用户的评分和信任信息来提高推荐的准确度, 但这却浪费了大量的宝贵的隐性反馈信息。由于推荐系统可以很容易地获取隐性反馈信 息,而且用户不会很反感,同时隐性反馈信息还具有收集成本低、应用场景广、数据规模大 等特点。因此,在推荐系统中需要将隐性反馈信息和显性反馈信息相结合。 矩阵分解技术已逐步应用于推荐系统,其中就包括概率矩阵分解技术。概率矩阵 分解技术是根据用户和商品的特征向量以及观察到的评分服从的高斯先验分布,利用贝叶 斯推导,得到用户和商品的特征矩阵,最后根据特征矩阵计算出预测的评分。该方法可以 有效地利用多方面信息,在推荐时有着更好的准确率,而且复杂度不高,适合处理大规模数 据。
技术实现思路
技术问题:本专利技术的目的是提供,该方法是一种基于 显性与隐性反馈信息同时结合概率矩阵分解技术帮助用户给商品评分的方法,该方法以在 线社交网络为平台,对显性与隐性反馈信息进行概率矩阵分解,并根据贝叶斯推理来预测 出用户对商品的评分,解决了预测精度不高以及评分稀疏与冷启动的问题。 技术方案:本专利技术所述概率矩阵分解推荐方法,首先对用户信任关系矩阵进行概 率矩阵分解,然后对用户的商品评分矩阵和隐性反馈信息进行概率矩阵分解,综合两次分 解的结果,求出隐含用户特征矩阵、隐含商品特征矩阵以及隐性反馈信息特征向量,最后计 算出给用户推荐的评分。 本专利技术所述概率矩阵分解推荐方法包括以下步骤: 步骤1)获得用户在线社交网络中的信任关系矩阵与用户商品评分矩阵;所述在 线社交网络是在互联网上与其他人相联系的一个平台,用户对产品进行评分,同时分享给 该用户的朋友,查询该用户的朋友的评分; 步骤2)随机生成U和Z,所述U e Rdx?表示隐含用户特征矩阵,Z e Rdx?表示隐 含信任关系特征矩阵,Z e Rdxm表示d行m列的矩阵,d是用户根据经验指定的隐含特征数, m是用户的个数,将隐含用户特征矩阵和隐含信任关系特征矩阵的先验分布表示为: 所述i表示用户个数的变量,k表示用户个数的变量,Ui表示用户U ;的特征列向 量,Zk表示第k个信任关系特征向量,I 表示是均值为〇,方差为^的高斯分布 的概率密度函数,iV(ZJ0,c^)表示是均值为〇,方差为σ〗的高斯分布的概率密度函数; 步骤3)对用户信任关系矩阵进行概率矩阵分解,用户信任关系矩阵的条件概率 分布表不为: 所述T表示mXm维的用户信任关系矩阵,表示1^的转置,表不均值为ZA_)、方差为4的高斯分布的概率密度函数,IijiJ是一个变量,表不用 户Ui与用户u k之间信任关系,当用户u ;信任用户u k时,I i_k_T= 1,否则I i_k_T= 0 ;所 述gif/%,是将£/?的值映射在之间,,G是一个变量,表示用户u i与用户u k之间的信任权值,d + (U1)表示用 户U1信任的用户数量,d (Uk)表示用户Uk被信任的用户数量; 步骤4)随机生成V,所述V e Rdxn表示隐含商品特征矩阵,Rdxn表示d行η列的 矩阵,η表示商品的个数,将隐含商品特征矩阵的先验分布表示为: 所述j表示商品个数的变量,Vj表示商品i 的特征向量,ArG77 I 〇,<_)表示是均值 为〇,方差为的高斯分布的概率密度函数; 步骤5)对用户的商品评分矩阵进行概率矩阵分解,用户的商品评分矩阵的条件 概率分布表不为: υ?Ν 丄 丄 λ J ^ o/ υ, 所述R表示mXn维的用户的商品评分矩阵,Γι ]表示用户u i对商品i ,的评分,'表示均值为、方差为4的高斯分 布的概率密度函数,Iu表示被用户评过分的商品集合,|lu|表示被用户评过分的商品的数 量,Ii」_R表示用户Ui是否给商品i .j评过分,若评过分,则I ^jjf= 1,否则I ^jjf = 0,y .j表示 已被用户评过分的商品对即将要评分商品的隐性影响的权重值,初始值为1. 〇 ; 步骤6)分别计算Up Vp Z1^ y郝更新值U /、V /、Z k'与y /,,所述γ为预先 定义的步长,γ足够小且γ >〇, γ的具体值根据经验确定,其中'Λ 所述λ为预先定义的规则 化参数,λ足够小且λ > 〇, λ的具体值根据经验确定; 步骤7)根据公式 计算目标函数L的值,当目标函数L的值变化小于某个预先定义的很小的常数或 在经过设定的迭代次数后终止迭代过程,否则令U i=U/,Vj= V/ ,Zk=Z1/,yj=y/, 返回步骤6),所述|*£是欧几里得向量范数; 步骤8)当迭代运算终止后,得到U1'、V / 以及y /,使用计算用户U1对商品i j的未知评分考」。 有益效果: 1)本专利技术提供一种基于在线社交网络的一种基于显性与隐性反馈信息同时结合 概率矩阵分解技术帮助用户给商品评分的方法,整个过程思路清晰完整,可读性强,尽量将 晦涩难懂的相关技术概念、相关算法表述清晰,易于理解。 2)本专利技术中所述的评分预测过程,提供了一套计算公式,能够将实际社交网络中 相关的数据转化为数学化的模型形式,从而得到最终的结果。 3)本专利技术中所述的推荐方法能够缓解社交网络中数据稀疏问题和冷启动问题,有 着更好的推荐效果,并且该推荐方法能运用于有大规模数据集的推荐系统。【附图说明】 图1是基于显性与隐性反馈信息同时结合概率矩阵分解技术帮助用户给商品评 分的方法流程图; 图2是基于显性与隐性反馈信息同时结合概率矩阵分解技术帮助用户给商品评 分的方法的图形模型。【具体实施方式】 本专利技术在在线社交网络中,结合用户对商品的评分以及用户之间的关系等相关数 据,给用户提供了准确地推荐评分。下面根据图1和实施例当前第1页1 2 本文档来自技高网
...

【技术保护点】
一种概率矩阵分解推荐方法,其特征在于该方法包括以下步骤:步骤1)获得用户在线社交网络中的信任关系矩阵与用户商品评分矩阵;所述在线社交网络是在互联网上与其他人相联系的一个平台,用户对产品进行评分,同时分享给该用户的朋友,查询该用户的朋友的评分;步骤2)随机生成U和Z,所述U∈Rd×m表示隐含用户特征矩阵,Z∈Rd×m表示隐含信任关系特征矩阵,表示d行m列的矩阵,d是用户根据经验指定的隐含特征数,m是用户的个数,将隐含用户特征矩阵和隐含信任关系特征矩阵的先验分布表示为:p(U|σU2)=Πi=1mN(Ui|0,σU2)]]>p(Z|σZ2)=Πk=1mN(Zk|0,σz2)]]>所述i表示用户个数的变量,k表示用户个数的变量,Ui表示用户ui的特征列向量,Zk表示第k个信任关系特征向量,表示是均值为0,方差为的高斯分布的概率密度函数,表示是均值为0,方差为的高斯分布的概率密度函数;步骤3)对用户信任关系矩阵进行概率矩阵分解,用户信任关系矩阵的条件概率分布表示为:p(T|U,Z,σT2)=Πi=1mΠk=1m[N(ti_k*|g(UiTZk),σT2)]Ii_k_T]]>所述T表示m×m维的用户信任关系矩阵,表示Ui的转置,表示均值为方差为的高斯分布的概率密度函数,Ii_k_T是一个变量,表示用户ui与用户uk之间信任关系,当用户ui信任用户uk时,Ii_k_T=1,否则Ii_k_T=0;所述是将的值映射在[0,1]之间,g(UiTZk)=11+e(UiTZk),]]>是一个变量,ti_k*=d-(uk)d+(ui)+d-(uk)×ti_k,]]>ti_k表示用户ui与用户uk之间的信任权值,d+(ui)表示用户ui信任的用户数量,d‑(uk)表示用户uk被信任的用户数量;步骤4)随机生成V,所述V∈Rd×n表示隐含商品特征矩阵,表示d行n列的矩阵,n表示商品的个数,将隐含商品特征矩阵的先验分布表示为:p(V|σV2)=Πj=1nN(Vj|0,σV2)]]>所述j表示商品个数的变量,Vj表示商品ij的特征向量,表示是均值为0,方差为的高斯分布的概率密度函数;步骤5)对用户的商品评分矩阵进行概率矩阵分解,用户的商品评分矩阵的条件概率分布表示为:p(R|U,V,σR2)=Πi=1mΠj=1m[N(ri_j|g(UiT(Vj+|Iu|-12Σj∈Iuyj)),σR2)]Ii_j_R]]>所述R表示m×n维的用户的商品评分矩阵,ri_j表示用户ui对商品ij的评分,N(ri_j|g(UiT(Vj+|Iu|-12Σj∈Iuyj)),σR2)]]>表示均值为g(UiT(Vj+|Iu|-12Σj∈Iuyj)),]]>方差为的高斯分布的概率密度函数,Iu表示被用户评过分的商品集合,|Iu|表示被用户评过分的商品的数量,Ii_j_R表示用户ui是否给商品ij评过分,若评过分,则Ii_j_R=1,否则Ii_j_R=0,yj表示已被用户评过分的商品对即将要评分商品ij的隐性影响的权重值,初始值为1.0;步骤6)分别计算Ui、Vj、Zk及yj的更新值Ui′、Vj′、Zk′与yj′,Ui′=Ui-γ·∂L∂Ui,]]>Vj′=Vj-γ·∂L∂Vj,]]>Zk′=Zk-γ·∂L∂Zk,]]>yj′=yj-γ·∂L∂yj,]]>所述γ为预先定义的步长,γ足够小且γ>0,γ的具体值根据经验确定,其中∂L∂Ui=Σj=1nIi_j_Rg′(UiT(Vj+|Iu|-12Σj∈Iuyj))×(g(UiT(Vj+|Iu|-12Σj∈Iuyj)-ri_j))×(Vj+|Iu|-12Σj∈Iuyj)+λCΣi=1mIi_k_Tg′(UiTZk)(g(UiTZk)-ti_j*))Zk+λUUi,]]>∂L∂Vj=Σi=1mIi_j_Rg...

【技术特征摘要】

【专利技术属性】
技术研发人员:王东陈志岳文静
申请(专利权)人:南京邮电大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1