一种基于组合编码的协同排序推荐方法技术

技术编号：28979044 阅读：25 留言：0更新日期：2021-06-23 09:25

本发明专利技术公开了一种基于组合编码的协同排序推荐方法，试图在不影响模型性能的前提下，充分利用实值向量的准确性和二进制向量的高效性来表示用户以及物品，以此来提升推荐方法的准确度和效率。为了和推荐系统获得top‑k个推荐结果的最终目标保持一致，CCCR采用了成对的排序损失函数，使得方法在排序指标上有更好的表现。为了比传统的离散坐标下降法获得更快的收敛速度以及更优的收敛结果，CCCR使用了一种新的高效优化方法，采用整体更新二进制向量而不是逐位更新的方式。最后，在公开的数据集上的实验结果表明，CCCR在保持检索和训练的高效性的同时，显著地提高了top‑k推荐任务中结果的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于组合编码的协同排序推荐方法
本专利技术属于离散推荐领域，尤其涉及一种基于组合编码的协同排序推荐方法。
技术介绍
近年来，推荐系统在互联网多个领域中得到广泛运用，比如电子商务、社交媒体、新闻流平台等，在这些场景中，推荐系统主要的作用，是根据用户和物品已有的信息，挖掘出用户潜在的感兴趣的物品，推荐给用户，从而提升用户的体验以及平台的流量和广告收入等。为了提升算法在大规模推荐场景下的推荐效率，近年来很多研究工作在这方面做了大量努力。其中一个研究方向是使用哈希方法。区别于传统的使用实数潜在特征向量来表示用户和物品，哈希方法使用二进制向量来表示用户和物品，这样一来，用户和物品的特征向量的内积操作，就可以在海明空间中，通过快速的位运算的方式来实现。然而，与实值向量相比，二进制向量由于其每一位表达能力有限，其精度自然就会比较低，这就阻碍了它对用户和物品之间的复杂关系的建模。为了充分利用实值向量在精度上的优势和二进制向量在效率上的优势，基于组合编码的协同过滤方法(CCCF)被提出。尽管与现有的推荐方法相比，CCCF方法在推荐精度和效率之间有更好的平衡，但是它有两个局限性。首先，该方法的目标函数是平方差逐点损失函数，这与推荐系统的最终目标(即准确推荐用户最喜欢的top-k物品的排序目标)不一致。第二，由于离散约束，该方法采用离散坐标下降的方式进行优化，这种按位更新哈希码的方法会导致方法收敛速度慢，并且容易陷入局部最小值。
技术实现思路
本专利技术的目的在于针对现有技术的局限和不足，提供一种基...

【技术保护点】
1.一种基于组合编码的协同排序推荐方法，其特征在于，包括训练阶段和在线推荐阶段。/n在训练阶段，根据由m个用户和n个物品构成的评分矩阵M∈R

【技术特征摘要】
1.一种基于组合编码的协同排序推荐方法，其特征在于，包括训练阶段和在线推荐阶段。
在训练阶段，根据由m个用户和n个物品构成的评分矩阵M∈Rm×n，来得到用户和物品的组合编码，组合编码包括G个r维的二进制向量，以及一个G维的实数权重向量。第u个用户的组合编码表示为：

其中，bu(k)∈{±1}r为用户u的第k个二进制向量，ηu为用户u实数权重向量，k＝1～G，r是实值特征向量的维度。
第i个物品的组合编码表示为：

其中，为物品i的第k个二进制向量，ξi为物品i实数权重向量。
用A＝{(u，i)|Mui＞0}来表示M中每一个评分对应的用户和物品构成的集合对，u＝1～m，i＝1～n，Mui表示用户u对物品i的评分。用三元组(u，i，j)来代表用户u所评分过的所有物品对i和j使用Ω＝{(u，i，j)|(u，i)，(u，j)∈A}来表示所有的三元组，j＝1～n。定义Yu，i，j来表示用户对这两个物品偏好程度的相对关系，具体定义如下：

用B＝[b1，...，bm]∈{±1}m×r以及D＝[d1，...，dn]∈{±1}n×r来分别表示r维的用户和物品的二进制向量。优化的目标函数如下：

B(k)∈{±1}m×r，D(k)∈{±1}n×r，k＝1，...，G.

其中，分别表示用户u对物品i，j的得分估计；B(k)表示第k个局部模型的r维用户二进制向量；D(k)表示第k个局部模型的r维物品二进制向量。
在线推荐阶段：根据训练得到的用户和物品的组合编码，对于每一个访问的用户，计算该用户与所有物品的得分，用户u对物品i的得分计算公式如下：

再将所有得分从高到低进行排序，选择top-k个物品作为推荐结果返回给用户，完成在线推荐。

2.如权利要求1所述基于组合编码的协同排序推荐方法，其特征在于，训练阶段具体包括以下步骤：
(1)选择锚点。使用协同过滤算法，得到用...

【专利技术属性】
技术研发人员：卢涛，刘成昊，孙建伶，
申请(专利权)人：浙江大学，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人