一种基于时效近邻可信选取的协同过滤推荐方法及系统技术方案

技术编号:34458640 阅读:23 留言:0更新日期:2022-08-06 17:11
本发明专利技术公开一种基于时效近邻可信选取的协同过滤推荐方法及系统,依据评分矩阵来预测目标用户在目标项目上的评分,具体步骤包括:时效近邻筛选、可信近邻选取、评分预测。本发明专利技术的基于时效近邻可信选取的协同过滤推荐方法,充分考虑用户兴趣异常变迁和推荐信度波动两个时变因素,顺序利用时效近邻筛选、可信近邻选取和目标用户评分预测三个步骤,完成向目标用户的推荐,缓解了数据稀疏情况下协同过滤推荐精度低、稳定性差、抗用户概貌注入攻击能力弱的问题。弱的问题。弱的问题。

【技术实现步骤摘要】
一种基于时效近邻可信选取的协同过滤推荐方法及系统


[0001]本专利技术涉及信息推荐技术,具体涉及一种基于时效近邻可信选取的协同过滤推荐方法及系统。

技术介绍

[0002]近年来随着社会生产与人们生活大规模向信息空间迁移,信息过载所引发的信息迷航现象日趋严重。为帮助人们从急剧膨胀的数据中筛选出有用信息,推荐系统应运而生。当前基于内容的推荐、协同过滤推荐、基于关联规则的推荐、基于效用的推荐、基于知识的推荐以及混合推荐等技术已广泛应用于各类电子商务平台,用于提升用户粘度、降低服务跳出率、助力用户构建信息茧房。据统计,Netflix上80%被观看的电影、YouTube上60%的视频点击量和Google上38%的新闻点击量均源自于推荐;Amazon上30%的商品页面浏览量、20%~30%的商品销售量,以及35%的销售收入均由个性化推荐所贡献。
[0003]其中,作为电子商务推荐系统中应用最成功的推荐技术之一,协同过滤推荐的基本思想是相似的用户可能会喜欢同一种物品、相似的物品可能会被同一个用户喜欢。虽然该类推荐具备无需领域知识、对推荐对象无特殊要求、易解释、便于工程实现等优势,然而传统的协同过滤推荐通常基于数据是静态的假设,在数据稀疏时存在推荐精度低下的问题。
[0004]为提高协同过滤推荐精度,一些研究尝试在推荐策略中添加有关用户兴趣变化的描述信息,例如:
[0005]Liu提出一种基于聚类的协同过滤推荐算法,该算法利用时间衰减函数对用户评分进行预处理,使用兴趣向量对用户进行描述,使用聚类算法对用户进行聚类,实现了反映用户兴趣变化的多维度画像。董晨露等人提出一种基于用户兴趣变化和评论的协同过滤算法,该算法利用主题模型从评论文本中挖掘商品主题特征,利用艾宾浩斯遗忘曲线协助计算用户评论相似度,并结合用户评论相似度和评分相似度来获取用户之间的最终相似度。Xu等人基于每个领域的专家都更具说服力、用户兴趣会随时间推移而变化的事实,提出一种基于用户可信度和时间上下文的协同过滤推荐算法,通过将这两个因素纳入到基于修正的余弦相似度模型,提高了用户间相似度计算的准确度。Li等人依据推荐需要契合用户短期兴趣的事实,提出了一种使用社会信息和动态时间窗口的协同过滤算法,该算法依据艾宾浩斯遗忘曲线,借助细分时间窗口来界定用户的短期兴趣,引入时间函数区分各短期兴趣的重要度,实现对用户兴趣变化的及时捕捉。
[0006]然而,以上技术方案对恶意用户为干扰或误导推荐所实施的异常兴趣变迁现象并没有关注。以协同过滤推荐中常见的用户概貌攻击为例,恶意用户完全可以在目标用户已评分项目的评分上通过刻意迎合目标用户的兴趣来获取目标用户相似用户(近邻)身份,之后通过在目标用户未评分项目上实施策略评分,从而达到干扰或误导推荐的目的。与目标用户兴趣的正常变化不同,这种潜藏在恶意用户策略评分背后的兴趣异常变化如果得不到有效处置,势必会削弱推荐系统的抗攻击能力。
[0007]另外,目前也有人通过在推荐中引入信任关系来提高推荐精度和系统鲁棒性,例如:
[0008]陈婷等人提出一种社交网络环境下基于信任的推荐算法,但该算法在利用由评分数据产生的相似度和信任关系产生的信任度融合构建的用户偏好模型寻找邻居时,尚未对信任关系的动态性进行关注。Wang等人针对智慧城市中面向用户轨迹行为序列预测的兴趣点推荐,将地理位置和时间信息纳入到基于兴趣点偏好的相似度计算模型,给出了具备信任增强的用户相似度计算方法,但该方法将评分时间简单地切分为24个时区的做法,无法在细粒度层面上可靠地反映用户信度随时间变化的情况。Wang等人提出一种新的基于信任的协同过滤算法,但是如何保证所使用的信任度在时间跨度上具有一致性和可靠性并没有提及。贾冬艳等人提出一种基于双重邻居选取策略的协同过滤推荐算法,利用信度来刻画用户的推荐能力,但该算法对目标用户的兴趣变迁和近邻用户的信度波动欠缺考虑,推荐系统的推荐精度和抗攻击能力还有提升的空间。
[0009]综上所述,现有技术未能对推荐中出现的用户兴趣异常变迁和用户信度波动这两个可能会对推荐结果造成干扰或误导的问题进行处置,使得推荐系统的抗攻击性、推荐稳定性与可信性均难得到保证。

技术实现思路

[0010]专利技术目的:本专利技术的目的在于解决现有技术中存在的不足,提供一种基于时效近邻可信选取的协同过滤推荐方法及系统。
[0011]技术方案:本专利技术的一种基于时效近邻可信选取的协同过滤推荐方法,设定六元组CFRS=<U,I,R,u
a
,i
b
,r
ab
>,U={u1,u2,

,u
i
,

,u
m
}是由m个用户u
i
所组成的用户集,1≤i≤m;I={i1,i2,

,i
j
,

,i
m
}是由n个项目i
j
所组成的项目集,1≤j≤n;R={r
ij
}
m*n
是由m*n个评分r
ij
所组成的评分矩阵,r
ij
表示u
i
对i
j
的评分,若表示u
i
对i
j
暂未评分;依据评分矩阵R来预测目标用户u
a
在目标项目i
b
上评分r
ab
的具体步骤如下:
[0012]步骤S1、时效近邻筛选
[0013]先使用时效权重函数w(t)计算目标用户邻居在共同评分项目上的评分时效权重,然后通过纳入有时效权重的基于皮尔逊相关系数的兴趣相似度计算模型来计算出每个邻居与目标用户的时效相似度,最后依据时效相似度为目标用户动态筛选出时效近邻;
[0014]步骤S2、可信近邻选取
[0015]先利用项目级信任计算模型对步骤S1中筛选出的时效近邻的推荐能力进行推荐信度初估,然后利用PID控制器变体模型对推荐信度初估值进行重估,最后依据推荐信度重估值为目标用户动态选取可信近邻;
[0016]步骤S3、评分预测
[0017]先逐个依据每个可信近邻的推荐信度计算出其自身在目标项目上的推荐权重,然后利用所有可信近邻在目标项目上的评分来预测出目标用户对该项目的评分,进而完成向目标用户进行项目推荐。
[0018]上述技术方案充分考虑影响目标用户近邻筛选质量的用户兴趣异常变化和推荐能力可信度波动两个关键因素,构建包含时效近邻筛选、可信近邻选取和评分预测三个策略的推荐流程。
[0019]进一步地,所述步骤S1的详细过程为:
[0020]步骤S1.1、通过兴趣相似度计算目标用户u
a
与其邻居用户u
i
∈NS(u
a
)的时效相似度TSD(u
a
,u
i
);
[0021][0022]式(本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于时效近邻可信选取的协同过滤推荐方法,其特征在于:设定六元组CFRS=<U,I,R,u
a
,i
b
,r
ab
>,U={u1,u2,L,u
i
,L,u
m
}是由m个用户u
i
所组成的用户集,1≤i≤m;I={i1,i2,L,i
j
,L,i
m
}是由n个项目i
j
所组成的项目集,1≤j≤n;R={r
ij
}
m*n
是由m*n个评分r
ij
所组成的评分矩阵,r
ij
表示u
i
对i
j
的评分,若表示u
i
对i
j
暂未评分;依据评分矩阵R来预测目标用户u
a
在目标项目i
b
上评分r
ab
的具体步骤如下:步骤S1、时效近邻筛选先使用时效权重函数w(t)计算目标用户邻居在共同评分项目上的评分时效权重,然后通过纳入有时效权重的基于皮尔逊相关系数的兴趣相似度计算模型来计算出每个邻居与目标用户的时效相似度,最后依据时效相似度为目标用户动态筛选出时效近邻;步骤S2、可信近邻选取先利用项目级信任计算模型对步骤S1中筛选出的时效近邻的推荐能力进行推荐信度初估,然后利用PID控制器变体模型对推荐信度初估值进行重估,最后依据推荐信度重估值为目标用户动态选取可信近邻;步骤S3、评分预测先逐个依据每个可信近邻的推荐信度计算出其自身在目标项目上的推荐权重,然后利用所有可信近邻在目标项目上的评分来预测出目标用户对该项目的评分,进而完成向目标用户进行项目推荐。2.根据权利要求1所述的基于时效近邻可信选取的协同过滤推荐方法,其特征在于:所述步骤S1的详细过程为:步骤S1.1、通过兴趣相似度计算目标用户u
a
与其邻居用户u
i
∈NS(u
a
)的时效相似度TSD(u
a
,u
i
);式(1)中,r
ak
和r
ik
分别为u
a
和u
i
对项目i
k
∈CRIS(u
a
,u
i
)的评分;表示u
a
在其对应评分项目RIS(u
a
)中所有项目上的评分均值,表示u
i
在其对应评分项目集RIS(u
i
)中所有项目上的评分均值;t
ak
和t
ik
分别为评分r
ak
和r
ik
的生成时间,w(t
ak
)和w(t
ik
)分别为r
ak
和r
ik
的时效权重;CRIS(u
a
,u
i
)为目标用户u
a
和其邻居用户u
i
的共同评分项目集,且CRIS(u
a
,u
i
)=RIS(u
a
)∩RIS(u
i
);步骤S1.2、计算目标用户u
a
与邻居集NS(u
a
)中所有用户的时效相似度阈值为:NS(u
a
)为目标用户u
a
的邻居集,且步骤S1.3、为目标用户u
a
筛选其对应的时效近邻集TeCNS(u
a
);
3.根据权利要求2所述的基于时效近邻可信选取的协同过滤推荐方法,其特征在于:所述时效权重w(t
ak
)和w(t
ik
)通过时效权重函数w(t)来计算,w(t)表达式为:w(t)=Logistic(t)=(1+e

t
)
‑1;t∈[

1,1]
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(2)。4.根据权利要求1所述的基...

【专利技术属性】
技术研发人员:韩志耕范远哲陈耿张晓东伍之昂周婷吴慧玲
申请(专利权)人:南京审计大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1