【技术实现步骤摘要】
一种基于时效近邻可信选取的协同过滤推荐方法及系统
[0001]本专利技术涉及信息推荐技术,具体涉及一种基于时效近邻可信选取的协同过滤推荐方法及系统。
技术介绍
[0002]近年来随着社会生产与人们生活大规模向信息空间迁移,信息过载所引发的信息迷航现象日趋严重。为帮助人们从急剧膨胀的数据中筛选出有用信息,推荐系统应运而生。当前基于内容的推荐、协同过滤推荐、基于关联规则的推荐、基于效用的推荐、基于知识的推荐以及混合推荐等技术已广泛应用于各类电子商务平台,用于提升用户粘度、降低服务跳出率、助力用户构建信息茧房。据统计,Netflix上80%被观看的电影、YouTube上60%的视频点击量和Google上38%的新闻点击量均源自于推荐;Amazon上30%的商品页面浏览量、20%~30%的商品销售量,以及35%的销售收入均由个性化推荐所贡献。
[0003]其中,作为电子商务推荐系统中应用最成功的推荐技术之一,协同过滤推荐的基本思想是相似的用户可能会喜欢同一种物品、相似的物品可能会被同一个用户喜欢。虽然该类推荐具备无需领域知识、对推荐对象无特殊要求、易解释、便于工程实现等优势,然而传统的协同过滤推荐通常基于数据是静态的假设,在数据稀疏时存在推荐精度低下的问题。
[0004]为提高协同过滤推荐精度,一些研究尝试在推荐策略中添加有关用户兴趣变化的描述信息,例如:
[0005]Liu提出一种基于聚类的协同过滤推荐算法,该算法利用时间衰减函数对用户评分进行预处理,使用兴趣向量对用户进行描述,使用聚类算法对用户进 ...
【技术保护点】
【技术特征摘要】
1.一种基于时效近邻可信选取的协同过滤推荐方法,其特征在于:设定六元组CFRS=<U,I,R,u
a
,i
b
,r
ab
>,U={u1,u2,L,u
i
,L,u
m
}是由m个用户u
i
所组成的用户集,1≤i≤m;I={i1,i2,L,i
j
,L,i
m
}是由n个项目i
j
所组成的项目集,1≤j≤n;R={r
ij
}
m*n
是由m*n个评分r
ij
所组成的评分矩阵,r
ij
表示u
i
对i
j
的评分,若表示u
i
对i
j
暂未评分;依据评分矩阵R来预测目标用户u
a
在目标项目i
b
上评分r
ab
的具体步骤如下:步骤S1、时效近邻筛选先使用时效权重函数w(t)计算目标用户邻居在共同评分项目上的评分时效权重,然后通过纳入有时效权重的基于皮尔逊相关系数的兴趣相似度计算模型来计算出每个邻居与目标用户的时效相似度,最后依据时效相似度为目标用户动态筛选出时效近邻;步骤S2、可信近邻选取先利用项目级信任计算模型对步骤S1中筛选出的时效近邻的推荐能力进行推荐信度初估,然后利用PID控制器变体模型对推荐信度初估值进行重估,最后依据推荐信度重估值为目标用户动态选取可信近邻;步骤S3、评分预测先逐个依据每个可信近邻的推荐信度计算出其自身在目标项目上的推荐权重,然后利用所有可信近邻在目标项目上的评分来预测出目标用户对该项目的评分,进而完成向目标用户进行项目推荐。2.根据权利要求1所述的基于时效近邻可信选取的协同过滤推荐方法,其特征在于:所述步骤S1的详细过程为:步骤S1.1、通过兴趣相似度计算目标用户u
a
与其邻居用户u
i
∈NS(u
a
)的时效相似度TSD(u
a
,u
i
);式(1)中,r
ak
和r
ik
分别为u
a
和u
i
对项目i
k
∈CRIS(u
a
,u
i
)的评分;表示u
a
在其对应评分项目RIS(u
a
)中所有项目上的评分均值,表示u
i
在其对应评分项目集RIS(u
i
)中所有项目上的评分均值;t
ak
和t
ik
分别为评分r
ak
和r
ik
的生成时间,w(t
ak
)和w(t
ik
)分别为r
ak
和r
ik
的时效权重;CRIS(u
a
,u
i
)为目标用户u
a
和其邻居用户u
i
的共同评分项目集,且CRIS(u
a
,u
i
)=RIS(u
a
)∩RIS(u
i
);步骤S1.2、计算目标用户u
a
与邻居集NS(u
a
)中所有用户的时效相似度阈值为:NS(u
a
)为目标用户u
a
的邻居集,且步骤S1.3、为目标用户u
a
筛选其对应的时效近邻集TeCNS(u
a
);
3.根据权利要求2所述的基于时效近邻可信选取的协同过滤推荐方法,其特征在于:所述时效权重w(t
ak
)和w(t
ik
)通过时效权重函数w(t)来计算,w(t)表达式为:w(t)=Logistic(t)=(1+e
‑
t
)
‑1;t∈[
‑
1,1]
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(2)。4.根据权利要求1所述的基...
【专利技术属性】
技术研发人员:韩志耕,范远哲,陈耿,张晓东,伍之昂,周婷,吴慧玲,
申请(专利权)人:南京审计大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。