一种基于用户群体偏好的科技资源动态协同过滤推荐方法技术

技术编号：26970660 阅读：23 留言：0更新日期：2021-01-06 00:00

本发明专利技术的实施例提供了一种基于用户群体偏好的科技资源动态协同过滤推荐方法。所述方法包括根据用户间的标签相似度和用户对科技资源的评分相似度计算用户间的相似度；将用户进行聚类，并构造科技资源的类别偏好矩阵；计算用户对目标科技资源与其他科技资源的类别偏好相似度，生成目标科技资源的候选邻居列表；计算每个科技资源与其前若干个科技资源的评分相似度，生成科技资源最近邻列表；将用户未评分的科技资源作为待预测科技资源，计算所述待预测科技资源的预测评分。以此方式，可以通过分析目标用户的相似用户群体的评分，对评分数据进行预测，生成的推荐结果与目标用户的兴趣匹配度一致性较高。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于用户群体偏好的科技资源动态协同过滤推荐方法
本专利技术的实施例一般涉及计算机
，并且更具体地，涉及一种基于用户群体偏好的科技资源动态协同过滤推荐方法。
技术介绍
协同过滤算法是推荐系统中应用最广泛的核心算法。协同过滤也被称为社会过滤(SocialFiltering)，这一概念最早是在1992年Goldber的研宄报告中提出来的，Goldberg等人应用Tapestry系统过滤出对用户有用的电子信件，但要求用户标注不愿意看到的信息，体现了系统与用户间的互动。至今，协同过滤技术己成功应用于各种推荐系统中，其核心思想是：机器本身缺乏情感要素，异致其筛选的内容存在缺陷，协同过滤就是通过分析用户的评价，排除无用的信息，挑选出符合用户期望的有效信息。协同过滤推荐算法的基本流程：计算用户群体或者物品群体的相似度，根据拥有相同或者相似兴趣的用户评价来推测目标用户对物品的评价。与基于内容的推荐算法不同，协同过滤算法分析目标用户的相似用户群体的兴趣爱好来挖掘目标用户的潜在兴趣，推荐质量高，这也是该技术得以广泛应用的最主要的原因。传统的协同过滤算法的思想是利用用户-资源评分矩阵计算出用户间或者资源间的相似度，根据相似度得到近邻用户集或者邻居资源集，最后根据邻居集来预测评分产生Top-N推荐。但是传统的协同过滤算法都存在一个问题，它们只考虑了用户间或者科技资源间的评分相似性，没有考虑到用户兴趣变化，用户兴趣不是一成不变的，是随着时间的推移而变化的，现阶段用户感兴趣的内容，下阶段用户不一定依旧感兴趣。
技术实现思路
...

【技术保护点】
1.一种基于用户群体偏好的科技资源动态协同过滤推荐方法，其特征在于，包括：/n计算用户间的标签相似度以及计算用户对科技资源的评分相似度，根据所述用户间的标签相似度和用户对科技资源的评分相似度计算用户间的相似度；/n将用户进行聚类，并构造科技资源的类别偏好矩阵；/n根据所述科技资源的类别偏好矩阵，计算用户对目标科技资源与其他科技资源的类别偏好相似度，按照类别偏好相似度由从高到低对科技资源进行排列，生成目标科技资源的候选邻居列表；/n计算所述目标科技资源的候选邻居列表中每个科技资源与其前若干个科技资源的评分相似度，生成科技资源最近邻列表；/n将用户未评分的科技资源作为待预测科技资源，从所述科技资源最邻近列表中识别所述待预测科技资源所在行，并顺序提取前若干个已评分的科技资源，计算所述待预测科技资源的预测评分。/n

【技术特征摘要】
1.一种基于用户群体偏好的科技资源动态协同过滤推荐方法，其特征在于，包括：
计算用户间的标签相似度以及计算用户对科技资源的评分相似度，根据所述用户间的标签相似度和用户对科技资源的评分相似度计算用户间的相似度；
将用户进行聚类，并构造科技资源的类别偏好矩阵；
根据所述科技资源的类别偏好矩阵，计算用户对目标科技资源与其他科技资源的类别偏好相似度，按照类别偏好相似度由从高到低对科技资源进行排列，生成目标科技资源的候选邻居列表；
计算所述目标科技资源的候选邻居列表中每个科技资源与其前若干个科技资源的评分相似度，生成科技资源最近邻列表；
将用户未评分的科技资源作为待预测科技资源，从所述科技资源最邻近列表中识别所述待预测科技资源所在行，并顺序提取前若干个已评分的科技资源，计算所述待预测科技资源的预测评分。

2.根据权利要求1所述的方法，其特征在于，所述计算用户间的标签相似度，包括：

其中，simtag(u，v)为第一用户u和第二用户v之间的标签相似度；第一用户的标签向量表示为u＝(u1，u2，u3，...um)；第二用户v的标签向量表示为v＝(v1，v2，v3，...vm)。

3.根据权利要求1所述的方法，其特征在于，所述计算用户对科技资源的评分相似度，包括：

其中，wr是热门科技资源惩罚权值；Iuv表示同时被第一用户u和第二用户v调用过的科技资源，Ruj表示第一用户u对科技资源j的评分，Rvj表示第一用户u对科技资源j的评分，和表示第一用户u和第二用户v对所有不同科技资源的平均评分；simrating(u，v)表示第一用户u和第二用户v对科技资源的评分相似度。

4.根据权利要求3所述的方法，其特征在于，所述热门科技资源惩罚权值为：

其中，wr为热门科技资源惩罚权值；r为两个用户共同评分过的科技资源；Nr为所有用户中喜欢该类科技资源r的用户数。

5.根据权利要求1所述的方法，其特征在于，所述用户间的相似度为：
simunify(u，v)＝α×simra...

【专利技术属性】
技术研发人员：毛维娜，毛卫南，苗润莲，
申请(专利权)人：北京市科学技术情报研究所，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人