一种基于用户群体偏好的科技资源动态协同过滤推荐方法技术

技术编号:26970660 阅读:23 留言:0更新日期:2021-01-06 00:00
本发明专利技术的实施例提供了一种基于用户群体偏好的科技资源动态协同过滤推荐方法。所述方法包括根据用户间的标签相似度和用户对科技资源的评分相似度计算用户间的相似度;将用户进行聚类,并构造科技资源的类别偏好矩阵;计算用户对目标科技资源与其他科技资源的类别偏好相似度,生成目标科技资源的候选邻居列表;计算每个科技资源与其前若干个科技资源的评分相似度,生成科技资源最近邻列表;将用户未评分的科技资源作为待预测科技资源,计算所述待预测科技资源的预测评分。以此方式,可以通过分析目标用户的相似用户群体的评分,对评分数据进行预测,生成的推荐结果与目标用户的兴趣匹配度一致性较高。

【技术实现步骤摘要】
一种基于用户群体偏好的科技资源动态协同过滤推荐方法
本专利技术的实施例一般涉及计算机
,并且更具体地,涉及一种基于用户群体偏好的科技资源动态协同过滤推荐方法。
技术介绍
协同过滤算法是推荐系统中应用最广泛的核心算法。协同过滤也被称为社会过滤(SocialFiltering),这一概念最早是在1992年Goldber的研宄报告中提出来的,Goldberg等人应用Tapestry系统过滤出对用户有用的电子信件,但要求用户标注不愿意看到的信息,体现了系统与用户间的互动。至今,协同过滤技术己成功应用于各种推荐系统中,其核心思想是:机器本身缺乏情感要素,异致其筛选的内容存在缺陷,协同过滤就是通过分析用户的评价,排除无用的信息,挑选出符合用户期望的有效信息。协同过滤推荐算法的基本流程:计算用户群体或者物品群体的相似度,根据拥有相同或者相似兴趣的用户评价来推测目标用户对物品的评价。与基于内容的推荐算法不同,协同过滤算法分析目标用户的相似用户群体的兴趣爱好来挖掘目标用户的潜在兴趣,推荐质量高,这也是该技术得以广泛应用的最主要的原因。传统的协同过滤算法的思想是利用用户-资源评分矩阵计算出用户间或者资源间的相似度,根据相似度得到近邻用户集或者邻居资源集,最后根据邻居集来预测评分产生Top-N推荐。但是传统的协同过滤算法都存在一个问题,它们只考虑了用户间或者科技资源间的评分相似性,没有考虑到用户兴趣变化,用户兴趣不是一成不变的,是随着时间的推移而变化的,现阶段用户感兴趣的内容,下阶段用户不一定依旧感兴趣。
技术实现思路
根据本专利技术的实施例,提供了一种基于用户群体偏好的科技资源动态协同过滤推荐方案。在本专利技术的第一方面,提供了一种基于用户群体偏好的科技资源动态协同过滤推荐方法。该方法包括:计算用户间的标签相似度以及计算用户对科技资源的评分相似度,根据所述用户间的标签相似度和用户对科技资源的评分相似度计算用户间的相似度;将用户进行聚类,并构造科技资源的类别偏好矩阵;根据所述科技资源的类别偏好矩阵,计算用户对目标科技资源与其他科技资源的类别偏好相似度,按照类别偏好相似度由从高到低对科技资源进行排列,生成目标科技资源的候选邻居列表;计算所述目标科技资源的候选邻居列表中每个科技资源与其前若干个科技资源的评分相似度,生成科技资源最近邻列表;将用户未评分的科技资源作为待预测科技资源,从所述科技资源最邻近列表中识别所述待预测科技资源所在行,并顺序提取前若干个已评分的科技资源,计算所述待预测科技资源的预测评分。进一步地,所述计算用户间的标签相似度,包括:其中,simtag(u,v)为第一用户u和第二用户v之间的标签相似度;第一用户的标签向量表示为u=(u1,u2,u3,...um);第二用户的标签向量表示为v=(v1,v2,v3,...vm)。进一步地,所述计算用户对科技资源的评分相似度,包括:其中,wr是热门科技资源惩罚权值;Iuv表示同时被第一用户u和第二用户v调用过的科技资源,Ruj表示第一用户u对科技资源j的评分,Rvj表示第一用户u对科技资源j的评分,和表示第一用户u和第二用户v对所有不同科技资源的平均评分;simrating(u,v)表示第一用户u和第二用户v对科技资源的评分相似度。进一步地,所述热门科技资源惩罚权值为:其中,wr为热门科技资源惩罚权值;r为两个用户共同评分过的科技资源;Nr为所有用户中喜欢该类科技资源r的用户数。进一步地,所述用户间的相似度为:simunify(u,v)=α×simrating(u,v)+(1-α)×simtag(u,v)其中,simrating(u,v)为第一用户u和第二用户v对科技资源的评分相似度;simtag(u,v)为第一用户u和第二用户v之间的标签相似度;α为第一平衡因子,且0<α<1。进一步地,所述将用户进行聚类,并构造科技资源的类别偏好矩阵,包括:步骤1:在用户对任一科技资源的评分矩阵中,将所述科技资源的已评分用户进行聚类,得到若干个用户类;步骤2:计算所述科技资源在各个用户类上的类别偏好值;重复上述步骤1和步骤2,直至计算出全部科技资源在对应用户类上的类别偏好值,生成科技资源的类别偏好矩阵。进一步地,所述类别偏好值为:Pz,s=|Cs∩Uz|/|Uz|其中,Pz,s为科技资源z在用户类Cs上的类别偏好值,Cs∈C,C为经过聚类生成的用户类集合;Uz={u∈U|Ru,z≠Φ}表示对科技资源z进行过评分的用户集合。进一步地,科技资源之间的评分相似度为:其中,simrating′(p,q)为科技资源p和科技资源q的评分相似度;Rup为第一用户u对科技资源p的评分;Ruq为第一用户u对科技资源q的评分;为第一用户u对科技资源p的平均评分;为第一用户u对科技资源q的平均评分;Upq为用户对从科技资源p到科技资源q的评分。进一步地,所述计算所述待预测科技资源的预测评分,包括:f(tuj)=1-exp(-tuj)其中,Rum为预测第一用户u对科技资源m的评分;simunity(m,j)为科技资源m和科技资源j之间的科技资源相似度;Ruj为第一用户u对科技资源j的评分;tuj表示第一用户u对科技资源j的评分时间。在本专利技术的第二方面,提供了一种电子设备。该电子设备包括:存储器和处理器,所述存储器上存储有计算机程序,所述处理器执行所述程序时实现如以上所述的方法。应当理解,
技术实现思路
部分中所描述的内容并非旨在限定本专利技术的实施例的关键或重要特征,亦非用于限制本专利技术的范围。本专利技术的其它特征将通过以下的描述变得容易理解。本专利技术能够过滤掉难以处理的信息,通过分析目标用户的相似用户群体的评分,对评分数据进行预测,生成的推荐结果与目标用户的兴趣匹配度一致性较高;且由于协同过滤推荐是以其他相关用户的评分为基础,所以推荐列表会出现新的物品,而不仅仅是以前爱好的物品,引入其他用户的历史评分数据,丰富了数据内容。附图说明结合附图并参考以下详细说明,本专利技术各实施例的上述和其他特征、优点及方面将变得更加明显。在附图中,相同或相似的附图标记表示相同或相似的元素,其中:图1示出了根据本专利技术的实施例的基于用户群体偏好的科技资源动态协同过滤推荐方法的流程图;图2示出了能够实施本专利技术的实施例的示例性电子设备的方框图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的全部其他实施例,都属于本专利技术保护的范围。另外,本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和本文档来自技高网
...

【技术保护点】
1.一种基于用户群体偏好的科技资源动态协同过滤推荐方法,其特征在于,包括:/n计算用户间的标签相似度以及计算用户对科技资源的评分相似度,根据所述用户间的标签相似度和用户对科技资源的评分相似度计算用户间的相似度;/n将用户进行聚类,并构造科技资源的类别偏好矩阵;/n根据所述科技资源的类别偏好矩阵,计算用户对目标科技资源与其他科技资源的类别偏好相似度,按照类别偏好相似度由从高到低对科技资源进行排列,生成目标科技资源的候选邻居列表;/n计算所述目标科技资源的候选邻居列表中每个科技资源与其前若干个科技资源的评分相似度,生成科技资源最近邻列表;/n将用户未评分的科技资源作为待预测科技资源,从所述科技资源最邻近列表中识别所述待预测科技资源所在行,并顺序提取前若干个已评分的科技资源,计算所述待预测科技资源的预测评分。/n

【技术特征摘要】
1.一种基于用户群体偏好的科技资源动态协同过滤推荐方法,其特征在于,包括:
计算用户间的标签相似度以及计算用户对科技资源的评分相似度,根据所述用户间的标签相似度和用户对科技资源的评分相似度计算用户间的相似度;
将用户进行聚类,并构造科技资源的类别偏好矩阵;
根据所述科技资源的类别偏好矩阵,计算用户对目标科技资源与其他科技资源的类别偏好相似度,按照类别偏好相似度由从高到低对科技资源进行排列,生成目标科技资源的候选邻居列表;
计算所述目标科技资源的候选邻居列表中每个科技资源与其前若干个科技资源的评分相似度,生成科技资源最近邻列表;
将用户未评分的科技资源作为待预测科技资源,从所述科技资源最邻近列表中识别所述待预测科技资源所在行,并顺序提取前若干个已评分的科技资源,计算所述待预测科技资源的预测评分。


2.根据权利要求1所述的方法,其特征在于,所述计算用户间的标签相似度,包括:



其中,simtag(u,v)为第一用户u和第二用户v之间的标签相似度;第一用户的标签向量表示为u=(u1,u2,u3,...um);第二用户v的标签向量表示为v=(v1,v2,v3,...vm)。


3.根据权利要求1所述的方法,其特征在于,所述计算用户对科技资源的评分相似度,包括:



其中,wr是热门科技资源惩罚权值;Iuv表示同时被第一用户u和第二用户v调用过的科技资源,Ruj表示第一用户u对科技资源j的评分,Rvj表示第一用户u对科技资源j的评分,和表示第一用户u和第二用户v对所有不同科技资源的平均评分;simrating(u,v)表示第一用户u和第二用户v对科技资源的评分相似度。


4.根据权利要求3所述的方法,其特征在于,所述热门科技资源惩罚权值为:



其中,wr为热门科技资源惩罚权值;r为两个用户共同评分过的科技资源;Nr为所有用户中喜欢该类科技资源r的用户数。


5.根据权利要求1所述的方法,其特征在于,所述用户间的相似度为:
simunify(u,v)=α×simra...

【专利技术属性】
技术研发人员:毛维娜毛卫南苗润莲
申请(专利权)人:北京市科学技术情报研究所
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1