本发明专利技术公开了一种基于评分特征的时序推荐方法及推荐装置,其中,包括以下步骤:采集所有评分数据,并获取时间信息;将所有评分数据切分成时间段相等的多个时间域,以得到每个时间域上的训练数据;通过跨域时序协同过滤算法获取每个时间域上的用户兴趣、物品流行度与公共特征;通过距离公式获取相邻时间域之间用户兴趣与物品流行度的共同变化值;如果共同变化值小于或等于预设值,则将当前时间域对商品的评分扩充到相邻时间域;对每个时间域上的训练数据进行预测,以进行推荐。本发明专利技术实施例的推荐方法,通过对每个时间域中的训练数据进行扩充,从而解决时序推荐中的稀疏性问题,提高推荐质量,提高用户的使用体验。
【技术实现步骤摘要】
本专利技术涉及机器学习
,特别涉及一种基于评分特征的时序推荐方法及推 荐装置。
技术介绍
随着推荐技术的发展,人们发现了用户的兴趣和物品的流行度随着时间会产生变 化这一现象。即言,传统的静态推荐方法并没有利用时间信息对历史评分数据进行处理,所 以不能很好地解决这一现象。因此,针对用户兴趣和物品流行度随时间动态变化这一现象, 需要提出一种时序推荐方法以能够有效地解决这一问题。 相关技术中,时序推荐方法包括两种:时间权重推荐方法和时间切片推荐方法。 其中,TWCF(TimeWeightCollaborativeFiltering,时间权重方法),将时间信息融入 传统协同过滤推荐算法中,具体是在计算皮尔森相关系数时,将商品相似性项上乘上时间 权重因子,并且在计算时间权重因子时,假定商品被评分离当前时间越远其对当前推荐活 动影响越小,故可以用指数衰减公式计算。时间切片推荐方法是由BinLi等人提出的 CDCF-〇T(Cross_DomainCollaborativeFilteringoverTime,跨域时序协同过滤算法)。 在CDCF-0T技术中,将时间轴进行等时间段切分,通过这种处理,系统收集的所有评分数据 被分到不同的时间段中,每个时间段的评分数据组成一个域,其中假定每个时间域内用户 兴趣和物品流行度是不变的,在域间用户兴趣和物品流行度是变化的。参照图1所示,针 对这种假设,时间切片推荐方法包括以下步骤:将评分数据集X按时间轴划为T个时间域, 得到每个时间域上评分数据为X= {X(1),X(2),…,X(T)};挖掘每个时间域中的用户兴趣P= {P⑴,P⑵,…,Pm}和物品流行度Q= {Q⑴,Q⑵,…,Qm},并且得到所有时间域的公共特征 B。其中假定每个时间域中的用户兴趣和物品流行度只受上一个域的影响;对每个时间域的 评分进行预测 然而,相关技术中的时序推荐技术虽然在一定程度上解决了静态推荐技术中用户 兴趣和物品流行度时序变化这一问题,但仍存在诸多问题。首先,时间权重式的时序推荐方 法人为假定了距离当前时间越远的评分对当前的推荐影响越小,但是用户兴趣和物品流行 度可能随时间会有周期性等变化,例如淘宝上凉鞋只在夏天很受欢迎。其次,在时间切片式 的时序推荐方法中,虽然去掉了这一假设,从而可以刻画出用户兴趣和物品流行度的变化 趋势,但是该方法为了刻画这种变化,将所有评分数据切分成若干个时间域,并在每个时间 域上分别刻画,导致极大地加剧了评分数据的稀疏性,降低了每个时间域上刻画出来的用 户兴趣和物品流行度的可靠性。在推荐技术中,评分数据的稀疏性极大地制约了推荐的质 量。
技术实现思路
本专利技术旨在至少在一定程度上解决上述相关技术中的技术问题之一。 为此,本专利技术的一个目的在于提出一种基于评分特征的时序推荐方法,该推荐方 法可以提高推荐质量,简单便捷。 本专利技术的另一个目的在于提出一种基于评分特征的时序推荐装置。 为达到上述目的,本专利技术一方面实施例提出了一种基于评分特征的时序推荐方 法,包括以下步骤:采集用户的所有评分数据,并获取所述所有评分数据的时间信息,其中, 所述时间信息包括起始时间与终止时间;根据所述时间信息将所述所有评分数据切分成时 间段相等的多个时间域,以得到每个时间域上的训练数据;根据所述每个时间上的训练数 据通过跨域时序协同过滤算法获取所述每个时间域上的用户兴趣、物品流行度与所述多个 时间域的公共特征;通过距离公式获取相邻时间域之间用户兴趣与物品流行度的共同变化 值;如果对商品偏好的共同变化值小于或等于预设值,则将当前时间域对商品的评分扩充 到相邻时间域,直至每个相邻时间域的共同变化值大于所述预设值;以及根据扩充后的每 个时间域的用户兴趣、物品流行度与所述多个时间域的公共特征对所述每个时间域上的训 练数据进行预测,并根据预测结果进行推荐。 根据本专利技术实施例提出的基于评分特征的时序推荐方法,通过挖掘评分特征的变 化,以对每个时间域上的评分数据进行扩充,增大每个时间域上的评分数据,从而解决时序 推荐中的稀疏性问题,提高推荐质量,提高用户的使用体验。 另外,根据本专利技术上述实施例的基于评分特征的时序推荐方法还可以具有如下附 加的技术特征: 优选地,在本专利技术的一个实施例中,所述距离公式可以为KL距离公式。 进一步地,在本专利技术的一个实施例中,通过所述KL距离公式获取所述相邻时间域 之间用户兴趣与物品流行度的变化值的公式为: 其中,pu为用户u兴趣,qv为物品v流行度,n为时间域数量。 进一步地,在本专利技术的一个实施例中,根据以下公式得到所述预测结果,所述公式 为: = 其中,t为时间域,B为所述公共特征。 本专利技术另一方面实施例提出了一种基于评分特征的时序推荐装置,包括:采集模 块,用于采集用户的所有评分数据,并获取所述所有评分数据的时间信息,其中,所述时间 信息包括起始时间与终止时间;切分模块,用于根据所述时间信息将所述所有评分数据切 分成时间段相等的多个时间域,以得到每个时间域上的训练数据;获取模块,用于根据所述 每个时间上的训练数据通过跨域时序协同过滤算法获取所述每个时间域上的用户兴趣、物 品流行度与所述多个时间域的公共特征;计算模块,用于通过距离公式获取相邻时间域之 间用户兴趣与物品流行度的共同变化值;收敛模块,如果对商品偏好的共同变化值小于或 等于预设值,则将当前时间域对商品的评分扩充到相邻时间域,直至每个相邻时间域的共 同变化值大于所述预设值;以及预测模块,用于根据扩充后的每个时间域的用户兴趣、物品 流行度与所述多个时间域的公共特征对所述每个时间域上的训练数据进行预测,并根据预 测结果进行推荐。 根据本专利技术实施例提出的基于评分特征的时序推荐装置,通过挖掘评分特征的变 化,以对每个时间域上的评分数据进行扩充,增大每个时间域上的评分数据,从而解决时序 推荐中的稀疏性问题,提高推荐质量,提高用户的使用体验。 另外,根据本专利技术上述实施例的基于评分特征的时序推荐装置还可以具有如下附 加的技术特征: 优选地,在本专利技术的一个实施例中,所述距离公式可以为KL距离公式。进一步地,在本专利技术的一个实施例中,通过所述KL距离公式获取所述相邻时间域 之间用户兴趣与物品流行度的变化值的公式为: 其中,pu为用户u兴趣,qv为物品v流行度,n为时间域数量。进一步地,在本专利技术的一个实施例中,根据以下公式得到所述预测结果,所述公式 为: 其中,t为时间域,B为所述公共特征。本专利技术附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变 得明显,或通过本专利技术的实践了解到。【附图说明】本专利技术的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变 得明显和容易理解,其中: 图1为相关技术的跨域时序协同过滤算法示意图; 图2为根据本专利技术实施例的基于评分特征的时序推荐方法的流程图;图3为根据本专利技术一个实施例的基于评分特征的时序推荐方法的流程图;以及图4为根据本专利技术实施例的基于评分特征的时序推荐装置的结构示意图。【具体实施方式】 下面详细描述本专利技术的实施例,所述实施例的示例在附图中示出,其中自始至终 相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附 图描述的实施例是示例性的本文档来自技高网...
【技术保护点】
一种基于评分特征的时序推荐方法,其特征在于,包括以下步骤:采集用户的所有评分数据,并获取所述所有评分数据的时间信息,其中,所述时间信息包括起始时间与终止时间;根据所述时间信息将所述所有评分数据切分成时间段相等的多个时间域,以得到每个时间域上的训练数据;根据所述每个时间上的训练数据通过跨域时序协同过滤算法获取所述每个时间域上的用户兴趣、物品流行度与所述多个时间域的公共特征;通过距离公式获取相邻时间域之间用户兴趣与物品流行度的共同变化值;如果对商品偏好的共同变化值小于或等于预设值,则将当前时间域对商品的评分扩充到相邻时间域,直至每个相邻时间域的共同变化值大于所述预设值;以及根据扩充后的每个时间域的用户兴趣、物品流行度与所述多个时间域的公共特征对所述每个时间域上的训练数据进行预测,并根据预测结果进行推荐。
【技术特征摘要】
【专利技术属性】
技术研发人员:靳晓明,张子涵,
申请(专利权)人:清华大学,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。