一种基于生成对抗网络的时序评分预测方法技术

技术编号:24456627 阅读:38 留言:0更新日期:2020-06-10 15:44
本发明专利技术公开了一种基于生成对抗网络的时序评分预测方法,其包括以下步骤:S1、样本抽取以及时间特征提取;S2、构建生成对抗网络模型中的生成模型和鉴别模型;S3、基于时序的奇异值分解,得到加入时序信息的生成对抗网络模型;S4、基于生成对抗网络模型进行时序评分预测。本发明专利技术结合了时间序列信息以及生成对抗网络,将得到的新的时序评分预测方法应用到推荐系统中,实现长期有效的推荐,使得推荐精度有所提高。

A prediction method of time series score based on generative adversary network

【技术实现步骤摘要】
一种基于生成对抗网络的时序评分预测方法
本专利技术属于推荐系统
,具体涉及一种基于生成对抗网络的时序评分预测方法。
技术介绍
传统的推荐系统主要采用基于原始的矩阵分解方法的协同过滤,并没有考虑时间信息的作用;而时间信息作为一种重要的上下文信息,反映了用户行为的时间序列模式,也被一些研究者用于辅助推荐算法获得更高的预测精度。例如Netfilx竞赛中,Xiang等人提出了TimeSVD算法,该算法将时间效应加入到奇异值分解中去,有效的解决了兴趣偏移问题。但是时间信息大都应用于单次推荐,为了实现系统的长期有效推荐,需要提出新的推荐模型。生成对抗网络是2014年GoodFellow提出,结合了数学中极小极大博弈的思想,由生成模型和鉴别模型两部分组成,现已广泛应用于图像生成、多媒体等领域,且成熟模型高达380多个,在图像领域逐渐趋于饱和。IRGAN首次尝试将生成对抗网络应用于推荐系统,在推荐精度上有所提高,但是其仅仅使用的是传统协同过滤方法,并未考虑时间信息在推荐系统中的应用,导致时间信息的丢失,导致推荐效果没有达到最优,无法实现长期有效推荐。
技术实现思路
针对现有技术中的上述不足,本专利技术提供了一种基于生成对抗网络的时序评分预测方法,以解决现有推荐系统中不能长期有效推荐的问题。为了达到上述专利技术目的,本专利技术采用的技术方案为:一种基于生成对抗网络的时序评分预测方法,包括以下步骤:S1、对原始数据进行样本抽取和时间特征提取,形成包含时间信息的数据集;S2、构建生成对抗网络模型中的生成模型和鉴别模型;S3、基于时序的奇异值分解,得到加入时序信息的生成对抗网络模型;S4、利用步骤S3得到的加入时序信息的生成对抗网络模型对步骤S1中包含时间信息的数据集进行时序评分预测。进一步的,所述步骤S1包括以下分步骤:S1-1、从原始数据库中进行样本抽取,将其按设定比例分为训练集和测试集,并生成特征索引;S1-2、对数据集中的时间信息进行处理,获取数据集中最小时间戳min_time_stamp以及最大时间戳max_time_stamp,计算出整个数据集的时间跨度num;对于每一条数据,将其时间信息转化为min(num-1,time-min_time_stamp),记为t;S1-3、将步骤S1-2处理后的时间信息t,结合项目编号i、用户编号u以及评分r组成新的数据集结构(u,i,r,t)。进一步的,所述步骤S2包括以下分步骤:S2-1、生成对抗网络中生成模型以及鉴别模型的重定义,将生成模型定义为其中gθ(u,i)表示生成器预测的用户u与项目i之间的评分,θ为生成模型参数;将鉴别模型定义为其中fφ(u,i)表示鉴别器在验证集的基础上计算出的用户u与项目i之间的评分,为鉴别模型参数;S2-2、根据定义的生成模型以及鉴别模型,生成对抗网络目标函数为其中E表示期望,x~pdata(x)表示变量x服从真实数据分布,D(i|u,r),G(i|u,r)分别表示生成模型和鉴别模型使用先验概率在给定用户和评分时项目i的概率;S2-3、对生成对抗网络模型进行求解,相应的生成模型梯度为其中θg表示生成模型参数,m表示项目总量;鉴别器梯度为S2-4、将鉴别模型梯度表示为其中Φ表示鉴别模型参数,z~pz(z)表示变量z服从生成模型分布,Gθ(z)表示带有参数θ的生成模型在输入变量z后的输出,σ表示sigmoid函数,fΦ(Gθ(z))表示带有参数Φ的鉴别模型在输入生成器的输出后的输出;将鉴别模型损失函数表示为其中表示对于任一用户推荐项目im鉴别模型给出的评分,n表示用户总量;S2-5、根据原始奇异值分解方法计算用户与项目之间的评分,表示为其中pu,qi分别表示用户u与项目i的潜在特征向量,b表示项目偏置量。进一步的,所述步骤S3包括以下分步骤:S3-1、根据用户喜好随时间变化、用户评分习惯随时间变化、项目受欢迎程度随时间变化、整个社会的偏好随时间变化这四种时间效应分别构建其特征表示矩阵,分别初始化为0矩阵,加入到传统奇异值分解方法中,得到改进的奇异值分解方法表示为其中bt为时间特征向量,表示社会偏好随时间的变化;xu,zt分别为用户u和时间t的潜在特征向量,表示用户评分习惯随时间的变化;si,yω分别为项目i和时间ω的潜在特征向量,代表项目流行度随时间的变化;gu,k,li,k,ht,k分别为用户u、项目i和时间t的潜在特征向量,表示用户喜好的转变;S3-2、初始化用户、项目以及时间对应的潜在特征矩阵,重新定义生成模型为定义鉴别模型为其中gθ(u,i,t)表示使用改进的奇异值分解方法预测的用户与项目之间的评分,fφ(u,i,t)表示鉴别器使用改进的奇异值分解方法计算出的用户u与项目i之间的评分。进一步的,所述步骤S4包括以下分步骤:S4-1、利用步骤S3得到的加入时序信息的生成对抗网络模型中的生成模型预测用户项目之间的相关度,将其生成的序列输入鉴别器;S4-2、利用步骤S3得到的加入时序信息的生成对抗网络模型中的鉴别模型根据改进的的奇异值分解方法计算输入的用户项目序列评分,进而给用户项目序列打出标签,来鉴别是否为真数据;S4-3、生成器根据步骤S4-2中得到的标签,进而优化生成器参数集;通过生成模型以及鉴别模型的极小极大博弈,达到生成对抗网络的0-1平衡;S4-4、得到项目的带有时间信息的预测评分,并根据评分排序进行推荐。本专利技术具有以下有益效果:本专利技术通过将用户项目以及时间信息以其潜在特征矩阵的方式加入到传统奇异值分解方法中,生成了融合时间序列因素的奇异值分解方法,完善了生成模型以及鉴别模型计算相关度的方法,提升了生成对抗网络在推荐时的有效性,使得推荐系统有了记忆效果;本专利技术结合了生成对抗网络,并将时间序列信息融合进来,提高了推荐精度和推荐质量,进一步实现长期有效推荐。附图说明图1是本专利技术基于生成对抗网络的时序评分预测方法流程示意图。具体实施方式为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本专利技术,并不用于限定本专利技术。如图1所示,本专利技术实施例提供了一种基于生成对抗网络的时序评分预测方法,包括以下步骤S1至S4:S1、对原始数据进行样本抽取和时间特征提取,形成包含时间信息的数据集;在本实施例中,步骤S1包括以下分步骤:S1-1、从原始数据库中进行样本抽取,将其按设定比例分为训练集和测试集,并生成特征索引;具体而言,本专利技术在样本抽取后按比例8:2划分训练集和测试集,利用随机抽取样本的特性,使得数据集能够更好的代表某一个时间段的本文档来自技高网...

【技术保护点】
1.一种基于生成对抗网络的时序评分预测方法,其特征在于,包括以下步骤:/nS1、对原始数据进行样本抽取和时间特征提取,形成包含时间信息的数据集;/nS2、构建生成对抗网络模型中的生成模型和鉴别模型;/nS3、基于时序的奇异值分解,得到加入时序信息的生成对抗网络模型;/nS4、利用步骤S3得到的加入时序信息的生成对抗网络模型对步骤S1中包含时间信息的数据集进行时序评分预测。/n

【技术特征摘要】
1.一种基于生成对抗网络的时序评分预测方法,其特征在于,包括以下步骤:
S1、对原始数据进行样本抽取和时间特征提取,形成包含时间信息的数据集;
S2、构建生成对抗网络模型中的生成模型和鉴别模型;
S3、基于时序的奇异值分解,得到加入时序信息的生成对抗网络模型;
S4、利用步骤S3得到的加入时序信息的生成对抗网络模型对步骤S1中包含时间信息的数据集进行时序评分预测。


2.如权利要求1所述的基于生成对抗网络的时序评分预测方法,其特征在于,所述步骤S1包括以下分步骤:
S1-1、从原始数据库中进行样本抽取,将其按设定比例分为训练集和测试集,并生成特征索引;
S1-2、对数据集中的时间信息进行处理,获取数据集中最小时间戳min_time_stamp以及最大时间戳max_time_stamp,计算出整个数据集的时间跨度num;对于每一条数据,将其时间信息转化为min(num-1,time-min_time_stamp),记为t;
S1-3、将步骤S1-2处理后的时间信息t,结合项目编号i、用户编号u以及评分r组成新的数据集结构(u,i,r,t)。


3.如权利要求2所述的基于生成对抗网络的时序评分预测方法,其特征在于,所述步骤S2包括以下分步骤:
S2-1、生成对抗网络中生成模型以及鉴别模型的重定义,将生成模型定义为



其中gθ(u,i)表示生成器预测的用户u与项目i之间的评分,θ为生成模型参数;
将鉴别模型定义为



其中fφ(u,i)表示鉴别器在验证集的基础上计算出的用户u与项目i之间的评分,为鉴别模型参数;
S2-2、根据定义的生成模型以及鉴别模型,生成对抗网络目标函数为



其中E表示期望,x~pdata(x)表示变量x服从真实数据分布,D(i|u,r),G(i|u,r)分别表示生成模型和鉴别模型使用先验概率在给定用户和评分时项目i的概率;
S2-3、对生成对抗网络模型进行求解,相应的生成模型梯度为



其中θg表示生成模型参数,m表示项目总量;
鉴别器梯度为



S2-4、将鉴别模型梯度表示为



其中Φ表示鉴别模型参数,z~pz(z)表示变量z服从生成模型分布,Gθ(z)表示带有参数...

【专利技术属性】
技术研发人员:王庆先王超
申请(专利权)人:电子科技大学
类型:发明
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1