【技术实现步骤摘要】
一种基于物品交互约束的自编码器推荐系统
[0001]本专利技术涉及推荐
,特别涉及一种基于物品交互约束的自编码器推荐系统
。
技术介绍
[0002]在深度学习模型中,自编码器具有强大的数据压缩能力,在处理推荐系统数据稀疏性问题方面展现出很好的应用潜力
。
当前,一些基于自编码器的推荐模型被提出,有效推动了基于深度模型的推荐系统的发展,展现出良好的应用前景
。
[0003]然而,通过对基于自编码器的推荐模型深入分析,发现该模型在学习过程中会因为数据缺失而产生新的误差,从而影响推荐的准确性
。
为此,本文提出了一种基于物品交互约束的自编码器推荐模型
。
该模型依据用户与物品之间是否存在交互而动态设置差异化的参数更新规则,有效限制了模型训练过程中因数据缺失产生的误差,保证了模型训练的有效性
。
此外,本文提出的模型还将物品标签个性化引入到训练中,通过丰富数据的维度,增强了模型的泛化能力,进一步提升了模型的性能
。
技术实现思路
[0004]针对上述问题,本专利技术提出一种基于物品交互约束的自编码器推荐系统,以限制模型训练过程中因数据缺失产生的误差,包括如下:
[0005]数据采集及准备模块,用于对数据库中收集的数据进行获取和清洗,以得到需要信息
。
[0006]偏好特征获取模块,用于帮助编码器从已有的评分信息中获取用户的偏好特征,挖掘用户的购买行为以及对物品的偏好
。 >[0007]物品特征获取模块,用于帮助编码器从标签中获取物品特征,挖掘物品的类别特征信息
。
[0008]融合偏好特征模块,用于融合所述用户偏好特征以及物品类别特征以生产融合偏好向量
。
[0009]融合特征处理模块,用于帮助解码器对融合用户偏好向量以及物品特征向量的特征向量进行处理,以重构物品的评分向量,并输出预测评分
。
[0010]参数更新约束模块,用于避免模型在训练过程中产生误差,以用户与物品是否存在交互作为模型参数更新的约束条件
。
[0011]推荐结果获取模块,用于将预测评分较高的前
k
个项目推送给目标用户,以形成其个性化推荐列表
。
[0012]本专利技术所述偏好特征获取模块,用于从已有的评分信息中获取用户的偏好特征
。
编码器中该模块采用全连接神经网络,以评分值
r
u
,
i
和物品标签属性的
one
‑
hot
值
l
t
,
i
作为输入,对应计算过程分别如式
(1)
和式
(2)
所示,即:
[0013][0014][0015]其中,
s
q
为从物品评分中获取的特征分量,
e
q
为从物品标签中获取的特征分量,和分别为模型中评分和标签的权重,
S
为
Sigmoid
激活函数
。
[0016]本专利技术所述物品特征获取模块,用于从标签中获取物品特征
。
编码器中该模块采用全连接神经网络,相关公式同偏好特征模块所述
。
[0017]本专利技术所述融合偏好特征模块,用于融合所述用户偏好特征以及物品类别特征
。
在产生
s
q
和
e
q
之后,将两者按位相加进行融合,计算过程如式
(3)
所示:
[0018]h
q
=
s
q
+e
q
,
q
=1,2,
...
,
K(3)
[0019]其中,
h
q
表示第
q
维特征分量融合后的结果
。
[0020]本专利技术所述融合特征处理模块,用于对用户偏好向量进行处理,以重构物品的评分向量
。
其计算过程如式
(4)
所示:
[0021][0022]其中,是解码器的权值
。
[0023]本专利技术所述参数更新约束模块,用于避免模型在训练过程中产生误差,以用户与物品是否存在交互作为模型参数更新的约束条件
。
本文模型的损失函数为:
[0024][0025]其中,
T
i
是标签在物品
i
有值的集合,
K
是融合特征向量的维度
。
[0026]为了避免推荐模型在训练过程中产生误差,以用户与物品是否存在交互作为模型参数更新的约束条件,设计模型参数的更新规则如下:
[0027][0028][0029][0030]然后根据式
(9)
‑
(11)
更新参数
。
[0031][0032][0033][0034]由式
(9)
可知,当用户与物品之间不存在交互时,则在训练过程中不更新参数
[0035]本专利技术所述推荐结果获取模块,用于获取目标用户
u
的推荐列表
。
其中包括:将保留的预测评级进行内部从大到小排序,设定待推荐项目数
k
,选取前
k
个预测评级较高的项目推送给目标用户
u
,以形成目标用户
u
的个性化推荐列表
。
[0036]本专利技术提出的一种基于物品交互约束的自编码器推荐系统,在学习过程中会根据用户与物品的交互情况对模型中的权重进行选择性的更新,有效避免了将数据缺失而产生的噪音或误差引入模型中,保证了学习过程的有效性
。
同时,选择性权重更新方式还能减少模型的计算量,有效提高了模型的学习效率
。
附图说明
[0037]图1是本专利技术的系统过程示意图;
[0038]图2是本专利技术的系统框架图;
[0039]图3是本专利技术在三个数据集下
MAE
值和
RMSE
值与其他方法对比情况
。
具体实施方式
[0040]为了使用本专利技术的目的
、
技术方案及优点更加清楚明白,以下结合附图,对本专利技术提出的一种基于物品交互约束的自编码器推荐系统进行详细说明
。
应当理解,此处所描述的具体实施方法仅仅用以解释本专利技术,并不用于限定本专利技术,本
的普通技术人员在本专利技术的示值范围内所做出的变化
、
改动
、
添加修改或替换,其均应涵盖在本专利技术的权利要求范围之中
。
[0041]图1是本专利技术的基于物品交互约束的自编码器推荐系统的过程示意图
。
从图1本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.
一种基于物品交互约束的自编码器推荐系统,以限制模型训练过程中因数据缺失产生的误差,包括如下:数据采集及准备模块,用于对数据库中收集的数据进行获取和清洗,以得到需要信息
。
偏好特征获取模块,用于帮助编码器从已有的评分信息中获取用户的偏好特征,挖掘用户的购买行为以及对物品的偏好
。
物品特征获取模块,用于帮助编码器从标签中获取物品特征,挖掘物品的类别特征信息
。
融合偏好特征模块,用于融合所述用户偏好特征以及物品类别特征以生产融合偏好向量
。
融合特征处理模块,用于帮助解码器对融合用户偏好向量以及物品特征向量的特征向量进行处理,以重构物品的评分向量,并输出预测评分
。
参数更新约束模块,用于避免模型在训练过程中产生误差,以用户与物品是否存在交互作为模型参数更新的约束条件
。
推荐结果获取模块,用于将预测评分较高的前
k
个项目推送给目标用户,以形成其个性化推荐列表
。2.
如权利要求1所述的基于物品交互约束的自编码器推荐系统,其特征在于,所述偏好特征获取模块,用于从已有的评分信息中获取用户的偏好特征
。
编码器中该模块采用全连接神经网络,以评分值
r
u,i
和物品标签属性的
one
‑
hot
值
l
t,i
作为输入,对应计算过程分别如式
(1)
和式
(2)
所示,即:所示,即:其中,
s
q
为从物品评分中获取的特征分量,
e
q
为从物品标签中获取的特征分量,和分别为模型中评分和标签的权重,
S
为
Sigmoid
激活函数
。3.
如权利要求1所述的基于物品交互约束的自编码器推荐系统,其特征在于,所述物品特征获取模块,用于从标签中获取物品特征
。
编码器中该模块采用全连接神经网络,以评分值
r
u,i
和物品标签属性的
one
‑
hot
值
l
t,i
作为输入,对应计算过程分别如式
(1)
和式
(2)
...
【专利技术属性】
技术研发人员:李昌兵,陈思彤,邓江洲,王淞立,陈俊谕,李行健,刘岽,罗陈红,
申请(专利权)人:重庆邮电大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。