System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及个性化推荐,更具体的,涉及一种基于数据增强与表征对齐的购物篮推荐方法及系统。
技术介绍
1、在现代的大数据和人工智能的领域中,对比学习已成为提高模型性能、缓解数据稀疏性的关键方法。对比学习主要包括数据增强与构建对比损失,而重构是一种有效的数据增强的方法。
2、现有的下一个购物篮推荐任务技术中,传统的对比学习方法是通过在项目或者购物篮的嵌入中引入随机的噪音或者进行元素级掩码实现数据增强,然而这样的数据增强的方法可能会破坏原有的实体中重要特征的嵌入表征,从而难以达到一种比较好的对比学习效果。而且传统的推荐方法大多基于协同过滤,内容过滤等方法,在处理冷启动、数据稀疏等问题面临了巨大的挑战,而且忽略了数据之间更为深层的联系和内在结构,导致推荐效果不好。
3、因此,本专利技术提出了基于自编码器的购物篮增强方式,通过两种不同的自编码器实现两组数据增强,与原有的购物篮嵌入构成三组正样本对,构建对比损失进而优化购物篮嵌入表征以提高下一个购物篮推荐的准确性和多样性,给用户带来更好的购物体验。
技术实现思路
1、为了解决上述技术问题,本专利技术提出了一种基于数据增强与表征对齐的购物篮推荐方法及系统,目的是通过自编码器完成数据增强,进而构建对比学习,用来优化购物篮嵌入表征,从而提升下一个购物篮推荐的效果。
2、本专利技术第一方面提供了一种基于数据增强与表征对齐的购物篮推荐方法,包括:
3、获取用户购物篮序列数据,对所述用户购物篮序列数据进行预
4、构建降噪自编码器及变分自编码器生成两种自编码器的购物篮增强,获取重构购物篮嵌入表征,将两种重构购物篮嵌入表征对齐;
5、获取购物篮嵌入表征、降噪自编码器与变分自编码器的重构购物篮嵌入表征构建正样本对,随机选取与用户不相关的项目与三种购物篮嵌入表示构成负样本对,利用所述正样本对及负样本对进行自编码器的对比学习;
6、根据用户原始的购物篮嵌入表征以及两种自编码器的重构购物篮嵌入表征生成三组购物篮嵌入表征序列,分别做序列编码,利用多层感知机将用户偏好表征向量映射到概率空间,得到每个项目在用户的下一个购物篮的概率。
7、本方案中,对所有用户、项目及购物篮数据进行编号,根据用户筛选存在交互关联的项目及购物篮,获取用户购物篮序列数据并根据预设数据格式生成训练数据、测试数据及验证数据;
8、对于任一购物篮中的所有项目构建项目嵌入表征,将所有项目的项目嵌入表征进行平均池化得到购物篮嵌入表征。
9、本方案中,构建降噪自编码器,生成降噪自编码器的购物篮增强,具体为:
10、获取给定购物篮的购物篮嵌入表征,构建出与购物篮嵌入表征大小相同的高斯噪声,将所述高斯噪声加入到购物篮嵌入表征中,并引入超参数调节高斯噪声强度;
11、将加入噪声的购物篮嵌入表征输入到由三层全连接层构成的编码器中,编码器将逐层压缩购物篮嵌入表征,提取关键特征,经过三次压缩,最终得到低维的购物篮关键特征向量;
12、通过降噪自编码器的解码器结构对所述购物篮关键特征向量进行解码,还原为原本的大小,重构购物篮嵌入表征,进行基于降噪自编码器的购物篮增强。
13、本方案中,构建变分自编码器,生成变分自编码器的购物篮增强,具体为:
14、获取给定购物篮的购物篮嵌入表征,通过全连接层压缩所述购物篮嵌入表征进行特征提取;
15、利用两个不同的全连接层从被压缩的购物篮嵌入表征中拟合潜在空间的均值与对数方差,生成潜在空间分布;
16、从标准高斯分布中采样一个随机噪声,与潜在空间的标准差计算逐元素积并加上潜在空间的均值,得到潜在空间的高斯采样结果,利用解码器结构进行解码,重构购物篮嵌入表征,进行基于变分自编码器的购物篮增强。
17、本方案中,将两种购物篮增强进行表征对齐,具体为:
18、计算购物篮嵌入表征与基于降噪自编码器的购物篮增强之间的均方误差,通过最小化均方误差进行重构购物篮嵌入表征的对齐;
19、计算购物篮嵌入表征与基于变分自编码器的购物篮增强之间的均方误差,通过最小化均方误差及最小化潜在空间分布与标准高斯分布之间的kl散度进行重构购物篮嵌入表征的对齐。
20、本方案中,进行自编码器的对比学习,具体为:
21、获取给定购物篮的购物篮嵌入表征降噪自编码器的重构购物篮嵌入表征及变分自编码器的重构购物篮嵌入表征构建三组正样本对
22、基于预设数量k随机选择与用户无交互的负样本与给定购物篮的三种嵌入表征构成负样本对k=1,2,...,k,为无交互样本的嵌入表征;
23、使用余弦相似度计算不同样本对之间的相似度,通过最大化正样本对之间的相似度,最小化负样本对之间的相似度,得到对比损失,利用所述对比损失指导降噪自编码器及变分自编码器的对比训练。
24、本方案中,获取用户原始的购物篮嵌入表征以及两种自编码器的重构购物篮嵌入表征生成三组购物篮嵌入表征序列,使用门控循环单元分别对三组购物篮嵌入表征序列进行序列编码,得到用户的三组偏好表征向量。
25、本方案中,基于用户的三组偏好表征向量,通过两组两层的多层感知机将用户的偏好表征向量映射到概率空间,得到每个项目出现在用户下一个购物篮中的概率;
26、得到数据集中所有项目出现在用户下一个购物篮中的概率后,最大化实际出现在用户下一个购物篮中的概率,计算预测损失进行训练,预测损失表示为:
27、
28、其中ip表示出现在下一个购物篮bt+1中的项目,in表示未出现在下一个购物篮bt+1中的项目,表示ip对应的预测概率,表示in对应的预测概率。
29、本专利技术第二方面提供了一种基于数据增强与表征对齐的购物篮推荐系统,该系统包括:购物篮输入模块、购物篮表征生成模块、购物篮增强模块、对比学习模块、购物篮序列编码模块及项目预测模块;
30、所述购物篮输入模块将用户购买过的购物篮和项目进行数据预处理,生成预设的数据格式;
31、所述购物篮表征生成模块生成购物篮嵌入表征、项目嵌入表征以用于购物篮增强模块前向传播的计算;
32、所述购物篮增强模块利用降噪自编码器与变分自编码器对购物篮嵌入表征的数据增强以及重构表征对齐,生成重构购物篮嵌入表征。
33、所述对比学习模块将两组自编码器生成的重构购物篮嵌入表征与原始的购物篮嵌入表征构造成3组正样本,基于预设数量k随机取出与用户不相关的项目与3组购物篮嵌入数据构成3*k组负样本,最大化正样本对之间的相似度,最小化负样本对之间的相似度;
34、所述购物篮序列编码模块通过门控循环单元对三组购物篮嵌入表征进行序列编码,获取能够表示用户偏好的嵌入表征;
35、所述项目预测模块通过多层感知机将用户偏好表征向量映射到概率空间中,预测项目在用户的下一个购物篮本文档来自技高网...
【技术保护点】
1.一种基于数据增强与表征对齐的购物篮推荐方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种基于数据增强与表征对齐的购物篮推荐方法,其特征在于,对所有用户、项目及购物篮数据进行编号,根据用户筛选存在交互关联的项目及购物篮,获取用户购物篮序列数据并根据预设数据格式生成训练数据、测试数据及验证数据;
3.根据权利要求1所述的一种基于数据增强与表征对齐的购物篮推荐方法,其特征在于,构建降噪自编码器,生成降噪自编码器的购物篮增强,具体为:
4.根据权利要求1所述的一种基于数据增强与表征对齐的购物篮推荐方法,其特征在于,构建变分自编码器,生成变分自编码器的购物篮增强,具体为:
5.根据权利要求1所述的一种基于数据增强与表征对齐的购物篮推荐方法,其特征在于,将两种购物篮增强进行表征对齐,具体为:
6.根据权利要求1所述的一种基于数据增强与表征对齐的购物篮推荐方法,其特征在于,进行自编码器的对比学习,具体为:
7.根据权利要求1所述的一种基于数据增强与表征对齐的购物篮推荐方法,其特征在于,获取用户原始的购物篮嵌
8.根据权利要求1所述的一种基于数据增强与表征对齐的购物篮推荐方法,其特征在于,基于用户的三组偏好表征向量,通过两组两层的多层感知机将用户的偏好表征向量映射到概率空间,得到每个项目出现在用户下一个购物篮中的概率;
9.一种基于数据增强与表征对齐的购物篮推荐系统,其特征在于,该系统包括:购物篮输入模块、购物篮表征生成模块、购物篮增强模块、对比学习模块、购物篮序列编码模块及项目预测模块;
...【技术特征摘要】
1.一种基于数据增强与表征对齐的购物篮推荐方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种基于数据增强与表征对齐的购物篮推荐方法,其特征在于,对所有用户、项目及购物篮数据进行编号,根据用户筛选存在交互关联的项目及购物篮,获取用户购物篮序列数据并根据预设数据格式生成训练数据、测试数据及验证数据;
3.根据权利要求1所述的一种基于数据增强与表征对齐的购物篮推荐方法,其特征在于,构建降噪自编码器,生成降噪自编码器的购物篮增强,具体为:
4.根据权利要求1所述的一种基于数据增强与表征对齐的购物篮推荐方法,其特征在于,构建变分自编码器,生成变分自编码器的购物篮增强,具体为:
5.根据权利要求1所述的一种基于数据增强与表征对齐的购物篮推荐方法,其特征在于,将两种购物篮增强进行表征对齐,具体为:
6.根据权利要求...
【专利技术属性】
技术研发人员:黄玲,李哲远,谭子星,黄晓东,高月芳,邝颖杰,
申请(专利权)人:华南农业大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。