System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于特征对比和全域图增强的序列推荐方法技术_技高网
当前位置: 首页 > 专利查询>燕山大学专利>正文

一种基于特征对比和全域图增强的序列推荐方法技术

技术编号:42329197 阅读:12 留言:0更新日期:2024-08-14 16:07
本发明专利技术公开了一种基于特征对比和全域图增强的序列推荐方法,属于推荐系统技术领域,包括以下步骤:步骤S1:生成节点特征向量矩阵;步骤S2:构建全域上下文图;步骤S3:生成序列级表征;步骤S4:生成全域级序列表征;步骤S5:生成用户最终序列表征:将步骤S3和步骤S4中训练得到的用户序列的序列级表和全域级表征进行融合,作为行为序列的最终表示;步骤S6:计算评分预测下一次点击:在全部的商品上面做评分,并从中选出评分最高的k个商品推荐给用户。本发明专利技术融合了序列学习和图学习的优势,通过构建对比学习任务进行优化,使得模型更专注于提取序列中的关键特征,缓解了数据不平衡的问题,能够有效提升序列推荐效果。

【技术实现步骤摘要】

本专利技术属于推荐系统,具体涉及一种基于特征对比和全域图增强的序列推荐方法


技术介绍

1、随着大数据时代的到来,人们在互联网上获取信息变得更加便利,但是信息过载的问题也随之而来,而推荐系统可以对海量的用户和物品之间的交互数据进行处理,帮助人们过滤信息进行个性化推荐,从而有效解决上述问题。序列推荐是推荐系统的子领域,基于序列的推荐能够从用户的历史行为中捕获到随着时间推进而动态变化的兴趣,进而能够产生准确的推荐结果。

2、为了获得更加优异的推荐效果,不少研究人员还采用将自注意力机制加入构建序列推荐模型中的方式,利用自注意力层对序列中的每个行为进行加权整合,生成每个行为上下文相关的表示,捕捉用户历史行为序列中的长期依赖关系,从而达到能够获得更加准确的推荐效果的目的。基于自注意力机制的序列推荐(sasrec)旨在解决推荐系统中的序列建模和预测问题,该模型能够在序列中的不同位置之间建立动态关联,而不是依赖于固定的权重和序列中节点的邻接关系,因此能够更为全面的了解用户的行为模式和兴趣演化趋势,然而,尽管sasrec取得了一定成功,但是仍然存在着较多难题,目前主流的序列推荐模型普遍受到模型鲁棒性、数据不平衡和数据稀疏性问题的困扰,导致达不到预期的推荐效果,因此,现在需要一种能够解决模型鲁棒性、数据不平衡和数据稀疏性等问题的基于特征对比和全域图增强的序列推荐方法。


技术实现思路

1、本专利技术的目的是提供一种基于特征对比和全域图增强的序列推荐方法,能够融合序列学习和图学习的优势,通过构建对比学习任务进行优化,使得模型更专注于提取序列中的关键特征,缓解数据不平衡问题,能够有效提升序列推荐效果。

2、为实现上述目的,本专利技术所采用的技术方案是:

3、一种基于特征对比和全域图增强的序列推荐方法,包括以下步骤:

4、步骤s1:生成节点特征向量矩阵:原始序列su={vu,1,vu,2,…,vu,|u|}利用特征映射层获得序列中节点在向量空间中的表示,将原始序列su中节点的特征向量通过添加均匀噪声进行扰动,获得增强后用于对比学习任务的特征序列

5、su'={vu,1',vu,2',…,vu,|u|'}和su”={vu,1”,vu,2”,…,vu,|u|”};

6、步骤s2:构建全域上下文图:根据所有的用户历史交互序列,设定超参数ε限定序列中节点vi的上下文范围,对于商品集v中的每个节点计算项转换对出现的次数取出χ个高频对,构造全域上下文图gs;

7、步骤s3:生成序列级表征:将原始的特征向量和语义扰动后的特征向量分别与位置特征向量进行叠加,向量表示中融合节点的语义特征和位置特征,将叠加后的特征作为自注意力编码层的输入,拼接自注意力编码层的输出作为历史交互序列的表征获取序列级表征

8、步骤s4:生成全域级序列表征:在全域上下文图中进行广度优先搜索找出用户序列su,su'和su”相应的邻居,利用图神经网络方法聚合邻居节点的信息生成节点的全域图表征,然后利用自注意力机制对整个序列的全域图表征进行权重求和,获取序列层面的全域级表征和

9、步骤s5:生成用户最终序列表征:将步骤s3和步骤s4中训练得到的用户序列的序列级表征和全域级表征进行融合,作为行为序列su的最终表示shu;

10、步骤s6:计算评分预测下一次点击:在全部的商品上面做评分,并从中选出评分最高的k个商品推荐给用户。

11、本专利技术技术方案的进一步改进在于:在步骤s2中,引入全域上下文图gs=(vs,es),采用图神经网络学习节点在全域级转换关系中的表征,并针对单一序列su={v1,v5,v6,v2,v8,v11},将成对的<v2,v5>、<v2,v6>、<v2,v8>和<v2,v11>纳入考虑,然后获得节点v2在全域图中的邻居集合并统计每个转换对的出现频率,从中取出χ个高频对用于全域图的构建。

12、本专利技术技术方案的进一步改进在于:邻居集定义如公式(1)所示:

13、

14、式中,表示序列sp、序列sq的相应节点。

15、本专利技术技术方案的进一步改进在于:在步骤s3中,生成序列级表征包括以下步骤:

16、步骤s301:针对输入的用户行为历史序列su,通过特征映射层将高维稀疏的one-hot向量转换成低维稠密的表征向量,并将叠加后的位置向量pi和节点向量vi进行拼接,获得多头自注意力层的第0层输入操作过程如公式(2)所示:

17、

18、式中,concat(·)表示向量拼接操作;

19、步骤s302:将稠密的用户序列表征矩阵作为自注意力编码层的输入,捕获序列中节点与其他节点之间的关联程度,通过叠加多层注意力层学习序列中更复杂的关联模式,操作过程如公式(3)、(4)所示:

20、

21、

22、式中,attention(·)表示自注意力编码层,wq、w k、w v和w o表示线性变换矩阵;

23、步骤s303:在模型中引入非线性化处理层位置前馈神经网络,并施加dropout、残差连接和层正则化,操作过程如公式(5)、(6)、(7)所示:

24、

25、

26、

27、式中,g(·)表示attention(·)和pffn(·)层,ω和λ表示可学习参数,ε和δ表示输入x的均值和方差,⊙表示element-product操作。

28、本专利技术技术方案的进一步改进在于:在步骤s4中,生成全域级序列表征包括以下步骤:

29、步骤s401:在全域图gs中提取vi的邻居信息,通过聚合邻居特征丰富自身的表征,并设定计算权重比例的规则传播邻居信息,操作过程如公式(8)、(9)、(10)、(11)所示:

30、

31、

32、

33、

34、式中,表示vi在全域图的邻居集,q1∈rd+1和w1∈r(d+1)*(d+1)均表示可学习参数,wi,j∈r1表示转换对<vi,vj>在全域图中出现的频率;

35、步骤s402:将节点向量vi与其邻居特征进行聚合,获得节点在全域图中的表示向量通过对聚合器进行扩展,从一层扩展到多层探索更深层次的连接信息,操作过程如公式(12)、(13)所示:

36、

37、

38、式中,relu(·)表示非线性激活函数,w2∈rd*2d表示可学习参数,||表示向量拼接,k表示聚合器的层数,当k=0时,

39、步骤s403:对聚合后的节点特征使用dropout操作,并引入位置参数p,将节点表征与位置参数进行拼接,然后将其重新映射到相同维度空间,通过tanh(·)引入非线性信息于最终的节点表示,操作过程如公式(14)、(15)所示:

40、

41、

...

【技术保护点】

1.一种基于特征对比和全域图增强的序列推荐方法,其特征在于:包括以下步骤:

2.根据权利要求1所述的一种基于特征对比和全域图增强的序列推荐方法,其特征在于:在步骤S2中,引入全域上下文图Gs=(Vs,Es),采用图神经网络学习节点在全域级转换关系中的表征,并针对单一序列su={v1,v5,v6,v2,v8,v11},将成对的<v2,v5>、<v2,v6>、<v2,v8>和<v2,v11>纳入考虑,然后获得节点v2在全域图中的邻居集合并统计每个转换对的出现频率,从中取出χ个高频对用于全域图的构建。

3.根据权利要求2所述的一种基于特征对比和全域图增强的序列推荐方法,其特征在于:邻居集定义如公式(1)所示:

4.根据权利要求2或3任一项所述的一种基于特征对比和全域图增强的序列推荐方法,其特征在于:在步骤S3中,生成序列级表征包括以下步骤:

5.根据权利要求4所述的一种基于特征对比和全域图增强的序列推荐方法,其特征在于:在步骤S4中,生成全域级序列表征包括以下步骤:

6.根据权利要求5所述的一种基于特征对比和全域图增强的序列推荐方法,其特征在于:在步骤S5中,将步骤S3和步骤S4中训练得到的用户序列的序列级表征和全域级表征进行融合,作为行为序列su的最终表示SHu,操作过程如公式(19)所示:

7.根据权利要求6所述的一种基于特征对比和全域图增强的序列推荐方法,其特征在于:在步骤S6中,计算评分预测下一次点击包括以下步骤:

...

【技术特征摘要】

1.一种基于特征对比和全域图增强的序列推荐方法,其特征在于:包括以下步骤:

2.根据权利要求1所述的一种基于特征对比和全域图增强的序列推荐方法,其特征在于:在步骤s2中,引入全域上下文图gs=(vs,es),采用图神经网络学习节点在全域级转换关系中的表征,并针对单一序列su={v1,v5,v6,v2,v8,v11},将成对的<v2,v5>、<v2,v6>、<v2,v8>和<v2,v11>纳入考虑,然后获得节点v2在全域图中的邻居集合并统计每个转换对的出现频率,从中取出χ个高频对用于全域图的构建。

3.根据权利要求2所述的一种基于特征对比和全域图增强的序列推荐方法,其特征在于:邻居集定义如公式(1)所...

【专利技术属性】
技术研发人员:宫继兵徐以丽张锦赵金烨郑少杰暴阳豪林宇庭
申请(专利权)人:燕山大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1