System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于对比学习与场因子分解的教育资源推荐方法技术_技高网

一种基于对比学习与场因子分解的教育资源推荐方法技术

技术编号:41670177 阅读:8 留言:0更新日期:2024-06-14 15:27
本发明专利技术涉及一种基于对比学习与场因子分解的教育资源推荐方法,属于深度学习、基于上下文的推荐系统、对比学习等相关领域。本发明专利技术将资源和用户的特征分为项目场特征和用户场特征分别进行嵌入,并将两种特征输入神经网络获得高阶场特征,然后按组别对用户和资源进行二阶特征交叉,利用多层神经网络进行高阶特征交叉融合。再对二阶特征交叉结果与高阶特征交叉结果使用sigmoid函数计算点击率,对点击率排序完成资源推荐,该点击率与真实标签通过交叉熵损失函数计算损失,通过对比学习损失优化同一特征在三个场下的不同表征。最后收敛推荐任务中的交叉熵损失和交叉阶段构建的对比损失,以此优化推荐效果。

【技术实现步骤摘要】

本专利技术涉及一种基于对比学习与场因子分解的教育资源推荐方法,属于深度学习、基于上下文的推荐系统以及对比学习相关。


技术介绍

1、推荐系统旨在依据用户与项目的特征为用户匹配点击率最高的项目。当前,推荐系统按其依赖的技术可分为多类,包括基于上下文的推荐、基于序列的推荐、基于知识图谱的推荐、基于图神经网络的推荐。多种推荐的方法适应了不同应用场景下的需要。其中,基于上下文的推荐算法的主流方法是对用户和项目的特征进行交叉,计算不同特征间组合对点击率的贡献。当前,deepfm、wide&deep、xdeepfm等都分为了低阶、高阶特征的交叉,该范式取得了较好的效果。

2、对比学习的概念源自于图像处理、自然语言处理领域,在无监督学习、半监督学习场景下取得了较好的效果。对比学习的核心方法是,将文本、图像、图结构等进行数据增强,从而得到同一数据在不同数据增强策略下的两种表现显示。在图像领域,若将一张狗的图像分别进行小范围的高斯模糊操作、灰度化操作,则会得到两张数据增强的图片,在操作后两张图片仍然可以被识别出图片中的对象为狗。因此,在数据增强后不影响数据的本质,此前,一些模型使用增强的数据进行训练,该方法能够使得模型鲁棒性更强。对比学习的方法则认为,经过增强后的数据如果不改变数据的本质,则在对数据进行向量化表征后,在空间中仍应有相近的空间距离。因此,将增强数据间的空间距离作为一种损失,通过优化该目标获得更好的效果。

3、在公开号为cn115270004b的专利技术专利中,描述了一种基于场因子分解的教育资源推荐方法,该方法构建项目场特征和用户场特征,然后按组别对用户和教育资源进行二阶特征交叉,再利用交叉压缩网络和深度神经网络学习高阶特征,最终对二阶特征交叉结果与高阶特征交叉结果使用线性层和sigmoid函数计算点击率。但此方法仍然存在如下问题:1、项目场特征和用户场特征间同种特征间没有建立联系,其交叉效果可能受此影响。2、该方法采用cin作为高阶特征融合的方式,尽管带来了性能的提升,但也带来了较大的计算开销。


技术实现思路

1、本专利技术针对场因子分解推荐方法中存在的问题,提出了一种基于对比学习和场因子分解的资源推荐方法,在基于场因子分解的教育资源推荐方法的基础上,本方法使用多层神经网络对高阶场特征进行高阶特征交叉融合,同时配合对比学习损失优化同一特征在三个场下的不同表征,收敛交叉熵损失和交叉阶段构建的对比损失,从而优化推荐效果。

2、本专利技术的具体技术方案是:

3、一种基于对比学习与场因子分解的教育资源推荐方法,包括特征表征阶段、特征交叉阶段、预测阶段、训练阶段;

4、在特征表征阶段,将资源和用户的特征分为项目场特征和用户场特征分别进行嵌入得到两个场下的表征,并将两种特征输入神经网络获得高阶场特征;在特征交叉阶段,基于项目场和用户场按组别对用户和资源进行二阶特征交叉,再利用深度神经网络对高阶场特征进行高阶特征融合;在预测阶段,对二阶特征交叉结果与高阶特征融合结果使用sigmoid函数计算点击率,通过对点击率的排序完成资源推荐任务,该点击率与真实标签通过交叉熵损失函数计算损失,同时,通过对比学习损失优化同一特征在三个场下的不同表征;在训练阶段,同时收敛推荐任务中的交叉熵损失和交叉阶段构建的对比损失,以此优化推荐效果。

5、所述资源推荐方法的具体步骤如下:

6、以所有用户对学习资源的全部访问记录为数据总样本,设该样本集中有n个样本,每个样本包含了单个用户对某个资源的单次访问行为的发生;

7、step1、对用户特征和项目特征进行编码;

8、step2、用户场、项目场特征嵌入;

9、step3、基于用户场、项目场进行二阶特征交叉;

10、step4、基于高阶场使用dnn实现高阶特征融合;

11、取用户场特征组、项目场特征组,在嵌入维度上进行拼接后输入神经网络进行降维,得到高阶场特征 ,代表嵌入维度,代表特征种数。然后将高阶场特征输入k层神经网络,计算高阶特征融合结果:

12、

13、式中:表示高阶场融合结果,表示当前层数,为第层网络权重,为第k层网络偏置,其中首层输入为。

14、上式表示多层神经网络中,第k-1层的中间结果,与其下一神经网络层权重相乘并与偏置相加得到第k层结果,层数可按实际应用情况设定。

15、step5、通过sigmoid函数计算点击率:

16、

17、其中,为sigmoid函数,将结果转化至<mi>[0,1]</mi>中,表示二阶特征交叉结果,表示高阶特征融合结果。

18、step6、计算推荐任务的二分类交叉熵损失,基于用户场、项目场、高阶场计算对比学习损失,对比损失的目的是减小同一特征在不同场下的空间距离,利用损失之和训练参数;

19、step6.1、计算推荐任务损失:

20、使用二分类交叉熵损失函数为损失,训练参数,损失函数为:

21、             (10)

22、式中,为样本总量,为样本真实值,为预测值。

23、step6.2、对用户场、项目场、高阶场进行两两组合,分别计算用户场-项目场对比损失、用户场-高阶场对比损失、项目场-高阶场对比损失,该对比损失的目的是拉近同一特征在不同场下的距离:

24、用户场-项目场对比损失,为:

25、

26、用户场-高阶场对比损失,为:

27、

28、项目场-高阶场对比损失,为:

29、

30、式中,τ为温度系数,分别为特征i在用户场、项目场和高阶场下的表达,分别为负样本k在用户场、项目场和高阶场的表达。

31、step6.3、计算总损失:

32、=+++

33、step6.4、依据总损失计算该模型中可训练参数的梯度完成反向传播过程,使用adam优化器进行参数优化。

34、step7、按上述 step1-step5 求取每个用户对每个资源的点击率,对点击率按降序进行排序,选取点击率前几名作为推荐资源,由此完成推荐过程;

35、本专利技术的有益效果是:

36、本专利技术提供一种基于对比学习与场因子分解的教育资源推荐方法,能有效解决当前资源推荐方法准确率低、特征挖掘能力差的问题,可应用在各类不同规模的推荐系统和教育资源推荐数据集上。本专利技术方法具体考虑了用户特征、项目特征和高阶场特征在特征交叉时不同情况下的差异,所提出的基于对比学习和场因子分解的资源推荐方法可以很好地建模特征交叉时的需求,该方法在推荐过程中利用dnn对高阶特征进行特征融合,利用对比学习损失优化同一特征在三个场下的不同表征,可有效提高推荐系统的准确率。

本文档来自技高网...

【技术保护点】

1.一种基于对比学习与场因子分解的教育资源推荐方法,其特征在于,包括特征表征阶段、特征交叉阶段、预测阶段、训练阶段;

2.根据权利要求1所述的基于对比学习与场因子分解的教育资源推荐方法,其特征在于,所述利用深度神经网络进行高阶特征融合,具体步骤如下:

3.根据权利要求1所述的基于对比学习与场因子分解的教育资源推荐方法,其特征在于,所述点击率计算为:

4.根据权利要求1所述的基于对比学习与场因子分解的教育资源推荐方法,其特征在于,所述训练过程包括:计算推荐任务的二分类交叉熵损失,基于用户场、项目场、高阶场计算对比学习损失,利用损失训练参数;具体步骤如下:

【技术特征摘要】

1.一种基于对比学习与场因子分解的教育资源推荐方法,其特征在于,包括特征表征阶段、特征交叉阶段、预测阶段、训练阶段;

2.根据权利要求1所述的基于对比学习与场因子分解的教育资源推荐方法,其特征在于,所述利用深度神经网络进行高阶特征融合,具体步骤如下:

3.根据权利要求1所述...

【专利技术属性】
技术研发人员:周菊香孔宪艳李子杰王俊张姝
申请(专利权)人:云南师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1