System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于特征权重感知与二阶特征选择的商品推荐方法及系统技术方案_技高网
当前位置: 首页 > 专利查询>重庆大学专利>正文

基于特征权重感知与二阶特征选择的商品推荐方法及系统技术方案

技术编号:40927576 阅读:9 留言:0更新日期:2024-04-18 14:50
本发明专利技术属于商品推荐技术领域,具体公开了一种基于特征权重感知与二阶特征选择的商品推荐方法及系统,该方法获取原始数据集,并进行稀疏编码,通过嵌入层将高维的稀疏向量转换为低维的稠密嵌入特征向量,从不同尺度计算不同嵌入特征的注意力权重,以及单个稠密嵌入特征向量内部元素的注意力权重,计算所有二阶特征与目标任务的相关性;将获取的二阶交互特征向量拼接成单个向量后,输入深度神经网络,获取高阶特征交互结果;根据高阶特征交互结果,计算目标商品的点击概率的预测值,基于该预测值,决定是否对用户推荐该商品。采用本技术方案,从不同尺度计算输入的不同嵌入特征的注意力权重,对二阶交互特征进行选择,提高目标商品的推荐精准率。

【技术实现步骤摘要】

本专利技术属于商品推荐,涉及一种基于特征权重感知与二阶特征选择的商品推荐方法及系统


技术介绍

1、在大规模工业级推荐系统、广告系统中,点击率(ctr)预测是非常重要的环节,其任务是估计用户点击推荐项目的概率。每提升一点点击率预估模型的准确性,都能给互联网公司带来更好的营收以及提升用户的使用体验,同时引导用户发现自己的信息需求,向用户推荐其感兴趣的信息和商品,极大地提升交易成交率。

2、近年来,受深度学习在计算机视觉和自然语言处理中取得成功的启发,基于深度学习的方法被提出用于点击率预测任务。这些方法遵循相似的嵌入层结合多层感知机范式:首先将大规模稀疏输入特征映射为低维嵌入向量,然后以分组方式将其转换为定长向量,最后将其连接在一起,输入多层感知机,学习特征之间的非线性关系。与常用的逻辑回归模型相比,这些深度学习方法可以减少大量的特征工程工作,大大增强模型能。

3、然而,现有的大多数基于嵌入层结合多层感知机范式模型仅仅对输入特征进行建模,通过权重拟合特征和样本的关系,并没有考虑到对于不同的目标商品而言,特征之间的重要性也是不同的,忽略了嵌入特征本身的差异性,从而导致目标商品的推荐精准率欠佳。


技术实现思路

1、本专利技术的目的在于提供一种基于特征权重感知与二阶特征选择的商品推荐方法及系统,提高目标商品的推荐精准率。

2、为了达到上述目的,本专利技术的基础方案为:一种基于特征权重感知与二阶特征选择的商品推荐方法,包括如下步骤:

3、获取用户信息、商品信息、上下文信息和用户实时行为,作为原始数据集;

4、将原始数据进行稀疏编码,通过嵌入层将高维的稀疏向量转换为低维的稠密嵌入特征向量;

5、基于多尺度特征权重感知机制,从不同尺度计算不同嵌入特征的注意力权重,以及单个稠密嵌入特征向量内部元素的注意力权重;

6、基于二阶重要性特征选择机制,计算所有二阶特征与目标任务的相关性,获取二阶交互特征向量;

7、将获取的二阶交互特征向量拼接成单个向量后,输入深度神经网络,通过非线性变换学习高维特征交互,获取高阶特征交互结果;

8、根据高阶特征交互结果,计算目标商品的点击概率的预测值,基于该预测值,决定是否对用户推荐该商品。

9、本基础方案的工作原理和有益效果在于:本技术方案能够从不同尺度计算输入的不同嵌入特征的注意力权重,还能计算单个嵌入特征向量内部元素的注意力权重,更加细腻地衡量了不同特征的重要性程度。

10、同时,该方法对二阶交互特征进行选择,筛选出与目标任务相关程度高的二阶交互特征参与后续计算,丢弃与目标任务不相关或者相关程度低的二阶交互特征。从而对于不同的用户和目标商品而言,能够实现更加个性化的推荐,商品推荐结果也更符合用户的实际潜在兴趣,提高目标商品的推荐精准率。

11、进一步,所述用户信息包括性别、是否是高消费群体和注册时间;

12、所述商品信息包括价格、类目、折扣和评价;

13、所述上下文信息包括当前时间和商品展示位置;

14、所述用户实时行为包括用户浏览目标商品的时间点前浏览的商品类目。

15、获取相应信息,便于后续使用。

16、进一步,将原始输入进行稀疏编码,通过嵌入层将高维的稀疏向量转换为低维的稠密嵌入特征向量,具体步骤如下:

17、对每一条原始数据记录进行编码,用0-1编码的稀疏向量来表示记录中的类别信息;

18、通过一个嵌入层将每一个稀疏高维的向量映射为一个低维稠密的嵌入特征向量,嵌入层的输出为:

19、e=[e1,e2,..,ei,...,ef]

20、其中,f代表域的数量,ei∈rk则表示第i个域的嵌入特征向量,向量的维度为k。

21、将原始输入的类别特征进行one-hot编码,如果是一个连续特征,则是它本身;然后通过嵌入层将高维的稀疏向量转换为低维的稠密嵌入特征向量。

22、进一步,计算不同嵌入特征的注意力权重,以及单个稠密嵌入特征向量内部元素的注意力权重的方法为:

23、通过4个并行的不同尺寸的可分离卷积模块,获取4个不同尺度的权重注意力图,具体步骤如下:

24、首先对输入的嵌入特征分别采用卷积核大小为2×2,3×3,6×6和12×12的可分离卷积进行卷积操作,然后使用1×1卷积将通道数压缩到1,最后将特征图上采样到和输入特征一致,表示为:

25、attention1=upsample(conv1x1(s-conv2x2(e)))

26、attention2=upsample(conv1x1(s-conv3x3(e)))

27、attention3=upsample(conv1x1(s-conv6x6(e)))

28、attention4=upsample(conv1x1(s-conv12x12(e)))

29、其中,attention1-4表示分别从分支1到分支4得到的注意力图,e=[e1,e2,…,ef]表示嵌入层输出的嵌入特征集合,f代表域的数量;s-conv2x2表示2×2可分离卷积,s-conv3x3表示3×3可分离卷积,s-conv6x6表示6×6可分离卷积,s-conv12x12表示12×12可分离卷积;conv1x1表示1×1卷积,upsample表示双线性插值上采样;

30、获取最终的注意力图和对特征加权:将4个权重注意力图进行拼接,通过1x1卷积生成最终的注意力图,基于该注意力图对输入的嵌入特征进行加权:attention=conv1x1(concat(attention1,attention2,attention3,attention4))

31、v=attntion⊙[e1,e2,…,ef]=[v1,v2,…,vf]

32、其中,attention表示生成得到的最终注意力图,v表示经过加权后获得的权重特征向量,⊙表示哈达玛乘积,concat表示拼接操作。

33、对于不同的目标商品,不同的特征应有不同的权重,所以需要通过多尺度特征权重感知机制动态地增大重要特征的权重,同时减少无关特征的权重。

34、进一步,基于二阶重要性特征选择机制,计算所有二阶特征与目标任务的相关性,获取二阶交互特征向量的方法如下:

35、获取经加权后的嵌入特征vi和嵌入特征vj的二阶交互特征向量pij:

36、pij=vi⊙vj

37、将pij与代表目标商品的嵌入特征向量vitem拼接后送入两个全连接层,得到临时相关性系数,同时计算pij和vitem的余弦相似度,将两个结果想乘得到最终的相关性系数:

38、relation=σ2(w2σ1(w1[pij,vitem]))×cos(pij,vitem)

39、其中,relation表示二阶特征pij和目本文档来自技高网...

【技术保护点】

1.一种基于特征权重感知与二阶特征选择的商品推荐方法,其特征在于,包括如下步骤:

2.如权利要求1所述的基于特征权重感知与二阶特征选择的商品推荐方法,其特征在于,所述用户信息包括性别、是否是高消费群体和注册时间;

3.如权利要求1所述的基于特征权重感知与二阶特征选择的商品推荐方法,其特征在于,将原始输入进行稀疏编码,通过嵌入层将高维的稀疏向量转换为低维的稠密嵌入特征向量,具体步骤如下:

4.如权利要求1所述的基于特征权重感知与二阶特征选择的商品推荐方法,其特征在于,计算不同嵌入特征的注意力权重,以及单个稠密嵌入特征向量内部元素的注意力权重的方法为:

5.如权利要求1所述的基于特征权重感知与二阶特征选择的商品推荐方法,其特征在于,基于二阶重要性特征选择机制,计算所有二阶特征与目标任务的相关性,获取二阶交互特征向量的方法如下:

6.如权利要求1所述的基于特征权重感知与二阶特征选择的商品推荐方法,其特征在于,获取高阶特征交互结果的方法为:

7.如权利要求1所述的基于特征权重感知与二阶特征选择的商品推荐方法,其特征在于,根据高阶特征交互结果ydnn,计算目标商品的点击概率的预测值为:

8.如权利要求1所述的基于特征权重感知与二阶特征选择的商品推荐方法,其特征在于,引入损失函数Logloss,优化预测结果:

9.一种基于权利要求1-8之一所述方法的商品推荐系统,其特征在于,包括依次连接的离散特征输入层、嵌入层、二阶重要特征选择层、连接层、DNN隐藏层和预测层;

...

【技术特征摘要】

1.一种基于特征权重感知与二阶特征选择的商品推荐方法,其特征在于,包括如下步骤:

2.如权利要求1所述的基于特征权重感知与二阶特征选择的商品推荐方法,其特征在于,所述用户信息包括性别、是否是高消费群体和注册时间;

3.如权利要求1所述的基于特征权重感知与二阶特征选择的商品推荐方法,其特征在于,将原始输入进行稀疏编码,通过嵌入层将高维的稀疏向量转换为低维的稠密嵌入特征向量,具体步骤如下:

4.如权利要求1所述的基于特征权重感知与二阶特征选择的商品推荐方法,其特征在于,计算不同嵌入特征的注意力权重,以及单个稠密嵌入特征向量内部元素的注意力权重的方法为:

5.如权利要求1所述的基于特征权重感知与二阶特征选择的商品推荐方法,其特征在于,...

【专利技术属性】
技术研发人员:李承幸尚赵伟
申请(专利权)人:重庆大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1