当前位置: 首页 > 专利查询>厦门大学专利>正文

一种基于图神经网络的噪声数据下的商品推荐方法技术

技术编号:34697440 阅读:17 留言:0更新日期:2022-08-27 16:33
一种基于图神经网络的噪声数据下的商品推荐方法,涉及商品推荐领域。通过设计噪声数据纠正与数据动态增强方法,提升实际应用场景中噪声数据下商品推荐效果。包括:1)初始学习阶段:初步学习数据集中用户和商品的特征表达,使模型具有识别能力;2)数据纠正阶段:利用模型预测用户集对商品集的感兴趣概率,将概率矩阵与设定的概率阈值比较,纠正用户

【技术实现步骤摘要】
一种基于图神经网络的噪声数据下的商品推荐方法


[0001]本专利技术涉及商品推荐领域,尤其是涉及商品推荐、点击率预测和社交网络等领域的一种基于图神经网络的噪声数据下的商品推荐方法。

技术介绍

[0002]信息技术的普及使得互联网上的数据飞速增长,其中空间拓扑图结构的数据更是层出不穷,如商品推荐、社交网络、通信网络等。对于过载的拓扑图结构信息,向用户推荐其感兴趣的信息是一件困难的事情,这是当前互联网时代发展过快的负面影响之一。互联网上的信息过载会导致信息难以有效整合,同时大量的冗余信息也会影响用户使用体验。如何帮助用户在海量空间拓扑图结构数据中找到其感兴趣的数据成为一个备受关注的问题。
[0003]协同过滤算法是个性化推荐算法中经典的算法之一,在商品推荐领域得到广泛的应用,该算法可以针对性地向用户推荐他们所需要的信息,其核心思想是向用户推荐与该用户类似的用户所感兴趣的信息。
[0004]随着空间拓扑图结构数据的实际场景的增加,图卷积神经网络在生物网络、通信网络、社交网络等拓扑图结构数据上相较于传统神经网络模型表现十分出色。通信网络、电商网络中抽象意义的图结构被引入到神经网络模型中,用于表示空间拓扑图结构数据,从而用于神经网络的训练。引入图结构数据的神经网络称为图神经网络,这种基于图结构的神经网络模型相比于传统神经网络模型在空间拓扑图数据上有着更加优秀的表现,同时拥有着更广阔的应用场景。
[0005]中国专利CN201811549358.4公开一种商品推荐方法、装置及服务器。获取历史会话数据,包括:用户浏览的商品的序列、以及浏览各商品对应的时间戳;根据所述历史会话数据,获取至少一个商品组合;针对每个商品组合,根据第一商品的浏览频次、商品组合的浏览频次、第二商品与第一商品之间间隔的商品数量、以及第一商品至第二商品之间各商品的浏览停留时长,获取第二商品相对于第一商品的跳转相关性;针对每个第一商品,根据各商品组合获取第一商品对应的各所述第二商品,并根据各第二商品相对于第一商品的跳转相关性,对各第二商品进行排序,得到第一商品对应的推荐商品列表。
[0006]中国专利CN201811584362.4公开一种商品推荐方法及移动终端,所述商品推荐方法包括:根据参考商品的第一参数,建立所述参考商品的推荐列表;获取用户的需求信息;展示所述参考商品中,与所述需求信息匹配的目标商品的推荐列表;其中,所述推荐列表中包括所述目标商品的保质期信息。
[0007]中国专利CN202110444726.4公开一种基于多模态商品特征融合的商品推荐方法;包括:根据用户已经购买的商品序列构建用户商品二分图,通过图卷积得到用户节点的向量表示和商品节点的向量表示;通过卷积神经网络对商品得到的评论文本进行特征提取,得到商品评论的向量表示;通过卷积神经网络对商品的标题和描述信息进行特征提取,得到商品内容的向量表示;将商品节点、评论和内容的向量表示连接得到商品的最终表示,将用户节点的向量表示作为用户的最终表示。
[0008]现有的个性化图推荐方法通常忽略实际应用场景中图数据集的噪声数据,例如用户误点击商品的交互等记录,因此纠正实际应用场景中噪声数据是具有重要意义的。通过设计噪声数据纠正方法与数据动态增强方法,可以提升实际应用场景中噪声数据下的商品推荐的效果。

技术实现思路

[0009]本专利技术的目的在于针对现有技术存在的上述问题,提供一种基于图神经网络的噪声数据下的商品推荐方法。通过初始学习阶段、数据纠正阶段和数据动态增强阶段,以增加或删除边的方式动态纠正用户

商品之间误标注的交互关系,并且直接编码到图结构中,使得模型聚焦于有效的数据训练,从而提升实际应用场景中噪声数据下的商品推荐的效果。
[0010]本专利技术包括以下步骤:
[0011]1)获取图推荐数据集:包含用户集、商品集和用户

商品交互关系集,所述用户

商品交互关系集中含有噪声数据,即用户

商品之间并无交互关系,但数据中误将两者标注为有交互关系,或者用户

商品之间存在交互关系,但数据中没有标注交互关系;
[0012]2)获取嵌入矩阵:将用户信息和商品信息初始化成多维的嵌入信息,图中用户和商品的嵌入信息聚合在一起后,得到嵌入矩阵;
[0013]3)模型训练阶段:包括初始学习阶段、数据纠正阶段和数据动态增强阶段;初始学习阶段的训练使得图神经网络模型具有一定的识别能力;数据纠正阶段的训练可以纠正数据集中的噪声数据,即纠正用户

商品之间误标注的交互关系;数据动态增强阶段的训练使得用户之间的相似性和商品之间的相似性直接以增加或删除边的形式动态编码到图结构中,降低图神经网络模型对高阶连通性的依赖,自适应捕获用户集和商品集各自的内部关系;模型训练过程中,通过损失函数对模型提取的特征进行约束,进而训练出能表达用户和商品特征的嵌入信息;
[0014]4)模型预测阶段:预测用户对商品感兴趣的概率,按概率值进行排序,返回用户感兴趣的商品集合。
[0015]在步骤1)中,所述获取图推荐数据集的具体步骤为:首先将用户集表示为U={u1,u2,u3,...,u
n
},其中,n代表用户的数量,将商品集表示为I={i1,i2,i3,...,i
m
},其中,m代表商品的数量;然后将用户

商品的交互关系集表示为Y∈R
|U|
×
|I|
,其中,y
u,i
=1代表用户u与商品i有交互关系,y
u,i
=0代表用户u与商品i没有交互关系;最后通过用户集、商品集和用户

商品交互关系集构建一个无向图G,其中无向图G通过邻接矩阵A表示。
[0016]在步骤2)中,所述嵌入信息用于表达用户或商品特征的向量,将图中用户和商品的嵌入信息聚合在一起后,得到嵌入矩阵其中,e
u
代表无向图中的用户u的嵌入信息,e
i
代表无向图中的商品i的嵌入信息,其中d代表嵌入信息的维度。
[0017]在步骤3)中,所述初始学习阶段,图神经网络模型初步学习图推荐数据集中用户和商品的特征表达,使得模型具有一定的识别能力,初始化模型参数矩阵,将初始化的嵌入矩阵E输入到由两层图卷积层构成的图卷积模块;在训练过程中,模型对上一层节点i和节点j的嵌入信息的和进行点积并与原本的信息聚合,对于每个图卷积层而言,都会
将上一层的得到的嵌入矩阵E
(l

1)
输作为本层的输入,再将这一层嵌入矩阵E
(l)
的作为下一层的输入,最后经过LeakyReLU激励层;嵌入矩阵E经过层层传播捕获图中用户和商品之间的交互关系,从而准确表达出用户和商品的嵌入信息;在经过T轮的初始学习阶段训练后,模型进入数据纠正阶段和数据动态增强阶段训练。
[0018]所述嵌入矩阵的训本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于图神经网络的噪声数据下的商品推荐方法,其特征在于包括以下步骤:1)获取图推荐数据集:包含用户集、商品集和用户

商品交互关系集,所述用户

商品交互关系集中含有噪声数据,即用户

商品之间并无交互关系,但数据中误将两者标注为有交互关系,或者用户

商品之间存在交互关系,但数据中没有标注交互关系;2)获取嵌入矩阵:将用户信息和商品信息初始化成多维的嵌入信息,图中用户和商品的嵌入信息聚合在一起后,得到嵌入矩阵;3)模型训练阶段:包括初始学习阶段、数据纠正阶段和数据动态增强阶段;初始学习阶段的训练使得图神经网络模型具有一定的识别能力;数据纠正阶段的训练可以纠正数据集中的噪声数据,即纠正用户

商品之间误标注的交互关系;数据动态增强阶段的训练使得用户之间的相似性和商品之间的相似性直接以增加或删除边的形式动态编码到图结构中,降低图神经网络模型对高阶连通性的依赖,自适应捕获用户集和商品集各自的内部关系;模型训练过程中,通过损失函数对模型提取的特征进行约束,进而训练出能表达用户和商品特征的嵌入信息;4)模型预测阶段:预测用户对商品感兴趣的概率,按概率值进行排序,返回用户感兴趣的商品集合。2.如权利要求1所述一种基于图神经网络的噪声数据下的商品推荐方法,其特征在于在步骤1)中,所述获取图推荐数据集的具体步骤为:首先将用户集表示为U={u1,u2,u3,...,u
n
},其中,n代表用户的数量,将商品集表示为I={i1,i2,i3,...,i
m
},其中,m代表商品的数量;然后将用户

商品的交互关系集表示为Y∈R
|U|
×
|I|
,其中,y
u,i
=1代表用户u与商品i有交互关系,y
u,i
=0代表用户u与商品i没有交互关系;最后通过用户集、商品集和用户

商品交互关系集构建一个无向图G,其中无向图G通过邻接矩阵A表示。3.如权利要求1所述一种基于图神经网络的噪声数据下的商品推荐方法,其特征在于在步骤2)中,所述嵌入信息用于表达用户或商品特征的向量,将图中用户和商品的嵌入信息聚合在一起后,得到嵌入矩阵其中,e
u
代表无向图中的用户u的嵌入信息,e
i
代表无向图中的商品i的嵌入信息,其中d代表嵌入信息的维度。4.如权利要求1所述一种基于图神经网络的噪声数据下的商品推荐方法,其特征在于在步骤3)中,所述初始学习阶段,图神经网络模型初步学习图推荐数据集中用户和商品的特征表达,使得模型具有一定的识别能力,初始化模型参数矩阵,将初始化的嵌入矩阵E输入到由两层图卷积层构成的图卷积模块;在训练过程中,模型对上一层节点i和节点j的嵌入信息的和进行点积并与原本的信息聚合,对于每个图卷积层而言,都会将上一层的得到的嵌入矩阵E
(l

1)
输作为本层的输入,再将这一层嵌入矩阵E
(l)
的作为下一层的输入,最后经过LeakyReLU激励层;嵌入矩阵E经过层层传播捕获图中用户和商品之间的交互关系,从而准确表达出用户和商品的嵌入信息;在经过T轮的初始学习阶段训练后,模型进入数据纠正阶段和数据动态增强阶段训练;所述嵌入矩阵的训练方法可为:(1)在信息构造过程中,通过累加多层嵌入传播层的嵌入信息,再利用高阶连通性建模,得到最终的节点嵌入信息;假设当前在第l层嵌入传播过程中,嵌入信息由节点j流向节点i,信息构造公式为:
其中,是由邻接矩阵A得到的拉普拉斯矩阵,是从节点j流向节点i的信息,和是上一层节点i和节点j的嵌入信息,W1、W2是可训练的参数矩阵;在高阶传播过程中,模型会对上一层节点i和节点j的嵌入信息的和行点积并与原本的信息聚合,使得上一层的特征能更多地保留下来,从而提高嵌入信息的表达能力;当节点i和节点j都是用户或商品时,将节点之间的相似性编码进嵌入信息中,使得节点i与节点j在向量空间上的距离更近;当节点i是用户,节点j是商品时,将节点之间的交互信息编码到嵌入信息中;(2)在信息聚合过程中,通过累加当前层节点的嵌入信息和相邻节点的嵌入信息聚合出当前层的嵌入信息;假设当前在第l层嵌入传播,节点q的相邻的用户节点为u,相邻的商品节点为i,节点q删除的相邻的用户节点为u

,删除的相邻的商品节点为i

;节点q的相邻节点的信息聚合公式如下:其中,节点q可以指代用户节点或者商品节点,N(
·
)代表节点的相邻节点集合,代表经过第l次嵌入传播后的节点q的嵌入信息,δ(
·
)为LeakyReLU激励函数。5.如权利要求1所述一种基于图神经网络的噪声数据下的商品推荐方法,其特征在于在步骤3)中,所述数据纠正阶段,每隔三轮训练进行一次用户

商品交互关系的纠正;经过初始学习阶段的训练,图神经网络模型具有一定的识别能力,利用模型预测用户集U对商品集I的感兴趣的概率,得到概率矩阵P∈R
|U|
×
|I|
,其中,p
u,i
代表用户u对商品i感兴趣的概率;将p
u,i
与设定的概率阈值比较,判断当前用户u对商品i的交互关系是否为噪声数据,若超出设定概率范围,则认定为噪声数据,进行噪声数据纠正;纠正用户

商品之间误标注的交互关系,使模型聚焦于正确的数据训练,从而提高训练效果。6.如权利要求5所述一种基于图神经网络的噪声数据下的商品推荐方法,其特征在于所述数据纠正阶段,具体步骤为:(1)利用初始学习阶段训练的模型得到每一层的用户...

【专利技术属性】
技术研发人员:张德富邱雷
申请(专利权)人:厦门大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1