一种基于图神经网络与协同关系挖掘的兴趣点推荐方法技术

技术编号:38826706 阅读:21 留言:0更新日期:2023-09-15 20:06
本发明专利技术涉及一种基于图神经网络与协同关系挖掘的兴趣点推荐方法,包括:对原始兴趣点签到数据集进行预处理;根据每个兴趣点被用户签到的总次数计算每个兴趣点的流行度;利用kmeans算法对兴趣点进行聚类得到兴趣点的目标类别标签;将用户和兴趣点作为节点,用户和兴趣点之间的签到关系作为边构建用户兴趣点关系二部图;根据用户兴趣点关系二部图中用户节点的隐式关系节点和用户对兴趣点的签到时间利用基于多头自注意力机制的图神经网络提取用户节点在图神经网络中所有隐藏层的特征表示;利用Softmax计算得到兴趣点推荐列表;向用户进行推荐概率值高于设定阈值的兴趣点,本发明专利技术有助于兴趣点推荐服务商提高兴趣点推荐的精度。的精度。的精度。

【技术实现步骤摘要】
一种基于图神经网络与协同关系挖掘的兴趣点推荐方法


[0001]本专利技术属于兴趣点推荐领域,具体涉及一种基于图神经网络与协同关系挖掘的兴趣点推荐方法。

技术介绍

[0002]近年来,基于位置的社交网络得到快速发展,导致大量的商家、用户数据快速增长,这对用户和服务提供商而言都是巨大的机遇;通过对海量的LBSN数据的分析挖掘,可以帮助服务提供商向用户推荐精准的兴趣点(Point of Interest,POI)服务。而下一个兴趣点推荐能够预测用户在指定时间点最有可能访问的兴趣点,其应用场景时效强使得下一个兴趣点推荐成为推荐领域中的研究热点问题。由于兴趣点惊人的增长速度,兴趣点推荐服务商很难在短暂时间内向用户推荐令其满意的兴趣点。兴趣点推荐不但能够为LBSN服务提供商带来经济效益,还能为用户挖掘潜在喜好,进而为生活带来乐趣与便利。对于用户而言,准确有效的兴趣点推荐服务能够帮助用户了解生活环境进而做出访问决策,提高生活乐趣以及了解所在城市。对于商家而言,为用户提供精准的兴趣点推荐能够获取一定的经济效益,提高平台知名度,此外,还能够为用户提供个性化服务以提高用户体验,进而为服务商家分析出用户的个性化喜好特征,挖掘出热门兴趣点区域范围以实现精准营销。
[0003]近年来,随着图结构数据的无处不在,基于图模型挖掘的研究被广泛用于推荐系统中。基于图挖掘的兴趣点推荐模型通过将历史轨迹转换为图结构学习节点特征,能够更好地挖掘不同用户之间存在的隐式关系。研究团队通过构建兴趣点推荐中的四类图,挖掘序列影响、地理影响、时间周期影响和语义影响。为能够解决节点嵌入问题,有研究提出了一种边采样策略,通过权重成正比的概率对边进行抽样。为能够通过多层网络学习包含隐式关系的节点特征,研究团队提出了神经图协同过滤模型,在高阶连接图上通过消息传递机制将用户之间的隐式协同信号融合进节点特征的学习中。此外知识图注意力网络被用来挖掘协同信号,将基于属性的协同信号融入基于知识图注意力网络中。为加快学习效率,研究者提出了一种子图采样机制,将序列信息结合进协同信号的学习中。然而,上述工作大多数针对描述特征(例如ID或其他属性)进行建模,而基于协同信号学习嵌入揭示用户与兴趣点之间潜在交互过程的研究有待进一步探索。
[0004]虽然对兴趣点推荐模型进行了大量的研究,并取得了较好的成果,但仍存在一些挑战:
[0005]1、缺乏通过直接挖掘隐式关系的目标特征以加强身特征学习。
[0006]2、在图神经网络中,能够较好地挖掘节点依赖,但缺乏对节点时空特征或序列特征的挖掘,导致推荐准确性不高、推荐效果不好的问题。

技术实现思路

[0007]为了解决
技术介绍
中存在的问题,本专利技术提供一种基于图神经网络与协同关系挖掘的兴趣点推荐方法,包括:
[0008]S1:获取原始兴趣点签到数据集,并对原始兴趣点签到数据集进行预处理;所述原始兴趣点签到数据包括:兴趣点的ID、用户的ID、用户对兴趣点的签到时间、兴趣点的初始类别标签和兴趣点的坐标;
[0009]S2:根据原始兴趣点签到数据集中每个兴趣点被用户签到的总次数计算每个兴趣点的流行度;根据兴趣点的流行度、兴趣点的初始类别和兴趣点的坐标利用kmeans算法对兴趣点进行聚类得到兴趣点的目标类别标签;
[0010]S3:将用户对兴趣点的签到时间转换为以小时进行表示;将用户和兴趣点作为节点,用户和兴趣点之间的签到关系作为边构建用户兴趣点关系二部图;
[0011]S4:根据用户兴趣点关系二部图中用户节点的隐式关系节点和用户对兴趣点的签到时间利用基于多头自注意力机制的图神经网络提取用户节点在图神经网络中所有隐藏层的特征表示;
[0012]S5:根据用户节点在图神经网络中所有隐藏层的特征表示和所有兴趣点的初始特征向量利用Softmax计算得到兴趣点推荐列表;选择概率值高于设定阈值的兴趣点向用户进行推荐。
[0013]优选地,对原始兴趣点签到数据集进行预处理,包括:
[0014]对原始兴趣点签到数据集进行数据清洗,统计清洗后原始兴趣点签到数据集中每个用户对所有兴趣点的签到总次数和每个兴趣点被所有用户签到的总次数;其中,若某个用户对所有兴趣点的签到总次数小于签到阈值,则删除关于该用户的所有数据,若兴趣点被所有用户签到的总次数小于签到阈值,则删除关于该兴趣点的所有数据。
[0015]优选地,所述利用kmeans算法对兴趣点进行聚类得到兴趣点的目标类别标签包括:
[0016]S21:选取k个兴趣点作为中心点;
[0017]S22:根据兴趣点的流行度、兴趣点的初始类别和兴趣点的坐标定义损失函数:
[0018][0019]其中,haversine(v
i
,v
j
)表示兴趣点v
i
和v
j
坐标之间的距离;count(vi)和count(vj)分别表示兴趣点v
i
和v
j
被签到的总次数,popu(v
i
)和popu(vi)分别表示兴趣点v
i
和v
j
的流行度;s
i,j
表示兴趣点v
i
和v
j
的类别相似度,c(v
i
)和c(v
j
)分别表示兴趣点v
i
和v
j
的类别标签,dis(v
i
,v
j
)表示损失函数;v
j
属于中心点集合;len函数计算列表长度。
[0020]S23:令t=0,1,2,...为迭代步数,重复如下过程,直到损失函数收敛;
[0021]S23:对每一个兴趣点,将其分配到距离最近的中心点所属的簇;
[0022]S24:对于每一个簇,重新计算该类簇的中心点;当损失函数收敛后将兴趣点所属簇对应的类别标签作为兴趣点的目标类别标签。
[0023]优选地,所述将用户对兴趣点的签到时间转换为以小时进行表示包括:
[0024]初始时刻t表示为0小时,将在[t,t+60min*1)区间内用户对兴趣点的签到时间表示为第0个小时,将在[t+60min*1,t+60min*2)区间内用户对兴趣点的签到时间表示为第1个小时,

,将在区间[t+60min*n,t+60min*(n+1))区间内用户对兴趣点的签到时间表示为第n个小时,将所有用户兴趣点的签到时间转换为以小时进行表示。
[0025]优选地,所述利用基于多头自注意力机制的图神经网络提取用户节点在图神经网络中所有隐藏层的特征包括:
[0026]图神经网络包括:输入层、输出层和多个隐藏层;在每一个隐藏层中进行如下操作:
[0027]S41:根据用户节点的隐式关系节点提取用户节点的隐式协同信号特征,具体如下所示:
[0028][0029]其中,表示图神经网络第l

1个隐藏层中用户节点u本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于图神经网络与协同关系挖掘的兴趣点推荐方法,其特征在于,包括:S1:获取原始兴趣点签到数据集,并对原始兴趣点签到数据集进行预处理;所述原始兴趣点签到数据包括:兴趣点的ID、用户的ID、用户对兴趣点的签到时间、兴趣点的初始类别标签和兴趣点的坐标;S2:根据原始兴趣点签到数据集中每个兴趣点被用户签到的总次数计算每个兴趣点的流行度;根据兴趣点的流行度、兴趣点的初始类别和兴趣点的坐标利用kmeans算法对兴趣点进行聚类得到兴趣点的目标类别标签;S3:将用户对兴趣点的签到时间转换为以小时进行表示;将用户和兴趣点作为节点,用户和兴趣点之间的签到关系作为边构建用户兴趣点关系二部图;S4:根据用户兴趣点关系二部图中用户节点的隐式关系节点和用户对兴趣点的签到时间利用基于多头自注意力机制的图神经网络提取用户节点在图神经网络中所有隐藏层的特征表示;S5:根据用户节点在图神经网络中所有隐藏层的特征表示和所有兴趣点的初始特征向量利用Softmax计算得到兴趣点推荐列表;选择概率值高于设定阈值的兴趣点向用户进行推荐。2.根据权利要求1所述的一种基于图神经网络与协同关系挖掘的兴趣点推荐方法,其特征在于,对原始兴趣点签到数据集进行预处理,包括:对原始兴趣点签到数据集进行数据清洗,统计清洗后原始兴趣点签到数据集中每个用户对所有兴趣点的签到总次数和每个兴趣点被所有用户签到的总次数;其中,若某个用户对所有兴趣点的签到总次数小于签到阈值,则删除关于该用户的所有数据,若兴趣点被所有用户签到的总次数小于签到阈值,则删除关于该兴趣点的所有数据。3.根据权利要求1所述的一种基于图神经网络与协同关系挖掘的兴趣点推荐方法,其特征在于,所述利用kmeans算法对兴趣点进行聚类得到兴趣点的目标类别标签包括:S21:选取k个兴趣点作为中心点;S22:根据兴趣点的流行度、兴趣点的初始类别和兴趣点的坐标定义损失函数:其中,haversine(v
i
,v
j
)表示兴趣点v
i
和v
j
坐标之间的距离;count(v
i
)和count(v
j
)分别表示兴趣点v
i
和v
j
被签到的总次数,popu(v
i
)和popu(v
i
)分别表示兴趣点v
i
和v
j
的流行度;s
i,j
表示兴趣点v
i
和v
j
的类别相似度,c(v
i
)和c(v
j
)分别表示兴趣点v
i
和v
j
的类别标签,dis(v
i
,v
j
)表示损失函数;v
j
属于中心点集合;len函数计算列表长度。S23:令t=0,1,2,...为迭代步数,重复如下过程,直到损失函数收敛;S23:对每一个兴趣点,将其分配到距离最近的中心点所属的簇;
S24:对于每一个簇,重新计算该类簇的中心点;当损失函数收敛后将兴趣点所属簇对应的类别标签作为兴趣点的目标类别标签。4.根据权利要求1所述的一种基于图神经网络与协同关系挖掘的兴趣点推荐方法,其特征在于,所述将用户对兴趣点的签到时间转换为以小时进行表示包括:初始时刻t表示为0小时,将在[t,k+60min*1)区间内用户对兴趣点的签到时间表示为第0个小时,将在[t+60min*1,t+60min*2)区间内用户对兴趣点的签到时间表示为第1个小时,

,将在区间[t+60min*n,t+60min*(n+1))区间内用户对兴趣点的签到时间表示为第...

【专利技术属性】
技术研发人员:桑春艳易星宇廖世根
申请(专利权)人:重庆邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1