当前位置: 首页 > 专利查询>重庆大学专利>正文

一种社交网络中用户未来交互行为预测方法技术

技术编号:34733695 阅读:14 留言:0更新日期:2022-08-31 18:23
本发明专利技术公开了一种社交网络中用户未来交互行为预测方法,该该方法为:通过社区感知的时序有偏游走获得t

【技术实现步骤摘要】
一种社交网络中用户未来交互行为预测方法


[0001]本专利技术属于动态时序数据的信息识别处理
,具体涉及一种社交网络中用户未来交互行为预测方法。

技术介绍

[0002]互联网大数据背景下,如何有效的利用用户的社交信息,并实现精确的内容,商品和服务等方面的推荐具有重要的商业价值。而巨大的用户量,随着地域、年龄、性别、爱好等信息的不同,个性化的需求也不同。真实世界的用户行为呈现某种程度的周期性,同时又一直随着时间而发生演化,如何有效捕捉社交网络中用户周期性的行为,并且又能及时的更新用户的最新的行为模式(用户社交的演化)是当前研究的重点和难点。
[0003]当前的预测模型,针对网络巨大的信息量,纷纷采用了嵌入降维的思路来实现网络的节点表示。将网络从|V|*|V|的维度降低到|V|*P,P<<|V|,研究者提出许多方法来获得网络的低维嵌入表示,如基于矩阵分解(SVD)、基于Skip

gram(DeepWalk,Node2Vec),基于自动编码器(SDNE)等等。绝大部分研究的方法都是基于静态的网络,而真实世界中的网络是动态的,具有演化动力的。静态的模型由于处理的是静态的数据,当网络结构发生改变的时候,往往需要重新训练,花费巨大的计算代价。同时,此类方法无法有效的捕捉网络的演化行为。

技术实现思路

[0004]本专利技术所要解决的技术问题在于针对上述现有技术的不足,提供了一种社交网络中用户未来交互行为预测方法,该方法能够提供更准确的用户未来的链路预测效果,对未来的交互行为进行有效预测。
[0005]为解决上述技术问题,本专利技术采用的技术方案是:一种社交网络中用户未来交互行为预测方法,该方法包括:
[0006]S1、通过社区感知的时序有偏游走获取第t

ttl时段至第t时段节点的初始编码向量和邻域序列;节点指社区内的用户;
[0007]S2、采用第t

ttl时段至第t时段节点的初始编码向量和邻域序列在DyCDUP模型联合表示学习中进行训练,直到满足预设的训练条件,DyCDUP模型训练结束,输出节点的最终特征向量;所述DyCDUP模型依次包括邻域注意力层和时序注意力层;邻域注意力层用于聚合同一社区结构内节点的交互情况,时序注意力层用于沿时段捕捉节点之间交互的演化情况;
[0008]S3、利用S2中输出节点的最终特征向量,选择两个样本节点的最终特征向量进行hadmard编码得到两个样本节点的交互特征向量,联合两个样本节点的真实交互情况做正负采样,正采样指已发生的所有交互信息,负采样指已存在的交互中未发生的交互,采样的结果用来训练逻辑回归分类器;
[0009]S4、从节点的最终特征向量集合中,挑选两个目标节点的特征向量组成交互特征
向量输入训练好的逻辑回归分类器,预测出两个目标节点的未来交互概率。
[0010]优选的,S1中通过社区感知的时序有偏游走获取第(t

ttl)个时段至第t个时段节点的初始编码向量,包括:
[0011]以第t时段中最后交互发生的时间为初始时间t

,t

=max(E
t
),节点按照时间逆向游走,每次根据随机游走概率在邻域邻居中选择出下一个节点,重复选择下一个节点多次,直到游走序列达到l次,且每个节点作为起始节点游走ω次,从而获得节点由社区感知的游走序列,根据所述游走序列通过word2vec算法得到第t时段节点的初始编码向量;所述的邻域邻居包括时序邻居Γ
t(v)
和社区邻居C
t(v)

[0012]具体地,节点在k时刻的游走选择下一个节点是通过以下规则进行:
[0013]基于设定的社区感知的随机游走参数δ,每次选择下一个节点时,生成一个随机数r,依据随机游走概率选择下一个节点,当r≥δ时,下一个节点从k时刻的时序邻居中选择作为下一个的节点,否则,选择相同社区中的社区邻居的一个节点作为下一个节点;
[0014]所述随机游走概率的函数为:其中,δ表示随机游走参数,r表示随机数,P
temporal
(k)表示k时刻的时序邻居被选择的概率;P
community
(k)表示k时刻的相同社区内社区邻居被选择的概率。
[0015]S1中所述邻域序列的获取包括:
[0016]根据所述获得节点由社区感知的游走序列,得到节点的邻域序列nodeSeq={(v1,t1)

(v2,t2)
→…→
(v
i
,t
i
)
→…→
(v
l
,t
l
)},v
i
∈V,t1≥t2≥

≥t
i


≥t
l
,即节点序列按照时间戳降序排列,依次遍历每一条时间逆向游走后的邻域序列,取邻域序列中节点前后固定个数节点加入该节点的邻域集合Ns。
[0017]优选的,S2中所述DyCDUP模型中邻域注意力层训练时的计算方法包括:
[0018]将第t

ttl时段至第t个时段的节点的初始编码向量定义为D维向量,通过对邻域注意力层的权重公式计算,将D维向量转化为具有F维的节点向量;所述的权重系数的计算公式为:
[0019][0020]其中,α
uv
表示节点u相对节点v的权重系数;邻域集合是从第i个时段中节点v的邻域序列NodeSeq中获取的,V表示网络中的节点集合,T'表示交互事件发生的时间戳集合,E
t
表示t时刻网络中所有节点的交互集合,节点v前后预设数个节点作为邻域集合m是邻域集合Ns中的一个节点,W是一个转移矩阵;a是邻域注意力层的模型函数的权重向量参数;||表示串联运算,σ是非线性激活函数,A
uv
表示当前动态网络时刻G
i
中边(u,v)的权重,表示i时刻节点v的初始编码向量;
[0021]根据相对于节点v的权重系数,计算第i个时段v节点的邻域嵌入;计算公式
为:
[0022]其中σ表示激活函数LeakyRELU,表示第i时段节点v的初始编码向量,W
s
表示邻域注意力层的转移矩阵,表示第i时段节点u相对节点v的权重系数;
[0023]对所述邻域嵌入的向量采用hs个多头机制的拆分,得到子向量,在子向量之间进行自注意力计算,对于节点所得的嵌入向量多头机制的具体计算公式为:
[0024][0025][0026][0027][0028]其中表示邻域注意力层在i时段最终输出的节点v的嵌入表示,将第i时段的各节点最终输出的嵌入向量最终表示为表示t时段网络中所有节点的特征向量集合R
F
,F表示向量维度;qu表示邻域注意力层的query,ke表示邻域注意力层的key,va表示邻域注意本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种社交网络中用户未来交互行为预测方法,其特征在于,该方法包括:S1、通过社区感知的时序有偏游走获取第t

ttl时段至第t时段节点的初始编码向量和邻域序列;节点指社区内的用户;S2、采用第t

ttl时段至第t时段节点的初始编码向量和邻域序列在DyCDUP模型联合表示学习中进行训练,直到满足预设的训练条件,DyCDUP模型训练结束,输出节点的最终特征向量;所述DyCDUP模型依次包括邻域注意力层和时序注意力层;邻域注意力层用于聚合同一社区结构内节点的交互情况,时序注意力层用于沿时段捕捉节点之间交互的演化情况;S3、利用S2中输出节点的最终特征向量,选择两个样本节点的最终特征向量进行hadmard编码得到两个样本节点的交互特征向量,联合两个样本节点的真实交互情况做正负采样,正采样指已发生的所有交互信息,负采样指已存在的交互中未发生的交互,采样的结果用来训练逻辑回归分类器;S4、从节点的最终特征向量集合中,挑选两个目标节点的特征向量组成交互特征向量输入训练好的逻辑回归分类器,预测出两个目标节点的未来交互概率。2.根据权利要求1所述的一种社交网络中用户未来交互行为预测方法,其特征在于,S1中通过社区感知的时序有偏游走获取第(t

ttl)个时段至第t个时段节点的初始编码向量,包括:以第t时段中最后交互发生的时间为初始时间t

,t

=max(E
t
),节点按照时间逆向游走,每次根据随机游走概率在邻域邻居中选择出下一个节点,重复选择下一个节点多次,直到游走序列达到l次,且每个节点作为起始节点游走ω次,从而获得节点由社区感知的游走序列,根据所述游走序列通过word2vec算法得到第t时段节点的初始编码向量;所述的邻域邻居包括时序邻居Γ
t(v)
和社区邻居C
t(v)
;具体地,节点在k时刻的游走选择下一个节点是通过以下规则进行:基于设定的社区感知的随机游走参数δ,每次选择下一个节点时,生成一个随机数r,依据随机游走概率选择下一个节点,当r≥δ时,下一个节点从k时刻的时序邻居中选择作为下一个的节点,否则,选择相同社区中的社区邻居的一个节点作为下一个节点;所述随机游走概率的函数为:其中,δ表示随机游走参数,r表示随机数,P
temporal
(k)表示k时刻的相同社区内时序邻居被选择的概率;P
community
(k)表示k时刻的相同社区内社区邻居被选择的概率。S1中所述邻域序列的获取包括:根据所述获得节点由社区感知的游走序列,得到节点的邻域序列nodeSeq={(v1,t1)

(v2,t2)
→…→
(v
i
,t
i
)
→…→
(v
l
,t
l
)},v
i
∈V,t1≥t2≥

≥t
i


≥t
l
,即节点序列按照时间戳降序排列,依次遍历每一条时间逆向游走后的邻域序列,取邻域序列中节点前后固定个数节点加入该节点的邻域集合Ns。3.根据权利要求2所述的一种社交网络中用户未来交互行为预测方法,其特征在于,S2中所述DyCDUP模型中邻域注意力层训练时的计算方法包括:将第t

ttl时段至第t个时段的节点的初始编码向量定义为D维向量,通过对邻域注意力层的权重公式计算,将D维向量转化为具有F维的节点向量;所述的权重系数的计算公式
为:其中,α
uv
表示节点u相对节点v的权重系数;邻域集合是从第i个时段中节点v的邻域序列NodeSeq中获取的,V表示网络中的节点集合,T'表示交互事件发生的时间戳集合,E
t
表示t时刻网络中所有节点的交互集合,节点v前后预设数个节点作为邻域集合m是邻域集合Ns中的一个节点,W是一个转移矩阵;a是邻域注意力层的模型函数的权重向量参数;||表示串联运算,σ是非线性激活函数,A
uv
表示当前动态网络时刻G
i
中边(u,v)的权重,表...

【专利技术属性】
技术研发人员:杨宇航
申请(专利权)人:重庆大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1