【技术实现步骤摘要】
一种跨社交网络用户对齐方法以及装置
[0001]本专利技术主要涉及社交网络分析
,具体涉及一种跨社交网络用户对齐方法以及装置。
技术介绍
[0002]各种功能各异的社交平台极大丰富了人们的生活,但是也使得用户的各类信息散布于各个社交平台中无法整合。因为社交平台的的根源是用户,所以各个社交平台都想独占用户,不愿用户流失,因此各个社交平台之间的信息共享机制缺失,导致用户的数据碎片化。用户数据碎片化导致用户在加入新社交平台时丢失了之前的社交数据,需要重新花费时间构建社交圈,导致用户体验不佳。而对于社交平台而言,新用户加入时没有之前的社交数据,无法知道其社交关系与喜好,无法进行有效的个性化推荐,也为社交平台带来了弊端。跨社交网络用户对齐是通过将多个网络中属于现实世界中同一人的不同账号匹配起来,这对于社交网络领域的多个方面研究或应用都具有重大意义。
[0003]而对社交网络的研究方向可以大致分为三类:基于用户属性的用户对齐技术研究,基于网络结构的用户对齐技术研究,结合属性与网络结构的多因素用户对齐技术研究。其中,结合属性与网络结构的多因素用户对齐技术研究无论是通过网络结构进行用户对齐还是基于属性进行用户对齐,都在近些年取得了不错的效果。既然各种方法都各自有着自己的优势,自然就有学者尝试着将各种方式相结合一起进行用户对齐。现有技术有的是使用社交网络结构和用户档案属性实现用户对齐;有的是将LHNE模型用于跨网络用户对齐任务,该模型同时利用了网络结构和用户文本信息;有的是同时利用网络结构和用户位置信息,采用深度神经网络
【技术保护点】
【技术特征摘要】
1.一种跨社交网络用户对齐方法,其特征在于,包括如下步骤:导入社交网络用户数据,并构建用于进行特征提取的训练模型,根据所述社交网络用户数据对所述训练模型进行优化处理,得到优化模型;导入待测社交网络用户数据,通过所述优化模型对所述待测社交网络用户数据进行对齐处理,得到用户对齐结果。2.根据权利要求1所述的跨社交网络用户对齐方法,其特征在于,所述社交网络用户数据包括携带预设用户编号的多个社交网络用户子数据,每个所述社交网络用户子数包括用户属性信息、结构数据和真实值;所述构建用于进行特征提取的训练模型的过程包括如下步骤:从每个所述社交网络用户子数据中获得用户属性信息,并分别对各个所述用户属性信息进行属性特征提取,得到与各个所述预设用户编号对应的属性特征向量组;从每个所述社交网络用户子数据中获得结构数据,并分别对各个所述结构数据进行结构特征提取,得到与各个所述预设用户编号对应的结构特征向量;从每个所述社交网络用户子数据中获得真实值,并将所有的属性特征向量组、所有的真实值以及所有的结构特征向量一并进行融合损失计算,得到融合损失函数;所述根据所述社交网络用户数据对所述训练模型进行优化处理,得到优化模型的过程包括:根据所述融合损失函数对所述训练模型进行参数更新,得到优化模型。3.根据权利要求2所述的跨社交网络用户对齐方法,其特征在于,所述用户属性信息包括邻居节点信息和多个用户属性参数,多个所述用户属性信息两两对应;所述分别对各个所述用户属性信息进行属性特征提取,得到与所述预设用户编号对应的属性特征向量组的过程包括:分别对与所述预设用户编号对应的多个所述用户属性参数进行单词特征提取,得到与所述用户属性参数对应的多个单词特征向量;分别对各个所述单词特征向量进行信息的平衡处理,得到与所述单词特征向量对应的单词平衡向量;通过TextCNN卷积网络分别对多个所述单词平衡向量进行局部特征提取,得到与所述用户属性参数对应的局部特征向量组;分别对各个所述局部特征向量组进行评估处理,得到与所述用户属性参数对应的语义特征向量;通过第一式分别对与所述预设用户编号对应的多个所述语义特征向量进行融合,得到与所述预设用户编号对应的融合属性特征向量,所述第一式为:其中,z
ik
为预设用户编号i的第k个属性的语义特征向量,γ
k
∈R,γ
k
为要学习的相应加权参数,v
i
为融合属性特征向量,m为预设用户编号对应的语义特征向量的个数;根据各个所述邻居节点信息得到与所述预设用户编号相邻的预设用户编号,并将所述相邻的预设用户编号对应的融合属性特征向量作为邻居属性特征向量;
分别对两两对应的所述用户属性信息各自所对应的所述融合属性特征向量以及与各自的所述融合属性特征向量对应的多个所述邻居属性特征向量进行向量融合,得到与所述预设用户编号对应的属性特征向量组。4.根据权利要求3所述的跨社交网络用户对齐方法,其特征在于,所述分别对与所述预设用户编号对应的多个所述用户属性参数进行单词特征提取,得到与所述用户属性参数对应的多个单词特征向量的过程包括:分别对与所述预设用户编号对应的多个所述用户属性参数进行单词划分,得到与各个所述用户属性参数对应的多个单词信息,并将各个所述单词信息转换为单词向量;分别对各个所述单词信息进行字符划分,得到与所述单词信息对应的多个字符信息,并将各个所述字符信息转换为字符向量;通过预设一维卷积层分别对各个所述字符向量进行特征提取,得到与所述字符向量对应的字符特征向量;通过预设最大池化层分别对各个所述字符特征向量进行筛选,经筛选得到与所述单词信息对应的多个字符筛选向量;分别对各个所述单词向量和与所述单词向量对应的多个字符筛选向量进行向量拼接,得到与所述单词向量对应的单词特征向量。5.根据权利要求3所述的跨社交网络用户对齐方法,其特征在于,所述分别对各个所述单词特征向量进行信息的平衡处理,得到与所述单词特征向量对应的单词平衡向量的过程包括:通过第二式分别对各个所述单词特征向量进行信息平衡处理,得到与所述单词特征向量对应的单词平衡向量,所述第二式为:z=t
⊙
g(W
H
h+b
H
)+(1
‑
t)
⊙
h,其中,t=σ(W
T
h+b
T
),其中,W
H
和W
T
均为方阵,b
H
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。