一种跨社交网络用户对齐方法以及装置制造方法及图纸

技术编号:30076982 阅读:13 留言:0更新日期:2021-09-18 08:32
本发明专利技术提供一种跨社交网络用户对齐方法及装置,方法包括:导入社交网络用户数据,并构建用于进行特征提取的训练模型,根据社交网络用户数据对训练模型进行优化处理,得到优化模型,导入待测社交网络用户数据,通过优化模型对待测社交网络用户数据进行对齐处理,得到用户对齐结果。本发明专利技术能够提取区分性语义特征,减少网络结构信息的稀疏性,大大地提高了跨社交网络用户对齐的准确性。交网络用户对齐的准确性。交网络用户对齐的准确性。

【技术实现步骤摘要】
一种跨社交网络用户对齐方法以及装置


[0001]本专利技术主要涉及社交网络分析
,具体涉及一种跨社交网络用户对齐方法以及装置。

技术介绍

[0002]各种功能各异的社交平台极大丰富了人们的生活,但是也使得用户的各类信息散布于各个社交平台中无法整合。因为社交平台的的根源是用户,所以各个社交平台都想独占用户,不愿用户流失,因此各个社交平台之间的信息共享机制缺失,导致用户的数据碎片化。用户数据碎片化导致用户在加入新社交平台时丢失了之前的社交数据,需要重新花费时间构建社交圈,导致用户体验不佳。而对于社交平台而言,新用户加入时没有之前的社交数据,无法知道其社交关系与喜好,无法进行有效的个性化推荐,也为社交平台带来了弊端。跨社交网络用户对齐是通过将多个网络中属于现实世界中同一人的不同账号匹配起来,这对于社交网络领域的多个方面研究或应用都具有重大意义。
[0003]而对社交网络的研究方向可以大致分为三类:基于用户属性的用户对齐技术研究,基于网络结构的用户对齐技术研究,结合属性与网络结构的多因素用户对齐技术研究。其中,结合属性与网络结构的多因素用户对齐技术研究无论是通过网络结构进行用户对齐还是基于属性进行用户对齐,都在近些年取得了不错的效果。既然各种方法都各自有着自己的优势,自然就有学者尝试着将各种方式相结合一起进行用户对齐。现有技术有的是使用社交网络结构和用户档案属性实现用户对齐;有的是将LHNE模型用于跨网络用户对齐任务,该模型同时利用了网络结构和用户文本信息;有的是同时利用网络结构和用户位置信息,采用深度神经网络完成用户对齐任务。但是上述方法均没有提取出区分性语义特征,且网络结构信息的稀疏性对用户对齐准确率造成了极大的影响。

技术实现思路

[0004]本专利技术所要解决的技术问题是针对现有技术的不足,提供一种跨社交网络用户对齐方法以及装置。
[0005]本专利技术解决上述技术问题的技术方案如下:一种跨社交网络用户对齐方法,包括如下步骤:
[0006]导入社交网络用户数据,并构建用于进行特征提取的训练模型,根据所述社交网络用户数据对所述训练模型进行优化处理,得到优化模型;
[0007]导入待测社交网络用户数据,通过所述优化模型对所述待测社交网络用户数据进行对齐处理,得到用户对齐结果。
[0008]本专利技术的有益效果是:通过构建用于进行特征提取的训练模型,根据社交网络用户数据对训练模型的优化处理得到优化模型,通过优化模型对待测社交网络用户数据的对齐处理得到用户对齐结果,能够提取区分性语义特征,减少网络结构信息的稀疏性,大大地提高了跨社交网络用户对齐的准确性。
附图说明
[0009]图1为本专利技术实施例提供的跨社交网络用户对齐方法的流程示意图;
[0010]图2为本专利技术实施例提供的跨社交网络用户对齐装置的模块框图。
具体实施方式
[0011]以下结合附图对本专利技术的原理和特征进行描述,所举实例只用于解释本专利技术,并非用于限定本专利技术的范围。
[0012]图1为本专利技术实施例提供的跨社交网络用户对齐方法的流程示意图。
[0013]如图1所示,一种跨社交网络用户对齐方法,包括如下步骤:
[0014]导入社交网络用户数据,并构建用于进行特征提取的训练模型,根据所述社交网络用户数据对所述训练模型进行优化处理,得到优化模型;
[0015]导入待测社交网络用户数据,通过所述优化模型对所述待测社交网络用户数据进行对齐处理,得到用户对齐结果。
[0016]上述实施例中,通过构建用于进行特征提取的训练模型,根据社交网络用户数据对训练模型的优化处理得到优化模型,通过优化模型对待测社交网络用户数据的对齐处理得到用户对齐结果,能够提取区分性语义特征,减少网络结构信息的稀疏性,大大地提高了跨社交网络用户对齐的准确性。
[0017]可选地,作为本专利技术的一个实施例,所述社交网络用户数据包括携带预设用户编号的多个社交网络用户子数据,每个所述社交网络用户子数包括用户属性信息、结构数据和真实值;所述构建用于进行特征提取的训练模型的过程包括如下步骤:
[0018]从每个所述社交网络用户子数据中获得用户属性信息,并分别对各个所述用户属性信息进行属性特征提取,得到与各个所述预设用户编号对应的属性特征向量组;
[0019]从每个所述社交网络用户子数据中获得结构数据,并分别对各个所述结构数据进行结构特征提取,得到与各个所述预设用户编号对应的结构特征向量;
[0020]从每个所述社交网络用户子数据中获得真实值,并将所有的属性特征向量组、所有的真实值以及所有的结构特征向量一并进行融合损失计算,得到融合损失函数;
[0021]所述根据所述社交网络用户数据对所述训练模型进行优化处理,得到优化模型的过程包括:
[0022]根据所述融合损失函数对所述训练模型进行参数更新,得到优化模型。
[0023]具体地,步骤S1:将含属性信息和结构信息的所述社交网络用户数据进行属性特征向量提取得到用户节点的属性特征向量(即所述属性特征向量组);步骤S2:将含属性信息和结构信息的所述社交网络用户数据进行结构特征向量提取得到用户节点的结构特征向量;步骤S3:以步骤S1和步骤S2的输出为输入,融合属性特征向量(即所述属性特征向量组)与结构特征向量,判定用户对齐结果,与地面真实值(即所述真实)作比较并计算融合损失。
[0024]上述实施例中,分别对各个用户属性信息的属性特征提取得到与各个预设用户编号对应的属性特征向量组,分别对各个结构数据的结构特征提取得到与各个预设用户编号对应的结构特征向量,将所有的属性特征向量组、所有的真实值以及所有的结构特征向量一并进行融合损失计算得到融合损失函数,能够提取区分性语义特征,大大地提高了跨社
交网络用户对齐的准确性。
[0025]可选地,作为本专利技术的一个实施例,所述用户属性信息包括邻居节点信息和多个用户属性参数,多个所述用户属性信息两两对应;所述分别对各个所述用户属性信息进行属性特征提取,得到与所述预设用户编号对应的属性特征向量组的过程包括:
[0026]分别对与所述预设用户编号对应的多个所述用户属性参数进行单词特征提取,得到与所述用户属性参数对应的多个单词特征向量;
[0027]分别对各个所述单词特征向量进行信息的平衡处理,得到与所述单词特征向量对应的单词平衡向量;
[0028]通过TextCNN卷积网络分别对多个所述单词平衡向量进行局部特征提取,得到与所述用户属性参数对应的局部特征向量组;
[0029]分别对各个所述局部特征向量组进行评估处理,得到与所述用户属性参数对应的语义特征向量;
[0030]通过第一式分别对与所述预设用户编号对应的多个所述语义特征向量进行融合,得到与所述预设用户编号对应的融合属性特征向量,所述第一式为:
[0031][0032]其中,z
ik
为预设用户编号i的第k个属性的语义特征向量,γ
k
∈R,γ...

【技术保护点】

【技术特征摘要】
1.一种跨社交网络用户对齐方法,其特征在于,包括如下步骤:导入社交网络用户数据,并构建用于进行特征提取的训练模型,根据所述社交网络用户数据对所述训练模型进行优化处理,得到优化模型;导入待测社交网络用户数据,通过所述优化模型对所述待测社交网络用户数据进行对齐处理,得到用户对齐结果。2.根据权利要求1所述的跨社交网络用户对齐方法,其特征在于,所述社交网络用户数据包括携带预设用户编号的多个社交网络用户子数据,每个所述社交网络用户子数包括用户属性信息、结构数据和真实值;所述构建用于进行特征提取的训练模型的过程包括如下步骤:从每个所述社交网络用户子数据中获得用户属性信息,并分别对各个所述用户属性信息进行属性特征提取,得到与各个所述预设用户编号对应的属性特征向量组;从每个所述社交网络用户子数据中获得结构数据,并分别对各个所述结构数据进行结构特征提取,得到与各个所述预设用户编号对应的结构特征向量;从每个所述社交网络用户子数据中获得真实值,并将所有的属性特征向量组、所有的真实值以及所有的结构特征向量一并进行融合损失计算,得到融合损失函数;所述根据所述社交网络用户数据对所述训练模型进行优化处理,得到优化模型的过程包括:根据所述融合损失函数对所述训练模型进行参数更新,得到优化模型。3.根据权利要求2所述的跨社交网络用户对齐方法,其特征在于,所述用户属性信息包括邻居节点信息和多个用户属性参数,多个所述用户属性信息两两对应;所述分别对各个所述用户属性信息进行属性特征提取,得到与所述预设用户编号对应的属性特征向量组的过程包括:分别对与所述预设用户编号对应的多个所述用户属性参数进行单词特征提取,得到与所述用户属性参数对应的多个单词特征向量;分别对各个所述单词特征向量进行信息的平衡处理,得到与所述单词特征向量对应的单词平衡向量;通过TextCNN卷积网络分别对多个所述单词平衡向量进行局部特征提取,得到与所述用户属性参数对应的局部特征向量组;分别对各个所述局部特征向量组进行评估处理,得到与所述用户属性参数对应的语义特征向量;通过第一式分别对与所述预设用户编号对应的多个所述语义特征向量进行融合,得到与所述预设用户编号对应的融合属性特征向量,所述第一式为:其中,z
ik
为预设用户编号i的第k个属性的语义特征向量,γ
k
∈R,γ
k
为要学习的相应加权参数,v
i
为融合属性特征向量,m为预设用户编号对应的语义特征向量的个数;根据各个所述邻居节点信息得到与所述预设用户编号相邻的预设用户编号,并将所述相邻的预设用户编号对应的融合属性特征向量作为邻居属性特征向量;
分别对两两对应的所述用户属性信息各自所对应的所述融合属性特征向量以及与各自的所述融合属性特征向量对应的多个所述邻居属性特征向量进行向量融合,得到与所述预设用户编号对应的属性特征向量组。4.根据权利要求3所述的跨社交网络用户对齐方法,其特征在于,所述分别对与所述预设用户编号对应的多个所述用户属性参数进行单词特征提取,得到与所述用户属性参数对应的多个单词特征向量的过程包括:分别对与所述预设用户编号对应的多个所述用户属性参数进行单词划分,得到与各个所述用户属性参数对应的多个单词信息,并将各个所述单词信息转换为单词向量;分别对各个所述单词信息进行字符划分,得到与所述单词信息对应的多个字符信息,并将各个所述字符信息转换为字符向量;通过预设一维卷积层分别对各个所述字符向量进行特征提取,得到与所述字符向量对应的字符特征向量;通过预设最大池化层分别对各个所述字符特征向量进行筛选,经筛选得到与所述单词信息对应的多个字符筛选向量;分别对各个所述单词向量和与所述单词向量对应的多个字符筛选向量进行向量拼接,得到与所述单词向量对应的单词特征向量。5.根据权利要求3所述的跨社交网络用户对齐方法,其特征在于,所述分别对各个所述单词特征向量进行信息的平衡处理,得到与所述单词特征向量对应的单词平衡向量的过程包括:通过第二式分别对各个所述单词特征向量进行信息平衡处理,得到与所述单词特征向量对应的单词平衡向量,所述第二式为:z=t

g(W
H
h+b
H
)+(1

t)

h,其中,t=σ(W
T
h+b
T
),其中,W
H
和W
T
均为方阵,b
H

【专利技术属性】
技术研发人员:蔡晓东王鑫岚
申请(专利权)人:桂林电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1