System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于关系引导随机游走的社交平台目标用户识别方法技术_技高网

一种基于关系引导随机游走的社交平台目标用户识别方法技术

技术编号:44019489 阅读:3 留言:0更新日期:2025-01-15 01:03
本发明专利技术公开了一种基于关系引导随机游走的社交平台目标用户识别方法,该方法通过将社交平台建模成异质网络,使用异质网络领域的处理方法,可以量化地表示社交平台中的用户、内容及它们的交互,进而通过用户的影响力识别KOL,而将异质网络进行分层,则是能够将社交平台中各种耦合在一起的关系进行分类处理,并通过关系引导的随机游走更好地获取隐藏在社交平台中的高阶语义信息,从而提高社交平台KOL识别的准确性。

【技术实现步骤摘要】

本专利技术涉及社交网络数据处理,特别是涉及一种基于关系引导随机游走的社交平台目标用户识别方法


技术介绍

1、关键意见领袖(key opinion leader,kol)是指在各大社交平台上积极传播分享,在领域内有一定影响力的个人或组织。随着现实生活中的社交平台如微博、b站等快速兴起,各个社交平台上的用户之间会产生海量的交互数据如关注、转发、评论等,这些交互数据揭示着用户相互间的影响力,且在社交平台中存在着一些特殊的用户,这些用户一般被称为kol,是整个社交平台所构成社交网络的核心,具有信息传播范围广、传播速度快的特点。因此,在舆情控制、广告投放等领域,准确有效地识别出这些kol是尤为重要的。

2、现有的社交平台kol识别方法主要包括人工筛选、基于社交网络的方法。人工筛选存在着筛选效率低、工作量大的问题;基于社交网络的方法往往只聚焦于用户本身,而忽略了用户、内容相互之间的关系所包含的语义信息,不能全面体现某一用户对于其它用户的影响力,所以基于社交网络的方法在识别社交平台kol时表现不佳。目前,如何有效提取并利用高阶语义信息,从而提升社交平台kol识别的准确性,是当今kol识别领域的一个重要难题。


技术实现思路

1、为此,本专利技术的目的在于提供一种基于关系引导随机游走的社交平台目标用户识别方法,以深入发掘社交平台用户和内容间高阶语义信息,提升社交平台kol识别的准确性。

2、一种基于关系引导随机游走的社交平台目标用户识别方法,包括以下步骤:

3、步骤s1,获取社交平台中用户、内容的交互数据,并根据用户、内容间的关系构建异质网络;

4、步骤s2,对异质网络进行分层,使得各种类型的用户和内容处于不同网络层,并构建初始特征;

5、步骤s3,将构建的初始特征输入图卷积网络和节点-边交替卷积神经网络,获得用户、内容及它们之间关系的表征向量;

6、步骤s4,根据获得的表征向量,使用关系引导的随机游走进行高阶语义信息采样,获得包含不同网络层交互的随机游走序列;

7、步骤s5,在随机游走序列上,通过语义融合组件,引入距离衰减因子和注意力机制,获得用户的嵌入表示,基于获得用户的嵌入表示进行社交平台目标用户的识别。

8、上述基于关系引导随机游走的社交平台目标用户识别方法,其中,步骤s1具体包括:

9、获取社交平台数据,包括用户、内容和它们相互之间的交互,用户包括读者、作者、视频主,内容包括文章、视频,它们互相之间的交互包括读者对作者和视频主的关注、读者对文章和视频的阅读、作者和视频主对文章和视频的发布,根据用户、内容间的关系构建异质网络ghn=(v,e,a,p),其中,v表示所有用户和内容节点的集合,e表示用户和内容间交互的关系集合,a表示用户和内容节点类型集合,p表示用户和内容间交互关系类型集合。

10、上述基于关系引导随机游走的社交平台目标用户识别方法,其中,步骤s2具体包括:

11、步骤s2.1,分析异质网络中用户和内容节点的类型,对异质网络按用户和内容的节点类型进行分层,得到分层异质网络其中n为所有用户和内容节点类型数量,表示gvhhn中不同层上的子网络,a1、a2、an表示不同的节点类型;

12、步骤s2.2,根据得到的分层异质网络gvhhn构建初始特征向量,设每层的子网络为其中,vl表示第l层的节点集合,el表示第l层的关系集合,在每层的子网络中,提取节点的拉普拉斯矩阵和关系的邻接矩阵并将它们投影到同一特征空间,获得初始特征,包括节点vi的初始特征及关系eij的初始特征

13、上述基于关系引导随机游走的社交平台目标用户识别方法,其中,步骤s3具体包括:

14、步骤s3.1,对于节点vi的初始特征根据下式使用图卷积网络获得节点的表征向量:

15、

16、其中,表示节点vi的表征向量;

17、步骤s3.2,对于关系eij的初始特征根据下式使用节点-边交替卷积神经网络的交互函数,聚合关系相连的用户或内容节点表征以及关系自身的初始特征,获得关系的表征向量:

18、

19、其中,表示节点vi、节点vj间关系的表征向量,表示节点vj的表征向量。

20、上述基于关系引导随机游走的社交平台目标用户识别方法,其中,步骤s4具体包括:

21、在得到的分层异质网络gvhhn的基础上,结合用户和内容的节点表征向量及用户和内容间的关系表征向量,采用关系引导的随机游走进行高阶语义信息的采样,获得包含不同网络层交互的随机游走序列,如下式所示:

22、

23、其中,vsequence表示包含不同网络层交互的随机游走序列集合,表示vsequence中的第1条、第2条、第n条随机游走序列,he表示所有用户和内容间存在的关系表征向量集合,hv表示所有用户和内容节点表征向量集合,rgrw表示关系引导的随机游走,关系引导的随机游走能够区分出不同关系类型间的差异,进而分别处理不同类型的关系,并引导随机游走的方向,发掘社交平台用户和内容间的高阶语义信息,关系引导的随机游走过程中,转移概率的计算如下式所示:

24、

25、其中,表示关系r下从节点vi到节点vj的随机游走转移概率,表示节点vk的表征向量,表示节点vi、节点vk间关系的表征向量,||表示向量的拼接。

26、上述基于关系引导随机游走的社交平台目标用户识别方法,其中,步骤s5具体包括:

27、步骤s5.1,根据用户和内容节点的表征向量,通过语义融合组件,引入距离衰减因子和注意力机制,聚合随机游走序列内的所有用户和内容节点,以及它们之间包含的高阶语义信息,获得用户节点的嵌入向量,距离衰减因子的计算公式为:

28、δt=exp(-λ·t);

29、其中,δt为节点vt对于节点vi的衰减因子,λ是超参数,t表示随机游走序列中当前节点和序列起始节点的距离;

30、注意力机制中的权重计算如下式所示:

31、

32、其中,αit表示节点vt对于节点vi的注意力权重,表示节点vt的表征向量,δk为节点vk对于节点vi的衰减因子,t表示随机游走的总步数;

33、包含高阶语义信息的用户节点特征聚合过程如下式所示:

34、

35、其中,表示聚合后节点vi的嵌入向量,m表示以节点vi为起始节点的随机游走序列数量,表示节点vt在随机游走序列的用户节点表征向量;

36、步骤s5.2,使用多层感知机构建社交平台目标用户识别模型,将用户节点的嵌入向量作为模型的输入,输出为用户节点在社交平台中的重要度得分,从而获得目标用户序列,社交平台目标用户识别模型满足下式:

37、

38、其中,wm和bm表示多层感知机的权重和偏置,表示节点vi的重要度分数;

39、识别模型训练使用mse损失函数,本文档来自技高网...

【技术保护点】

1.一种基于关系引导随机游走的社交平台目标用户识别方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于关系引导随机游走的社交平台目标用户识别方法,其特征在于,步骤S1具体包括:

3.根据权利要求2所述的基于关系引导随机游走的社交平台目标用户识别方法,其特征在于,步骤S2具体包括:

4.根据权利要求3所述的基于关系引导随机游走的社交平台目标用户识别方法,其特征在于,步骤S3具体包括:

5.根据权利要求4所述的基于关系引导随机游走的社交平台目标用户识别方法,其特征在于,步骤S4具体包括:

6.根据权利要求5所述的基于关系引导随机游走的社交平台目标用户识别方法,其特征在于,步骤S5具体包括:

【技术特征摘要】

1.一种基于关系引导随机游走的社交平台目标用户识别方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于关系引导随机游走的社交平台目标用户识别方法,其特征在于,步骤s1具体包括:

3.根据权利要求2所述的基于关系引导随机游走的社交平台目标用户识别方法,其特征在于,步骤s2具体包括:

4....

【专利技术属性】
技术研发人员:王诺言舒坚刘琳岚
申请(专利权)人:南昌航空大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1