System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于深度属性图聚类的社交网络分析方法技术_技高网
当前位置: 首页 > 专利查询>山西大学专利>正文

一种基于深度属性图聚类的社交网络分析方法技术

技术编号:43403655 阅读:2 留言:0更新日期:2024-11-22 17:43
本发明专利技术公开了一种基于深度属性图聚类的社交网络分析方法,属于聚类分析和社交网络分析技术领域。针对图数据存在噪声与稀疏性并且忽略浅层特征的问题,本发明专利技术通过对数据进行预处理得到属性特征矩阵和邻接矩阵;构建双路径并行的自适应深度属性图聚类网络;在第一条路径中,使用自编码器模块提取数据的潜在特征;在第二条路径中,使用自适应图自编码器模块逐层交替更新图结构和数据表示;使用注意力融合模块对自适应图自编码器模块和自编码器模块学习到的表示进行加权融合;使用双重自监督聚类模块对融合后的表示进行聚类,得到伪标签完成分析。本发明专利技术能动态地将数据的图结构信息和特征信息进行自适应更新,有助于反映社交网络中的复杂关系,提高社交网络分析的准确性。

【技术实现步骤摘要】

本专利技术属于聚类分析和社交网络分析,具体涉及一种基于深度属性图聚类的社交网络分析方法


技术介绍

1、社交网络数据是指用户在社交平台上产生的各类信息集合,包括用户个人资料、发布的内容(如文字、图片、视频)、互动行为(点赞、评论、分享、关注等)以及形成的社交关系网络。这些数据的目的旨在揭示用户的兴趣、行为模式、社交结构等特征,为个性化推荐、广告精准投放、社会趋势分析、舆情监测等提供数据支持。其意义在于帮助个人更好地管理自己的社交生活,同时也为企业、研究机构等提供决策参考和市场洞察。然而,实际问题中的社交网络数据往往包含复杂的节点(如用户)和边(如关系、互动)结构,这一特性导致现有方法难以对其进行建模。此外,社交网络数据中往往存在大量的稀疏性和缺失值,致使现有方法无法有效捕捉节点之间的潜在联系和完整信息,从而影响数据分析的准确性和可靠性。

2、深度属性图聚类是指通过深度学习模型学习图数据的节点表示,并利用这些表示进行图上的聚类分析。它利用深度学习技术自动学习并提取社交网络数据中的复杂结构特征,并且可以通过学习节点的属性特征和邻居信息,对稀疏数据进行一定程度的填充和修复。因此,可以通过深度属性图聚类方法对社交网络数据进行更准确地建模。尽管深度属性图聚类在社交网络数据分析领域展现了良好效果,但仍面临两大挑战:一是图数据的噪声与稀疏性,导致相似节点间连接缺失或错误边存在,影响图神经网络中的信息传递,降低节点表示学习质量;二是现有方法常忽视多层中的多尺度信息整合,忽略浅层特征,限制了聚类模型的全面性和准确性,进而影响了最终的分析效果和决策支持能力。


技术实现思路

1、针对图数据存在噪声与稀疏性并且忽略浅层特征的问题,本专利技术提出了一种基于深度属性图聚类的社交网络分析方法。该方法既融合了不同层次的多尺度信息,又自适应的根据融合特征表示更新图结构,使其学习到更好的特征表示,从而有助于社交网络分析。

2、为了达到上述目的,本专利技术采用了下列技术方案:

3、一种基于深度属性图聚类的社交网络分析方法,包括以下步骤:

4、步骤1,获取社交网络数据集,对数据集进行预处理,得到属性特征矩阵和邻接矩阵;

5、步骤2,构建双路径并行的自适应深度属性图聚类网络,其包括自编码器模块、自适应图自编码器模块、注意力融合模块以及双重自监督聚类模块;

6、步骤3,将属性特征矩阵和邻接矩阵输入到双路径并行的自适应深度属性图聚类网络,通过最小化各个模块的损失对网络进行训练,得到伪标签,完成社交网络分析。

7、进一步,所述步骤1的具体方法是:使用社交网站提供的社交网络数据集或通过api接口使用网页爬虫技术在社交媒体平台上获取的用户信息、关系网络数据组成社交网络数据集,对数据集进行预处理,得到属性特征矩阵和邻接矩阵。

8、进一步,所述步骤2的具体方法包括以下步骤:

9、步骤2.1,通过自编码器模块将属性特征矩阵进行重构,提取潜在的属性特征表示;

10、步骤2.2,通过自适应图自编码器模块将属性特征矩阵x和邻接矩阵a进行重构,捕获数据的结构特征表示;

11、步骤2.3,通过注意力融合模块将自编码器模块和自适应图自编码器模块中同一层编码器学习到的特征表示进行注意力融合得到融合特征表示,并基于融合特征表示学习得到一个新的图结构;将新构建的图结构与原图结构进行融合,更新原图结构;

12、步骤2.4,通过双重自监督聚类模块采用双路径协同训练的方式对网络进行优化。

13、进一步,所述步骤2.1,通过自编码器模块将属性特征矩阵进行重构,提取潜在的属性特征表示具体包括以下步骤:

14、步骤2.1.1,将属性特征矩阵x传入到自编码器模块,通过编码器学习有用的属性特征表示;

15、具体地,由编码器部分中的第(l)层学习的属性特征表示h(l):

16、

17、其中,ψ(·)表示带泄露的修正线性单元(leaky rectified linearunit)的激活函数,和分别表示编码器第(l)层的权重矩阵和偏置;

18、将h(0)表示为属性特征矩阵x;

19、步骤2.1.2,将潜在的属性特征表示传入解码器重构属性特征矩阵x,得到重构的属性特征矩阵

20、

21、其中,和分别表示解码器第(l)层的权重矩阵和偏置;

22、将h(2l)表示为重构的属性特征矩阵

23、其自编码器模块的重构损失如下:

24、

25、其中,表示自编码器模块的重构损失,n表示样本的数量,xi表示样本i的属性特征,表示样本i的重构属性特征,表示f范数。

26、进一步,所述步骤2.2,通过自适应图自编码器模块将属性特征矩阵x和邻接矩阵a进行重构,捕获数据的结构特征表示具体包括以下步骤:

27、步骤2.2.1,将图数据中的属性特征矩阵x和邻接矩阵a传入到自适应图自编码器模块,通过图编码器学习到结构特征表示z(l):

28、

29、其中,φ(·)表示修正线性单元(rectified linearunit)的激活函数,i是单位矩阵,并且表示图编码器的权重矩阵,此外,z(0)表示为属性特征矩阵x;

30、步骤2.2.2,从第二层开始使用上一层的融合表示f(l)和更新后的图结构a(l),其表达式变为如下:

31、

32、当经过图编码器的第五层后,得到最终的联合特征表示z;

33、步骤2.2.3,将最终的联合特征表示z传入图解码器,从而得到重构的特征矩阵

34、

35、其中,表示图解码器的权重矩阵,此外,z(l)表示重构的特征矩阵

36、步骤2.2.4,将属性特征矩阵x和邻接矩阵a进行重构:

37、

38、其中,重构的邻接矩阵是最终的联合特征表示z的内积与重构的特征矩阵的内积之和;

39、其自适应图自编码器模块的重构损失如下:

40、

41、

42、

43、进一步,所述步骤2.3,通过注意力融合模块将自编码器模块和自适应图自编码器模块中同一层编码器学习到的特征表示进行注意力融合得到融合特征表示,并通过该融合特征表示学习得到一个新的图结构,与原图结构融合,从而更新图结构具体包括以下步骤:

44、步骤2.3.1,将自编码器学习到的潜在的属性特征表示h(l)传入两层gnn中,从而学习更好的属性特征表示

45、

46、其中,表示gnn中的权重矩阵;

47、步骤2.3.2,将自适应图自编码器模块学习的结构特征表示z(l)和更好的属性特征表示连接在一起得到级联特征表示y(l):

48、

49、其中,[,]表示连接操作;

50、步骤2.3.3,利用级联特征表示,根本文档来自技高网...

【技术保护点】

1.一种基于深度属性图聚类的社交网络分析方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于深度属性图聚类的社交网络分析方法,其特征在于:所述步骤1的具体方法是:使用社交网站提供的社交网络数据集或使用网页爬虫技术在社交媒体平台上获取的用户信息、关系网络数据组成社交网络数据集,对数据集进行预处理,得到属性特征矩阵和邻接矩阵。

3.根据权利要求1所述的一种基于深度属性图聚类的社交网络分析方法,其特征在于:所述步骤2的具体方法包括以下步骤:

4.根据权利要求1所述的一种基于深度属性图聚类的社交网络分析方法,其特征在于:所述步骤2.1,通过自编码器模块将属性特征矩阵进行重构,提取潜在的属性特征表示具体包括以下步骤:

5.根据权利要求1所述的一种基于深度属性图聚类的社交网络分析方法,其特征在于:所述步骤2.2,通过自适应图自编码器模块将属性特征矩阵X和邻接矩阵A进行重构,捕获数据的结构特征表示具体包括以下步骤:

6.根据权利要求1所述的一种基于深度属性图聚类的社交网络分析方法,其特征在于:所述步骤2.3,通过注意力融合模块将自编码器模块和自适应图自编码器模块中同一层编码器学习到的特征表示进行注意力融合得到融合特征表示,并通过该融合特征表示学习得到一个新的图结构,与原图结构融合,从而更新图结构具体包括以下步骤:

7.根据权利要求1所述的一种基于深度属性图聚类的社交网络分析方法,其特征在于:所述步骤2.4,通过双重自监督聚类模块同时指导两条路径的网络进行优化训练具体包括以下步骤:

8.根据权利要求1所述的一种基于深度属性图聚类的社交网络分析方法,其特征在于:所述步骤3的具体操作是:训练阶段网络总体目标损失函数包括三部分,即自编码器模块的重构损失、自适应图自编码器模块的重构损失和双重自监督聚类模块的聚类损失;

...

【技术特征摘要】

1.一种基于深度属性图聚类的社交网络分析方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于深度属性图聚类的社交网络分析方法,其特征在于:所述步骤1的具体方法是:使用社交网站提供的社交网络数据集或使用网页爬虫技术在社交媒体平台上获取的用户信息、关系网络数据组成社交网络数据集,对数据集进行预处理,得到属性特征矩阵和邻接矩阵。

3.根据权利要求1所述的一种基于深度属性图聚类的社交网络分析方法,其特征在于:所述步骤2的具体方法包括以下步骤:

4.根据权利要求1所述的一种基于深度属性图聚类的社交网络分析方法,其特征在于:所述步骤2.1,通过自编码器模块将属性特征矩阵进行重构,提取潜在的属性特征表示具体包括以下步骤:

5.根据权利要求1所述的一种基于深度属性图聚类的社交网络分析方法,其特征在于:所述步骤2.2,通过自适应图自编码器模块将属性特征矩...

【专利技术属性】
技术研发人员:曹付元王晋瑞陈庆强
申请(专利权)人:山西大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1