System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于自监督图注意力网络的人员群体预测方法及装置制造方法及图纸_技高网
当前位置: 首页 > 专利查询>广州大学专利>正文

基于自监督图注意力网络的人员群体预测方法及装置制造方法及图纸

技术编号:40198082 阅读:11 留言:0更新日期:2024-01-27 00:02
本发明专利技术公开了一种基于自监督图注意力网络的人员群体预测方法及装置,包括:构建属性图,将属性图输入到改进的GAT模型,得到人员嵌入;将所述属性图中的属性经过拉普拉斯平滑滤波器过滤,对齐改进的GAT模型输出的嵌入特征维度,由此作为改进的GAT模型输出嵌入的监督嵌入;随机遮盖人员嵌入,预测结果计算损失并通过自监督训练模型;利用新的数据得到新人员的嵌入并利用训练好的GAT模型聚类划分人员群体,计算、聚合相似度获得人员群体预测结果。本发明专利技术以改进的GAT模型构建人员群体预测模型获得新节点的嵌入,使用拉普拉斯滤波器过滤后的属性矩阵作为监督嵌入,通过随机遮盖已有嵌入来训练改进的GAT模型,从而提高了人员群体预测方法的通用性和泛化性。

【技术实现步骤摘要】

本专利技术属于图像分类的,具体涉及一种基于自监督图注意力网络的人员群体预测方法及装置


技术介绍

1、随着移动互联网的不断发展,人们都在使用各种社交软件在网络上进行沟通,这形成了丰富的社交网络关系,这些关系蕴藏着很丰富的信息,使用恰当的技术手段可以获取其隐藏的有用信息。在社交网络领域,对于人员群体的研究已经有很多。传统的方法是针对关系网络进行分析,即通过人员互相关注的网络进行研究,这种方法利用到的社交网络的信息很少,因此得到的人员群体的划分并没有很好的效果;现在的方法不仅利用了关系网络,还使用个人资料、用户行为信息作为辅助属性,以求获得更好的人员群体划分效果。随着人工智能技术的发展,研究人员还使用了自然语言处理技术,对人员发过的推文进行处理,使其能作为人员的关键属性,对人员群体划分起到了很好的效果。

2、纵观社交网络人员群体发现的发展动态,针对相关技术的研究可以分为两个阶段。早期,基于模块度的方法进行社区发现是比较流行的方法。这一方法最开始是很有效的,但也仅限于关系网络的处理,对于社交网络中其他信息没有过多的处理,其实效果是受到限制的。近年来,国内外逐渐开始关注机器学习、神经网络等人工智能技术在这一工作中的应用,旨在提升人员群体预测的准确性。研究人员对社交网络中的个人资料、人员行为等属性进行提取,然后应用机器学习的分类或聚类算法进行人员群体划分;最新的研究还提取了人员转发或自己发的推文作为属性,利用图卷积网络(gcn)等技术将推文和关系网络进行无监督学习,将得到的人员嵌入输入聚类或分类算法对人员群体划分。然而,现有的基于gcn的人员嵌入方法,有一个问题是它的权重矩阵维度是固定的,即取决于已有数据集的样本数,如果要预测新人员的群体,在提取人员嵌入时势必会改变权重矩阵的维度,即要对模型进行重新训练;其次,现有技术往往只针对已训练的人员数据进行群体预测,而没有对未训练人员数据进行群体预测。因此,当前提出一种如何进行通用且具有较强的泛化性的群体预测是亟待解决的问题。


技术实现思路

1、本专利技术的主要目的在于克服现有技术的缺点与不足,提供一种基于自监督图注意力网络的人员群体预测方法及装置,本专利技术提出了以改进的gat模型构建人员群体预测模型获得新节点的嵌入,使用拉普拉斯滤波器过滤后的属性矩阵作为监督嵌入,通过随机遮盖已有嵌入来训练改进的gat模型,从而提高了人员群体预测方法的通用性和泛化性。

2、为了达到上述目的,本专利技术采用以下技术方案:

3、第一方面,本专利技术提供了一种基于自监督图注意力网络的人员群体预测方法,包括下述步骤:

4、构建属性图,将所述属性图输入到改进的gat模型,得到人员嵌入;将所述属性图中的属性向量经过拉普拉斯平滑滤波器过滤,然后将过滤后的每个节点的属性向量使用主成分分析pca降维后对齐改进的gat模型输出的嵌入特征维度,由此作为改进的gat模型输出嵌入的监督嵌入;随机遮盖人员嵌入,通过改进的gat模型预测被遮盖的人员嵌入,并计算被遮盖的人员嵌入和监督嵌入的损失,进行自监督学习,得到训练完成后的改进的gat模型;所述属性图以人员作为节点,人员关系网络作为结构特征、推文内容作为节点属性特征;

5、利用新的人员通过自身及其推文内容与已有的人员关系网络,聚合邻居节点的嵌入,得到新人员的嵌入;利用训练好的改进的gat模型将已有人员进行嵌入并聚类,得到群体划分,计算新人员的嵌入与其他人员嵌入的相似度,聚合同一群体的相似度,将新人员划分到相似度最高的群体,获取人员群体预测结果。

6、作为优选的技术方案,所述改进的gat模型的改进方法,具体为:

7、计算每个节点相对邻居节点的注意力系数,即将单层前馈神经网络删除,将经过线性变换的节点i的属性向量进行转置,乘以经过线性变换的节点j的属性向量,得到节点i和节点j的相关系数eij;

8、将相关系数eij输入激活函数保留正值,然后输入到softmax函数中,将相关系数映射到[0,1]之间,得到节点i与节点j的注意力系数aij;

9、经过线性变换的邻居节点的属性向量乘上注意力系数aij,然后将所有邻居节点的输出求和,并输入到sigmoid激活函数得到节点i的嵌入,获取改进的gat模型。

10、作为优选的技术方案,所述改进的gat模型的改进方法,还包括多头注意力机制,具体为:

11、将权重矩阵w和注意力系数aij计算k次,然后将k次嵌入的结果进行平均计算,得到节点i最后的嵌入。

12、作为优选的技术方案,所述将所述属性图中的属性经过拉普拉斯平滑滤波器过滤,具体为:

13、通过人员关系网络的邻接矩阵a经过求和、对称归一化可得到对称归一化的拉普拉斯矩阵计算拉普拉斯矩阵的特征值λ,得到拉普拉斯平滑滤波器的参数构建拉普拉斯平滑滤波器

14、将推文属性矩阵x输入到拉普拉斯平滑滤波器中,得到过滤后的属性矩阵

15、作为优选的技术方案,将过滤后的每个节点的属性向量使用主成分分析pca降维后对齐改进的gat模型输出的嵌入特征维度,由此作为改进的gat模型输出嵌入的监督嵌入,具体为:

16、对过滤后的属性矩阵中所有样本去中心化,然后计算协方差矩阵并进行特征值分解,取最大的f'个特征值所对应的特征向量,组成n*f'维的矩阵,获取降维后的属性矩阵;

17、设定改进后的gat输出嵌入维度f',降维后的属性矩阵中的每个属性向量即为监督嵌入。

18、作为优选的技术方案,所述随机遮盖人员嵌入,通过改进的gat模型预测被遮盖的人员嵌入,并计算被遮盖的人员嵌入和监督嵌入的损失,

19、具体为:随机遮盖当前训练样本数b的10%的节点嵌入,并将其该嵌入置为0,然后通过改进的gat模型预测这被遮盖的节点嵌入,把预测的嵌入与监督嵌入作对比,算出均方误差lossavg,接着使用adam优化器优化损失函数,对改进gat模型的权重矩阵进行优化。

20、作为优选的技术方案,所述得到新人员的嵌入,包括以下步骤:

21、利用新的人员通过自身与已有的人员关系网络,通过网络关系聚合已学习的新人员邻居节点的属性向量;

22、对新人员节点属性向量与新节点邻居的属性向量进行加权求和;

23、经过迭代并求平均值,获取新人员的嵌入。

24、作为优选的技术方案,所述获取人员群体预测结果,包括以下步骤:

25、将节点嵌入通过聚类算法划分群体,得到群体划分;

26、计算新人员的嵌入与节点嵌入余弦相似度,得到n个余弦相似度,通过群体划分,将每个群体的相似度求平均值,选择相似度最高的群体作为新成员的群体,获取人员群体预测结果。

27、第二方面,本专利技术还提供了一种基于自监督图注意力网络的人员群体预测系统,应用于所述的基于自监督图注意力网络的人员群体预测方法,包括初始模型训练模块和人员群体预测模块;

28、所述初始模型训练模块构建属性图,本文档来自技高网...

【技术保护点】

1.基于自监督图注意力网络的人员群体预测方法,其特征在于,包括下述步骤:

2.根据权利要求1所述基于自监督图注意力网络的人员群体预测方法,其特征在于,所述改进的GAT模型的改进方法,具体为:

3.根据权利要求2所述基于自监督图注意力网络的人员群体预测方法,其特征在于,所述改进的GAT模型的改进方法,还包括多头注意力机制,具体为:

4.根据权利要求1所述基于自监督图注意力网络的人员群体预测方法,其特征在于,所述将所述属性图中的属性经过拉普拉斯平滑滤波器过滤,具体为:

5.根据权利要求1所述基于自监督图注意力网络的人员群体预测方法,其特征在于,将过滤后的每个节点的属性向量使用主成分分析PCA降维后对齐改进的GAT模型输出的特征维度,由此作为改进的GAT模型的监督嵌入,具体为:

6.根据权利要求1所述基于自监督图注意力网络的人员群体预测方法,其特征在于,所述随机遮盖人员嵌入,通过改进的GAT模型预测被遮盖的人员嵌入,并计算被遮盖的人员嵌入和监督嵌入的损失,具体为:

7.根据权利要求1所述基于自监督图注意力网络的人员群体预测方法,其特征在于,所述得到新人员的嵌入,包括以下步骤:

8.根据权利要求1所述基于自监督图注意力网络的人员群体预测方法,其特征在于,所述获取人员群体预测结果,包括以下步骤:

9.基于自监督图注意力网络的人员群体预测系统,其特征在于,应用于权利要求1-8中任一项所述的基于自监督图注意力网络的人员群体预测方法,包括初始模型训练模块和人员群体预测模块;

10.一种电子设备,其特征在于,所述电子设备包括:

...

【技术特征摘要】

1.基于自监督图注意力网络的人员群体预测方法,其特征在于,包括下述步骤:

2.根据权利要求1所述基于自监督图注意力网络的人员群体预测方法,其特征在于,所述改进的gat模型的改进方法,具体为:

3.根据权利要求2所述基于自监督图注意力网络的人员群体预测方法,其特征在于,所述改进的gat模型的改进方法,还包括多头注意力机制,具体为:

4.根据权利要求1所述基于自监督图注意力网络的人员群体预测方法,其特征在于,所述将所述属性图中的属性经过拉普拉斯平滑滤波器过滤,具体为:

5.根据权利要求1所述基于自监督图注意力网络的人员群体预测方法,其特征在于,将过滤后的每个节点的属性向量使用主成分分析pca降维后对齐改进的gat模型输出的特征维度,由此作为改进的gat模型的监督嵌入,...

【专利技术属性】
技术研发人员:李树栋陈昭阳韩伟红吴晓波黄小慧黄兹勤李雪斌杨鹏伟唐可可张登辉
申请(专利权)人:广州大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1