一种网络表征算法稳定性度量方法技术

技术编号:21034545 阅读:24 留言:0更新日期:2019-05-04 05:31
一种网络表征算法稳定性度量方法,该方法利用网络表征算法保留网络节点之间关系的特点,使用表征空间中节点的最近邻集合是否一致来判断稳定性大小;对一个网络采用某种表征方法映射到多维连续稠密的向量空间中,利用余弦相似度计算每一个节点距离它最近的前K个节点作为稳定性测量的基础;对一个网络采用同一个表征方法多次产生多个向量空间,对于一个节点计算在多个向量空间中最近邻集合的相似性,包括节点的重合率,重合节点的排位信息。本发明专利技术可有效的测量不同算法在不同网络集上的稳定性表现,从而进一步可以揭示网络表征的稳定性受何种因素影响,影响的大小有多少。

A Method for Measuring the Stability of Network Representation Algorithms

【技术实现步骤摘要】
一种网络表征算法稳定性度量方法
本专利技术属于网络与图表征算法领域,涉及一种网络表征算法稳定性度量方法。
技术介绍
图类型的数据结构是社交、生物和信息网络的基本离散表示形式,然而对于需要基于连续特征的机器学习任务来说很难进行泛化应用。所以最近研究人员提出了一系列学习节点的连续表征(保留节点之间关系信息)的方法。事实证明,网络表征在下游任务中十分有效,例如节点分类和聚类、链路预测和网络对齐。但是网络表征方法也存在一定问题,Zügner方法(参考Zügner的方法:DanielZügner,AmirAkbarnejad,andStephanGünnemann.2018.Adversarialattacksonneuralnetworksforgraphdata.InProc.ofSIGKDD.ACM,2847–2856.)表明当节点之间的关系受到干扰或不稳定时,它将显著降低基于神经网络的节点分类方法的准确性。最近在自然语言处理(NLP)领域中的研究已经证明,不同表征空间中单词的最近邻集合是变化的,表明单词的向量化存在大量的不稳定性。通过实验我们发现这种不稳定同样存在与网络表征空间中,与词向量相比,网络表征算法的不稳定性具有特定的影响因素,例如DeepWalk方法(参考DeepWalk方法:BryanPerozzi,RamiAl-Rfou,andStevenSkiena.2014.Deepwalk:Onlinelearningofsocialrepresentations.InProc.ofSIGKDD.ACM,701–710.)采用随机游走模型来构造节点之间的相互关系,该模型在节点的上下文构造中存在固有的不确定性,这导致表征空间的不稳定性。了解和对这些不稳定性进行评估至关重要。
技术实现思路
为克服现有技术中的问题,本专利技术的目的在于提供一种网络表征算法稳定性度量方法。为实现上述目的,本专利技术的技术方案如下:一种网络表征算法稳定性度量方法步骤,包括以下步骤:步骤1:对于一个网络G,选择一种网络表征方法在网络G上使用网络表征方法多次,得到多个向量空间集合Ω={M1,M2,...,MT};其中,T是向量空间集合Ω的大小;步骤2:对于一个向量空间M中的节点i,计算与节点i最近的K个最近邻节点集合N,其中最近邻集合大小K取值为:K=0.3×|V|其中|V|是节点数量大小;步骤3:对于一对向量空间Ms和Mt,分别进行步骤2得到节点i的两个最近邻集合Ns和Nt;步骤4:如果集合Ns和Nt的Jaccard相似度为0,则计算结束,稳定性为0;否则,进行步骤5;步骤5:结合Ns和Nt的Jaccard相似度Ji(Ns,Nt)和排序贡献度Hi(Ns,Nt),向量空间Ms和Mt中节点i的稳定性为Ji(Ns,Nt)×Hi(Ns,Nt),对于网络表征方法节点i的稳定性Si为所有向量空间对(Ms,Mt)∈Ω×Ω,s≠t的稳定性的均值;网络G中所有节点的稳定性SG的平均值为整个网络的稳定性。本专利技术进一步的改进在于,步骤2中,通过余弦距离计算与节点i最近的K个最近邻节点集合N。本专利技术进一步的改进在于,步骤4中,集合Ns和Nt的Jaccard相似度Ji(Ns,Nt)为:本专利技术进一步的改进在于,步骤5中,排序贡献度Hi(Ns,Nt)通过以下过程得到:首先计算集合Ns和Nt的交集C,则Ns和Nt的排序贡献度Hi(Ns,Nt)为:其中,和是节点j在Ns和Nt的排序大小,是当Ns和Nt完全相同时得到的最大值。本专利技术进一步的改进在于,步骤5中,节点i的稳定性Hi(Ns,Nt)。本专利技术进一步的改进在于,步骤5中,网络G的整体稳定性SG为:其中,V是网络中节点的集合。与现有技术相比,本专利技术具有的有益效果:由于网络表征学习的目的是为了能够在向量空间中很好的反应出原网络中节点之间的相互关系,所以本专利技术对于网络表征的稳定性测量使用节点在向量空间中的最近邻节点集合作为参照物,最近邻集合能够不受向量空间平移、旋转等操作的影响,本质的反应节点关系在向量空间中的变化;同时本专利技术还考虑了最近邻集合的排序问题,使得向量空间中节点关系的评定更加精准。因此本专利技术能够有效的对各种网络表征的稳定度进行测量,该测量方法本身不受网络和方法的影响。附图说明图1为网络表征稳定性计算的示意图。图2为参数T的取值对稳定性影响图。图3不同节点的稳定性计算中参数K取值对稳定性的影响图。图4为本专利技术的流程图。具体实施方式下面结合附图对本专利技术做详细描述。本专利技术中通过对网络进行表征学习后测量表征空间的稳定性。参见图1和图4,本专利技术包括以下步骤:步骤1:对于一个网络G,选择一种网络表征方法在网络G上使用网络表征方法多次,得到多个向量空间集合Ω={M1,M2,...,MT};其中,T是向量空间集合Ω的大小。步骤2:对于一个向量空间M中的节点i,通过余弦距离计算与节点i最近的K个最近邻节点集合N,其中定义最近邻集合大小K取值为:K=0.3×|V|其中|V|是节点数量大小,即K的取值为网络节点总数的百分之三十;步骤3:对于一对向量空间Ms和Mt,分别进行步骤2得到节点i的两个最近邻集合Ns和Nt,然后计算集合Ns和Nt的Jaccard相似度Ji(Ns,Nt):步骤4:如果集合Ns和Nt的Jaccard相似度为0,则计算结束,稳定性为0;否则,考虑两个最近邻集合的距离排序关系,进行步骤5;步骤5:对于排序信息贡献计算,首先计算集合Ns和Nt的交集C,考虑交集C中节点在集合Ns和Nt的排序大小,排序越靠前表明其对稳定性的贡献越大,即如果排序靠前,则贡献较大所以有同时如果两个集合中同一个节点的位置排序相差较多,或降低稳定性所以有综合两部分相乘得到最终的排序得分Hi(Ns,Nt),最后需要进行归一化是的最高得分为1,通过除以Ns和Nt完全一致(节点数量和排序完全相同)情况下的最大值得分Hmax来进行归一化。同时考虑交集C中节点在集合Ns和Nt的排序差异,差异越大,说明Ns和Nt的相似度越低即越不稳定,则Ns和Nt的排序贡献度Hi(Ns,Nt)为:其中,和是节点j在Ns和Nt的排序大小,是当Ns和Nt完全相同(排序也相同)时得到的最大值;步骤6:结合步骤4得到Ns和Nt的Jaccard相似度Ji(Ns,Nt)和步骤5得到的排序贡献Hi(Ns,Nt),向量空间Ms和Mt中节点i的稳定性定义为Ji(Ns,Nt)×Hi(Ns,Nt),对于网络表征方法节点i的稳定性Si定义为所有向量空间对(Ms,Mt)∈Ω×Ω,s≠t的稳定性的均值,即其中,同时定义网络G中所有节点的稳定性SG的平均值为整个网络的稳定性,即网络G的整体稳定性SG定义为:其中,V是网络中节点的集合。本专利技术的有益效果是:本专利技术能够有效的对各种网络表征的稳定性进行测量,该测量方法本身不受网络和方法的影响。如图2所示,通过在网络上进行参数T和网络的整体稳定性的关系实验,发现随着T的增大,稳定性的大小的方差并没有明显的变化,所以结合效率问题,定义T=3。如图3所示,通过计算参数K的大小与稳定性的关系,发现K的大小在较小的时候稳定性的波动较大,而当K的大小增加到站总结点数的百分之二十时后,稳定性的波动几乎可以忽略。所以这里参数K的取值与网络的总结点数成正比,的取值为网络本文档来自技高网
...

【技术保护点】
1.一种网络表征算法稳定性度量方法步骤,其特征在于,包括以下步骤:步骤1:对于一个网络G,选择一种网络表征方法

【技术特征摘要】
1.一种网络表征算法稳定性度量方法步骤,其特征在于,包括以下步骤:步骤1:对于一个网络G,选择一种网络表征方法在网络G上使用网络表征方法多次,得到多个向量空间集合Ω={M1,M2,...,MT};其中,T是向量空间集合Ω的大小;步骤2:对于一个向量空间M中的节点i,计算与节点i最近的K个最近邻节点集合N,其中最近邻集合大小K取值为:K=0.3×|V|其中|V|是节点数量大小;步骤3:对于一对向量空间Ms和Mt,分别进行步骤2得到节点i的两个最近邻集合Ns和Nt;步骤4:如果集合Ns和Nt的Jaccard相似度为0,则计算结束,稳定性为0;否则,进行步骤5;步骤5:结合Ns和Nt的Jaccard相似度Ji(Ns,Nt)和排序贡献度Hi(Ns,Nt),向量空间Ms和Mt中节点i的稳定性为Ji(Ns,Nt)×Hi(Ns,Nt),对于网络表征方法节点i的稳定性Si为所有向量空间对(Ms,Mt)∈Ω×Ω,s≠t的稳定性的均值;网络G中...

【专利技术属性】
技术研发人员:王晨旭饶巍郭文娜王平辉刘均
申请(专利权)人:西安交通大学
类型:发明
国别省市:陕西,61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1