一种网络表征算法稳定性度量方法技术

技术编号：21034545 阅读：24 留言：0更新日期：2019-05-04 05:31

一种网络表征算法稳定性度量方法，该方法利用网络表征算法保留网络节点之间关系的特点，使用表征空间中节点的最近邻集合是否一致来判断稳定性大小；对一个网络采用某种表征方法映射到多维连续稠密的向量空间中，利用余弦相似度计算每一个节点距离它最近的前K个节点作为稳定性测量的基础；对一个网络采用同一个表征方法多次产生多个向量空间，对于一个节点计算在多个向量空间中最近邻集合的相似性，包括节点的重合率，重合节点的排位信息。本发明专利技术可有效的测量不同算法在不同网络集上的稳定性表现，从而进一步可以揭示网络表征的稳定性受何种因素影响，影响的大小有多少。

A Method for Measuring the Stability of Network Representation Algorithms

全部详细技术资料下载

【技术实现步骤摘要】
一种网络表征算法稳定性度量方法
本专利技术属于网络与图表征算法领域，涉及一种网络表征算法稳定性度量方法。
技术介绍
图类型的数据结构是社交、生物和信息网络的基本离散表示形式，然而对于需要基于连续特征的机器学习任务来说很难进行泛化应用。所以最近研究人员提出了一系列学习节点的连续表征(保留节点之间关系信息)的方法。事实证明，网络表征在下游任务中十分有效，例如节点分类和聚类、链路预测和网络对齐。但是网络表征方法也存在一定问题，Zügner方法(参考Zügner的方法：DanielZügner,AmirAkbarnejad,andStephanGünnemann.2018.Adversarialattacksonneuralnetworksforgraphdata.InProc.ofSIGKDD.ACM,2847–2856.)表明当节点之间的关系受到干扰或不稳定时，它将显著降低基于神经网络的节点分类方法的准确性。最近在自然语言处理(NLP)领域中的研究已经证明，不同表征空间中单词的最近邻集合是变化的，表明单词的向量化存在大量的不稳定性。通过实验我们发现这种不稳定同样存在与网络表征空间中，与词向量相比，网络表征算法的不稳定性具有特定的影响因素，例如DeepWalk方法(参考DeepWalk方法：BryanPerozzi,RamiAl-Rfou,andStevenSkiena.2014.Deepwalk:Onlinelearningofsocialrepresentations.InProc.ofSIGKDD.ACM,701–710.)采用随机游走模型来构造节点之间的...

【技术保护点】
1.一种网络表征算法稳定性度量方法步骤，其特征在于，包括以下步骤：步骤1：对于一个网络G，选择一种网络表征方法

【技术特征摘要】
1.一种网络表征算法稳定性度量方法步骤，其特征在于，包括以下步骤：步骤1：对于一个网络G，选择一种网络表征方法在网络G上使用网络表征方法多次，得到多个向量空间集合Ω＝{M1,M2,...,MT}；其中，T是向量空间集合Ω的大小；步骤2：对于一个向量空间M中的节点i，计算与节点i最近的K个最近邻节点集合N，其中最近邻集合大小K取值为：K＝0.3×|V|其中|V|是节点数量大小；步骤3：对于一对向量空间Ms和Mt，分别进行步骤2得到节点i的两个最近邻集合Ns和Nt；步骤4：如果集合Ns和Nt的Jaccard相似度为0，则计算结束，稳定性为0；否则，进行步骤5；步骤5：结合Ns和Nt的Jaccard相似度Ji(Ns,Nt)和排序贡献度Hi(Ns,Nt)，向量空间Ms和Mt中节点i的稳定性为Ji(Ns,Nt)×Hi(Ns,Nt)，对于网络表征方法节点i的稳定性Si为所有向量空间对(Ms,Mt)∈Ω×Ω,s≠t的稳定性的均值；网络G中...

【专利技术属性】
技术研发人员：王晨旭，饶巍，郭文娜，王平辉，刘均，
申请(专利权)人：西安交通大学，
类型：发明
国别省市：陕西,61

全部详细技术资料下载我是这个专利的主人