一种基于SimRank的结点相似度计算方法技术

技术编号：12125109 阅读：79 留言：0更新日期：2015-09-25 13:22

本发明专利技术涉及一种基于SimRank的结点相似度计算方法，包括以下步骤：1)将多关系网络用邻接矩阵形式表示，采用非迭代的结点相似度矩阵S表示多关系网络的结点相似度；2)建立Eigen-SimRank模型，对计算结点相似度矩阵S所需的各相关矩阵信息进行分析；3)若网络结构不发生变化，则根据与计算该多关系网络相似度矩阵S的相关矩阵信息，对多关系网络中的结点相似度进行计算；4)若网络结构发生变化，则采用Eigen-SimRank动态更新算法对相关矩阵信息进行更新，得到网络结构变化后计算相似度矩阵所需要的新的相关矩阵信息；5)根据更新后的相关矩阵信息，对结点相似度进行计算；6)根据计算得到的相似度计算结果，对多关系网络中各结点之间的相似度值进行分析。本发明专利技术可以广泛应用于网络结构中结点相似度计算领域。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及多关系网络中相似度计算领域，特别是关于一种基于SimRank的结点相似度计算方法。
技术介绍
近年来，由于互联网浪潮的席卷，在计算机应用领域产生了数量大量网络，而在此基础上产生的大量应用，例如在社交网络中产生的边预测以及电子商务中产生的推荐系统，其均是通过结点之间相似度计算技术和Top-k查询技术，根据用户结点本身的属性和特征，为用户提供更精确、更符合用户期望的信息。然而，这些研宄也有一定的局限性，其中之一就是这些相关研宄在进行查询时都没有考虑某个特定的视角。互联网发展到今天，一个网络中的结点之间，已经不再单纯的只有一种关系，结点之间可能存在着很多很多的关系。这种网络中结点之间存在着多种关系的网络即为多关系网络。采用已有的查询技术在多关系网络中进行查询时，并没有考虑某个特定的视角，因此查询结果可能并不完全符合用户的需求。查询时考虑特定视角能为用户提供更符合用户需求的信息，因此能在一定程度上满足这一要求。考虑特定视角的查询相较已有的查询技术而言虽然在一定程度上能为用户提供更多有用的信息，但是在本质上它们都是利用相似度计算算法来计算结点之间的相似度，并依据这个相似度值的高低返回相应的结果给用户。一般来说，两个结点之间的相似度指的是根据这两个结点之间的路径而计算出的一个介于〇和1之间的数值。经过多年的研宄，现在计算两个结点间相似度比较成熟的算法有谷歌公司提出的PageRank，以及 PageRank 的变式 Personalized PageRank ;Random Walk 以及 Random Walk...

【技术保护点】
一种基于SimRank的结点相似度计算方法，包括以下步骤：1)首先将多关系网络用邻接矩阵形式表示，将原始迭代的SimRank计算式变式为矩阵计算式，即采用非迭代的结点相似度矩阵S表示多关系网络的结点相似度，结点相似度矩阵S表示为：其中，c是衰减系数，矩阵为矩阵W的转置矩阵，矩阵W是多关系网络邻接矩阵的列归一化矩阵，矩阵I是单位矩阵；2)建立Eigen‑SimRank模型，对计算结点相似度矩阵S所需的各相关矩阵信息进行分析，得到与计算多关系网络结点相似度矩阵S的相关矩阵信息；3)若网络结构不发生变化，则直接根据步骤2)中分析得到的与计算该多关系网络结点相似度矩阵S的相关矩阵信息，对多关系网络中的结点相似度进行计算；4)若网络结构发生变化，则采用Eigen‑SimRank动态更新算法对步骤2)中分析得到的与计算多关系网络结点相似度矩阵S的相关矩阵信息进行更新，得到网络结构变化后计算结点相似度矩阵所需要的新的相关矩阵信息；5)根据步骤4)中得到的网络结构变化后计算结点相似度矩阵所需的新的相关矩阵信息，对结点相似度进行计算，计算方法同步骤3)；6)根据计算得到的相似度计算结果，对多关系网络中各...

【技术特征摘要】

【专利技术属性】
技术研发人员：李翠平，
申请(专利权)人：中国人民大学，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人