The present invention relates to a method for calculating vertex similarity of large-scale time series graphs, which includes the following steps: S1, abstracting the data of each vertex of social network into time series graphs; S2, building tree index by random walk method and path fusion method, estimating the expectation of time difference of each node in index tree by Bootstrap sampling method, and calculating target vertex and time difference by Monte Coral method. The similarity of other vertices; S3, the similarity of target vertices and other vertices calculated according to The technical method of the present invention makes the vertex similarity calculation more accurate and can be used to recommend users more accurately in the recommendation system.
【技术实现步骤摘要】
一种大规模时序图顶点相似度计算方法
本专利技术涉及一种大规模时序图顶点相似度计算方法,属于数据库
技术介绍
现实生活中的许多场景可以抽象成图模型,从而进行数据的处理和分析。近年来随着数据科学的迅猛发展,人们对于数据分析结果的精确具有较高的要求,然而当前对于图模型的研究大多集中在静态图上。静态图模型忽略了真实场景中的时间因素,这使得在静态图中的数据分析结果不准确。顶点相似性计算是图论中的基本问题,广泛应用于社交网络、推荐系统等现实应用。以社交网络为例,可以使用图结构来表示社交网络的拓扑结构,图中顶点表示社交网络中的用户,图中的边可以表示社交网络中用户之间的联系,在社交网络中可以根据用户间的相似性进行朋友推荐等活动,因此计算图中顶点相似性是一个十分重要的问题。当前的研究大多使用静态图对现实场景进行建模,忽略了现实场景中的时间因素,对分析结果造成了很大影响。针对这种情况,应使用时序图对现实场景进行建模,保留时间因素对现实场景的影响。因此如何高效地处理时序图中顶点相似性计算是一个亟待解决的问题。
技术实现思路
(一)要解决的技术问题为了解决现有技术的上述问题,本专利技术提供一种大规模时序图顶点相似度计算方法。(二)技术方案为了达到上述目的,本专利技术采用的主要技术方案包括:一种大规模时序图顶点相似度计算方法,包括如下步骤:S1、将社交网络各个顶点的数据抽象为时序图;S2、通过随机游走方法和路径融合方法建立树形索引,使用Bootstrap抽样方法估计索引树中每层节点时间差的期望,使用MonteCoral方法计算目标顶点与其他顶点的相似度;S3、根据步骤S2计算 ...
【技术保护点】
1.一种大规模时序图顶点相似度计算方法,其特征在于,其包括如下步骤:S1、将社交网络各个顶点的数据抽象为时序图;S2、通过随机游走方法和路径融合方法建立树形索引,使用Bootstrap抽样方法估计索引树中每层节点时间差的期望,使用Monte Coral方法计算目标顶点与其他顶点的相似度;S3、根据步骤S2计算出的目标顶点与其他顶点相似度,找出与目标定点最相似的k个顶点。
【技术特征摘要】
1.一种大规模时序图顶点相似度计算方法,其特征在于,其包括如下步骤:S1、将社交网络各个顶点的数据抽象为时序图;S2、通过随机游走方法和路径融合方法建立树形索引,使用Bootstrap抽样方法估计索引树中每层节点时间差的期望,使用MonteCoral方法计算目标顶点与其他顶点的相似度;S3、根据步骤S2计算出的目标顶点与其他顶点相似度,找出与目标定点最相似的k个顶点。2.如权利要求1所述的计算方法,其特征在于,在步骤S1中,所述时序图表示为GT=(V,E,T),其中V表示社交网络中的顶点集合,E表示的是网络中时序边的集合,T表示的各个顶点联系时刻的集合。3.如权利要求1所述的计算方法,其特征在于,在步骤S2中,所述树形索引的建立包括:S20101、对所述时序图GT=(V,E,T)中任意顶点u∈V,创建一颗以u为叶节点的单节点树,并记level(u)=0;S20102、对每个叶节点进行反向随机游走,即对叶节点u进行反向随机游走,得到时序路径pu=(u,v),其中v∈Γin(u,G);记level(v)=level(u)+1,且节点u到达节点v的时间记为tv(u);S20103、判断任意两个叶节点生成的时序路径是否符合路径融合条...
【专利技术属性】
技术研发人员:袁野,王国仁,苗壮,王一舒,马玉亮,
申请(专利权)人:东北大学,
类型:发明
国别省市:辽宁,21
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。