当前位置: 首页 > 专利查询>浙江大学专利>正文

一种基于地标节点的不确定图可达概率计算方法技术

技术编号:38670738 阅读:14 留言:0更新日期:2023-09-02 22:48
本发明专利技术公开了一种基于地标节点的不确定图可达概率计算方法,包括:(1)将现实世界中的网络建模成为不确定图;(2)离线采样构建每个节点对应的地标节点;(3)计算每个节点到其地标节点的可达概率;(4)通过地标节点计算给定节点对之间的可达概率。本发明专利技术在保证不确定图中任意两个节点可达概率计算准确率接近主流方法的同时,提升了时间效率。提升了时间效率。提升了时间效率。

【技术实现步骤摘要】
一种基于地标节点的不确定图可达概率计算方法


[0001]本专利技术涉及数据挖掘中的不确定图领域,特别是一种基于地标节点的不确定图可达概率计算方法。

技术介绍

[0002]在数据挖掘领域中,不确定图是一种常用的模型。现实世界中的许多关系建模成不确定图,不确定图中两个节点之间的可达概率,也称为双端可靠性,有着非常广泛的应用。例如由于意外的交通堵塞,道路网络可以建模成不确定图,节点代表地点,边代表地点之间的道路,边概率设置为两个地点之间的道路不发生交通堵塞的概率,两个节点之间的可达概率的实际含义便是从一个地点出发到另一个地点不发生交通堵塞的概率。还有计算机网络中的自治系统,自治系统之间的连接会因为外部或者内部的原因而失败,将其建模成不确定图,两个自治系统所在的节点之间的可达概率可以衡量它们之间的连接质量。此外,不确定图中两个节点之间的可达概率也在社交、金融、计算机科学、新闻传播等领域有着广泛的用途。
[0003]现有的不确定图可达概率计算方法例如蒙特卡洛采样方法、递归采样方法、固定宽度树分解方法,均基于采样,每次使用这些方法计算两个节点之间的可达概率都需要重新采样,因此在大规模不确定图中会耗费大量时间,为了解决这一问题,本专利技术从最短路径领域得到启发,提出了一种基于地标节点的可达概率计算方法。

技术实现思路

[0004]本专利技术提出了一种基于地标节点的不确定图可达概率计算方法,在准确率与主流方法接近的情况下,提高可达概率的计算效率,该方法包括以下步骤:
[0005](1)将现实世界中的网络建模成为不确定图;
[0006](2)离线采样构建每个节点对应的地标节点;
[0007](3)计算每个节点到其地标节点的可达概率;
[0008](4)通过地标节点计算给定节点对之间的可达概率。
[0009]对于步骤(2)中所述的离线构建每个节点对应的地标节点,包括以下步骤:
[0010]步骤(2.1)令其中n=|V|,为总的节点数目。均匀随机采样r+1组节点集合,它们的节点数目分别为1,2,22,

,2
r
,表示为节点集S0,S1,,

,S
r

[0011]步骤(2.2)对每个采样生成的节点集合S
i
和不确定图中每个节点v∈V,计算最大路径概率MaxPr(S
i
,v)和MaxPr(v,S
i
),最大路径概率是从一个节点出发到另外一个节点的所有路径中边概率乘积的最大值。将不确定图边概率取对数之后再取反,两个节点之间最短路径就对应最大路径概率所在的路径。从节点v出发做单源最短路径算法,到达节点集合S
i
中的任何一个节点立即结束算法。如此对每个节点v∈V,获得了一个从节点v出发到节点集合S
i
最大路径概率最大的节点l
forward
,同时MaxPr(v,S
i
)=MaxPr(v,l
forward
)。类似的,从节点集合S
i
出发,也就是从节点v的反向边出发,使用单源最短路径算法,算法终止于节点
集合S
i
中的任何一个节点,用l
backward
表示。节点l
forward
和l
backward
被称为节点v在节点集合S
i
中的正向地标节点和反向地标节点。r+1组节点集合会为每个节点得到r+1组正反向地标节点。
[0012]步骤(2.3)将步骤(2.1)和(2.2)重复k次,对于不确定图中的每个节点v∈V,存储了(r+1)k个正向地标节点信息集合L
forward
(v)={l
i
,i=1,2,

,(r+1)k

1,(r+1)k},以及(r+1)k个反向地标节点信息集合L
backward
(v)={l
j
,j=1,2,

,(r+1)k

1,(r+1)k},参数k可以控制地标节点数目。
[0013]对于步骤(3)中所述的计算每个节点到其地标节点的可达概率,其可行性依据是容斥原理,包括以下步骤:
[0014]步骤(3.1)先计算d次节点v到地标节点l的最大路径概率MaxPr(v,l),初始化ans=1,每次使用单源最短路径算法计算出节点v到地标节点l的最大路径概率MaxPr(v,l)之后,将最大路径概率所在的边删除,在最后一次计算中将所有删除的边恢复,更新ans=ans
×
(1

MaxPr(v,l))。最后1一ans就是节点v到地标节点l的可达概率,用R(v,l)表示。地标节点l到节点v的可达概率R(l,v)计算同理。
[0015]步骤(3.2)将得到的所有可达概率存储在地标节点信息集合中,可以得到(r+1)k个含有可达概率的正向地标节点信息集合L
forward
(v)={(l
i
,R(v,l
i
)),i=1,2,

,(r+1)k

1,(r+1)k},以及(r+1)k个含有可达概率的反向地标节点信息集合L
backward
(v)={(l
j
,R(l
j
,v)),j=1,2,

,(r+1)k

1,(r+1)k}。
[0016]本专利技术的工作原理是:使用地标节点这种基于索引的方法对可达概率进行良好的估计,将主要的计算耗时转移到步骤(3)计算每个节点到其地标节点的可达概率中,并利用容斥原理避免了耗费大量时间的采样过程。
[0017]本专利技术的优点是:与现有技术相比,本专利技术在保证计算准确率的前提下,大幅度提升了给定节点对之间可达概率的计算效率。
附图说明
[0018]图1是本专利技术一种基于地标节点的不确定图可达概率计算方法的流程图。
[0019]图2是本专利技术一种基于地标节点的不确定图可达概率计算方法中计算每个节点到其地标节点可达概率的示例。
[0020]图3是本专利技术应用本专利技术的一种基于地标节点的不确定图可达概率计算方法的交通堵塞预测方法流程图。
具体实施方式
[0021]下面将结合附图对本专利技术的具体实施进行详细的描述,结合图示过程对专利技术进行详细说明。
[0022]实施例1
[0023]如图1所示,本专利技术提供了一种基于地标节点的不确定图可达概率计算方法,包括以下步骤:
[0024](1)将需要进行分析的现实世界中的网络建模成为不确定图,并根据网络性质合理设置边概率;
[0025](2)对步骤(1)中得到的不确定图,通过离线采样构建每个节点对应的地标节点,不确定图中每个节点会得到(r+1)k个正向地标节点本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于地标节点的不确定图可达概率计算方法,该方法的特征在于,包括以下步骤:(1)将现实世界中的网络建模成为不确定图;(2)离线采样构建每个节点对应的地标节点;(3)计算每个节点到其地标节点的可达概率;(4)通过地标节点计算给定节点对之间的可达概率。2.根据权利要求1所述的一种基于地标节点的不确定图可达概率计算方法,其特征在于,步骤(2)所述的离线构建每个节点对应的地标节点,具体步骤为:(2.1)令其中n=|V|,为总的节点数目;均匀随机采样r+1组节点集合,它们的节点数目分别为1,2,22,

,2
r
,表示为节点集S0,S1,,

,S
r
;(2.2)对每个采样生成的节点集合S
i
和不确定图中每个节点v∈V,计算最大路径概率MaxPr(S
i
,v)和MaxPr(v,S
i
),最大路径概率是从一个节点出发到另外一个节点的所有路径,路径上的所有边概率乘积的最大值;将不确定图边概率取对数之后再取反,两个节点之间最短路径就对应最大路径概率所在的路径;从节点v出发做单源最短路径算法,到达节点集合S
i
中的任何一个节点立即结束算法;如此对每个节点v∈V,获得了一个从节点v出发到节点集合S
i
最大路径概率最大的节点l
forward
,同时MaxPr(v,S
i
)=MaxPr(v,l
forward
);类似的,从节点集合S
i
出发,也就是从节点v的反向边出发,使用单源最短路径算法,算法终止于节点集合S
i
中的任何一个节点,用l
backward
表示;节点l
forward
和l
backward
被称为节点v在节点集合S
i
中的正向地标节点和反向地标节点;r+1组节点集合会为每个节点得到r+1组正反向地标节点;(2.3)将步骤(2.1)、(2.2)重复k次,对于不确定图中的每个节点v∈V,存储了(r+1)k个正向地标节点信息集合L
forward
(v)={l
i
,i=1,2,<...

【专利技术属性】
技术研发人员:王灿沈跃冬史麒豪陈佳伟魏晓
申请(专利权)人:浙江大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1