评价和比较图嵌入模型的可视化分析方法与系统技术方案

技术编号:26891941 阅读:69 留言:0更新日期:2020-12-29 16:11
本发明专利技术提出了一种评价和比较图嵌入模型的可视化分析方法与系统,该方法利用图嵌入模型对航线网络进行向量化表达,根据图数据计算节点度量指标,通过用户选择的嵌入模型和设定的参数得到嵌入结果;从原始图结构、节点度量指标和嵌入结果这三个角度定性评价和比较图嵌入模型;同时通过神经网络回归模型,得到原始图节点度量指标值与图嵌入结果的节点度量指标估计值之间的偏差,根据该偏差得到嵌入模型保留节点度量指标的能力,实现定量评价和比较图嵌入模型。本发明专利技术应用于航空交通领域,在应用图嵌入方法对航线网络进行图分析时,根据图分析任务,可以选择优化的图嵌入模型,有效地分析航线网络,为更好的规划机场建设提供决策支持。

【技术实现步骤摘要】
评价和比较图嵌入模型的可视化分析方法与系统
本专利技术涉及图的表示学习与可视化领域,主要涉及一种图嵌入模型评价和比较的可视分析方法与系统及其在航线图分析中的应用。
技术介绍
随着生活水平的提高,越来越多的人选择坐飞机出行,不论我们飞去哪里,飞机都会按照制定好的航线进行飞行。众多航线与机场构成一个庞大的机场-航线网络。通过分析机场-航线网络特征,进行航线设计、交通枢纽选址和资源配置具有重要意义。例如,确定航线交通枢纽的最佳位置可以帮助航空公司规划和建设综合客运枢纽,发现具有潜在高收益的航线,也可以为旅客提供便捷的“零距离”换乘和一体化衔接服务,节省时间和空间资源,方便分配疏运交通等基础设施的配置数量。通常可以用图来表示机场-航线网络,然而表示航线网络的图节点众多且关联复杂,传统的节点-链接图表示方法很难满足此类网络的分析需求。通常研究人员用节点度量指标来定量地描述节点的结构信息,如节点的度、中心性、紧密度等。图由节点和边组成,每个节点和边都具有相应的属性,图嵌入是利用一组便于计算的低维稠密向量来表示图(或网络)的技术,它使得图分析变得可计算,从而帮助研究人员有效地完成各类图分析任务。然而不同的嵌入模型在保留原始图特征能力方面表现不同,有的在保留局部特征方面的能力比较强,有的在保留全局特征方面的能力比较强。许多模型并不能很好地保留原始的航线拓扑结构信息,且由于图嵌入模型是黑盒模型,嵌入结果保留了哪些节点特征?不同嵌入模型保留节点特征能力有何不同?模型的参数取值对嵌入模型保留节点特征的能力有何影响?对研究人员来说还是模糊的,盲目地优化目标无法得到预期的结果,因此如何根据用户的需求对不同的嵌入模型进行评价和比较,选择合适的嵌入模型来完成图的向量化,以帮助人们进行图分析,且由于用户的认知能力有限,当节点度量值接近的节点在嵌入空间中的分布规律不够明显时,单独依靠可视分析技术来定性的评价嵌入模型保留节点度量能力是有限而不精准的。特别是当不同的嵌入模型具有相似的节点度量保留能力时,单纯依靠人很难确定哪种模型具有更好的保留度量能力,因此如何通过评价、比较和优化图嵌入模型,选择适合分析任务的图嵌入模型,以及提高图嵌入模型保留图结构特征信息的能力,完善保留航线拓扑结构信息,分析数据中潜在特征,有利于完成各种图分析任务,是一个亟待解决的问题。
技术实现思路
为了克服上述现有技术的不足,本专利技术提出了一种支持对图嵌入模型进行评价、比较和优化的用于航线数据的多视图协同交互的可视分析方法和系统,利用图嵌入模型对航线网络进行向量化表达,进而在嵌入结果上计算图结构信息,通过评估和比较不同的图嵌入模型,选择合适的嵌入模型;同时通过改进参数,优化模型,提高图嵌入模型保留航路图结构信息的能力,方便相关部门发现交通枢纽,为更好的规划机场建设、部署机场资源,提供决策支持。本专利技术的技术方案如下:一种评价和比较图嵌入模型的可视化分析方法,构造航线网络,对网络中的所有节点进行量化,根据图数据计算节点度量指标值,通过用户选择的嵌入模型和设定的参数得到嵌入结果;然后,通过神经网络回归模型,得到原始图的节点度量指标值与图嵌入结果的节点度量指标估计值之间的偏差,根据该偏差得到嵌入模型保留节点度量指标的能力,定量评价图嵌入模型保留原始图结构特征的能力;最后将节点度量指标值、嵌入结果和原始图数据分别展示在节点度量视图、嵌入结果视图和原始图结构视图中,帮助用户探索嵌入向量、原始图结构和节点度量指标之间的相关性。如图1所示,具体包括如下步骤:A.对输入的航线数据进行处理,构造航线网络图即原始图,并将航线网络图以节点-链接展示在原始结构视图中,具体包括如下步骤:A1.根据航线网络构建原始图,抽象后的实体关联数据可以表示为图G=(V,E),V={v1,v2,...,vi...,vn},其中vi表示一个机场,|V|为机场数量,E={e1,e1,...ei,...,em},其中ei表示两个机场之间有航线。A2.根据A1构造的原始图,本专利技术提出利用A1得到的G(V,E),节点和边集合,在原始结构视图中使用力导向布局来展示原始图的结构信息,方便直接观察航路图结构与嵌入结果结构的差异,如图2.c所示。B.计算原始图中各个节点的节点度量指标值。节点度量指标通常用于定量地描述图中节点的结构特征。B1.针对航路图的结构信息,本专利技术选择了9个独立于任务的节点度量指标,并根据9个节点度量指标,计算原始图中各节点拓扑结构的节点度量指标值。其中这9个节点度量指标的说明如下:(1)度(degree)CD(u),节点u的邻居节点数量,在图中度数越大的节点,航线越多,该机场在航路中的作用越重要,需要航空公司安排更多的航班以及相应的资源。(2)离心率(Eccentricity),节点u到图中所有其他节点最短路径距离的最大值,节点的该值越大,对应机场的航线为远途的概率更大。计算方法如公式1,式中d(u,v)为节点u与v之间的最短距离:(3)紧密度(Closeness),图G中节点u到所有其他节点最短路径距离的平均值的倒数,值越小节点u越多长途航线,成为国际大机场,航路重要交通枢纽的可能性越高,计算方法如公式2。(4)介数(Betweenness),即节点u以外的两点间最短路径通过节点u的次数,介数反映了相应的节点在整个图中的作用,值较大说明节点u在图中是连接若干节点的枢纽。计算方法如公式3,表示从节点s到节点t的所有最短路的数量,式中表示从节点s到节点t的所有最短路径经过u的数量。(5)特征向量中心性(EigenvectorCentrality),是对网络中节点影响力的度量。它将相对分数分配给机场航线网络中的所有节点,连接到得分高的节点v比连接到得分低的节点v对节点u得分的贡献更大。计算方法如公式4,式中Nu表示节点u的所有邻居(6)PageRank是特征向量中心性度量的一个变体,值越大节点u在航线网络中的影响力就越大,但是它降低了度值高的节点对计算结果的影响,相当于将节点的PageRank值平均分给邻居节点,避免了度数高的节点PageRank值高时,它的邻居节点PageRank值也高的情况,计算方法如公式5。(7)聚集系数(ClusteringCoefficient),节点u的邻居节点间存在链接的比例,该值越高,节点u的邻居节点之间的链接就越紧密,航空公司分配给该机场的航班数量也应当增加。计算方法如公式6,式中{ekv}是u的邻居节点之间链接的集合:(8)最近邻平均度(AverageNearestNeighborsDegree),节点u所有相邻节点度之和与u度的比值,该值越高说明节点u的邻居节点度值比节点u大,因此该机场的规模以及航班数量都不会很高,计算方法如公式7。(9)影响力中心性(LeverageCentrality,简称Lev_Centrality),考虑节点u与它的邻居节点的度信息,该值越大节点u在邻域中的影响力也就越大。节点度量指标Lever本文档来自技高网
...

【技术保护点】
1.一种评价和比较图嵌入模型的可视化分析方法,构造航线网络,通过图嵌入技术将网络节点进行向量化,具体包括如下步骤:/nA.对输入的航线数据进行处理,构建航线网络图即原始图;/nB.计算原始图中每个节点的9个节点度量指标值,用于定量地描述图中节点的结构特征,所述9个节点度量指标具体为:/n(1)度C

【技术特征摘要】
1.一种评价和比较图嵌入模型的可视化分析方法,构造航线网络,通过图嵌入技术将网络节点进行向量化,具体包括如下步骤:
A.对输入的航线数据进行处理,构建航线网络图即原始图;
B.计算原始图中每个节点的9个节点度量指标值,用于定量地描述图中节点的结构特征,所述9个节点度量指标具体为:
(1)度CD(u),节点u的邻居节点数量;
(2)离心率,节点u到图中所有其他节点最短路径距离的最大值,计算方法如公式1,式中d(u,v)为节点u与v之间的最短距离:



(3)紧密度,图中节点u到所有其他节点最短路径距离的平均值的倒数,计算方法如公式2:



(4)介数,即节点u以外的两点间最短路径通过节点u的次数,计算方法如公式3,表示从节点s到节点t的所有最短路的数量,式中表示从节点s到节点t的所有最短路径经过u的数量。



(5)特征向量中心性,是对网络中节点影响力的度量,计算方法如公式4,式中Nu表示节点u的所有邻居



(6)PageRank是特征向量中心性度量的一个变体,计算方法如公式5:



(7)聚集系数,节点u的邻居节点间存在链接的比例,计算方法如公式6,式中{ekv}是u的邻居节点之间链接的集合:



(8)最近邻平均度,节点u所有相邻节点度之和与u度的比值,计算方法如公式7:



(9)影响力中心性,计算方法如公式8:



C.根据用户需求选择不同的图嵌入模型以及图嵌入模型的参数;
D.根据步骤C选定的图嵌入模型及其相关参数完成对步骤A构造的原始图的向量化,得到图嵌入模型的嵌入结果;
E.计算图嵌入模型对各个节点的节点度量指标的保留能力,具体步骤如下:
E1.首先构造神经网络回归模型;
E2.采用十折交叉验证方法将输入的嵌入向量及其对应的原始图节点度量指标值分为训练集和测试集,使用训练集训练神经网络回归模型;
E3.将嵌入向量输入训练好的神经网络回归模型,计算出嵌入向量的节点度量指标估计值,得到原始图节点度量指标值与通过回归模型计算得到的节点度量估计值之间的决定系数(R2),其中SSR表示回归平方和,SST表示总体偏差平方和,为节点i的原始图节点度量值,为回归模型计算结果的均值;
E4.重复执行E1,E2和E3分别进行上述9个节点度量指标的计算;
F.上述节点度量指标值、嵌入结果和原始图数据分别展示在节点度量视图、嵌入结果视图和原始结构视图中,建立多个视图之间的关联,实现多视图协同交互的可视化分析。


2.如权利要求1所述评价和比较图嵌入模型的可视化分析方法,其特征在于,步骤A具体包括如下步骤:
A1.根据航线网络构建原始视图,抽象后的实体关联数据表示为图G=(V,E),V={v1,v2,...,vi...,vn},其中vi表示一个机场,|V|为机场数量,E={e1,e1,...ei,...,em},其中ei表示两个机场之间有航线;
A2.根据A1构造的原始视图,得到的G(V,E),节点和边集合。


3.如权利要求1所述评价和比较图嵌入模型的可视化分析方法,其特征在于,步骤C选择的图嵌入模型有四种,分别为:DeepWalk、node2vec、struc2vec和SDNE。


4.如权利要求3所述评价和比较图嵌入模型的可视化分析方法,其特征在于,在选定图嵌入模型后,选择图嵌入模型的各种参数...

【专利技术属性】
技术研发人员:陈谊张清慧管泽礼
申请(专利权)人:北京工商大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1