基于图神经网络的IP街道级定位方法及装置制造方法及图纸

技术编号:36113995 阅读:13 留言:0更新日期:2022-12-28 14:17
本发明专利技术属于目标IP定位技术领域,公开一种基于图神经网络的IP街道级定位方法及装置,该方法包括:首先,将一个计算机网络的traceroute原始测量数据表示成一个带属性图;然后,通过编码器将带属性图转换为初始节点嵌入;随后,通过对连接信息建模来精细化初始节点嵌入;最终,解码器将精细的嵌入映射到节点位置。本发明专利技术通过考虑先验知识缓解了GNN的收敛问题,提高了地理位置预测精度,在不同的真实数据集上的实验表明:本发明专利技术在所有数据集的中值误差距离上优于最先进的基于规则和基于学习的基线16%至28%。学习的基线16%至28%。学习的基线16%至28%。

【技术实现步骤摘要】
基于图神经网络的IP街道级定位方法及装置


[0001]本专利技术涉及目标IP定位
,尤其涉及一种基于图神经网络的IP街道级定位方法及装置。

技术介绍

[0002]目标IP街道级定位是在IP城市级定位或IP城市位置已知的基础上,进一步寻找IP地址在城市内部的更准确位置。IP街道级定位在溯源网络攻击、提供本地化服务等多个领域都有着现实需求。然而现有方法多数仅适用于理想网络环境。在实际网络中,因测量数据和地理位置之间的关系不符合现有方法的假设,定位精度不高。因此,如何研发在实际网络中具有较高精度的IP街道级定位技术,具有重要的价值。
[0003]按照如何刻画“测量数据

地理位置”映射关系,IP街道级定位技术可分为基于规则的IP街道级定位技术和基于深度学习的IP街道级定位技术。
[0004]基于预定义规则的IP街道级定位技术一般假设时延或者路由路径等测量数据和地理距离存在某种强相关关系,并根据相应假设来定义从测量数据到地理距离的转换规则。本类方法的优势是方便理解。但由于本类方法的假设往往不符合多数实际网络的真实情况,精度一般不高。
[0005]最近一段时间,部分学者尝试用深度学习来建模测量数据和地理位置之间的映射关系。深度学习擅长从大量数据中,刻画多种测量数据和地理距离之间的非线性关系,更适应实际网络的复杂情况。专利申请人曾提出可向多层感知机MLP中输入目标网络的延迟和路由信息,经过MLP处理后,预测目标IP的地理位置。这类方法比基于预定义规则的定位技术的定位精度更高。但MLP方法无法对计算机网络的拓扑结构进行建模,定位精度依然有待提高。

技术实现思路

[0006]本专利技术针对现有IP街道级定位技术存在的定位精度依然有待提高的问题,提出一种基于图神经网络的IP街道级定位方法及装置,通过考虑先验知识缓解了GNN的收敛问题,提高了地理位置预测精度。
[0007]为了实现上述目的,本专利技术采用以下技术方案:
[0008]本专利技术一方面提出一种基于图神经网络的IP街道级定位方法,包括:
[0009]步骤1,将一个计算机网络的traceroute原始测量数据表示成一个带属性图;
[0010]步骤2,通过编码器基于带属性图生成各IP地址的初始图节点嵌入;所述IP地址包括地标IP地址,且地标IP地址对应的地理位置已知;
[0011]步骤3,通过对计算机网络节点之间的链接信息进行建模,将地理位置信息注入到初始图节点嵌入中;
[0012]步骤4,通过解码器将步骤3处理后的图节点嵌入映射到图节点即IP地址对应的地理位置;
[0013]步骤5,对比映射得到的地理位置和实际地理位置之间的差距,通过反向传播和梯度下降来优化模型的参数;
[0014]步骤6,基于优化后的模型对计算机网络中其他未知地理位置的IP地址进行地理位置预测。
[0015]进一步地,所述步骤1包括:
[0016]步骤1.1,构建网络拓扑图:
[0017]使用IP地址和IP地址之间的链接来表示计算机网络的拓扑结构,将一个计算机网络的traceroute原始测量数据中的所有IP地址都被转换为图节点,每个节点v
i
通过节点ID区分,节点ID取值为1~N
V
,其中N
V
为traceroute原始测量数据中所有IP地址的个数;
[0018]将两个IP地址之间直接的物理链路转换成图边;
[0019]步骤1.2,属性提取:
[0020]每个图节点都与两种节点属性相关联:节点延迟和节点IP地址;对于每个节点,探测主机重复多次测量延迟,选择最小的作为节点延迟;最后,结合节点ID和节点属性作为节点的初始特征;
[0021]每条边都与边延迟、头节点IP地址和尾节点IP地址相关联,将靠近探测主机的节点作为边的头节点,将边的另一个节点作为尾节点,通过尾节点减去头节点的节点延迟计算边缘延迟。
[0022]进一步地,所述步骤1.1中,在traceroute过程中,当路由器的IP地址和延迟无法被探测主机获得时,在上述路由器上建立边有两种方法:(i)忽略上述路由器,在路由路径上,在上述路由器之前和之后的两个路由器之间建立边;(ii)将上述路由器映射到其他重新测量的路由路径中找到的IP地址。
[0023]进一步地,所述步骤3包括:
[0024]对于节点v
i
及其相邻的节点v
j
,从v
j
到v
i
的消息定义为
[0025][0026]其中m
i

j
为v
j
发送给v
i
的消息,f
message
为消息函数,表示相邻节点嵌入,e
ij
表示节点v
i
及节点v
j
构成的边,将f
message
实现为:
[0027][0028]其中边缘网络f
edge
是一个两层MLP,它将边嵌入转化为一个矩阵用于计算相邻节点嵌入f
edge
的架构为:
[0029][0030]其中作为权值,用于控制相邻节点嵌入对节点i的影响;和为MLP两层的权值矩阵;
[0031]通过上述公式首先将初始边嵌入转化为临时嵌入,然后将临时嵌入转化为一维权值嵌入,将一维权值嵌入重构为二维方位权矩阵以控制邻居节点v
j
对节点v
i
的影响,利用ReLU的激活函数捕捉非线性关系;
[0032]U
vi
表示v
i
的邻居节点集,聚合函数f
aggregate
收集所有从传播到v
i
的消息,更新函数f
update
使用收集到的消息更新v
i
的嵌入,v
i
的聚合更新函数定义为:
[0033][0034][0035]其中表示节点v
i
在为编码器的初始节点嵌入后的更新嵌入;
[0036]更新功能实现如下:
[0037][0038]通过总结节点更新之前的嵌入和从邻居聚合的消息来更新节点v
i
的嵌入,利用Relu进行非线性特征变换。
[0039]进一步地,所述步骤5中,采用如下损失函数:
[0040][0041]其中N(v)
train
表示训练数据集中的所有节点,分别表示经过解码器变换后的训练集中IP的真实地理位置和预测地理位置,Θ表示可训练的模型参数。
[0042]本专利技术另一方面提出一种基于图神经网络的IP街道级定位装置,包括:
[0043]预处理模块,用于将一个计算机网络的traceroute原始测量数据表示成一个带属性图;
[0044]编码模块,用于通过编码器基于带属性图生成各IP地址的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于图神经网络的IP街道级定位方法,其特征在于,包括:步骤1,将一个计算机网络的traceroute原始测量数据表示成一个带属性图;步骤2,通过编码器基于带属性图生成各IP地址的初始图节点嵌入;所述IP地址包括地标IP地址,且地标IP地址对应的地理位置已知;步骤3,通过对计算机网络节点之间的链接信息进行建模,将地理位置信息注入到初始图节点嵌入中;步骤4,通过解码器将步骤3处理后的图节点嵌入映射到图节点即IP地址对应的地理位置;步骤5,对比映射得到的地理位置和实际地理位置之间的差距,通过反向传播和梯度下降来优化模型的参数;步骤6,基于优化后的模型对计算机网络中其他未知地理位置的IP地址进行地理位置预测。2.根据权利要求1所述的基于图神经网络的IP街道级定位方法,其特征在于,所述步骤1包括:步骤1.1,构建网络拓扑图:使用IP地址和IP地址之间的链接来表示计算机网络的拓扑结构,将一个计算机网络的traceroute原始测量数据中的所有IP地址都被转换为图节点,每个节点v
i
通过节点ID区分,节点ID取值为1~N
V
,其中N
V
为traceroute原始测量数据中所有IP地址的个数;将两个IP地址之间直接的物理链路转换成图边;步骤1.2,属性提取:每个图节点都与两种节点属性相关联:节点延迟和节点IP地址;对于每个节点,探测主机重复多次测量延迟,选择最小的作为节点延迟;最后,结合节点ID和节点属性作为节点的初始特征;每条边都与边延迟、头节点IP地址和尾节点IP地址相关联,将靠近探测主机的节点作为边的头节点,将边的另一个节点作为尾节点,通过尾节点减去头节点的节点延迟计算边缘延迟。3.根据权利要求2所述的基于图神经网络的IP街道级定位方法,其特征在于,所述步骤1.1中,在traceroute过程中,当路由器的IP地址和延迟无法被探测主机获得时,在上述路由器上建立边有两种方法:(i)忽略上述路由器,在路由路径上,在上述路由器之前和之后的两个路由器之间建立边;(ii)将上述路由器映射到其他重新测量的路由路径中找到的IP地址。4.根据权利要求1所述的基于图神经网络的IP街道级定位方法,其特征在于,所述步骤3包括:对于节点v
i
及其相邻的节点v
j
,从v
j
到v
i
的消息定义为其中m
i

j
为v
j
发送给v
i
的消息,f
message
为消息函数,表示相邻节点嵌入,e
ij
表示节点v
i
及节点v
j
构成的边,将f
message
实现为:
其中边缘网络f
edge
是一个两层MLP,它将边嵌入转化为一个矩阵用于计算相邻节点嵌入f
edge
的架构为:其中作为权值,用于控制相邻节点嵌入对节点i的影响;和为MLP两层的权值矩阵;通过上述公式首先将初始边嵌入转化为临时嵌入,然后将临时嵌入转化为一维权值嵌入,将一维权值嵌入重构为二维方位权矩阵以控制邻居节点v
j
对节点v
i
的影响,利用ReLU的激活函数捕捉非线性关系;U
vi
表示v
i
的邻居节点集,聚合函数f
aggregate
收集所有从传播到v
i
的消息,更新函数f
update
使用收集到的消息更新v
i
的嵌入,v
i
的聚合更新函数定义为:的聚合更新函数定义为:其中表示节点v
i
在为编码器的初始节点嵌入后的更新嵌入;更新功能实现如下:通过总结节点更新之前的嵌入和从邻居聚合的消息来更新节点v
i
的嵌入,利用Relu进行非线性特征变换。5.根据权利要求1所述的基于图神经网络的IP街道级定位方法,其特征在于,所述步骤5中,采用如下损失函数:其中N(v)
train
表示训练数据集中的所有节点,分别表示经过解码器变换后的训练集中IP的真实地理位置和预测地理位置,Θ表示可训练的模型参数。6.一种基于图神经网络的IP街道级定位装置,其特征在于,包括...

【专利技术属性】
技术研发人员:丁世昌罗向阳程若思李腾耀汤征张帆祖朔迪王玲巩道福杨春芳张弛
申请(专利权)人:中国人民解放军战略支援部队信息工程大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1