一种基于图神经网络的街道级IP地址定位方法技术

技术编号:35350759 阅读:52 留言:0更新日期:2022-10-26 12:18
本发明专利技术提供一种基于图神经网络的街道级IP地址定位方法,包括以下步骤:首先,筛选与目标IP匹配的地标IP;其次,从IP特征和网络测量两种不同的视角,建立所述区域中的目标IP与地标IP间的拓扑空间关系,以得到目标IP与关联地标IP间的边缘权重,构成完整的拓扑图结构;再次,利用目标IP与地标IP间的边缘权重及拓扑图结构,使用图卷积神经网络聚合邻域地标特征及地理坐标,并通过正则化流得到关于目标IP的概率表示以抵御网络波动带来的负面影响,得到关于IP的健壮的隐状态;最后,使用多层感知机进行线性仿射变化,从概率表示一一即目标IP的隐状态中解码得到目标IP的经纬度坐标,完成IP定位任务;本发明专利技术具有IP地址定位准确,抗干扰能力强的优点。力强的优点。

【技术实现步骤摘要】
一种基于图神经网络的街道级IP地址定位方法


[0001]本专利技术属于IP地址定位
,具体涉及一种基于图神经网络的街道级IP地址定位方法。

技术介绍

[0002]IP地址是分配给每个主机连接因特网(Internet)的唯一标识符,用作个人信息识别和虚拟位置寻址。从多个维度(网络时延、端口开放情况和WHOIS注册信息等)积极探索IP地址本身特征并提取背后的知识,可以视为IP地址分析。通过IP地址分析,可以识别虚拟地址的风险行为,挖掘用户的个人信息。这些信息在许多下游软件(如支付风控、DDos攻击防范和生活推荐平台)有着广泛的应用。在IP地址分析中,地理位置信息的推测近年来备受关注。它是指将真实世界的地理位置(通常由经度和纬度表示)分配到给定的目标IP地址的过程。这对许多用户定制化的广泛互联网应用有重要意义,包括有针对性的营销,欺诈预防等。有了用户的准确地理位置,线上平台还可以提供各种个性化服务。例如,在线定向广告可以推荐用户附近的餐馆。普适的基于位置的服务一直被认为是互联网面临的一个重要挑战。
[0003]在过去,IP地址定位主要通过收集公开路由器上存储的地理位置相关的字段,建立映射关系库来进行定位。然而,含有地理位置信息的公开路由器数量极少,且被动收集的方式无法保证地理位置的可靠程度。依靠此类方法,几乎无法得到细粒度的、可靠的地理位置。一部分方法使用各地的探测机向目的IP发送ping指令并观测延迟以推测其地理位置。然而,网络环境复杂且不稳定,拓扑结构也往往无法确定,该方法往往难以得到准确的结果。近年来,网络信息爆炸增长以及多媒体信息处理技术迅速发展,使得IP地址定位可以利用新兴技术进行数据收集和定位。这些方法利用自然语言处理、多模态等技术,搜寻并存储社交网络上的登录记录、网页多媒体信息中的地理线索和实时网络摄像头等数据,搜寻其服务器IP地址,建立IP地址与地理位置的映射关系。
[0004]随着机器学习技术的高速发展,深度学习在很多应用领域都取得了极好的效果。在IP地址定位这一领域中,现用方法采用聚类方法(如KNN)及多层感知机(MLP)技术,结合IP地址的特征,先将IP地址的范围逐步缩小,然后推测其经纬度,因而能基本完成IP地址定位任务。然而,该方法无法考虑IP之间的拓扑关联,所以模型的解释性差,数据利用不完全,且难以应对广泛存在的网络波动情况,无法胜任日益增长的高精度街道级定位需。

技术实现思路

[0005]本专利技术的目的是克服现有技术的不足而提供一种有效的基于图神经网络的街道级IP地址定位方法。
[0006]本专利技术的技术方案如下:
[0007]一种基于图神经网络的街道级IP地址定位方法,包括以下步骤:
[0008]步骤S1、IP地址聚类,筛选与目标IP匹配的地标IP,得到包含目标IP与若干地标IP
为图结点的区域;
[0009]步骤S2、IP地址连接,从IP特征和网络测量两种不同的视角,建立所述区域中的目标IP与地标IP间的拓扑空间关系,以得到目标IP与关联地标IP间的边缘权重,构成完整的拓扑图结构;
[0010]步骤S3、IP特征聚合,利用目标IP与地标IP间的边缘权重及拓扑图结构,使用图卷积神经网络聚合邻域地标特征及地理坐标,并通过正则化流得到关于目标IP的概率表示以抵御网络波动带来的负面影响,得到关于IP的健壮的隐状态;
[0011]步骤S4、IP地址定位,使用多层感知机进行线性仿射变化,从概率表示——即目标IP的隐状态中解码得到目标IP的经纬度坐标,完成IP定位任务。
[0012]进一步,所述步骤S1的具体过程如下:
[0013]在位于不同城市的探测机上使用tracert工具来搜索路由路径,并记录最后一跳路由器;将获得的最后一跳路由器存储到traceroute列表,然后将traceroute列表中具有相同最后一跳路由器的IP主机聚类成一个图,即得到包含目标IP与若干地标IP为图结点的区域。
[0014]进一步,所述步骤S2中获得目标IP与关联地标IP间的边缘权重的具体过程如下:
[0015]利用同一区域内的IP地址和该区域内的IP地址的公共路由器之间的网络测量得到的已有拓扑来建立第一边缘权重;
[0016]选择与目标IP具有相似半径的地标IP,以构造与目标IP和地标IP之间的距离差成反比的第一边缘权重,表示为:
[0017][0018]其中,t、l和r分别表示目标IP、地标IP和公共路由器;
[0019]Δ2(t,1)通过距离映射函数d(
·
,r)将网络测量值映射到地理距离,并计算t和l之间的径向距离差;
[0020]所述距离映射函数的表达式如下:
[0021]d(
·
,r)=α(βlog RTT(
·
,r)+Hop(
·
,r))+γ
ꢀꢀ
式2,
[0022]其中,RTT(
·
,r)和Hop(
·
,r)分别表示IP主机和公共路由器之间的延迟和路由跳数,α、β和γ是超参数,所述超参数是以网络测量为输入,使用全连接层网络学习并获得。
[0023]利用IP地址之间的特征相似度来构建第二边缘权重,已知目标IP和地标IP,通过拼接任意两个IP的特征向量,计算其点积来得到两两IP的相似度作为第二边缘权重,表达式如下:
[0024][0025]其中,T表示矩阵转置,{X
t
,X
l
}表示目标IP和地标IP特征向量的拼接,W
q
和W
k
为通过神经网络学习获得的参数。
[0026]进一步,将第一边缘权重和第二边缘权重融合并控制最终图的稀疏性,得到拓扑图结构描述如下:
[0027][0028]其中,κ是平衡第一边缘权重与第二边缘权重的超参数,∈是控制拓扑图结构邻接矩阵稀疏程度的阈值。
[0029]进一步,所述步骤S3的具体过程如下:
[0030]首先,利用图卷积神经网络(GCN)得到一个简单的高斯分布:
[0031][0032]其中,表示IP的特征向量与地标经纬度的拼接,对于待预测的目标IP,使用(0,0)代替,GCN
μ
和GCN
σ
是两个具有不同参数的图卷积神经网络,Z是服从高斯分布的随机变量,表示所有IP节点的隐状态;
[0033]然后,使用连续正则化流将隐状态Z继续推导至更灵活的分布形式以应对变幻莫测的网络环境,设和是初始随机变量和概率分布,那么分布变化可表示为:
[0034][0035][0036][0037]其中,t1是表示分布转换跨度的超参数,f(
·
;θ
f
)是以θ
f
为可学习参数的全连接层,Tr表示矩阵的迹;
[0038]最后,以最大化证据下限(ELBO)以优化最终后验分布,如下所示:
[0039][004本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于图神经网络的街道级IP地址定位方法,其特征在于,包括以下步骤:步骤S1、IP地址聚类,筛选与目标IP匹配的地标IP,得到包含目标IP与若干地标IP为图结点的区域;步骤S2、IP地址连接,从IP特征和网络测量两种不同的视角,建立所述区域中的目标IP与地标IP间的拓扑空间关系,以得到目标IP与关联地标IP间的边缘权重,构成完整的拓扑图结构;步骤S3、IP特征聚合,利用目标IP与地标IP间的边缘权重及拓扑图结构,使用图卷积神经网络聚合邻域地标特征及地理坐标,并通过正则化流得到关于目标IP的概率表示以抵御网络波动带来的负面影响,得到关于IP的健壮的隐状态;步骤S4、IP地址定位,使用多层感知机进行线性仿射变化,从概率表示——即目标IP的隐状态中解码得到目标IP的经纬度坐标,完成IP定位任务。2.根据权利要求1所述的基于图神经网络的街道级IP地址定位方法,其特征在于,所述步骤S1的具体过程如下:在位于不同城市的探测机上使用tracert工具来搜索路由路径,并记录最后一跳路由器;将获得的最后一跳路由器存储到traceroute列表,然后将traceroute列表中具有相同最后一跳路由器的IP主机聚类成一个图,即得到包含目标IP与若干地标IP为图结点的区域。3.根据权利要求1所述的基于图神经网络的街道级IP地址定位方法,其特征在于,所述步骤S2中获得目标IP与关联地标IP间的边缘权重的具体过程如下:利用同一区域内的IP地址和该区域内的IP地址的公共路由器之间的网络测量得到的已有拓扑来建立第一边缘权重;选择与目标IP具有相似半径的地标IP,以构造与目标IP和地标IP之间的距离差成反比的第一边缘权重,表示为:其中,t、l和r分别表示目标IP、地标IP和公共路由器;Δ2(t,l)通过距离映射函数d(
·
,r)将网络测量值映射到地理距离,并计算t和l之间的径向距离差;所述距离映射函数的表达式如下:d(
·
,r)=α(βlog RTT(
·
,r)+Hop(
·
,r))+γ
ꢀꢀ
式2,其中,RTT(
·
,r)和Hop(
·
,r)分别表示IP主机和公共路由器之间的延迟和路由跳数,α、β和γ是超参数,所述超参数是以网络测量为输入,使用全连接层网络学习并获得。4.根据权利要求3所述的基于图神经网络的街道级IP地址定位方法,其特征在于...

【专利技术属性】
技术研发人员:王永田占奎任国明武可嘉邱鹏遆永鹏杨宇强李梦月段金强
申请(专利权)人:郑州埃文计算机科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1