【技术实现步骤摘要】
基于深度聚类的船舶航道提取方法
[0001]本专利技术属于船舶轨迹聚类
,涉及基于深度聚类的船舶航道提取方法。
技术介绍
[0002]近年来,航运业在经济发展中占据着主导地位,随着船舶的数量持续增加,船只碰撞的情况经常发生,船舶航行安全问题越发突出。船舶自动识别系统(Automatic Identification System,AIS)是一种应用于船和岸、船和船之间的海事安全于通信的助航系统,能够提供包括船舶名称、位置、速度和航向等航行信息,通过提取船舶航道、分析航道内船舶行为模式,可实现对船舶航线的有序规划,有效降低水上交通事故风险,对于船舶航行安全具有重要意义。
[0003]目前,船舶航道提取主要通过聚类技术实现。然而目前大部分的轨迹聚类方法仅限于原始轨迹数据空间,当面对数据量大、维度高的船舶AIS轨迹数据时,聚类效果往往不佳,且轨迹数据的特征表示和聚类任务分离,不能保证提取到的特征适合于聚类任务,进一步造成聚类效果不佳。
[0004]因此设计一种适用于数据量大、维度高的船舶AIS轨迹数据的基于深度聚类的船舶航道提取方法。本方法利用深度神经网络提取船舶轨迹特征,并将KL(Kullback
‑
Leibler)散度作为聚类分配的损失函数,通过随机梯度下降算法迭代优化聚类目标,实现轨迹数据的特征表示和聚类分配的同时进行,提高聚类精度和效率。本方案实施简单,聚类效果明显,为从数据量大、维度高的船舶AIS轨迹数据提取出航道提供了一种新的解决方案和研究思路。
技术实现思路
r/>[0005]本专利技术的目的在于提供一种基于深度聚类的船舶航道提取方法。首先对船舶AIS轨迹数据进行预处理,然后采用堆叠自编码器提取船舶轨迹数据的初始特征,最后取出自编码器的编码器部分,引入聚类层,构建深度聚类网络,并以KL散度作为损失函数,通过随机梯度下降算法同时优化深度神经网络参数和聚类中心,实现船舶轨迹特征提取和聚类分配同时进行,最终根据聚类结果提取船舶航道。
[0006]为达到上述目的,本专利技术提供如下技术方案:
[0007]一种基于基于深度聚类的船舶航道提取方法,该方法包括以下步骤:
[0008]步骤1)船舶AIS数据预处理;
[0009]步骤2)轨迹初始特征提取;
[0010]步骤3)轨迹深度聚类。
[0011]进一步,所述步骤1)具体为包括以下步骤:
[0012]步骤11)轨迹提取。将船舶MMSI号相同的轨迹点按时间顺序连接形成的轨迹视为该船舶的历史轨迹。轨迹提取是提取船舶从一个港口到另一个港口的单一轨迹。本专利技术航道提取是针对一定区域进行的,考虑在观测时间内,船舶历史轨迹包含多条单一轨迹,需根
据船舶航行速度是否为0以及两相邻数据点的采集时间是否大于给定时间阈值,对历史轨迹进行分割,从中提取单一轨迹。第i条轨迹可表示为:
[0013]TR
i
=(p
i1
,p
i2
,L,p
in
)
[0014]其中,n表示该轨迹中包含的轨迹点数,轨迹点p
ij
=(t
ij
,lon
ij
,lat
ij
,sog
ij
),t
ij
表示轨迹点采集的时间,lon
ij
,lat
ij
,sog
ij
分别表示船舶i在t时刻的经度、纬度和速度。
[0015]步骤12)异常值删除。删除轨迹数据中的异常点,如速度出现负值,经度超过180
°
,维度超过90
°
,偏离整条轨迹的轨迹点。
[0016]步骤13)轨迹插值。原始AIS数据中存在部分数据缺失的情况,同时对于删除异常点后出现的数据缺失,都需要进行线性插值,填充缺失的数据,提高数据质量。方法如下:
[0017]设定时间阈值t
sh
,若|t
ij
‑
t
i(j+1)
|>t
sh
,计算插值数量:
[0018][0019]t
avg
表示这条轨迹正常采样的平均采样时间间隔,计算插入轨迹点的属性值:
[0020][0021]x=1,2,L,N1表示插入的第x个轨迹点。
[0022]步骤14)轨迹补全与归一化。AIS轨迹数据受采样率和环境影响,造成轨迹长度不同。为简化深度神经网络训练,需将不同长度的船舶轨迹转换为固定长度并做归一化处理。本方案考虑到航行在同一航道上的船舶起点和中典位置应该是相同的,因此采用一种首尾填充策略将轨迹填充到固定长度。以最长轨迹长度l
max
为标准,计算轨迹长度为l
i
的轨迹需要填充的轨迹点数量N2=l
max
‑
l
i
,计算轨迹首部需要填充的轨迹点数量轨迹尾部需要填充的轨迹点数量N4=N2‑
N3。在填充完整成后,轨迹i可表示为之后采用最大最小值法将船舶位置信息(经纬度)和方向信息(航向)都映射到0~1的范围内:
[0023][0024]其中y'为归一化船舶航行信息,y为原始船舶航行信息,y
max
为各航行信息中的最大值,y
min
为各航行信息中的最小值。
[0025]步骤2)轨迹初始特征提取。在完成船舶AIS轨迹数据预处理之后,需要训练一个有编码器和解码器构成的堆叠自编码器,它是一个完全对称的深度神经网络。其中编码器部分主要完成对船舶ASI轨迹数据进行编码,实现高维船舶AIS轨迹数据特征向低维轨迹特征的映射,而解码器与编码器想反,它是将低维的轨迹特征恢复为原始的输入数据。其中编码器端包括1个输入层,3个隐藏层,1个中间隐藏层,输入数据经编码器编码后得到长度为10的低维特征z
i
;解码器结构包括3个隐藏层,1个输出层。将自编码器训练完成之后,将高维船舶AIS轨迹数据集TR
′
=(TR1′
,TR2′
,L,TR
n
′
)输入自编码器的编码器端,得到轨迹的数据的低维特征集合Z=(z1,z2,L,z
n
),完成轨迹的初始特征提取。
[0026]进一步,所述步骤3)具体为包括以下步骤:
[0027]步骤31)自定义聚类层。在编码器部分后面自定义聚类层,将轨迹低维特征作为输
入,通过计算软分配概率获得轨迹聚类结果。为初始化聚类层的网络参数,采用基于欧式距离的K
‑
means算法对轨迹初始特征进行聚类,得到k个初始聚类中心将其作为聚类层的初始网络参数,在聚类层中采用t分布衡量低维特征向量z
i
与类簇中心μ
j
的相似度,称为软分配概率:
[0028][0029]式中||z
i
‑
μ...
【技术保护点】
【技术特征摘要】
1.基于深度聚类的船舶航道提取方法,其特征在于:该方法包括以下步骤:S1)船舶AIS数据预处理;S2)轨迹初始特征提取;S3)轨迹深度聚类。2.根据权利要求1所述的基于深度聚类的船舶航道提取方法,其特征在于:所述步骤S1中,船舶AIS数据预处理包括以下步骤:步骤S11)轨迹提取。将船舶MMSI号相同的轨迹点按时间顺序连接形成的轨迹视为该船舶的历史轨迹。轨迹提取是提取船舶从一个港口到另一个港口的单一轨迹。本发明航道提取是针对一定区域进行的,考虑在观测时间内,船舶历史轨迹包含多条单一轨迹,需根据船舶航行速度是否为0以及两相邻数据点的采集时间是否大于给定时间阈值,对历史轨迹进行分割,从中提取单一轨迹。第i条轨迹可表示为:TR
i
=(p
i1
,p
i2
,L,p
in
)其中,n表示该轨迹中包含的轨迹点数,轨迹点p
ij
=(t
ij
,lon
ij
,lat
ij
,sog
ij
),t
ij
表示轨迹点采集的时间,lon
ij
,lat
ij
,sog
ij
分别表示船舶i在t时刻的经度、纬度和速度。步骤S12)异常值删除。删除轨迹数据中的异常点,如速度出现负值,经度超过180
°
,维度超过90
°
,偏离整条轨迹的轨迹点。步骤S13)轨迹插值。原始AIS数据中存在部分数据缺失的情况,同时对于删除异常点后出现的数据缺失,都需要进行线性插值,填充缺失的数据,提高数据质量。方法如下:设定时间阈值t
sh
,若|t
ij
‑
t
i(j+1)
|>t
sh
,计算插值数量:t
avg
表示这条轨迹正常采样的平均采样时间间隔,计算插入轨迹点的属性值:x=1,2,L,N1表示插入的第x个轨迹点。步骤S14)轨迹补全与归一化。AIS轨迹数据受采样率和环境影响,造成轨迹长度不同。为简化深度神经网络训练,需将不同长度的船舶轨迹转换为固定长度并做归一化处理。本方案考虑到航行在同一航道上的船舶起点和中典位置应该是相同的,因此采用一种首尾填充策略将轨迹填充到固定长度。以最长轨迹长度l
max
为标准,计算轨迹长度为l
i
的轨迹需要填充的轨迹点数量N2=l
max
‑
l
i
,计算轨迹首部需要填充的轨迹点数量轨迹尾部需要填充的轨迹点数量N4=N2‑
N3。在填充完整成后,轨迹i可表示为之后采用最大最小值法将船舶位置信息(经纬度)和方向信息(航向)都映射到0~1的范围内:其中y'为归一化船舶航行信息,y为原始船舶航行信息,y
max
为各航行信息中的最大值,y
m...
【专利技术属性】
技术研发人员:熊炫睿,张帆,熊炼,贾钰梅,张媛,
申请(专利权)人:重庆邮电大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。