一种基于宽度学习系统的台风路径分类方法技术方案

技术编号:33528652 阅读:12 留言:0更新日期:2022-05-19 01:55
本发明专利技术公开了一种基于宽度学习系统的台风路径分类方法。本发明专利技术具体是:S1、将已有的台风路径数据利用改进的DBSCAN算法对台风路径进行聚类分析,建立台风路径的种类标签矩阵;S2、利用改进的层次聚类算法对台风路径进行特征表示,将所有台风路径统一维度;S3、构建基于宽度学习系统的台风路径分类模型,将S1建立的建立台风路径的种类标签矩阵和S2中台风路径特征矩阵作为输入样本,求出系统输入到输出的权重矩阵,从而实现台风路径的分类。本发明专利技术方法采用了宽度学习系统对台风路径进行分类,实现了台风路径的自动分类。现了台风路径的自动分类。现了台风路径的自动分类。

【技术实现步骤摘要】
一种基于宽度学习系统的台风路径分类方法


[0001]本专利技术属于台风路径分类
,特别涉及一种基于宽度学习系统的台风路径分类方法。

技术介绍

[0002]台风是全球最严重的自然灾害之一,因此研究台风活动的变化规律及其成因对台风预报及防灾减灾有极大的科学意义。
[0003]宽度学习系统(BLS)是一种基于随机向量函数链接神经网络的增量式学习算法,由于其训练过程无须反复迭代样本数据且通过岭回归求解伪逆的方式计算网络输出层权重矩阵,因此与普通神经网络相比更适合处理需要计算量较大的工作,如数据分类等。
[0004]宽度学习系统由特征映射层、增强节点层和输出层组成,其中特征映射层和增强向量层共同作为系统的输入。特征映射层通过特征映射函数随机生成权重实现对样本的特征提取。增强节点层通过正交规范化的随机权重对特征向量进行增强计算,引入激活函数函数增强模型的非线性分类能力,从而达到充分提取样本数据特征信息的目的。最后通过对特征映射层和增强节点层的合成矩阵进行伪逆运算,即可求出系统输入到输出的权重矩阵。当利用宽度学习系统解决分类问题时,将待分类的数据集和待分类数据集的标签集作为宽度学习系统的输入,训练宽度学习系统,宽度学习系统输出各数据分别属于各个类别的概率,概率最大所在的类别最即为该数据所被判别的类别。
[0005]台风路径是台风在运动过程中,台风中心点经过的位置组成的时间序列,因台风运动受区域环境、气候等影响导致其运动路径复杂,因此对台风路径进行分类分析较难。目前已有对台风路径的分类研究主集中在对台风进行聚类分析,利用相似阈值对台风路径进行分类。但这种方法只适用于较少的台风路径分类,当台风路径集很大时,相似阈值定义较难,通用型较差。

技术实现思路

[0006]为解决现有技术存在的上述问题,本专利技术提出了一种利用宽度学习系统结合台风路径特征表示的台风路径分类方法。
[0007]本专利技术方法包括以下步骤:
[0008]S1、构建台风路径种类集合。利用改进的DBSCAN算法对台风路径进行聚类分析,利用动态时间规整算法代替DBSCAN算法中的相似度计算方法计算路径间的相似度,将相似性大的路径自动聚为一类,建立台风路径的种类标签矩阵;
[0009]S2、构建台风路径的特征矩阵。利用改进的层次聚类算法对台风路径通过特征表示来统一长度,因台风路径点是严格按照时间先后顺序排列的数据序列,因此本专利技术将层次聚类算法进行改进,只对各个路径相邻点进行层次聚类分析,以相邻点的欧几里得距离(欧氏距离)为度量标准,将欧氏距离较小的点进行合并,将所有台风路径统一长度,实现各个台风路径的特征表示,得到台风路径特征矩阵;
[0010]S3、建立基于宽度学习系统的台风路径多分类模型,并利用该模型进行台风路径分类。宽度学习系统(BLS)是一种基于随机向量函数链接神经网络的增量式学习算法,本专利技术将S1得到的台风路径种类标签矩阵和S2得到的台风路径特征矩阵作为模型的输入,特征映射层随机生成权重对输入样本进行特征提取,增强节点层通过正交规范化的随机权重对特征向量进行增强计算,利用激活函数函数增强模型的非线性分类能力,最后通过对特征映射层和增强节点层的合成矩阵进行伪逆运算,求出系统输入到输出的权重矩阵,输出矩阵每行的输出值即为BLS求出的各路径分别属于各个类别的概率,各行最大值所在位置索引即为各条测试路径所被判别的类别,从而实现台风路径的分类预测。
[0011]本专利技术与现有技术相比有以下优点:
[0012]第一,本专利技术方法中采用了改进的DBSCAN聚类算法建立台风路径的种类集合,可以根据历史各个台风路径的相似性自动生成种类集合。
[0013]第二,本专利技术方法采用了改进层次聚类的特征表示方法,将不同台风路径数据统一尺度,为分类提供基础。
[0014]第三,本专利技术方法采用了宽度学习系统对台风路径进行分类,实现了台风路径的自动分类。
附图说明
[0015]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图做以简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他附图。
[0016]图1是本专利技术的具体实施方式中基于宽度学习系统的台风路径分类方法流程图。
具体实施方式
[0017]如图1所示,本专利技术包括以下步骤:
[0018]S1、通过聚类算法建立台风路径种类集。
[0019]因台风路径是台风运动过程中台风中心按照时间先后顺序排列的轨迹序列,而DBSCAN算法是一种基于密度的聚类算法,它可以发现任意形状的簇,自动确定簇的数量,并对噪声具有鲁棒性,因此很适合于对台风路径这种轨迹类数据进行聚类分析,将相似性大的路径自动聚为一类。相似度一般利用距离进行衡量,距离越小相似度越大。原始的DBSCAN算法在做聚类分析时,采用的是欧氏距离度量方法,此方法只适合用于具有相同个数的点的台风路径且其没有考虑路径的波动情况,因此本专利技术利用动态时间规整算法作为路径的距离度量方法。动态时间规整算法是通过把需要比较的不同路径进行伸长或缩短,直到长度一致,再计算路径间距离。因此台风路径种类集建立过程为:
[0020](1)设扫描邻域半径eps,最小包含路径个数minPts,任选台风路径样本中一条未被访问的路径开始,利用动态时间规整算法计算该路径与其他路径的距离,找出与其距离在eps之内(包括eps)的所有附近路径。
[0021](2)如果附近路径的数量大于等于minPts,则当前路径与其附近路径形成一个簇,并且出发路径被标记成已访问。
[0022](3)重复(1)

(2)步,处理该簇内所有未被标记成已访问的路径,若附近路径的数量小于minPts,则该路径被标记为噪声数据。
[0023](4)若簇内所有路径都被标记成已访问,重复(2)

(3)步直到所有对象都被归为某个簇或标记成噪声数据,输出各个路径的种类标签矩阵。每个路径的特征矩阵记为路径特征的标签矩阵记为Y。
[0024]S2、各个台风路径的数据长度可能不同,因此不能直接利用原始数据构造特征矩阵进行分类。考虑到台风路径无法用函数关系来准确拟合,因此,利用改进的层次聚类算法从各个台风路径上提取相同个数点来表示台风路径,这一过程本专利技术命名为台风路径特征表示,各个提取的点叫做特征点,各个特征点组成的为特征路径。层次的聚类算法的计算原理是先计算样本之间的距离,每次将距离最近的点合并到同一个类。然后,再计算类与类之间的距离,将距离最近的类合并为一个大类,不停的合并,直到达到规定的条件。本专利技术利用改进的层次聚类方法对台风路径进行特征表示,只以相邻点的欧几里得距离(欧氏距离)为度量标准,将欧氏距离小的点进行合并,把合并的点作为路径的特征点。若l
i
为点T
i
到点T
i+1
的距离,其中x...

【技术保护点】

【技术特征摘要】
1.一种基于宽度学习系统的台风路径分类方法,其特征在于该方法包括以下步骤:S1、构建台风路径种类集合;利用改进的DBSCAN算法对台风路径进行聚类分析,具体是:利用动态时间规整算法代替DBSCAN算法中的相似度计算方法计算路径间的相似度,将相似性大的路径自动聚为一类;建立台风路径的种类标签矩阵;S2、构建台风路径的特征矩阵;利用改进的层次聚类算法对台风路径通过特征表示来统一长度,具体是:将层次聚类算法进行改进,只对各个路径相邻点进行层次聚类分析,以相邻点的欧几里得距离为度量标准,将欧氏距离较小的点进行合并,将所有台风路径统一长度,实现各个台风路径的特征表示;得到台风路径特征矩阵;S3、利用基于宽度学习系统的台风路径多分类模型进行台风路径分类;将S1得到的台风路径种类标签矩阵和S2得到的台风路径特征矩阵作为模型的输入;台风路径多分类模型中的特征映射层随机生成权重对输入样本进行特征提取,增强节点层通过正交规范化的随机权重对特征向量进行增强计算,利用激活函数函数增强模型的非线性分类能力;最后通过对特征映射层和增强节点层的合成矩阵进行伪逆运算,求出系统输入到输出的权重矩阵,输出矩阵每行的输出值即为宽度学习系统求出的各路径分别属于各个类别的概率,各行最大值所在位置索引即为各条测试路径所被判别的类别,从而实现台风路径的分类预测。2.根据权利要求1所述一种基于宽度学习系统的台风路径分类方法,其特征在于,所述S1中的台风路径种类标签矩阵的构造步骤为:S11、设扫描邻域半径eps,最小包含路径个数minPts,任选台风路径样本中一条未被访问的路径开始,利用动态时...

【专利技术属性】
技术研发人员:贺治国朱业马赫卢美季余韩东睿
申请(专利权)人:浙江省海洋监测预报中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1