【技术实现步骤摘要】
本专利技术涉及数据挖掘
,特别是涉及一种时间序列分类方法及装置。
技术介绍
时间序列,是指某种现象或者统计指标在不同时间点上的各个数值按照时间顺序排列而成的有序序列。时间序列的分类问题一直是时间序列数据挖掘
研究人员关注的重点。目前,常根据基于欧氏距离的高斯核函数对时间序列进行分类。由于欧氏距离对时间序列没有较好的适应性,所以基于欧氏距离的高斯核函数难以为时间序列的分类提供较好的字典,使得对时间序列分类的精准度较低。
技术实现思路
本专利技术的目的是提供一种时间序列分类方法及装置,以快速有效地确定测试时间序列的类别,提高对测试时间序列分类的精准度。一种时间序列分类方法,包括:针对待分类的测试时间序列,确定所述测试时间序列与预先获得的训练时间序列集中每个训练时间序列的第一动态时间规整距离,所述训练时间序列集中包含若干个已知类别的训练时间序列;针对确定的每个第一动态时间规整距离,确定基于该第一动态时间规整距离的第一高斯核函数,获得所述测试时间序列的高斯核变换矩阵;根据所述高斯核变换矩阵和预先生成的所述训练时间序列集的字典矩阵,获得所述测试时间序列的稀疏表示系数矩阵,所述字典矩阵包含多个原子;针对每种类别,根据所述字典矩阵中与该类别位置对应的原子和所述稀疏表示系数矩阵,确定所述测试时间序列与该类别的残差;将最小残差对应的类别确定为所述测试时间序列的类别。在本专利技术的一种具体实施方式中,所述针对待分类的测试时间序列,确定所述测试时间序列与预先获得的训练时间序列集中每个训练时间序列的第一动态时间规整距离,包括:针对待分类的测试时间序列,根据公式 ...
【技术保护点】
一种时间序列分类方法,其特征在于,包括:针对待分类的测试时间序列,确定所述测试时间序列与预先获得的训练时间序列集中每个训练时间序列的第一动态时间规整距离,所述训练时间序列集中包含若干个已知类别的训练时间序列;针对确定的每个第一动态时间规整距离,确定基于该第一动态时间规整距离的第一高斯核函数,获得所述测试时间序列的高斯核变换矩阵;根据所述高斯核变换矩阵和预先生成的所述训练时间序列集的字典矩阵,获得所述测试时间序列的稀疏表示系数矩阵,所述字典矩阵包含多个原子;针对每种类别,根据所述字典矩阵中与该类别位置对应的原子和所述稀疏表示系数矩阵,确定所述测试时间序列与该类别的残差;将最小残差对应的类别确定为所述测试时间序列的类别。
【技术特征摘要】
1.一种时间序列分类方法,其特征在于,包括:针对待分类的测试时间序列,确定所述测试时间序列与预先获得的训练时间序列集中每个训练时间序列的第一动态时间规整距离,所述训练时间序列集中包含若干个已知类别的训练时间序列;针对确定的每个第一动态时间规整距离,确定基于该第一动态时间规整距离的第一高斯核函数,获得所述测试时间序列的高斯核变换矩阵;根据所述高斯核变换矩阵和预先生成的所述训练时间序列集的字典矩阵,获得所述测试时间序列的稀疏表示系数矩阵,所述字典矩阵包含多个原子;针对每种类别,根据所述字典矩阵中与该类别位置对应的原子和所述稀疏表示系数矩阵,确定所述测试时间序列与该类别的残差;将最小残差对应的类别确定为所述测试时间序列的类别。2.根据权利要求1所述的方法,其特征在于,所述针对待分类的测试时间序列,确定所述测试时间序列与预先获得的训练时间序列集中每个训练时间序列的第一动态时间规整距离,包括:针对待分类的测试时间序列,根据公式 d d t w ( ( x i ) 1 m , ( y ) 1 m ) = | x i m - y m | + min ( d d t w ( ( x i ) 1 m - 1 , ( y ) 1 m ) , d d t w ( ( x i ) 1 m - 1 , ( y ) 1 m - 1 ) , d d t w ( ( x i ) 1 m , ( y ) 1 m - 1 ) ) , ]]>确定所述测试时间序列与预先获得的训练时间序列集中每个训练时间序列的第一动态时间规整距离其中,xi∈Rm为所述训练时间序列集中的第i个训练时间序列,y∈Rm为所述测试时间序列,为训练时间序列xi的子序列,为测试时间序列y的子序列,|xim-ym|表示训练时间序列xi的第m个元素和测试时间序列y的第m个元素的欧氏距离。3.根据权利要求2所述的方法,其特征在于,所述针对确定的每个第一动态时间规整距离,确定基于该第一动态时间规整距离的第一高斯核函数,包括:针对确定的每个第一动态时间规整距离,根据公式 K d t w ( x i , y ) = exp ( - d d t w ( x i , y ) 2 σ 2 ) , ]]>确定基于该第一动态时间规整距离的第一高斯核函数Kdtw(xi,y);其中,σ2为函数宽度参数。4.根据权利要求1至3任一项所述的方法,其特征在于,通过以下步骤预先生成所述训练时间序列集的字典矩阵:针对所述训练时间序列集中的每个训练时间序列,确定该训练时间序列与所述训练时间序列集中每一个训练时间序列的第二动态时间规整距离;针对确定的每个第二动态时间规整距离,确定基于该第二动态时间规整距离的第二高斯核函数;根据获得的第二高斯核函数,生成所述训练时间序列集的字典矩阵。5.根据权利要求4所述的方法,其特征在于,所述针对所述训练时间序列集中的每个训练时间序列,确定该训练时间序列与所述训练时间序列集中每一个训练时间序列的第二动态时间规整距离,包括:针对所述训练时间序列集中的每个训练时间序列,根据公式 d d t w ( ( x i ) 1 m , ...
【专利技术属性】
技术研发人员:张莉,陶志伟,王邦军,张召,李凡长,
申请(专利权)人:苏州大学,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。