System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于混合关联网络的时间序列分类特征提取方法技术_技高网

一种基于混合关联网络的时间序列分类特征提取方法技术

技术编号:41362983 阅读:6 留言:0更新日期:2024-05-20 10:11
本发明专利技术公开了一种基于混合关联网络的时间序列分类特征提取方法,该方法首先将时间序列数据转化为一个数据关联网络,计算数据关联网络的统计指标作为分类特征。其次计算分类特征之间的皮尔逊相关系数,构建无监督特征关联网络P‑Net,计算分类特征之间的CH系数,构建有监督特征关联网络CH‑Net。然后获取节点在各自网络中的相对重要性得分,计算两个网络节点的重要性得分权重系数。最后利用重要性得分权重系数将相对重要性得分进行融合,获取特征得分,根据特征排序结果,按分类模型的实际需求数量选取特征。本发明专利技术能够挖掘原始数据中隐含的有效信息,减少过拟合风险,加速计算过程。

【技术实现步骤摘要】

本专利技术属于时间序列分类领域,具体涉及一种基于混合关联网络的时间序列分类特征提取方法


技术介绍

1、随着科技的不断进步和工业化的飞速发展,各类系统的运行和监测数据呈现出爆炸式增长的趋势,这些数据通常以时间序列的形式存在。时间序列数据承载着丰富的信息,对于系统的运行状态、性能变化以及潜在问题具有重要的指示作用,在分类问题中有广泛的应用。因此,从时间序列数据中挖掘出关键的分类特征具有重要的理论意义和应用价值。

2、然而,传统的时间序列分析方法往往基于统计学原理,在处理非线性、高度动态系统的时间序列数据时具有一定的局限性,难以有效提取关键特征信息。同时,对于挖掘得到的特征并没有进行有效的筛选,影响了分类模型的性能。

3、网络模型能够更好地捕捉时间序列数据中的时序关系,为解决以上问题提供了可能。一方面,可以将时间序列转化为网络,挖掘更加精细化的特征;另一方面,通过关联分析,对特征进行筛选,得到关键特征信息,提高分类模型的性能。


技术实现思路

1、为了解决上述技术,本专利技术提出一种基于混合关联网络的时间序列分类特征提取方法。该方法在处理非线性、动态系统的时间序列数据时展现出更好的适应性和鲁棒性。

2、本专利技术的具体技术方案如下:

3、s1:利用时间滑窗算法将得到的时间序列数据转化为宽度相同的子时间序列,利用加权可视图方法,将每个子时间序列转化为一个数据关联网络;

4、s2:采用网络拓扑分析方法,计算得到的数据关联网络的统计指标,作为分类特征;

5、s3:计算分类特征之间的皮尔逊相关系数,将分类特征作为网络节点,并根据皮尔逊相关系数获取分类特征之间的边权重,构建无监督特征关联网络p-net;

6、s4:计算分类特征之间的calinski-harabasz(ch)系数,以分类特征为网络节点,分类特征之间的ch系数为边权重,构建有监督特征关联网络ch-net;

7、s5:分别计算p-net和ch-net中各个节点的强度,基于此获取节点在各自网络中的相对重要性得分ps和chs;

8、s6:结合无监督特征关联网络p-net和有监督特征关联网络ch-net中相对重要性得分的中位数,计算两个网络节点的重要性得分权重系数;

9、s7:利用s6得到的重要性得分权重系数将s5得到的重要性得分进行融合,获取最终的特征得分,按得分由高到低进行排序;

10、s8:根据特征排序结果,按分类模型的实际需求选取一定数量的特征。

11、进一步地,所述步骤s1中,对同种类别下长度为len的时间序列数据进行滑窗提取,取滑窗尺度为ξ,步长为step,将时间序列数据划分为n组宽度相同的子时间序列。n的计算公式如公式(1)所示。

12、

13、其中,[x]表示不超过x的最大整数。

14、将子时间序列数据点作为数据关联网络网络的节点,以子时间序列数据点之间的可视连边作为数据关联网络网络的边。其中,可视连边的获取如下:设t={ti}i=1,...,η为一个具有η个数据的时间序列,时间序列中任意两个数据点(τa,ta)和(τb,tb),对其中τa<τi<τb,如果满足以下条件:

15、

16、则称这两点可视,两点之间有可视连边。重复公式(2)直至遍历一组时间序列所有的点,将时间序列转换为具有拓扑关系的数据关联网络。依次对所有子时间序列进行加权可视化,完成对应数据关联网络转化。

17、进一步地,所述步骤s2中,对子时间序列得到的数据关联网络进行网络拓扑分析,计算k种网络统计属性,得到对应数据关联网络的统计指标φi(i=1,2,...,k)。遍历同类别下所有的子时间序列,得到同类别的特征集其中,分别表示第n个子时间序列下第i个特征的数据集。故c类别下第n个子时间序列对应的数据关联网络的统计特征可记为c为类别的个数。记不同类别选取的时间序列数相同,则包含不同类别的分类特征集为统计特征数据集φc={φ1,φ2,...,φk,c};φi(i=1,2,...,k)为所有类别下对应的数据关联网络特征i的数据集,数据集中的样本总数为t,t=c*n。

18、进一步地,所述步骤s3中,基于所提取出的统计特征数据集φc={φ1,φ2,...,φk,c},将分类特征作为网络节点,并根据分类特征之间的皮尔逊相关系数的绝对值作为边的权重,构建无监督特征关联网络p-net。计算特征子集φi,φj(i≠j)之间的皮尔逊相关系数并取绝对值,记为pij。皮尔逊相关系数计算公式如下:

19、

20、进一步地,所述步骤s4中,以分类特征为节点,分类特征之间的ch系数为边权重,构建有监督特征关联网络ch-net。ch系数计算公式如下:

21、

22、其中,nj是第j个类的样本数目,u是整个数据集{φi,φj}(i≠j)的均值,uj是第j个类的均值。

23、进一步地,所述步骤s5中,先计算分类特征关联网络p-net和ch-net中各节点的强度,分别记为pws和chws。

24、

25、

26、找出pws中最小的强度值,将所有节点的强度依次除以最小强度值,得到各节点在p-net中节点强度的相对重要性得分ps,计算公式为:

27、

28、同理,找出chws中最小的强度值,计算各节点在ch-net中节点强度的相对重要性得分chs,计算公式为:

29、

30、进一步地所述步骤s6中,记p-net中节点的相对重要性得分的权重为ε,ch-net中节点的相对重要性得分的权重为μ。ε,μ的计算公式如下:

31、

32、

33、其中,psm为p-net中所有节点的相对重要性得分的中位数,chsm为ch-net中所有节点的相对重要性得分的中位数。

34、进一步地,所述步骤s7中,结合s5得到的重要性得分,按照步骤s6计算所得的权重系数ε,μ进行融合,获取最终的节点得分,按得分高低进行特征排序。特征i的最终得分fs(i)的计算公式如下:

35、fs(i)=ε*ps(i)+μ*chs(i)      (11)

36、对fs(i)进行排序,输出排序后的对应的特征编号i及对应特征子集φi的顺序。

37、进一步地,所述步骤s8中,根据特征排序结果,结合分类模型的输入以及性能要求,按顺序选出所需数量的特征。

38、本专利技术的有益效果在于:

39、与传统的时间序列分析方法相比,通过加权可视图将时间序列转化为复杂网络模型,借助网络的拓扑结构以及统计特性,能够挖掘原始数据中隐含的有效信息;

40、对基于复杂网络结构提取的特征进行筛选,可以根据分类模型的实际需求给出相应数量的关键特征,减少过拟合风险,加速计算过程,提升模型性能。

本文档来自技高网...

【技术保护点】

1.一种基于混合关联网络的时间序列分类特征提取方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的基于混合关联网络的时间序列分类特征提取方法,其特征在于,所述步骤S1具体过程为:对同种类别下长度为Len的时间序列数据进行滑窗提取,取滑窗尺度为ξ,步长为step,将时间序列数据划分为N组宽度相同的子时间序列;N的计算公式如公式(1)所示:

3.根据权利要求2所述的基于混合关联网络的时间序列分类特征提取方法,其特征在于,所述步骤S2具体过程为:对子时间序列得到的数据关联网络进行网络拓扑分析,计算k种网络统计属性,得到对应数据关联网络的统计指标φi(i=1,2,...,k);

4.根据权利要求3所述的基于混合关联网络的时间序列分类特征提取方法,其特征在于,所述步骤S3具体过程为:基于统计特征数据集Φc={φ1,φ2,...,φk,c},将分类特征作为网络节点,并根据分类特征之间的皮尔逊相关系数的绝对值作为边的权重,构建无监督特征关联网络P-Net;计算特征子集φi,φj(i≠j)之间的皮尔逊相关系数并取绝对值,记为Pij:

5.根据权利要求4所述的基于混合关联网络的时间序列分类特征提取方法,其特征在于,步骤S4中,所述CH系数计算公式如下:

6.根据权利要求5所述的基于混合关联网络的时间序列分类特征提取方法,其特征在于,所述步骤S5中,计算分类特征关联网络P-Net和CH-Net中各节点的强度,分别记为PWS和CHWS;

7.根据权利要求6所述的基于混合关联网络的时间序列分类特征提取方法,其特征在于,所述步骤S6中,记P-Net中节点的相对重要性得分的权重为ε,CH-Net中节点的相对重要性得分的权重为μ,ε,μ的计算公式如下:

8.根据权利要求7所述的基于混合关联网络的时间序列分类特征提取方法,其特征在于,所述步骤S7中,特征i的得分FS(i)的计算公式如下:

...

【技术特征摘要】

1.一种基于混合关联网络的时间序列分类特征提取方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的基于混合关联网络的时间序列分类特征提取方法,其特征在于,所述步骤s1具体过程为:对同种类别下长度为len的时间序列数据进行滑窗提取,取滑窗尺度为ξ,步长为step,将时间序列数据划分为n组宽度相同的子时间序列;n的计算公式如公式(1)所示:

3.根据权利要求2所述的基于混合关联网络的时间序列分类特征提取方法,其特征在于,所述步骤s2具体过程为:对子时间序列得到的数据关联网络进行网络拓扑分析,计算k种网络统计属性,得到对应数据关联网络的统计指标φi(i=1,2,...,k);

4.根据权利要求3所述的基于混合关联网络的时间序列分类特征提取方法,其特征在于,所述步骤s3具体过程为:基于统计特征数据集φc={φ1,φ2,...,φk,c},将分类特征作为网络节点,并根据分类特征之间的皮尔逊相关...

【专利技术属性】
技术研发人员:章振杰江宽徐晓滨李锋黄进刚常雷雷冯静侯平智
申请(专利权)人:杭州电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1