System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种时间序列数据分析方法、系统及设备技术方案_技高网

一种时间序列数据分析方法、系统及设备技术方案

技术编号:41367551 阅读:6 留言:0更新日期:2024-05-20 10:14
本发明专利技术涉及数据分析技术领域,尤其涉及一种时间序列数据分析方法,包括:获取时间序列数据的数据属性,并进行数据转换;对完成数据转换的数据属性进行去极值处理以及数据清洗;对完成数据清洗的时间序列数据,对时间序列数据进行分组;对分组后的时间序列数据进行数据关联,排序,并根据排序结果确定有效关联组;对有效关联组进行数据划分以生成数据排序训练集;对待处理的时间序列数据匹配数据排序训练集以进行数据分析;通过将时间序列数据进行分组,进行数据关联和排序,并根据排序结果修正时间序列数据的时序周期,确保时间序列的完成顺序与上传顺序一致,避免时间序列数据分析发生错误以及混淆,从而提高了时间序列数据分析的准确性。

【技术实现步骤摘要】

本专利技术涉及数据分析,尤其涉及一种时间序列数据分析方法、系统及设备


技术介绍

1、随着我国科技水平的不断提高,促使互联网技术飞速发展,用户所产生的数据总量成指数型增长,在大量的数据中,时间序列数据是一种非常常见的时态数据,它被广泛的应用于工业、农业、医疗、金融、交通等行业与我们的生活息息相关,因此如何准确分析时间序列数据成为重中之重。

2、目前常用的时间序列分析方法为中国专利授权公告号:cn108399434b公开了一种基于特征提取的高维时间序列数据的分析预测方法,涉及数据分析
该方法首先度量高维时间序列数据的条件属性间和条件属性与决策属性间的相关性,并将与决策属性有相关性的条件属性加入属性核集中;再对高维时间序列数据进行特征提取;然后建立多元线性回归模型,再通过基于健康度的粒子群优化算法对模型中的回归系数进行优化;最后根据所构建的多元线性回归模型,得到某一时刻决策属性的值。本专利技术提供的基于特征提取的高维时间序列数据的分析预测方法,解决了高维时间序列数据在分析预测过程中所存在的预测效率低、误差大以及容易出现局部最优解的问题,有效提高了多元线性回归分析算法对高维时间序列数据的预测效果。

3、但是,上述方法存在以下问题:时间序列数据分析时会因为其服务器所在地不同造成服务器对时间序列数据处理完成顺序与上传顺序不同,从而导致时间序列数据出现错误以及混淆。


技术实现思路

1、为此,本专利技术提供一种时间序列数据分析方法、系统及设备,用以克服现有技术中时间序列数据分析时会因为其服务器所在地不同造成服务器对时间序列数据处理完成顺序与上传顺序不同,从而导致时间序列数据出现错误以及混淆的问题。

2、为实现上述目的,本专利技术提供一种时间序列数据分析方法,包括:

3、步骤s1,获取时间序列数据的数据属性,并进行数据转换;

4、步骤s2,对完成所述数据转换的数据属性进行去极值处理以及数据清洗;

5、步骤s3,对完成所述数据清洗的时间序列数据,根据所述数据属性对时间序列数据进行分组;

6、步骤s4,对分组后的时间序列数据进行数据关联、排序,并根据排序结果确定有效关联组;

7、步骤s5,对所述有效关联组进行数据划分以生成数据排序训练集,并根据数据排序训练集确定对时间序列数据的静默时长;

8、步骤s6,对待处理的时间序列数据匹配所述静默时长以进行数据分析;

9、其中,所述数据属性包括数据名称、上传时间以及数据资源;所述数据关联为将所述时间序列数据关联其对应的传输时长以及处理时长。

10、进一步地,在所述步骤s1中,所述数据转换包括将从不同时区的服务器的所述时间序列数据的数据时间转换为协调世界时,以及将各所述时间序列数据的数据格式转换为相同格式。

11、进一步地,在所述步骤s2中,所述去极值处理为将所述时间序列数据对应的数据资源按照预设标准将量级不同的数据资源按量级进行分类,并在各类数据资源中确定对应的平均数据资源以及标准差,以分类进行去极值处理;

12、所述数据清洗为根据预设筛选条件对所述时间序列数据进行剔除。

13、进一步地,在所述步骤s3中,分组的方式包括根据所述时间序列数据对应的数据资源的分位数进行分组以及根据所述时间序列数据对应的数据资源的资源量级进行分组。

14、进一步地,在所述步骤s4中,对各个分组中的时间序列数据分别根据所述上传时间以及完成时间进行排序;

15、其中,时序周期包括所述传输时长以及所述处理时长;

16、其中,所述完成时间与所述时序周期以及所述上传时间有关。

17、进一步地,在所述步骤s4中,单个分组中的时间序列数据根据所述上传时间的排序顺序以及根据所述完成时间的排序顺序结果是否一致,确定单个分组中的时间序列数据是否为有效关联组;

18、若单个分组中的时间序列数据根据所述上传时间的排序顺序以及根据所述完成时间的排序顺序结果一致,判定单个分组中的时间序列数据为有效关联组;

19、若单个分组中的时间序列数据根据所述上传时间的排序顺序以及根据所述完成时间的排序顺序结果不一致,判定单个分组中的时间序列数据为无效关联组。

20、进一步地,对所述无效关联组对应的所述时间序列数据的所述时序周期进行修正,以生成对应的有效关联组;

21、其中,所述时序周期的修正为选取所述无效关联组中最长的时序周期作为标准周期,对无效关联组中的时序周期增加静默时长以生成标准周期;

22、静默时长由式(1)确定:

23、t’=t+t1=t0   (1)

24、其中,t’修正后的时序周期,t0为标准周期,t为原时序周期,t1为静默时长。

25、进一步地,根据所述有效关联组对应的数据资源的资源量级以及对应的上传间隔确定是否采用数据并行;

26、若所述有效关联组对应的数据资源的资源量级大于预设量级且对应的上传间隔大于预设间隔,对有效关联组采用数据并行。

27、另一方面,本专利技术还提供一种时间序列数据分析系统,包括:

28、收集单元,其用以收集时间序列数据,并获取对应的数据属性

29、预处理单元,其与所述收集单元相连,用以对所述时间序列数据进行数据转换、去极值处理以及数据清洗以生成初级时间序列数据;

30、分选单元,其与所述预处理单元相连,用以根据所述数据属性对所述初级时间序列数据进行分组以生成数据小组;

31、关联单元,其与所述分选单元相连,用以对所述数据小组进行数据关联以生成关联小组;

32、判断单元,其与所述关联单元相连,用以对所述关联小组进行排序并根据排序结果确定关联小组的类型;

33、修正单元,其与所述判断单元以及所述关联单元相连,用以根据所述关联小组的类型确定是否对所述关联小组进行修正以生成二次关联小组;

34、训练单元,其与所述关联单元以及所述修正单元相连,用以根据所述关联小组以及所述二次关联小组进行数据划分以生成数据排序训练集,并根据数据排序训练集确定对时间序列数据的静默时长;

35、应用单元,其与所述训练单元相连,用以对待处理的时间序列数据匹配所述静默时长以进行数据分析。

36、另一方面,本专利技术还提供一种时间序列数据分析设备,包括:

37、服务器,其用以接收时间序列数据;

38、处理组件,其用以对时间序列数据进行数据转换、去极值处理以及数据清洗以生成初级时间序列数据;

39、分析组件,其与所述处理组件相连,用以对所述初级时间序列数据进行分选、数据关联以生成关联小组;

40、决策组件,其与所述分析组件相连用以对所述关联小组进行排序并根据排序结果确定关联小组的类型;

41、管理组件,其与所述决策组件以及所述分析组件相连,用以根据所述关联小组的类型确定本文档来自技高网...

【技术保护点】

1.一种时间序列数据分析方法,其特征在于,包括:

2.根据权利要求1所述的时间序列数据分析方法,其特征在于,在所述步骤S1中,所述数据转换包括将从不同时区的服务器的所述时间序列数据的数据时间转换为协调世界时,以及将各所述时间序列数据的数据格式转换为相同格式。

3.根据权利要求2所述的时间序列数据分析方法,其特征在于,在所述步骤S2中,所述去极值处理为将所述时间序列数据对应的数据资源按照预设标准将量级不同的数据资源按量级进行分类,并在各类数据资源中确定对应的平均数据资源以及标准差,以分类进行去极值处理;

4.根据权利要求3所述的时间序列数据分析方法,其特征在于,在所述步骤S3中,分组的方式包括根据所述时间序列数据对应的数据资源的分位数进行分组以及根据所述时间序列数据对应的数据资源的资源量级进行分组。

5.根据权利要求4所述的时间序列数据分析方法,其特征在于,在所述步骤S4中,对各个分组中的时间序列数据分别根据所述上传时间以及完成时间进行排序;

6.根据权利要求5所述的时间序列数据分析方法,其特征在于,在所述步骤S4中,单个分组中的时间序列数据比较根据所述上传时间的排序顺序与根据所述完成时间的排序顺序的排序次序是否一致,并根据比较结果确定单个分组中的时间序列数据是否为有效关联组;

7.根据权利要求6所述的时间序列数据分析方法,其特征在于,对所述无效关联组对应的所述时间序列数据的所述时序周期进行修正,以生成对应的有效关联组;

8.根据权利要求7所述的时间序列数据分析方法,其特征在于,根据待处理的时间序列数据对应的数据资源的资源量级以及对应的上传间隔确定是否采用数据并行;

9.一种时间序列数据分析系统,其特征在于,包括:

10.一种时间序列数据分析设备,其特征在于,包括:

...

【技术特征摘要】

1.一种时间序列数据分析方法,其特征在于,包括:

2.根据权利要求1所述的时间序列数据分析方法,其特征在于,在所述步骤s1中,所述数据转换包括将从不同时区的服务器的所述时间序列数据的数据时间转换为协调世界时,以及将各所述时间序列数据的数据格式转换为相同格式。

3.根据权利要求2所述的时间序列数据分析方法,其特征在于,在所述步骤s2中,所述去极值处理为将所述时间序列数据对应的数据资源按照预设标准将量级不同的数据资源按量级进行分类,并在各类数据资源中确定对应的平均数据资源以及标准差,以分类进行去极值处理;

4.根据权利要求3所述的时间序列数据分析方法,其特征在于,在所述步骤s3中,分组的方式包括根据所述时间序列数据对应的数据资源的分位数进行分组以及根据所述时间序列数据对应的数据资源的资源量级进行分组。

5.根据权利要求4所述的时间序列数据分析方...

【专利技术属性】
技术研发人员:吴锐彬周海军
申请(专利权)人:广州龙数科技有限公司
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1