数据序列间关系分析方法、装置、存储介质及电子设备制造方法及图纸

技术编号:37959595 阅读:19 留言:0更新日期:2023-06-30 09:34
本申请提供一种数据序列间关系分析方法、装置、存储介质及电子设备,涉及大数据领域。其中,电子设备获取第一数据序列以及第二数据序列;根据第一数据序列与第二数据序列,获得多个片段对的关联指数,根据多个片段对的关联指数,从中选取关联指数最大的目标片段对;根据目标片段对,获得第一数据序列与第二数据序列之间的关联信息。由于每个片段对包括第一数据序列的第一序列片段以及第二数据序列的第二序列片段,并且,第一序列片段与第二序列片段分别截取自不同是时间段,因此,能够获得两序列数据之间滞后的关联关系。列数据之间滞后的关联关系。列数据之间滞后的关联关系。

【技术实现步骤摘要】
数据序列间关系分析方法、装置、存储介质及电子设备


[0001]本申请涉及大数据领域,具体而言,涉及一种数据序列间关系分析方法、装置、存储介质及电子设备。

技术介绍

[0002]时间序列数据是对物理状态或现象的有序观测而成的序列记录,蕴藏着外部环境不同因素对其变化的影响,表现出特定的变化特征,其是自然、工程、社会、经济等众多科学研究和决策的基础。
[0003]由于时间序列数据是挖掘分析、知识发现、情景预测等技术的基础;并且数据科学已由从粗放型分析迈入精细化分析的阶段,这就要求定性定量的分析某一特征的变化规律和影响程度,例如气候变化多少,会给人类那些群体的健康带来什么样的潜在风险,再如在什么样的气温条件下,不同粮食作物的增产效果。因此,在当前大数据背景下,时间序列数据的不断积累和丰富,对其变化特征的挖掘分析已成为数据科学的核心技术需求。
[0004]传统意义上的关联推断方法,大多通过构建复杂的物理过程模型,来分析不同因素间的因果关系。然而,在自然和社会现象中,广泛存在的局部变化效应,如生物都有自己的温度适应区间,病毒对不同年龄阶段的人群具有不同的感染致死率等,这就要求考虑对时间序列数据进行精细化挖掘分析,而传统意义上的关联推断方法并不能对此取得理想的分下效果。

技术实现思路

[0005]为了克服现有技术中的至少一个不足,本申请提供一种数据序列间关系分析方法、装置、存储介质及电子设备,用于分析出两序列数据之间滞后的关联关系,具体包括:
[0006]第一方面,本申请提供一种数据序列间关系分析方法,所述方法包括:
[0007]获取第一数据序列以及第二数据序列;
[0008]根据所述第一数据序列与所述第二数据序列,获得多个片段对的关联指数,其中,每个片段对包括所述第一数据序列的第一序列片段以及所述第二数据序列的第二序列片段,并且,所述第一序列片段与所述第二序列片段分别截取自不同是时间段;
[0009]根据所述多个片段对的关联指数,从中选取关联指数最大的目标片段对;
[0010]根据所述目标片段对,获得所述第一数据序列与所述第二数据序列之间的关联信息。
[0011]第二方面,本申请提供一种数据序列间关系分析装置,所述装置包括:
[0012]序列分割模块,用于获取第一数据序列以及第二数据序列;
[0013]所述序列分割模块,还用于根据所述第一数据序列与所述第二数据序列,获得多个片段对的关联指数,其中,每个片段对包括所述第一数据序列的第一序列片段以及所述第二数据序列的第二序列片段,并且,所述第一序列片段与所述第二序列片段分别截取自不同是时间段;
[0014]片段筛选模块,用于根据所述多个片段对的关联指数,从中选取关联指数最大的目标片段对;
[0015]关系分析模块,用于根据所述目标片段对,获得所述第一数据序列与所述第二数据序列之间的关联信息。
[0016]第三方面,本申请提供一种存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时,实现所述的数据序列间关系分析方法。
[0017]第四方面,本申请提供一种电子设备,所述电子设备包括处理器以及存储器,所述存储器存储有计算机程序,所述计算机程序被处理器执行时,实现所述的数据序列间关系分析方法。
[0018]相对于现有技术而言,本申请具有以下有益效果:
[0019]本申请提供的数据序列间关系分析方法、装置、存储介质及电子设备中,电子设备获取第一数据序列以及第二数据序列;根据第一数据序列与第二数据序列,获得多个片段对的关联指数,根据多个片段对的关联指数,从中选取关联指数最大的目标片段对;根据目标片段对,获得第一数据序列与第二数据序列之间的关联信息。由于每个片段对包括第一数据序列的第一序列片段以及第二数据序列的第二序列片段,并且,第一序列片段与第二序列片段分别截取自不同是时间段,因此,能够获得两序列数据之间滞后的关联关系。
附图说明
[0020]为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
[0021]图1为本申请实施例提供的地球在x方向的部分极移值序列;
[0022]图2为本申请实施例提供的地球在y方向的部分极移值序列;
[0023]图3为本申请实施例提供的常规方法分析出的序列关系示意图;
[0024]图4为本申请实施例提供的数据序列间关系分析方法的流程示意图;
[0025]图5为本申请实施例提供的二值化原理示意图之一;
[0026]图6为本申请实施例提供的二值化原理示意图之二;
[0027]图7为本申请实施例提供的两等效序列的示意图;
[0028]图8为本申请实施例提供的基于滞后时长的分割原理示意图之一;
[0029]图9为本申请实施例提供的基于滞后时长的分割原理示意图之二;
[0030]图10为本申请实施例提供的关联指标对的示意图;
[0031]图11为本申请实施例提供的关联矩阵的示意图;
[0032]图12为本申请实施例提供的矩阵片段的分割示意图;
[0033]图13为本申请实施例提供的数据序列间关系分析装置的结构示意图;
[0034]图14为本申请实施例提供的电子设备的结构示意图。
[0035]图标:101

序列分割模块;102

片段筛选模块;103

关系分析模块;201

存储器;202

处理器;203

通信单元;204

系统总线。
具体实施方式
[0036]为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。
[0037]因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0038]应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
[0039]在本申请的描述中,需要说明的是,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。此外,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据序列间关系分析方法,其特征在于,所述方法包括:获取第一数据序列以及第二数据序列;根据所述第一数据序列与所述第二数据序列,获得多个片段对的关联指数,其中,每个片段对包括所述第一数据序列的第一序列片段以及所述第二数据序列的第二序列片段,并且,所述第一序列片段与所述第二序列片段分别截取自不同的时间段;根据所述多个片段对的关联指数,从中选取关联指数最大的目标片段对;根据所述目标片段对,获得所述第一数据序列与所述第二数据序列之间的关联信息。2.根据权利要求1所述的数据序列间关系分析方法,其特征在于,所述根据所述第一数据序列与所述第二数据序列,获得多个片段对的关联指数,包括:根据所述第一数据序列的第一序列阈值,将所述第一数据序列二值化为第一等效序列;根据所述第二数据序列的第二序列阈值,将所述第二数据序列二值化为第二等效序列;将当前的滞后时长进行递增,得到目标滞后时长;根据所述目标滞后时长,从所述第一等效序列中截取第一等效片段;根据所述目标滞后时长,从所述第二等效序列中截取第二等效片段,所述第一等效片段对应的时间段与所述第二等效片段的时间段错开了所述目标滞后时长;根据所述第一等效片段与所述第二等效片段,获得当前的片段对的关联指数,其中,所述当前的片段对包括所述第一数据序列中与所述第一等效片段对应的第一序列片段以及所述第二数据序列中与所述第二等效片段对应的第二序列片段;若所述目标滞后时长不满足终止条件,则返回所述将当前的滞后时长进行递增,得到目标滞后时长的步骤执行,直至所述目标滞后时长满足所述终止条件后,获得所述多个片段对的关联指数。3.根据权利要求2所述的数据序列间关系分析方法,其特征在于,所述第一数据序列中的每个序列值,若大于所述第一序列阈值,则置为第一序列值;若小于或者等于所述第一序列阈值,则置为第二序列值;所述第二数据序列中的每个序列值,若大于所述第二序列阈值,则置为所述第一序列值;若小于或者等于所述第二序列阈值,则置为所述第二序列值。4.根据权利要求3所述的数据序列间关系分析方法,其特征在于,所述根据所述第一等效片段与所述第二等效片段,获得当前的片段对的关联指数的表达式为:式中,CI表示所述当前的片段对的关联指数,N
XY
表示所述第一等效片段与所述第二等效片段之间关联指标对的数量,其中,所述第一等效片段与所述第二等效片段之间位于同一序列位置的第一序列值构成一关联指标对;N
XX
表示所述第一等效片段的序列长度,N
YY
表示所述第二等效片段的序列长度。5.根据权利要求1所述的数据序列间关系分析方法,其特征在于,所述根据所述目标片段对,获得所述第一数据序列与所述第二数据序列之间的关联信息,包括:
将所述目标片段对分割成多个子片段对;分别将每个子片段对的平均斜率,作为每个子片段对的局部关联强度;将所述多个子片段对的局部关联强度之间的均值,作为所述第一数据序列与所述第二数据序列之间的关联强度;将所述多个子片段对的局部关联强度之间的平均斜率,作为所述关联强度的作用力。6.根据权利要求5所述的数据序列间关系分析方法,其特征在于,所述目标片段对包括第一目标序列片段以及第二目标系列片段,所述将所述目标片段对分割成多个子片段对,包括:根据所述第一数据序列的第一序列阈值,将所述第一目标序列片段二值化为第一目标等效片段,其中,所述第一目标序列片段中的每个序列值,若大于所述第一序列阈值,则置为第一序列值;若小于或者等于所述第一序列...

【专利技术属性】
技术研发人员:赵国辉
申请(专利权)人:中国科学院西北生态环境资源研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1