【技术实现步骤摘要】
数据序列间关系分析方法、装置、存储介质及电子设备
[0001]本申请涉及大数据领域,具体而言,涉及一种数据序列间关系分析方法、装置、存储介质及电子设备。
技术介绍
[0002]时间序列数据是对物理状态或现象的有序观测而成的序列记录,蕴藏着外部环境不同因素对其变化的影响,表现出特定的变化特征,其是自然、工程、社会、经济等众多科学研究和决策的基础。
[0003]由于时间序列数据是挖掘分析、知识发现、情景预测等技术的基础;并且数据科学已由从粗放型分析迈入精细化分析的阶段,这就要求定性定量的分析某一特征的变化规律和影响程度,例如气候变化多少,会给人类那些群体的健康带来什么样的潜在风险,再如在什么样的气温条件下,不同粮食作物的增产效果。因此,在当前大数据背景下,时间序列数据的不断积累和丰富,对其变化特征的挖掘分析已成为数据科学的核心技术需求。
[0004]传统意义上的关联推断方法,大多通过构建复杂的物理过程模型,来分析不同因素间的因果关系。然而,在自然和社会现象中,广泛存在的局部变化效应,如生物都有自己的温度适应区间,病毒对不同年龄阶段的人群具有不同的感染致死率等,这就要求考虑对时间序列数据进行精细化挖掘分析,而传统意义上的关联推断方法并不能对此取得理想的分下效果。
技术实现思路
[0005]为了克服现有技术中的至少一个不足,本申请提供一种数据序列间关系分析方法、装置、存储介质及电子设备,用于分析出两序列数据之间滞后的关联关系,具体包括:
[0006]第一方面,本申请提供一种数据序列间关 ...
【技术保护点】
【技术特征摘要】
1.一种数据序列间关系分析方法,其特征在于,所述方法包括:获取第一数据序列以及第二数据序列;根据所述第一数据序列与所述第二数据序列,获得多个片段对的关联指数,其中,每个片段对包括所述第一数据序列的第一序列片段以及所述第二数据序列的第二序列片段,并且,所述第一序列片段与所述第二序列片段分别截取自不同的时间段;根据所述多个片段对的关联指数,从中选取关联指数最大的目标片段对;根据所述目标片段对,获得所述第一数据序列与所述第二数据序列之间的关联信息。2.根据权利要求1所述的数据序列间关系分析方法,其特征在于,所述根据所述第一数据序列与所述第二数据序列,获得多个片段对的关联指数,包括:根据所述第一数据序列的第一序列阈值,将所述第一数据序列二值化为第一等效序列;根据所述第二数据序列的第二序列阈值,将所述第二数据序列二值化为第二等效序列;将当前的滞后时长进行递增,得到目标滞后时长;根据所述目标滞后时长,从所述第一等效序列中截取第一等效片段;根据所述目标滞后时长,从所述第二等效序列中截取第二等效片段,所述第一等效片段对应的时间段与所述第二等效片段的时间段错开了所述目标滞后时长;根据所述第一等效片段与所述第二等效片段,获得当前的片段对的关联指数,其中,所述当前的片段对包括所述第一数据序列中与所述第一等效片段对应的第一序列片段以及所述第二数据序列中与所述第二等效片段对应的第二序列片段;若所述目标滞后时长不满足终止条件,则返回所述将当前的滞后时长进行递增,得到目标滞后时长的步骤执行,直至所述目标滞后时长满足所述终止条件后,获得所述多个片段对的关联指数。3.根据权利要求2所述的数据序列间关系分析方法,其特征在于,所述第一数据序列中的每个序列值,若大于所述第一序列阈值,则置为第一序列值;若小于或者等于所述第一序列阈值,则置为第二序列值;所述第二数据序列中的每个序列值,若大于所述第二序列阈值,则置为所述第一序列值;若小于或者等于所述第二序列阈值,则置为所述第二序列值。4.根据权利要求3所述的数据序列间关系分析方法,其特征在于,所述根据所述第一等效片段与所述第二等效片段,获得当前的片段对的关联指数的表达式为:式中,CI表示所述当前的片段对的关联指数,N
XY
表示所述第一等效片段与所述第二等效片段之间关联指标对的数量,其中,所述第一等效片段与所述第二等效片段之间位于同一序列位置的第一序列值构成一关联指标对;N
XX
表示所述第一等效片段的序列长度,N
YY
表示所述第二等效片段的序列长度。5.根据权利要求1所述的数据序列间关系分析方法,其特征在于,所述根据所述目标片段对,获得所述第一数据序列与所述第二数据序列之间的关联信息,包括:
将所述目标片段对分割成多个子片段对;分别将每个子片段对的平均斜率,作为每个子片段对的局部关联强度;将所述多个子片段对的局部关联强度之间的均值,作为所述第一数据序列与所述第二数据序列之间的关联强度;将所述多个子片段对的局部关联强度之间的平均斜率,作为所述关联强度的作用力。6.根据权利要求5所述的数据序列间关系分析方法,其特征在于,所述目标片段对包括第一目标序列片段以及第二目标系列片段,所述将所述目标片段对分割成多个子片段对,包括:根据所述第一数据序列的第一序列阈值,将所述第一目标序列片段二值化为第一目标等效片段,其中,所述第一目标序列片段中的每个序列值,若大于所述第一序列阈值,则置为第一序列值;若小于或者等于所述第一序列...
【专利技术属性】
技术研发人员:赵国辉,
申请(专利权)人:中国科学院西北生态环境资源研究院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。