一种可解释的多维时序数据分析方法技术

技术编号：26376254 阅读：34 留言：0更新日期：2020-11-19 23:44

本发明专利技术公开一种可解释的多维时序数据分析方法，包括S1、建立多维时序数据分析模型，分析模型为卷积神经网络，依次包括输入层、卷积层、隐层和输出层；S2、将不同时间点采集的多个指标数据作为输入数据输入分析模型，输入数据为n*k的矩阵，其中n为输入数据的维数，即指标数量，k为输入数据的采集次数；S3、分析模型输出一个或多个预测结果，对应不同建模任务；S4、对预测结果进行回溯，得到神经元的权重，进而得到组成该神经元的输入数据维度和变化模式的权重，使得分析模型具有可解释性。本发明专利技术的这种自适应模式匹配机制可以充分挖掘各个指标的变化趋势，进而提升数据分析模型的预测能力。

全部详细技术资料下载

【技术实现步骤摘要】
一种可解释的多维时序数据分析方法
本专利技术涉及数据处理
，尤其是一种可解释的多维时序数据分析方法。
技术介绍
实际生活中，有些指标的具体数值很重要，但只看具体数值并不能反映相应指标的发展趋势，从而不能做出准确判断。比如，三个人的体检结果，收缩压都是145mmHg，如果按照静态值来看，三者没有区别，都是一级高血压。但是，如果考虑变化趋势，查看多年的体检结果，A是多年高血压，收缩压长期超过170mmHg；B的收缩压长期稳定在140mmHg附近；而C的收缩压之前一直是是正常的，低于120mmHg。那么我们可以得出截然不同的结论，A是成功的降低了血压，心血管健康状况有了显著的改善；B是较成功的控制了自己的高血压病情；而C是心血管健康状况急剧恶化。现有的多维时序分析方法分为两类，一类是传统的统计学方法，例如Logistic回归、COX回归等，这种方法的预测性能较低，结果难以令人满意。另一类方法是基于机器学习方法，例如神经网络、集成学习等，尤其是深度学习方法，可以得到比传统方法更好的性能。但这类方法不能给出强的解释性。虽然部分机器学习方法，如随机森林和梯度提升树方法，可以给出某些特征的重要性，但是不能直接分析同一指标的时序变化趋势。
技术实现思路
为了克服现有技术中的上述缺陷，本专利技术提供一种多维时序数据分析方法，通过趋势分析神经网络(TrendAnalysisNeuralNetworks，TANN)可以对各个指标的变化趋势进行建模和解析，实现更有效的预测和解析。为此，本专利技术采用...

【技术保护点】
1.一种可解释的多维时序数据分析方法，由处理器执行，其特征在于，包括以下步骤，/nS1、建立多维时序数据分析模型，所述分析模型为卷积神经网络，依次包括输入层、卷积层、隐层和输出层；其中卷积层用于对多维输入数据进行模式匹配，模式匹配的结果有n*m种，其中n为输入数据的维数，m为卷积核的数量即模式数量；所述隐层相应的包括n*m个神经元，所述神经元由所述模式匹配的结果经过激活函数计算得到；所述输出层对所述隐层的神经元采用全连接层得到预测结果；/nS2、将不同时间点采集的多个指标数据作为输入数据输入所述分析模型，所述输入数据为n*k的矩阵，其中n为输入数据的维数，即指标数量，k为输入数据的采集次数；/nS3、所述分析模型输出一个或多个预测结果，对应不同的建模任务；/nS4、对所述预测结果进行回溯，得到所述神经元的权重，进而得到组成该神经元的输入数据维度和模式的权重，实现所述分析模型的可解释性。/n

【技术特征摘要】
1.一种可解释的多维时序数据分析方法，由处理器执行，其特征在于，包括以下步骤，
S1、建立多维时序数据分析模型，所述分析模型为卷积神经网络，依次包括输入层、卷积层、隐层和输出层；其中卷积层用于对多维输入数据进行模式匹配，模式匹配的结果有n*m种，其中n为输入数据的维数，m为卷积核的数量即模式数量；所述隐层相应的包括n*m个神经元，所述神经元由所述模式匹配的结果经过激活函数计算得到；所述输出层对所述隐层的神经元采用全连接层得到预测结果；
S2、将不同时间点采集的多个指标数据作为输入数据输入所述分析模型，所述输入数据为n*k的矩阵，其中n为输入数据的维数，即指标数量，k为输入数据的采集次数；
S3、所述分析模型输出一个或多个预测结果，对应不同的建模任务；
S4、对所述预测结果进行回溯，得到所述神经元的权重，进而得到组成该神经元的输入数据维度和模式的权重，实现所述分析模型的可解释性。

2.根据权利要求1所述的多维时序...

【专利技术属性】
技术研发人员：姚振杰，涂燕晖，陈一昕，
申请(专利权)人：网络通信与安全紫金山实验室，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人