本发明专利技术公开了一种基于OS
【技术实现步骤摘要】
基于OS
‑
ELM网络的时间序列数据在线补齐方法
[0001]本专利技术涉及信息采集
,尤其是一种基于OS
‑
ELM网络的时间序列数据在线补齐方法。
技术介绍
[0002]随着信息采集技术的提高,信息采集设备的普及越来越广泛。而传感器所记载的数据承载着越来越多的潜在信息,这些未被挖掘出的信息,能够带来更多的经济效益和社会效益。由此,传感器数据的挖掘越来越受到许多学者的关注。而数据挖掘的重点就在于原始数据的真实性,由于传感器安装的位置是由所承担功能而决定,使得传感器的数据会因为受到强干扰、温度和湿度超过允许值、传感器失电、内部程序故障、传输故障等多种因素而发生数据丢失现象。不完整的数据没法真实的反应潜在的数据信息,这降低了数据挖掘结果的可靠性。因此,对于传感器原始数据的在线完整补齐是一个至关重要的问题。
[0003]现有的数据补齐方法可具体分为三种方法,统计学补齐方法、时间序列模型预测方法、机器学习预测方法。统计学补齐方法,主要是根据缺失值附近的数据值通过均值插补、众数插补或者其他数学规律对缺失数据进行补齐,这样的补齐方法,对于单一的缺失数据来说,补齐速度快。但是由于没有考虑历史数据蕴含的数据波动规律,因此补齐数据与真实数据相差较大。时间序列模型预测方法,充分考虑历史数据蕴含的数据波动规律,但是许多数据除了蕴含自身历史数据的波动规律,还受到许多其他因素影响,比如电表数据的波动受季节影响较大,而时间序列模型对于季节性数据的预测存在着预测精度不高的现象,虽然补齐的数据虽相比于统计学补齐方法精度有所提高,但是距离还原真实数据还存在一定的距离。机器学习预测方法,主要是对于不同类型数据,运用合适的神经网络模型对缺失数据进行补齐。相较于时间序列模型预测方法,机器学习预测方法在预测精度上要更高一些。而如何面对连续缺失数据的情况,需要用到在线数据补齐的方法。
技术实现思路
[0004]本专利技术所要解决的技术问题在于,提供一种基于OS
‑
ELM网络的时间序列数据在线补齐方法,对实时传输中的时间序列数据缺失值进行数据补齐,得到了较好的效果。
[0005]为解决上述技术问题,本专利技术提供一种基于OS
‑
ELM网络的时间序列数据在线补齐方法,包括如下步骤:
[0006](1)模型参数初始化阶段,对OS
‑
ELM网络中的各个参数进行初始化操作;
[0007](2)数据实时获取阶段,数据d(k)={d1,d2,
…
,d
k
,
…
},k∈Z+实时传输入补齐模型中,作为初始输入数据,为后面的数据预处理做准备;
[0008](3)数据预处理阶段;
[0009](4)基于OS
‑
ELM的数据补齐阶段;
[0010](5)补齐数据输出阶段;实时输出初始输出数据与补齐数据的合并数据,直至终止补齐流程。
[0011]优选的,步骤(1)中,将需要初始化的参数输入权重向量a
i
、隐含层偏差b
i
、隐含层节点数进行初始化设置,其中输入权重a
i
和隐含层偏差b
i
都是从[
‑
1,1]范围内随机选择的。
[0012]优选的,步骤(3)中,数据预处理阶段具体包括如下步骤:
[0013](31)查看输入数据是否有空值,检验输入数据是否存在数据缺失现象;
[0014](32)将数据进行无量纲化处理,进行Z
‑
Score标准化处理,Z
‑
Score标准化公式如下:
[0015][0016]其中,z为标准化后的结果,x为输入的原始数据,μ为数据集的平均值,δ为数据集的标准差;
[0017](33)将初始输入数据划分出输入集X与目标集Y,其中划分后的输入集X如下:
[0018][0019]划分后的目标集Y如下:
[0020][0021](34)生成输入值
‑
输出值键值对矩阵(x
i
,t
i
)∈R
n
×
R。
[0022]优选的,步骤(4)中,基于OS
‑
ELM的数据补齐阶段具体包括如下步骤:
[0023](41)向模型中追加样本,更新输出权重与隐含层输出矩阵;
[0024](42)对预测值范围内的数据进行预测;
[0025](43)判断数据是否缺失,对缺失的数据用预测值进行补齐,并更新追加的样本数据。
[0026]优选的,步骤(5)中,实际输出的数据为预测集补齐的追加数据集
[0027]本专利技术的有益效果为:本专利技术结合时间序列数据的特点,面对连续缺失数据、单一缺失数据的情况,以OS
‑
ELM网络为基础,结合数据在线补齐的方法,对缺失的时间序列数据进行补齐,解决了时间序列数据缺失的随机性、连续性等问题。
附图说明
[0028]图1为本专利技术的方法流程示意图。
[0029]图2为本专利技术数据预处理阶段的滑动窗口示意图。
[0030]图3为本专利技术OS
‑
ELM网络的模型示意图。
具体实施方式
[0031]如图1所示,一种基于OS
‑
ELM网络的时间序列数据在线补齐方法,包括如下步骤:
[0032]步骤一:模型参数初始化阶段,对OS
‑
ELM网络中的各个参数进行初始化操作。将需要初始化的参数,如输入权重向量a
i
、隐含层偏差b
i
、隐含层节点数进行初始化设置。其中输入权重a
i
和隐含层偏差b
i
都是从[
‑
1,1]范围内随机选择的。
[0033]步骤二:数据实时获取阶段,数据d(k)={d1,d2,
…
,d
k
,
…
},k∈Z+实时传输入补齐模型中,作为初始输入数据,为后面的数据预处理做准备。
[0034]步骤三:数据预处理阶段,首先,查看输入数据是否有空值,检验输入数据是否存在数据缺失现象;然后,将数据进行无量纲化处理,具体方法是进行Z
‑
Score标准化处理,Z
‑
Score标准化公式如下:
[0035][0036]其中,z为标准化后的结果,x为输入的原始数据,μ为数据集的平均值,δ为数据集的标准差。其次,通过滑动窗口的形式将初始输入数据划分出输入集X与目标集Y,其中划分后的输入集X如下:
[0037][0038]划分后的目标集Y如下:
[0039][0040]最后,生成输入值
‑
输出值键值对矩阵(x
i
,t
i
)∈R
n
×
R。其中滑动窗口示意本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.基于OS
‑
ELM网络的时间序列数据在线补齐方法,其特征在于,包括如下步骤:(1)模型参数初始化阶段,对OS
‑
ELM网络中的各个参数进行初始化操作;(2)数据实时获取阶段,数据d(k)={d1,d2,
…
,d
k
,
…
},k∈Z+实时传输入补齐模型中,作为初始输入数据,为后面的数据预处理做准备;(3)数据预处理阶段;(4)基于OS
‑
ELM的数据补齐阶段;(5)补齐数据输出阶段;实时输出初始输出数据与补齐数据的合并数据,直至终止补齐流程。2.如权利要求1所述的基于OS
‑
ELM网络的时间序列数据在线补齐方法,其特征在于,步骤(1)中,将需要初始化的参数输入权重向量a
i
、隐含层偏差b
i
、隐含层节点数进行初始化设置,其中输入权重a
i
和隐含层偏差b
i
都是从[
‑
1,1]范围内随机选择的。3.如权利要求1所述的基于OS
‑
ELM网络的时间序列数据在线补齐方法,其特征在于,步骤(3)中,数据预处理阶...
【专利技术属性】
技术研发人员:胡银龙,刘恩铮,周辉,单淼轩,龚增浩,林天川,
申请(专利权)人:河海大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。