缺失值填补方法、装置、计算机设备及存储介质制造方法及图纸

技术编号：30901799 阅读：16 留言：0更新日期：2021-11-22 23:46

本发明专利技术实施例公开了缺失值填补方法、装置、计算机设备及存储介质。所述方法包括：获取待填补的传感器数据；对待填补的传感器数据进行预处理，以得到初始数据；对所述初始数据进行信号分解，以得到分解结果；将所述分解结果输入至填补模型内进行缺失值填补，以得到填补结果；其中，所述填补模型是通过带有缺失值的数据集以及对应的没有缺失值的数据形成的样本集训练深度学习网络所得的，所述填补模型的损失函数包括非缺失值部分的损失函数以及缺失值部分的损失函数。通过实施本发明专利技术实施例的方法可实现增强模型的表达能力，增强模型的训练，且在网络中计算缺失值部分的损失。且在网络中计算缺失值部分的损失。且在网络中计算缺失值部分的损失。

全部详细技术资料下载

【技术实现步骤摘要】
缺失值填补方法、装置、计算机设备及存储介质

[0001]本专利技术涉及数据挖掘
，更具体地说是指缺失值填补方法、装置、计算机设备及存储介质。

技术介绍

[0002]缺失值是指粗糙数据中由于缺少信息而造成的数据的聚类、分组、删失或截断。它指的是现有数据集中某个或某些属性的值是不完全的。传感器所获取的数据也属于缺失值的一种。
[0003]目前对缺失值进行填补的方式主要是E2GAN，E2GAN是针对时序数据的缺失值填补而设计出来的生成式模型，对于时间序列数据采用移动窗口的方式进行切分数据，比如0
‑
47h，48
‑
96h，...，m
‑
m+47h，将数据分成48h的窗口，每个样本包含48h小时数据，训练和生成的数据均包含48h数据，大段缺失填补以48小时为一个窗口进行填充，小段缺失结合已有数据进行填充，但是对于传感器数据输入至E2GAN算法进行缺失值填补时，大部分只有两列数据，时间与监测值，对于机器学习或者深度学习算法模型来说，特征太少，模型无论是做生成模型还是预测模型，模型预测或者生成性能不佳，对于缺失值填补问题，而且对于传感器数据而言，都是采用0值填充的方式再进行模型填补，由此导致模型对于有缺失值的模型无法适用，而且缺失值部分的损失通常不会在网络中计算。
[0004]因此，有必要设计一种新的方法，实现增强模型的表达能力，增强模型的训练，且在网络中计算缺失值部分的损失。

技术实现思路

[0005]本专利技术的目的在于克服现有技术的...

【技术保护点】

【技术特征摘要】
1.缺失值填补方法，其特征在于，包括：获取待填补的传感器数据；对待填补的传感器数据进行预处理，以得到初始数据；对所述初始数据进行信号分解，以得到分解结果；将所述分解结果输入至填补模型内进行缺失值填补，以得到填补结果；其中，所述填补模型是通过带有缺失值的数据集以及对应的没有缺失值的数据形成的样本集训练深度学习网络所得的，所述填补模型的损失函数包括非缺失值部分的损失函数以及缺失值部分的损失函数。2.根据权利要求1所述的缺失值填补方法，其特征在于，所述对所述初始数据进行信号分解，以得到分解结果，包括：对所述初始数据采用变分模态分解方法进行信号分解，以得到分解结果。3.根据权利要求1所述的缺失值填补方法，其特征在于，所述对待填补的传感器数据进行预处理，以得到初始数据，包括：对待填补的传感器数据采用线性插值方式进行插值处理，以得到插值结果；对所述插值结果进行加噪声处理，以得到初始数据。4.根据权利要求1所述的缺失值填补方法，其特征在于，所述填补模型是通过带有缺失值的数据集以及对应的没有缺失值的数据形成的样本集训练深度学习网络所得的，包括：构建带有缺失值的数据集以及对应的没有缺失值的数据形成的样本集；构建深度学习网络模型；设定所述损失函数；采用样本集对所述深度学习网络模型进行训练，并采用损失函数计算对应的数值，根据所述数值对所述深度学习...

【专利技术属性】
技术研发人员：张军，郑增荣，张亮，杨杰，
申请(专利权)人：杭州鲁尔物联科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人