System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 非平衡缺失数据下工业设备剩余寿命的DTSIGAN数据增强方法技术_技高网

非平衡缺失数据下工业设备剩余寿命的DTSIGAN数据增强方法技术

技术编号:43958939 阅读:2 留言:0更新日期:2025-01-07 21:43
本发明专利技术属于工业剩余寿命技术领域,公开了一种非平衡缺失数据下工业设备剩余寿命的DTSIGAN数据增强方法及系统,解决了数据集规模小、数据不平衡且存在缺失值的问题。通过提供坚实的数据基础,提升了数据驱动的人工智能技术在工业设备剩余寿命预测中的应用效能。本发明专利技术采用循环动力学插补算法优化时间序列生成对抗网络,引入掩码矩阵、时间间隔矩阵和时间衰减因子,动态捕获和分析缺失值特征,优化缺失值插补过程。为增强模型稳定性,本发明专利技术结合Wasserstein距离与梯度惩罚项,优化生成网络与判别网络的损失函数,有效避免梯度消失和爆炸,确保训练过程稳定,提高高质量时序数据的合成能力。

【技术实现步骤摘要】

本专利技术属于工业剩余寿命,尤其涉及一种非平衡缺失数据下工业设备剩余寿命的dtsigan数据增强方法及系统。


技术介绍

1、在工业领域中,设备性能的退化或关键部件的耗损,时常威胁着整个生产过程的稳定性。它们不仅埋下了安全隐患,更会直接导致显著的经济损失,对生产效率和成本控制构成了严峻挑战。

2、近年来,工业4.0革命的浪潮席卷而来,其核心聚焦于智能制造的崛起,其标志性的鲜明特征在于人工智能、物联网、云计算等信息物理融合系统的无缝互联。在此背景下,故障预测与健康管理体系(phm)作为关键技术桥梁,正引领着传统生产行业向智能化、高效化的全新制造模式跨越与升级,成为转型升级的关键突破口。在故障预测与健康管理体系中,剩余寿命(rul)占据着核心且至关重要的位置。通过对当前的设备工况或部件状态的深入分析,精准预测未来的运行状态,为生产运营决策的制定提供坚实的数据支撑。基于此,企业能够实施针对性的预防性维护策略,这些措施不仅避免了因设备突发故障而导致的经济损失,还显著降低了安全事故的发生风险,从而确保了生产线的连续、稳定与高效运行。然而,在复杂的实际生产环境中,数据采集面临着诸多挑战。诸如密闭设备内部空间的局限性,使得部署足够数量的传感器以全面捕捉数据变得尤为困难,从而加剧了数据采集的技术难度。此外,数据采集成本高昂,尤其是为了获取设备完整生命周期的运行数据,需要耗费大量资源与时间。这些时间或经济成本的双重压力,导致了数据资源的匮乏与分布的不平衡。同时,数据采集系统失灵、人为操作失误以及外部环境的不确定因素,时常引发数据缺失问题。数据的非平衡与缺失现状,成为制约以数据驱动建模的人工智能技术在工业设备剩余寿命等领域深入拓展的关键因素。

3、在现有技术中,研究学者针对工业设备剩余寿命数据增强的问题提出了很多方案:

4、(1)时频域变换(tf)。tf方法通过将时间域信息映射至频率域,从而提取原始时序数据的周期性与趋势性特征。然而,在处理高维时间序列数据时,因无法充分捕捉数据的动态特征变化,进而限制了生成高质量、有效增强数据的能力。

5、(2)自编码器(vae)。vae方法是一种深度隐空间生成模型,编码器能够将原始时序数据的特征压缩至隐藏空间进行学习,随后通过解码器重构出与原始数据相似的输出。然而,作为无监督学习模型,在应对高维且复杂的时间序列数据增强任务时,其处理能力略显局限,与有监督学习模型相比,性能上存在一定的差距。

6、(3)生成对抗网络(gan)。gan是一种深度学习模型,通过生成网络与判别网络的动态博弈,最大程度还原真实数据的特征分布并实现数据的增强。gan模型在计算机视觉方面已展现出显著成效。然而,不同于图像数据,在工业设备剩余寿命领域中,数据具有较为复杂的时间依赖关系,gan难以捕捉时间特征与属性之间的相关性。此外,时序数据的长期相关性及其维度不确定性,加剧了数据生成的难度。另一方面,gan本身存在不收敛、梯度消失及模式崩溃等缺点,导致模型的训练难度较大。

7、通过上述分析,现有技术存在的问题及缺陷为:

8、(1)当前的技术主要聚焦于非平衡数据的增强策略,忽视了真实应用场景中数据缺失的普遍现象。

9、(2)它们在处理复杂高维时间序列数据时效果欠佳,模型构建与训练过程中仍存在不足。特别是在工业设备剩余寿命领域非平衡且包含缺失值的数据增强任务中,现有方法难以提供有效且可靠的解决方案。

10、(3)以gan模型为代表的深度学习技术在应对数据增强问题方面展现出了卓越的性能,成为当前的研究热点。然而,gan模型在衡量真实数据与生成数据间相似度的方法选取,以及网络架构设计或损失函数选择上的差异,均引发模型训练过程中出现梯度消失和梯度爆炸等现象,这阻碍了生成网络的收敛过程,进而影响了有效数据的合成。


技术实现思路

1、针对现有技术存在的问题,本专利技术提供了一种非平衡缺失数据下工业设备剩余寿命的dtsigan数据增强方法。

2、本专利技术是这样实现的,一种非平衡缺失数据下工业设备剩余寿命的dtsigan数据增强方法包括:

3、步骤1,对传感器采集到的非平衡缺失的工业设备数据进行数据预处理;其中包括数据归一化,构建掩码矩阵和时间间隔矩阵,并与原始时间序列进行拼接形成数据集,按比例划分为训练集和测试集;

4、步骤2,通过融合时间动力学原理与时间序列生成对抗网络的结构;引入了循环动力学插补算法,以优化嵌入网络模型;改进策略将真实数据与捕获到的缺失数据特征映射到潜在特征空间,随后,利用恢复网络依据此空间中的特征,重构原始数据;同时,在损失函数设计中,将原始数据、恢复数据和缺插补数据一同纳入误差的计算;

5、步骤3,通过向生成网络输入随机噪声,将其映射到生成特征空间;判别网络在潜在空间上区分真伪,基于判别网络的反馈,生成网络得以进行迭代式的优化与更新;

6、步骤4,将生成网络与判别网络之间传统的交叉熵函数替换为wasserstein距离,在衡量判别真实数据与合成数据分布之间相似度的同时引入梯度惩罚项以施加lipschitz约束;

7、步骤5,使用训练完成的dtsigan对非平衡缺失数据集进行动态插补和扩充,再利用预测模型对工业设备剩余寿命实现预测。

8、进一步,所述步骤1,将传感器所采集的原始数据进行数学化描述为一个时间步长为t,维度为d的多元时间序列集合,记x={x1,x2,x3,...,xt}∈rt×d;其中,第t步因为时间序列中存在缺失值,为了更好地标记x中缺失变量的所在位置,引入掩码矩阵m∈rt×d来表示:

9、

10、其中,表示第t步的第d维变量,即t时刻的第d个特征值;

11、对于时间戳向量s={s1,s2,s3,...,st}∈rt,引入时间间隔矩阵δ反映数据点之间的时滞分布情况;定义为表示t时刻观测到的值距离上一个未缺失的观测值的时间间隔,即:

12、

13、进一步,所述步骤2,嵌入网络e输入由步骤1得到的真实数据x、掩码矩阵m和时间间隔矩阵δ,提取时序数据的特征,映射至潜在特征空间h;随后,由恢复网络r将这些特征还原至原始数据空间和插补数据通过比较真实数据、恢复数据和插补数据间的差异构建重构损失函数lr,并以此训练嵌入网络和恢复网络;相关公式如下所示:

14、h=e(x,m,δ)

15、

16、其中,嵌入网络e经过循环动力学插补算法改进优化,恢复网络r由自回归并服从因果顺序的网络架构构成,由多层gru单元以及一层全连接层构成。

17、进一步,所述嵌入网络e将保存了t-1时刻之前信息的隐藏状态ht-1映射为t时刻的预测值利用步骤1中得到的掩码矩阵,用替换xt中对应的缺失值,得到填补后t时刻的值相关计算公式如下所示:

18、

19、其中,wx、bx为模型要学习的参数,ht-1为t-1时刻的掩藏状态,初始隐藏状态h0为本文档来自技高网...

【技术保护点】

1.一种非平衡缺失数据下工业设备剩余寿命的DTSIGAN数据增强方法,其特征在于,包括以下步骤:

2.如权利要求1所述非平衡缺失数据下工业设备剩余寿命的DTSIGAN数据增强方法,其特征在于,所述步骤1,将传感器所采集的原始数据进行数学化描述为一个时间步长为T,维度为D的多元时间序列集合,记X={x1,x2,x3,...,xT}∈RT×D;其中,第t步因为时间序列中存在缺失值,为了更好地标记X中缺失变量的所在位置,引入掩码矩阵M∈RT×D来表示:

3.如权利要求1所述非平衡缺失数据下工业设备剩余寿命的DTSIGAN数据增强方法,其特征在于,所述步骤2,嵌入网络E输入由步骤1得到的真实数据X、掩码矩阵M和时间间隔矩阵δ,提取时序数据的特征,映射至潜在特征空间H;随后,由恢复网络R将这些特征还原至原始数据空间和插补数据通过比较真实数据、恢复数据和插补数据间的差异构建重构损失函数LR,并以此训练嵌入网络和恢复网络;相关公式如下所示:

4.如权利要求3所述非平衡缺失数据下工业设备剩余寿命的DTSIGAN数据增强方法,其特征在于,所述嵌入网络E将保存了t-1时刻之前信息的隐藏状态ht-1映射为t时刻的预测值利用步骤1中得到的掩码矩阵,用替换xt中对应的缺失值,得到填补后t时刻的值相关计算公式如下所示:

5.如权利要求1所述非平衡缺失数据下工业设备剩余寿命的DTSIGAN数据增强方法,其特征在于,所述步骤3,生成网络G将随机噪声Z映射到生成特征空间判别网络D在特征空间维度上区分真伪;生成网络G与判别网络D均由多层GRU单元以及一层全连接层构成。

6.如权利要求1所述非平衡缺失数据下工业设备剩余寿命的DTSIGAN数据增强方法,其特征在于,所述步骤4,引入Wasserstein距离以及梯度惩罚项,确保模型不会因梯度爆炸或梯度消失而导致生成网络无法收敛,从而提高模型的稳定性;生成网络G与判别网络D间的损失函数计算公式如下所示:

7.一种实施如权利要求1-6任意一项所述非平衡缺失数据下工业设备剩余寿命的DTSIGAN数据增强方法的非平衡缺失数据下工业设备剩余寿命的DTSIGAN数据增强系统,其特征在于,所述非平衡缺失数据下工业设备剩余寿命的DTSIGAN数据增强系统包括:

8.一种计算机设备,其特征在于,所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如权利要求1-6任意一项所述非平衡缺失数据下工业设备剩余寿命的DTSIGAN数据增强方法的步骤。

9.一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如权利要求1-6任意一项所述非平衡缺失数据下工业设备剩余寿命的DTSIGAN数据增强方法的步骤。

10.一种信息数据处理终端,其特征在于,所述信息数据处理终端用于实现如权利要求7所述非平衡缺失数据下工业设备剩余寿命的DTSIGAN数据增强系统。

...

【技术特征摘要】

1.一种非平衡缺失数据下工业设备剩余寿命的dtsigan数据增强方法,其特征在于,包括以下步骤:

2.如权利要求1所述非平衡缺失数据下工业设备剩余寿命的dtsigan数据增强方法,其特征在于,所述步骤1,将传感器所采集的原始数据进行数学化描述为一个时间步长为t,维度为d的多元时间序列集合,记x={x1,x2,x3,...,xt}∈rt×d;其中,第t步因为时间序列中存在缺失值,为了更好地标记x中缺失变量的所在位置,引入掩码矩阵m∈rt×d来表示:

3.如权利要求1所述非平衡缺失数据下工业设备剩余寿命的dtsigan数据增强方法,其特征在于,所述步骤2,嵌入网络e输入由步骤1得到的真实数据x、掩码矩阵m和时间间隔矩阵δ,提取时序数据的特征,映射至潜在特征空间h;随后,由恢复网络r将这些特征还原至原始数据空间和插补数据通过比较真实数据、恢复数据和插补数据间的差异构建重构损失函数lr,并以此训练嵌入网络和恢复网络;相关公式如下所示:

4.如权利要求3所述非平衡缺失数据下工业设备剩余寿命的dtsigan数据增强方法,其特征在于,所述嵌入网络e将保存了t-1时刻之前信息的隐藏状态ht-1映射为t时刻的预测值利用步骤1中得到的掩码矩阵,用替换xt中对应的缺失值,得到填补后t时刻的值相关计算公式如下所示:

5.如权利要求1所述非平衡缺失数据下工业设备剩余寿命的dtsigan数据增强方法,其特征在于,所述步骤3,生成网络g将随机噪声z映射...

【专利技术属性】
技术研发人员:王远殷晨许冬燕史志刚徐朝宇邵壮
申请(专利权)人:山东外事职业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1