一种应用于模型训练的数据处理方法、装置、设备和介质制造方法及图纸

技术编号:37400176 阅读:35 留言:0更新日期:2023-04-30 09:28
本申请实施例公开了一种应用于模型训练的数据处理方法、装置、设备和介质,从原始设备数据中提取平滑信号序列。为了实现对设备数据的扩充,保证扩充后的设备数据与原始设备数据具有差异性,并且也能够符合业务场景特性,因此可以按照设定的跳变比例调整原始设备数据的跳变信息,以得到跳变特征数据。跳变信息可以包括跳变频率和/或跳变幅度。根据跳变特征数据和平滑信号序列,可以得到增强后的设备数据;增强后的设备数据与原始设备数据存在差异性,并且符合业务场景特性。增强后的设备数据满足数据集高质量的需求,因此利用原始设备数据以及增强后的设备数据对初始设备预测模型进行训练,可以得到具有较高精度的设备预测模型。型。型。

【技术实现步骤摘要】
一种应用于模型训练的数据处理方法、装置、设备和介质


[0001]本申请涉及模型训练
,特别是涉及一种应用于模型训练的数据处理方法、装置、设备和计算机可读存储介质。

技术介绍

[0002]设备数据是在不同时间上收集到的数据,这类数据反映了某一事物、现象等随时间的变化状态或程度。时间序列分析是一种设备数据处理的统计方法,该方法基于随机过程理论和数理统计学方法,研究设备数据所遵从的统计规律,以用于解决实际问题。
[0003]设备数据可以用于模型训练,例如,为了预测系统资源占用量的变化趋势,可以采集过去一段时间内各设备对系统资源的占用量作为数据集,利用该数据集对模型进行训练,从而使得训练后的模型可以对当前资源的占用量进行分析,预测出接下来一段时间内系统资源的占用量的变化趋势。为了提升模型分析的准确性,必须收集充分的数据集对模型进行训练,这就要求数据集有充足的样本数量,并且样本之间的有足够的差异性,能覆盖场景的分布特性。但在实际的环境中,收集到的数据集往往数量不够、数据特征单一、业务场景覆盖性不强。收集到的数据集质量不高,导致基于该数据集训练得到的设备预测模型的预测效果不好。
[0004]可见,如何提升设备预测模型的准确性,是本领域技术人员需要解决的问题。

技术实现思路

[0005]本申请实施例的目的是提供一种应用于模型训练的数据处理方法、装置、设备和计算机可读存储介质,可以提升设备预测模型的准确性。
[0006]为解决上述技术问题,本申请实施例提供一种应用于模型训练的数据处理方法,包括:
[0007]从原始设备数据中提取平滑信号序列;
[0008]按照设定的跳变比例调整所述原始设备数据的跳变信息,以得到跳变特征数据;其中,所述跳变信息包括跳变频率和/或跳变幅度;
[0009]根据所述跳变特征数据和所述平滑信号序列,得到增强后的设备数据;
[0010]利用所述原始设备数据以及所述增强后的设备数据对初始设备预测模型进行训练,以得到满足精度要求的设备预测模型。
[0011]可选地,所述按照设定的跳变比例调整所述原始设备数据的跳变信息,以得到跳变特征数据包括:
[0012]按照设定的频率跳变比例调整所述原始设备数据的跳变频率,以得到跳变位置序列;
[0013]按照设定的幅度跳变比例调整所述原始设备数据的跳变幅度,以得到跳变幅度序列。
[0014]可选地,所述按照设定的频率跳变比例调整所述原始设备数据的跳变频率,以得
到跳变位置序列包括:
[0015]对所述原始设备数据进行差分运算,得到差分序列;
[0016]根据所述差分序列和设定的标准差原则,确定出所述原始设备数据的初始跳变位置序列;
[0017]基于所述频率跳变比例和所述原始设备数据的跳变频率,随机生成新的跳变频率;
[0018]利用所述新的跳变频率对所述初始跳变位置序列进行调整,得到跳变位置序列。
[0019]可选地,在所述基于所述频率跳变比例和所述原始设备数据的跳变频率,随机生成新的跳变频率之前还包括:
[0020]判断所述初始跳变位置序列的间隔是否符合指数分布;
[0021]在所述初始跳变位置序列的间隔符合指数分布的情况下,执行所述基于所述频率跳变比例和所述原始设备数据的跳变频率,随机生成新的跳变频率的步骤。
[0022]可选地,所述按照设定的幅度跳变比例调整所述原始设备数据的跳变幅度,以得到跳变幅度序列包括:
[0023]将所述原始设备数据的均值和方差作为初始正态分布参数;
[0024]按照设定的幅度跳变比例对所述初始正态分布参数进行调整,得到新的初始正态分布参数;
[0025]基于所述新的正态分布参数,对所述原始设备数据进行正态分布拟合,生成随机变量;
[0026]选出取满足标准差原则的N个随机变量作为跳变幅度序列;其中,所述N的取值与所述初始跳变位置序列中包含的跳变位置的个数相同。
[0027]可选地,所述跳变特征数据包括跳变位置序列和跳变幅度序列;所述根据所述跳变特征数据和所述平滑信号序列,得到增强后的设备数据包括:
[0028]将所述跳变位置序列和所述跳变幅度序列合成得到跳变序列;
[0029]将所述跳变序列和所述平滑信号序列进行叠加,得到增强后的设备数据。
[0030]可选地,所述从原始设备数据中提取平滑信号序列包括:
[0031]对所述原始设备数据进行滑动平均运算,得到平滑信号序列。
[0032]本申请实施例还提供了一种应用于模型训练的数据处理装置,包括提取单元、调整单元、增强单元和训练单元;
[0033]所述提取单元,用于从原始设备数据中提取平滑信号序列;
[0034]所述调整单元,用于按照设定的跳变比例调整所述原始设备数据的跳变信息,以得到跳变特征数据;其中,所述跳变信息包括跳变频率和/或跳变幅度;
[0035]所述增强单元,用于根据所述跳变特征数据和所述平滑信号序列,得到增强后的设备数据;
[0036]所述训练单元,用于利用所述原始设备数据以及所述增强后的设备数据对初始设备预测模型进行训练,以得到满足精度要求的设备预测模型。
[0037]可选地,所述调整单元包括频率调整子单元和幅度调整子单元;
[0038]所述频率调整子单元,用于按照设定的频率跳变比例调整所述原始设备数据的跳变频率,以得到跳变位置序列;
[0039]所述幅度调整子单元,用于按照设定的幅度跳变比例调整所述原始设备数据的跳变幅度,以得到跳变幅度序列。
[0040]可选地,所述频率调整子单元用于对所述原始设备数据进行差分运算,得到差分序列;根据所述差分序列和设定的标准差原则,确定出所述原始设备数据的初始跳变位置序列;基于所述频率跳变比例和所述原始设备数据的跳变频率,随机生成新的跳变频率;利用所述新的跳变频率对所述初始跳变位置序列进行调整,得到跳变位置序列。
[0041]可选地,还包括判断单元;
[0042]所述判断单元,用于判断所述初始跳变位置序列的间隔是否符合指数分布;在所述初始跳变位置序列的间隔符合指数分布的情况下,触发所述频率调整子单元执行所述基于所述频率跳变比例和所述原始设备数据的跳变频率,随机生成新的跳变频率的步骤。
[0043]可选地,所述幅度调整子单元用于将所述原始设备数据的均值和方差作为初始正态分布参数;按照设定的幅度跳变比例对所述初始正态分布参数进行调整,得到新的初始正态分布参数;基于所述新的正态分布参数,对所述原始设备数据进行正态分布拟合,生成随机变量;选出取满足标准差原则的N个随机变量作为跳变幅度序列;其中,所述N的取值与所述初始跳变位置序列中包含的跳变位置的个数相同。
[0044]可选地,所述跳变特征数据包括跳变位置序列和跳变幅度序列;所述增强单元包括合成子单元和叠加子单元;
[0045]所述合成子单元,用于将所述跳变位置序列和所述跳变幅度序本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种应用于模型训练的数据处理方法,其特征在于,包括:从原始设备数据中提取平滑信号序列;按照设定的跳变比例调整所述原始设备数据的跳变信息,以得到跳变特征数据;其中,所述跳变信息包括跳变频率和/或跳变幅度;根据所述跳变特征数据和所述平滑信号序列,得到增强后的设备数据;利用所述原始设备数据以及所述增强后的设备数据对初始设备预测模型进行训练,以得到满足精度要求的设备预测模型。2.根据权利要求1所述的应用于模型训练的数据处理方法,其特征在于,所述按照设定的跳变比例调整所述原始设备数据的跳变信息,以得到跳变特征数据包括:按照设定的频率跳变比例调整所述原始设备数据的跳变频率,以得到跳变位置序列;按照设定的幅度跳变比例调整所述原始设备数据的跳变幅度,以得到跳变幅度序列。3.根据权利要求2所述的应用于模型训练的数据处理方法,其特征在于,所述按照设定的频率跳变比例调整所述原始设备数据的跳变频率,以得到跳变位置序列包括:对所述原始设备数据进行差分运算,得到差分序列;根据所述差分序列和设定的标准差原则,确定出所述原始设备数据的初始跳变位置序列;基于所述频率跳变比例和所述原始设备数据的跳变频率,随机生成新的跳变频率;利用所述新的跳变频率对所述初始跳变位置序列进行调整,得到跳变位置序列。4.根据权利要求3所述的应用于模型训练的数据处理方法,其特征在于,在所述基于所述频率跳变比例和所述原始设备数据的跳变频率,随机生成新的跳变频率之前还包括:判断所述初始跳变位置序列的间隔是否符合指数分布;在所述初始跳变位置序列的间隔符合指数分布的情况下,执行所述基于所述频率跳变比例和所述原始设备数据的跳变频率,随机生成新的跳变频率的步骤。5.根据权利要求2所述的应用于模型训练的数据处理方法,其特征在于,所述按照设定的幅度跳变比例调整所述原始设备数据的跳变幅度,以得到跳变幅度序列包括:将所述原始设备数据的均值和方差作为初始正态分布参数;按照...

【专利技术属性】
技术研发人员:张穗辉匡文彬陈晓帆郜振锋古亮
申请(专利权)人:深信服科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1