【技术实现步骤摘要】
一种预训练模型的训练方法、时序数据的识别方法及装置
[0001]本公开涉及人工智能
,尤其涉及数据处理、机器学习
技术介绍
[0002]时序数据是一种较为普遍的数据形态,与生产生活密切相关。如综合能源管理行业中,将一段时间内每个时刻下的能源消耗数据,作为一条时序数据。
技术实现思路
[0003]本公开提供了一种预训练模型的训练方法、时序数据的识别方法及装置。
[0004]本公开实施例的第一方面,提供了一种预训练模型的训练方法,包括:
[0005]对原始时序数据添加噪声,得到样本时序数据;
[0006]通过预训练模型提取所述样本时序数据的趋势项和季节项,所述趋势项表示所述样本时序数据的变化趋势,所述季节项表示所述样本时序数据的变化周期;
[0007]通过所述预训练模型基于所述趋势项和所述季节项,预测添加噪声前的时序数据,得到预测时序数据;
[0008]基于所述原始时序数据和所述预测时序数据,训练所述预训练模型。
[0009]本公开实施例的第二方面,提供了一种时序数据的识别方法,包括:
[0010]获取待识别时序数据;
[0011]通过识别模型提取所述待识别时序数据的趋势项和季节项,所述趋势项表示所述待识别时序数据的变化趋势,所述季节项表示所述待识别时序数据的变化周期;其中,所述识别模型基于第一方面任一项所述的方法训练的预训练模型得到;
[0012]通过所述识别模型基于所述趋势项和所述季节项,确定对所述待识别时序数据的 ...
【技术保护点】
【技术特征摘要】
1.一种预训练模型的训练方法,包括:对原始时序数据添加噪声,得到样本时序数据;通过预训练模型提取所述样本时序数据的趋势项和季节项,所述趋势项表示所述样本时序数据的变化趋势,所述季节项表示所述样本时序数据的变化周期;通过所述预训练模型基于所述趋势项和所述季节项,预测添加噪声前的时序数据,得到预测时序数据;基于所述原始时序数据和所述预测时序数据,训练所述预训练模型。2.根据权利要求1所述的方法,其中,所述对原始时序数据添加噪声,得到样本时序数据,包括:对所述原始时序数据中的部分数据进行掩盖mask,得到所述样本时序数据。3.根据权利要求2所述的方法,其中,所述对所述原始时序数据中的部分数据进行掩盖mask,得到所述样本时序数据,包括:针对所述原始时序数据包括的每段数据,根据预设的掩码率,确定是否需要对该段数据进行mask;其中,每段数据包括的数据量相同;若是,则对该段数据进行mask。4.根据权利要求1所述的方法,其中,所述通过预训练模型提取所述样本时序数据的趋势项和季节项,包括:通过所述预训练模型对所述样本时序数据进行因果卷积,并基于因果卷积结果得到趋势项;通过所述预训练模型确定所述样本时序数据与得到的趋势项之间的第一差值,并对所述第一差值进行快速傅里叶变换,得到频域数据,对得到的频域数据进行线性变换,并对线性变换结果进行快速傅里叶逆变换得到季节项;通过所述预训练模型确定所述第一差值与得到的季节项之间的第二差值,并对所述第二差值进行因果卷积,返回所述基于因果卷积结果得到趋势项的步骤,直至提取出预设数量的趋势项和季节项。5.根据权利要求4所述的方法,其中,所述通过所述预训练模型对所述样本时序数据进行因果卷积,并基于因果卷积结果得到趋势项,包括:通过所述预训练模型分别对所述样本时序数据进行多种因果卷积;其中,每种因果卷积的卷积核尺寸不同;通过所述预训练模型确定每种因果卷积结果的权重,并确定各因果卷积结果的加权和,将所述加权和作为提取的趋势项。6.根据权利要求1所述的方法,其中,所述通过预训练模型提取所述样本时序数据的趋势项和季节项,包括:通过所述预训练模型对所述样本时序数据进行因果卷积,并基于因果卷积结果得到趋势项;通过所述预训练模型确定所述样本时序数据与得到的趋势项之间的第一差值,并对所述第一差值进行快速傅里叶变换,得到频域数据,对得到的频域数据进行线性变换,并对线性变换结果进行快速傅里叶逆变换得到季节项。7.根据权利要求1
‑
6任一项所述的方法,其中,所述通过所述预训练模型基于所述趋势
项和所述季节项,预测添加噪声前的时序数据,得到预测时序数据,包括:通过所述预训练模型确定对所述样本时序数据提取的趋势项和季节项的总和;通过所述预训练模型对所述总和进行线性变换,将线性变换结果作为所述预测时序数据。8.一种时序数据的识别方法,包括:获取待识别时序数据;通过识别模型提取所述待识别时序数据的趋势项和季节项,所述趋势项表示所述待识别时序数据的变化趋势,所述季节项表示所述待识别时序数据的变化周期;其中,所述识别模型基于权利要求1
‑
7任一项所述的方法训练的预训练模型得到;通过所述识别模型基于所述趋势项和所述季节项,确定对所述待识别时序数据的识别结果。9.一种预训练模型的训练装置,包括:添加模块,用于对原始时序数据添加噪声,得到样本时序数据;提取模块,用于通过预训练模型提取所述样本时序数据的趋势项和季节项,所述趋势项表示所述样本时序数据的变化趋势,所述...
【专利技术属性】
技术研发人员:王龙飞,卞传鑫,杨胜文,孙玥,王栋,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。