一种预训练模型的训练方法、时序数据的识别方法及装置制造方法及图纸

技术编号：37822189 阅读：26 留言：0更新日期：2023-06-09 09:58

本公开提供了一种预训练模型的训练方法、时序数据的识别方法及装置，涉及人工智能技术领域，尤其涉及数据处理、机器学习技术领域。具体实现方案为：对原始时序数据添加噪声，得到样本时序数据。然后通过预训练模型提取样本时序数据的趋势项和季节项，其中，趋势项表示样本时序数据的变化趋势，季节项表示样本时序数据的变化周期。之后通过预训练模型基于趋势项和季节项，预测添加噪声前的时序数据，得到预测时序数据。再基于原始时序数据和预测时序数据，训练预训练模型。从而实现了提高对时序数据进行识别的准确性。据进行识别的准确性。据进行识别的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
一种预训练模型的训练方法、时序数据的识别方法及装置

[0001]本公开涉及人工智能
，尤其涉及数据处理、机器学习

技术介绍

[0002]时序数据是一种较为普遍的数据形态，与生产生活密切相关。如综合能源管理行业中，将一段时间内每个时刻下的能源消耗数据，作为一条时序数据。

技术实现思路

[0003]本公开提供了一种预训练模型的训练方法、时序数据的识别方法及装置。
[0004]本公开实施例的第一方面，提供了一种预训练模型的训练方法，包括：
[0005]对原始时序数据添加噪声，得到样本时序数据；
[0006]通过预训练模型提取所述样本时序数据的趋势项和季节项，所述趋势项表示所述样本时序数据的变化趋势，所述季节项表示所述样本时序数据的变化周期；
[0007]通过所述预训练模型基于所述趋势项和所述季节项，预测添加噪声前的时序数据，得到预测时序数据；
[0008]基于所述原始时序数据和所述预测时序数据，训练所述预训练模型。
[0009]本公开实施例的第二方面，提供了一种时序数据的识别方法，包括：
[0010]获取待识别时序数据；
[0011]通过识别模型提取所述待识别时序数据的趋势项和季节项，所述趋势项表示所述待识别时序数据的变化趋势，所述季节项表示所述待识别时序数据的变化周期；其中，所述识别模型基于第一方面任一项所述的方法训练的预训练模型得到；
[0012]通过所述识别模型基于所述趋势项和所述季节项，确定对所述待识别时序数据的...

【技术保护点】

【技术特征摘要】
1.一种预训练模型的训练方法，包括：对原始时序数据添加噪声，得到样本时序数据；通过预训练模型提取所述样本时序数据的趋势项和季节项，所述趋势项表示所述样本时序数据的变化趋势，所述季节项表示所述样本时序数据的变化周期；通过所述预训练模型基于所述趋势项和所述季节项，预测添加噪声前的时序数据，得到预测时序数据；基于所述原始时序数据和所述预测时序数据，训练所述预训练模型。2.根据权利要求1所述的方法，其中，所述对原始时序数据添加噪声，得到样本时序数据，包括：对所述原始时序数据中的部分数据进行掩盖mask，得到所述样本时序数据。3.根据权利要求2所述的方法，其中，所述对所述原始时序数据中的部分数据进行掩盖mask，得到所述样本时序数据，包括：针对所述原始时序数据包括的每段数据，根据预设的掩码率，确定是否需要对该段数据进行mask；其中，每段数据包括的数据量相同；若是，则对该段数据进行mask。4.根据权利要求1所述的方法，其中，所述通过预训练模型提取所述样本时序数据的趋势项和季节项，包括：通过所述预训练模型对所述样本时序数据进行因果卷积，并基于因果卷积结果得到趋势项；通过所述预训练模型确定所述样本时序数据与得到的趋势项之间的第一差值，并对所述第一差值进行快速傅里叶变换，得到频域数据，对得到的频域数据进行线性变换，并对线性变换结果进行快速傅里叶逆变换得到季节项；通过所述预训练模型确定所述第一差值与得到的季节项之间的第二差值，并对所述第二差值进行因果卷积，返回所述基于因果卷积结果得到趋势项的步骤，直至提取出预设数量的趋势项和季节项。5.根据权利要求4所述的方法，其中，所述通过所述预训练模型对所述样本时序数据进行因果卷积，并基于因果卷积结果得到趋势项，包括：通过所述预训练模型分别对所述样本时序数据进行多种因果卷积；其中，每种因果卷积的卷积核尺寸不同；通过所述预训练模型确定每种因果卷积结果的权重，并确定各因果卷积结果的加权和，将所述加权和作为提取的趋势项。6.根据权利要求1所述的方法，其中，所述通过预训练模型提取所述样本时序数据的趋势项和季节项，包括：通过所述预训练模型对所述样本时序数据进行因果卷积，并基于因果卷积结果得到趋势项；通过所述预训练模型确定所述样本时序数据与得到的趋势项之间的第一差值，并对所述第一差值进行快速傅里叶变换，得到频域数据，对得到的频域数据进行线性变换，并对线性变换结果进行快速傅里叶逆变换得到季节项。7.根据权利要求1
‑
6任一项所述的方法，其中，所述通过所述预训练模型基于所述趋势
项和所述季节项，预测添加噪声前的时序数据，得到预测时序数据，包括：通过所述预训练模型确定对所述样本时序数据提取的趋势项和季节项的总和；通过所述预训练模型对所述总和进行线性变换，将线性变换结果作为所述预测时序数据。8.一种时序数据的识别方法，包括：获取待识别时序数据；通过识别模型提取所述待识别时序数据的趋势项和季节项，所述趋势项表示所述待识别时序数据的变化趋势，所述季节项表示所述待识别时序数据的变化周期；其中，所述识别模型基于权利要求1
‑
7任一项所述的方法训练的预训练模型得到；通过所述识别模型基于所述趋势项和所述季节项，确定对所述待识别时序数据的识别结果。9.一种预训练模型的训练装置，包括：添加模块，用于对原始时序数据添加噪声，得到样本时序数据；提取模块，用于通过预训练模型提取所述样本时序数据的趋势项和季节项，所述趋势项表示所述样本时序数据的变化趋势，所述...

【专利技术属性】
技术研发人员：王龙飞，卞传鑫，杨胜文，孙玥，王栋，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人