一种数据预测模型的输入数据归一化方法和装置及设备制造方法及图纸

技术编号：36062499 阅读：22 留言：0更新日期：2022-12-24 10:27

本发明专利技术提供了一种数据预测模型的输入数据归一化方法和装置及设备，所述方法包括：获取待归一化的输入数据，并在确定所述输入数据超出预设范围时，限制所述输入数据的取值至预设范围内；根据所述预设范围的数据长度及预设的维度N，确定每一维度向量对应的单位数据长度，所述N不小于2；将所述输入数据和所述预设范围的最小阈值的差值β，映射为前n维采用绝对值不大于1的非零编码值、N

全部详细技术资料下载

【技术实现步骤摘要】
一种数据预测模型的输入数据归一化方法和装置及设备

[0001]本专利技术涉及领域，尤其涉及一种数据预测模型的输入数据归一化方法和装置及设备。

技术介绍

[0002]随着大数据技术的迅猛发展，数据中心也迅速增多。数据中心通常由机柜、互联网技术(Internet Technology，IT)服务器、不间断电源(Uninterruptible Power Supply，UPS)、空调、温湿度传感器等设备组成，上述设备在运行时会产生大量的热量，耗费大量电能。因此，通过人工智能的手段降低电源使用效率(Power Usage Effectiveness，PUE)成为了当前发展趋势。
[0003]可以使用人工智能等多种机器学习方法构建数据预测模型以降低PUE，例如，将数据中心的设备运行数据和环境状态数据输入到PUE预测模型，获得上述PUE预测模型预测的PUE数据，以确定使PUE较低的设备运行方案；或，将数据中心的设备运行数据和环境状态数据输入到温度预测模型，获得上述温度预测模型预测的温度，以对数据中心内的设备进行调节。使用上述机器学习方法时，为了提高机器学习模型的准确性，首先会对机器学习模型输入的数据进行归一化处理。标准的0
‑
1归一化方法为将待归一化数值和最小阈值的差值，与最大阈值和最小阈值的差值做比，计算归一化的数据，其中，要求待归一化数值在上述最大阈值和最小阈值之间。
[0004]上述数据预测模型的输入数据的变化范围常常较大，例如IT功率，不同数据中心的IT功率数值范围不同，且同一数据中心在

【技术保护点】

【技术特征摘要】
1.一种数据预测模型的输入数据归一化方法，其特征在于，包括：获取待归一化的输入数据，并在确定所述输入数据超出预设范围时，限制所述输入数据的取值至预设范围内；根据所述预设范围的数据长度及预设的维度N，确定每一维度向量对应的单位数据长度，所述N不小于2；将所述输入数据和所述预设范围的最小阈值的差值β，映射为前n维采用绝对值不大于1的非零编码值、N
‑
n维采用编码值0的N维向量，其中，所述N维向量中各维度编码值与所述单位数据长度的乘积之和，为所述差值β。2.根据权利要求1所述的方法，其特征在于，将所述输入数据和所述预设范围的最小阈值的差值β，映射为前n维采用绝对值不大于1的非零编码值、N
‑
n维采用编码值0的N维向量，包括：将所述输入数据和所述预设范围的最小阈值的差值β，按照所述单位数据长度进行拆解，得到n
‑
1个单位数据长度，及所述差值β和所述n
‑
1个单位数据长度的差值m；所述N维向量包括顺次排列的n
‑
1个编码值为1的维度，和一个编码值为所述差值m和所述单位数据长度的比值的维度，以及N
‑
n个编码值为0的维度。3.根据权利要求2所述的方法，其特征在于，将所述输入数据和所述预设范围的最小阈值的差值β，按照所述单位数据长度进行拆解，包括：将所述输入数据和所述预设范围的最小阈值的差值β，按照非零编码值与单位数据长度的乘积迭代递减，迭代n次至递减结果小于所述单位数据长度时结束；或者将所述输入数据和所述预设范围的最小阈值的差值β，对所述非零编码值与单位数据长度的乘积进行取模运算。4.根据权利要求1所述的方法，其特征在于，在确定所述输入数据超出预设范围时，限制所述输入数据的取值至预设范围内，包括：确定所述输入数据大于所述预设范围的最大阈值，将所述输...

【专利技术属性】
技术研发人员：刘敬民，颜泽波，周薛继，冯晓波，李星，王静，
申请(专利权)人：维谛技术西安有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人