一种数据预测模型的输入数据归一化方法和装置及设备制造方法及图纸

技术编号:36062499 阅读:22 留言:0更新日期:2022-12-24 10:27
本发明专利技术提供了一种数据预测模型的输入数据归一化方法和装置及设备,所述方法包括:获取待归一化的输入数据,并在确定所述输入数据超出预设范围时,限制所述输入数据的取值至预设范围内;根据所述预设范围的数据长度及预设的维度N,确定每一维度向量对应的单位数据长度,所述N不小于2;将所述输入数据和所述预设范围的最小阈值的差值β,映射为前n维采用绝对值不大于1的非零编码值、N

【技术实现步骤摘要】
一种数据预测模型的输入数据归一化方法和装置及设备


[0001]本专利技术涉及领域,尤其涉及一种数据预测模型的输入数据归一化方法和装置及设备。

技术介绍

[0002]随着大数据技术的迅猛发展,数据中心也迅速增多。数据中心通常由机柜、互联网技术(Internet Technology,IT)服务器、不间断电源(Uninterruptible Power Supply,UPS)、空调、温湿度传感器等设备组成,上述设备在运行时会产生大量的热量,耗费大量电能。因此,通过人工智能的手段降低电源使用效率(Power Usage Effectiveness,PUE)成为了当前发展趋势。
[0003]可以使用人工智能等多种机器学习方法构建数据预测模型以降低PUE,例如,将数据中心的设备运行数据和环境状态数据输入到PUE预测模型,获得上述PUE预测模型预测的PUE数据,以确定使PUE较低的设备运行方案;或,将数据中心的设备运行数据和环境状态数据输入到温度预测模型,获得上述温度预测模型预测的温度,以对数据中心内的设备进行调节。使用上述机器学习方法时,为了提高机器学习模型的准确性,首先会对机器学习模型输入的数据进行归一化处理。标准的0

1归一化方法为将待归一化数值和最小阈值的差值,与最大阈值和最小阈值的差值做比,计算归一化的数据,其中,要求待归一化数值在上述最大阈值和最小阈值之间。
[0004]上述数据预测模型的输入数据的变化范围常常较大,例如IT功率,不同数据中心的IT功率数值范围不同,且同一数据中心在不同时刻的IT功率的数值范围也不同,所以在使用上述标准的0

1归一化方法时,会遇到两个问题:(1)如果设置的最大阈值和最小阈值之间的预设范围较大,对于待归一化的输入数据中存在的变化范围较小的数据,则归一化后的值会集中在某一值附近,效果不理想;(2)如果设置的最大阈值和最小阈值之间的预设范围较小,上述标准的0

1归一化方法无法处理在上述预设范围之外的输入数据。

技术实现思路

[0005]本专利技术提供一种数据预测模型的输入数据归一化方法和装置及设备,解决现有的使用标准的0

1归一化方法处理数据预测模型的输入数据的方案,归一化结果集中在一个值附近,且无法处理预设范围之外的输入数据的问题。
[0006]第一方面,本专利技术提供一种数据预测模型的输入数据归一化方法,该方法包括:
[0007]获取待归一化的输入数据,并在确定所述输入数据超出预设范围时,限制所述输入数据的取值至预设范围内;
[0008]根据所述预设范围的数据长度及预设的维度N,确定每一维度向量对应的单位数据长度,所述N不小于2;
[0009]将所述输入数据和所述预设范围的最小阈值的差值β,映射为前n维采用绝对值不大于1的非零编码值、N

n维采用编码值0的N维向量,其中,所述N维向量中各维度编码值与
所述单位数据长度的乘积之和,为所述差值β。
[0010]可选地,将所述输入数据和所述预设范围的最小阈值的差值β,映射为前n维采用绝对值不大于1的非零编码值、N

n维采用编码值0的N维向量,包括:
[0011]将所述输入数据和所述预设范围的最小阈值的差值β,按照所述单位数据长度进行拆解,得到n

1个单位数据长度,及所述差值β和所述n

1个单位数据长度的差值m;
[0012]所述N维向量包括顺次排列的n

1个编码值为1的维度,和一个编码值为所述差值m和所述单位数据长度的比值的维度,以及N

n个编码值为0的维度。
[0013]可选地,将所述输入数据和所述预设范围的最小阈值的差值β,按照所述单位数据长度进行拆解,包括:
[0014]将所述输入数据和所述预设范围的最小阈值的差值β,按照非零编码值与单位数据长度的乘积迭代递减,迭代n次至递减结果小于所述单位数据长度时结束;或者
[0015]将所述输入数据和所述预设范围的最小阈值的差值β,对所述非零编码值与单位数据长度的乘积进行取模运算。
[0016]可选地,在确定所述输入数据超出预设范围时,限制所述输入数据的取值至预设范围内,包括:
[0017]确定所述输入数据大于所述预设范围的最大阈值,将所述输入数据更新为所述最大阈值;
[0018]确定所述输入数据小于所述预设范围的最小阈值,将所述输入数据更新为所述最小阈值;
[0019]确定所述输入数据不小于所述预设范围的最小阈值且不大于所述预设范围的最大阈值,保持所述输入数据不变。
[0020]可选地,根据所述预设范围的数据长度及预设的维度N,确定每一维度向量对应的单位数据长度,包括:
[0021]将所述预设范围的数据长度与预设的维度N做比,得到每一维度向量对应的单位数据长度。
[0022]可选地,所述方法还包括:
[0023]将所述N维向量作为数据预测模型的输入,以输出数据中心的与所述N维向量对应的实际数据为目标,调整所述数据预测模型的参数。
[0024]可选地,所述数据预测模型包括数据中心电源使用效率PUE预测模型和/或数据中心温度预测模型。
[0025]第二方面,本专利技术提供一种数据预测模型的输入数据归一化设备,包括存储器和处理器,其中:
[0026]所述存储器用于存储计算机程序;
[0027]所述处理器用于读取所述存储器中的程序并执行如下步骤:
[0028]获取待归一化的输入数据,并在确定所述输入数据超出预设范围时,限制所述输入数据的取值至预设范围内;
[0029]根据所述预设范围的数据长度及预设的维度N,确定每一维度向量对应的单位数据长度,所述N不小于2;
[0030]将所述输入数据和所述预设范围的最小阈值的差值β,映射为前n维采用绝对值不
大于1的非零编码值、N

n维采用编码值0的N维向量,其中,所述N维向量中各维度编码值与所述单位数据长度的乘积之和,为所述差值β。
[0031]可选地,所述处理器将所述输入数据和所述预设范围的最小阈值的差值β,映射为前n维采用绝对值不大于1的非零编码值、N

n维采用编码值0的N维向量,包括:
[0032]将所述输入数据和所述预设范围的最小阈值的差值β,按照所述单位数据长度进行拆解,得到n

1个单位数据长度,及所述差值β和所述n

1个单位数据长度的差值m;
[0033]所述N维向量包括顺次排列的n

1个编码值为1的维度,和一个编码值为所述差值m和所述单位数据长度的比值的维度,以及N

n个编码值为0的维度。
[0034]可选地,所述处理器将所述输入数据和所述预设范围的最小阈值的差值β,按照所述单位数据长度进行拆解,包括:
...

【技术保护点】

【技术特征摘要】
1.一种数据预测模型的输入数据归一化方法,其特征在于,包括:获取待归一化的输入数据,并在确定所述输入数据超出预设范围时,限制所述输入数据的取值至预设范围内;根据所述预设范围的数据长度及预设的维度N,确定每一维度向量对应的单位数据长度,所述N不小于2;将所述输入数据和所述预设范围的最小阈值的差值β,映射为前n维采用绝对值不大于1的非零编码值、N

n维采用编码值0的N维向量,其中,所述N维向量中各维度编码值与所述单位数据长度的乘积之和,为所述差值β。2.根据权利要求1所述的方法,其特征在于,将所述输入数据和所述预设范围的最小阈值的差值β,映射为前n维采用绝对值不大于1的非零编码值、N

n维采用编码值0的N维向量,包括:将所述输入数据和所述预设范围的最小阈值的差值β,按照所述单位数据长度进行拆解,得到n

1个单位数据长度,及所述差值β和所述n

1个单位数据长度的差值m;所述N维向量包括顺次排列的n

1个编码值为1的维度,和一个编码值为所述差值m和所述单位数据长度的比值的维度,以及N

n个编码值为0的维度。3.根据权利要求2所述的方法,其特征在于,将所述输入数据和所述预设范围的最小阈值的差值β,按照所述单位数据长度进行拆解,包括:将所述输入数据和所述预设范围的最小阈值的差值β,按照非零编码值与单位数据长度的乘积迭代递减,迭代n次至递减结果小于所述单位数据长度时结束;或者将所述输入数据和所述预设范围的最小阈值的差值β,对所述非零编码值与单位数据长度的乘积进行取模运算。4.根据权利要求1所述的方法,其特征在于,在确定所述输入数据超出预设范围时,限制所述输入数据的取值至预设范围内,包括:确定所述输入数据大于所述预设范围的最大阈值,将所述输...

【专利技术属性】
技术研发人员:刘敬民颜泽波周薛继冯晓波李星王静
申请(专利权)人:维谛技术西安有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1