System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及机器学习,特别涉及一种制冷系统的运行控制方法、装置、设备及介质。
技术介绍
1、在现有技术中,一般会在制冷系统中引入强化学习模型来寻找制冷系统的最优运行状态,并以此来降低制冷系统的功耗量。如果制冷系统完全依靠强化学习模型进行控制,通常会需要大量的资源开销。为了弥补这一缺陷,有时还会在强化学习模型中引入自学习网络架构来对强化学习模型进行优化,并以此达到降低强化学习模型所需资源开销的目的。
2、但是,由于该方法只是利用制冷系统的一成不变的历史样本参数来对强化学习模型进行优化,而制冷系统会随着环境和负载等实际运行参数的变化,不断地去调整自身的运行状态,因此,利用该方法只会让制冷系统根据其自身的历史样本参数不断地寻找最优运行状态,而无法让制冷系统工作在最优运行状态下。目前,针对这一技术问题,还没有较为有效的解决办法。
3、由此可见,如何让制冷系统工作在最优运行状态下,并进一步降低制冷系统的功耗量,是本领域技术人员亟待解决的技术问题。
技术实现思路
1、有鉴于此,本专利技术的目的在于提供一种制冷系统的运行控制方法、装置、设备及介质,以解决现有技术中制冷系统无法工作在最优运行状态下的技术问题。其具体方案如下:
2、为了解决上述技术问题,本专利技术提供了一种制冷系统的运行控制方法,包括:
3、利用设定参数对制冷系统进行初始化;
4、当所述制冷系统达到稳定运行状态时,利用所述制冷系统在当前状态下的目标参数对强化学习模型的初始
5、根据所述强化学习模型确定所述制冷系统在下一时刻的运行状态,并利用所述制冷系统在下一时刻的运行状态对所述强化学习模型以及所述制冷系统的所述设定参数进行更新;
6、利用所述目标样本库对所述强化学习模型中的行动网络和评估网络进行更新,并当所述制冷系统达到稳定运行状态时,再次执行所述利用所述制冷系统在当前状态下的目标参数对强化学习模型的初始样本库进行更新的步骤。
7、优选的,所述利用所述制冷系统在下一时刻的运行状态对所述强化学习模型以及所述制冷系统的所述设定参数进行更新的过程,包括:
8、利用所述强化学习模型确定所述制冷系统在下一时刻的运行状态,得到第一运行状态;
9、随机选取所述制冷系统在下一时刻的运行状态,得到第二运行状态;
10、若所述第一运行状态所对应的预设概率值大于随机概率值,则利用所述第一运行状态对所述制冷系统的所述设定参数进行更新;其中,所述预设概率值的取值范围为[0.5,1],所述随机概率值的取值范围为[0,1];
11、若所述第一运行状态所对应的预设概率值小于等于所述随机概率值,则利用所述第二运行状态对所述制冷系统的所述设定参数进行更新。
12、优选的,所述利用所述制冷系统在当前状态下的目标参数对强化学习模型的初始样本库进行更新,得到目标样本库的过程,包括:
13、获取所述强化学习模型的所述初始样本库中与所述制冷系统在当前状态下所对应的参数,得到样本参数;
14、将所述初始样本库中的所述样本参数替换为所述目标参数,得到所述目标样本库。
15、优选的,所述利用所述制冷系统在下一时刻的运行状态对所述强化学习模型以及所述制冷系统的所述设定参数进行更新的过程,包括:
16、利用所述制冷系统在下一时刻的运行状态对所述强化学习模型进行更新,并当所述强化学习模型的迭代次数达到第一预设阈值的整数倍时,利用所述制冷系统在下一时刻的运行状态对所述制冷系统的所述设定参数进行更新。
17、优选的,所述利用所述目标样本库对所述强化学习模型中的行动网络和评估网络进行更新的过程,包括:
18、基于bp神经网络算法,并利用所述目标样本库对所述强化学习模型中的所述行动网络和所述评估网络进行更新。
19、优选的,所述利用所述目标样本库对所述强化学习模型中的行动网络和评估网络进行更新的过程,包括:
20、当所述强化学习模型的迭代次数达到第二预设阈值的整数倍时,则利用所述目标样本库中的全部样本对所述强化学习模型中的所述行动网络进行更新;
21、当所述强化学习模型的迭代次数达到第三预设阈值的整数倍时,则利用所述目标样本库中的真实r值所对应的样本对所述强化学习模型中的所述评估网络进行更新。
22、优选的,所述根据所述强化学习模型确定所述制冷系统在下一时刻的运行状态的过程,包括:
23、若所述制冷系统为压缩式制冷系统,则基于所述强化学习模型,并根据所述压缩式制冷系统的冷凝压力设定值和蒸发压力设定值确定所述压缩式制冷系统在下一时刻的运行状态。
24、为了解决上述技术问题,本专利技术还提供了一种制冷系统的运行控制装置,包括:
25、系统初始化模块,用于利用设定参数对制冷系统进行初始化;
26、样本库更新模块,用于当所述制冷系统达到稳定运行状态时,利用所述制冷系统在当前状态下的目标参数对强化学习模型的初始样本库进行更新,得到目标样本库;
27、参数更新模块,用于根据所述强化学习模型确定所述制冷系统在下一时刻的运行状态,并利用所述制冷系统在下一时刻的运行状态对所述强化学习模型以及所述制冷系统的所述设定参数进行更新;
28、网络更新模块,用于利用所述目标样本库对所述强化学习模型中的行动网络和评估网络进行更新,并当所述制冷系统达到稳定运行状态时,再次执行所述利用所述制冷系统在当前状态下的目标参数对强化学习模型的初始样本库进行更新的步骤。
29、为了解决上述技术问题,本专利技术还提供了一种电子设备,包括:
30、存储器,用于存储计算机程序;
31、处理器,用于执行所述计算机程序时实现如前述所公开的一种制冷系统的运行控制方法的步骤。
32、为了解决上述技术问题,本专利技术还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如前述所公开的一种制冷系统的运行控制方法的步骤。
33、可见,在本专利技术中,首先是利用设定参数对制冷系统进行初始化,当制冷系统达到稳定运行状态时,利用制冷系统在当前状态下的目标参数对强化学习模型的初始样本库进行更新,得到目标样本库;之后,再根据强化学习模型确定制冷系统在下一时刻的运行状态,并利用制冷系统在下一时刻的运行状态对强化学习模型以及制冷系统的设定参数进行更新;最后,再利用目标样本库对强化学习模型中的行动网络和评估网络进行更新,并当制冷系统达到稳定运行状态时,再次执行利用制冷系统在当前状态下的目标参数对强化学习模型的初始样本库进行更新的步骤。显然,该方法在使用强化学习模型对制冷系统进行控制的过程中,因为可以根据制冷系统的实时运行参数来对强化学习模型进行优化,并且,还可以利用优化后的强化学习模型来对制冷系统的运行状态进行实时调整与控制,这样就可以避免现有技本文档来自技高网...
【技术保护点】
1.一种制冷系统的运行控制方法,其特征在于,包括:
2.根据权利要求1所述的一种制冷系统的运行控制方法,其特征在于,所述利用所述制冷系统在下一时刻的运行状态对所述强化学习模型以及所述制冷系统的所述设定参数进行更新的过程,包括:
3.根据权利要求1所述的一种制冷系统的运行控制方法,其特征在于,所述利用所述制冷系统在当前状态下的目标参数对强化学习模型的初始样本库进行更新,得到目标样本库的过程,包括:
4.根据权利要求1所述的一种制冷系统的运行控制方法,其特征在于,所述利用所述制冷系统在下一时刻的运行状态对所述强化学习模型以及所述制冷系统的所述设定参数进行更新的过程,包括:
5.根据权利要求1所述的一种制冷系统的运行控制方法,其特征在于,所述利用所述目标样本库对所述强化学习模型中的行动网络和评估网络进行更新的过程,包括:
6.根据权利要求1所述的一种制冷系统的运行控制方法,其特征在于,所述利用所述目标样本库对所述强化学习模型中的行动网络和评估网络进行更新的过程,包括:
7.根据权利要求1至6任一项所述的一种制冷系统
8.一种制冷系统的运行控制装置,其特征在于,包括:
9.一种电子设备,其特征在于,包括:
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的一种制冷系统的运行控制方法的步骤。
...【技术特征摘要】
1.一种制冷系统的运行控制方法,其特征在于,包括:
2.根据权利要求1所述的一种制冷系统的运行控制方法,其特征在于,所述利用所述制冷系统在下一时刻的运行状态对所述强化学习模型以及所述制冷系统的所述设定参数进行更新的过程,包括:
3.根据权利要求1所述的一种制冷系统的运行控制方法,其特征在于,所述利用所述制冷系统在当前状态下的目标参数对强化学习模型的初始样本库进行更新,得到目标样本库的过程,包括:
4.根据权利要求1所述的一种制冷系统的运行控制方法,其特征在于,所述利用所述制冷系统在下一时刻的运行状态对所述强化学习模型以及所述制冷系统的所述设定参数进行更新的过程,包括:
5.根据权利要求1所述的一种制冷系统的运行控制方法,其特征在于,所述利用所述目...
【专利技术属性】
技术研发人员:石健,杨龙玲,黎祖维,刘跨,
申请(专利权)人:深圳市英维克信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。