【技术实现步骤摘要】
本专利技术涉及建筑能源管理领域,尤其涉及基于td3强化学习优化的集成式建筑能耗预测方法及系统。
技术介绍
1、建筑行业是能源消耗的重要领域之一,其能耗对环境和经济均有显著影响。全球范围内,建筑物占总能源消耗的相当大比例,其中包括住宅、商业和工业建筑。这意味着有效管理和优化建筑能耗是减少温室气体排放和节省能源成本的关键因素。因此,建筑能耗预测变得至关重要,以帮助建筑业主、运营商和政府机构制定可持续的能源管理策略。能耗预测能够提前了解未来能耗趋势,有助于采取相应的节能措施,提高建筑能效,降低能源浪费,减少环境影响,并降低运营成本。
2、为了应对建筑能耗预测的挑战,研究人员和工程师们已经探索了各种预测方法。在过去的几年中,深度学习算法已经成为能耗预测领域的主流方法之一。深度学习模型,如长短时记忆网络(lstm)和卷积神经网络(cnn),可以处理时间序列数据,从而使它们成为用于建筑能耗预测的有力工具。此外,强化学习在时序预测领域具有多方面的用途,其中包括特征选择、集成模型权重分配以及直接用于预测等方面的应用。其中,深度确定性策略梯度(ddpg)是一种常用的强化学习算法,它结合了深度学习和强化学习,能够有效地学习动态环境中的最佳策略。在集成模型权重分配方面,ddpg算法使用历史数据作为状态,将建筑模型的性能指标,如损失值,作为奖励信号,以调整深度学习模型的权重(即动作),从而用于建筑能耗的预测。
3、目前,基于强化学习的集成预测模型虽被证实可以提高预测精度与泛化能力,但仍然具有改进的空间。比如,当ddpg算法被用来
技术实现思路
1、针对上述现有技术在建筑能耗预测方面依旧存在稳定性和准确度不佳的问题,本专利技术提供基于td3强化学习优化的集成式建筑能耗预测方法及系统,本专利技术在现有建筑能源管理方法无法充分应对复杂的能源消耗模式和建筑动态环境的情况下,依靠td3强化学习算法,有效解决了传统ddpg算法存在的价值高估和训练不稳定性问题;通过采用双critic网络、目标平滑化和策略噪声等关键技巧,使td3强化学习算法提高在能耗预测方面以强化学习为主的集成模型在进行权重分配时的稳定性和准确性。
2、基于td3强化学习优化的集成式建筑能耗预测方法,包括以下步骤:
3、收集建筑的能耗数据及周边气象数据,获得多特征数据集并进行预处理,选择多特征数据集中与能耗预测相关的特征作为样本训练集,所述样本训练集包括训练集、验证集及测试集;
4、将所述训练集输入至少两种深度训练模型进行训练,完成对应种类能耗预测模型的构建;
5、基于至少两种所述能耗预测模型的训练结果构建td3强化学习模型,在训练过程中,td3强化学习模型通过所述验证集进行迭代学习,确定最佳的权重分配策略,所述权重分配策略用于对所有能耗预测模型的预测结果进行权重分配;
6、将td3强化学习模型用于所述测试集,对其输出进行评估,基于评估结果对td3强化学习模型进行持续优化,达到预设要求后将td3强化学习模型用于建筑的能耗预测。
7、优选的,所述预处理包括:
8、数据清洗,识别和剔除数据中的异常值;
9、标准化,将所有特征的值缩放到相似的尺度范围内。
10、优选的,所述选择多特征数据集中与能耗预测相关的特征包括:
11、通过计算每个特征与建筑能耗之间的皮尔逊相关系数,确定与建筑能耗之间存在相关性的特征,其中,所述皮尔逊相关系数的取值范围为-1至1,负值表示负相关,正值表示正相关,接近0表示无相关性。
12、优选的,所述至少两种深度训练模型包括但不限于:
13、bi-lstm,用于双向递归的学习时间序列中的依赖关系;
14、tcn,用于利用卷积操作捕捉时间序列的局部模式;
15、gru,用于通过门控机制管理信息的传递。
16、优选的,构建所述td3强化学习模型包括:定义状态空间及动作空间,其中,
17、所述状态空间包括:历史时间步的观测数据及至少两种能耗预测模型在验证集上的性能指标,所述性能指标用于反映所有能耗预测模型的预测能力和准确度;
18、动作空间定义权重分配策略,所述权重分配策略用于针对所有能耗预测模型的性能指标进行动态调整,以确定在td3强化学习模型输出的最终预测结果中对应的贡献比例,所述动作空间中的所有能耗预测模型权重之和等于1。
19、优选的,所述td3强化学习模型的训练包括:
20、通过两套critic网络以减少网络过估计问题,并选择较小的值作为目标值;
21、通过引入扰动提高价值评估准确性;
22、通过至少两次critic网络的更新后再进行actor网络的更新。
23、优选的,所述td3强化学习模型通过所述验证集进行迭代学习,确定最佳的权重分配策略,所述权重分配策略用于对所有能耗预测模型的预测结果进行权重分配包括:
24、使用验证集上的性能数据作为反馈,评估所有能耗预测模型的效果;
25、设定td3强化学习模型的目标是最大化整体预测性能;
26、基于所有能耗预测模型在验证集上的性能反馈,td3强化学习模型动态调整所有能耗预测模型预测结果的权重分配;
27、通过反复迭代,确定最佳的权重分配策略。
28、优选的,所述评估的指标包括:平均绝对值误差、平均平方根误差、平均百分比误差及决定系数。
29、优选的,所述预设要求包括:
30、达到预设的优化次数,选择最佳参数设置;或
31、所述评估的指标达到预设阈值,选择对应参数设置。
32、基于td3强化学习优化的集成式建筑能耗预测系统,包括:
33、样本采集模块,所述样本采集模块用于收集建筑的能耗数据及周边气象数据,获得多特征数据集并进行预处理,选择多特征数据集中与能耗预测相关的特征作为样本训练集,所述样本训练集包括训练集、验证集及测试集;
34、能耗预测模型构建模块,所述能耗预测模型构建模块用于将所述训练集输入至少两种深度训练模型进行训练,完成对应种类能耗预测模型的构建;
35、td3模型构建训练模块,所述td3模型构建训练模块基于至少两种所述能耗预测模型的训练结果构建td3强化学习模型,在训练过程中,td3强化学习模型通过所述验证集进行迭代学习,确定最佳的权重分配策略,所述权重分配策略用于对所有能耗预测模型的预测结果进行权重分配;...
【技术保护点】
1.基于TD3强化学习优化的集成式建筑能耗预测方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于TD3强化学习优化的集成式建筑能耗预测方法,其特征在于,所述预处理包括:
3.根据权利要求1所述的基于TD3强化学习优化的集成式建筑能耗预测方法,其特征在于,所述选择多特征数据集中与能耗预测相关的特征包括:
4.根据权利要求1所述的基于TD3强化学习优化的集成式建筑能耗预测方法,其特征在于,所述至少两种深度训练模型包括但不限于:
5.根据权利要求1所述的基于TD3强化学习优化的集成式建筑能耗预测方法,其特征在于,构建所述TD3强化学习模型包括:定义状态空间及动作空间,其中,
6.根据权利要求1所述的基于TD3强化学习优化的集成式建筑能耗预测方法,其特征在于,所述TD3强化学习模型的训练包括:
7.根据权利要求1所述的基于TD3强化学习优化的集成式建筑能耗预测方法,其特征在于,所述TD3强化学习模型通过所述验证集进行迭代学习,确定最佳的权重分配策略,所述权重分配策略用于对所有能耗预测模型的预测结果进行权重
8.根据权利要求1所述的基于TD3强化学习优化的集成式建筑能耗预测方法,其特征在于,所述评估的指标包括:平均绝对值误差、平均平方根误差、平均百分比误差及决定系数。
9.根据权利要求8所述的基于TD3强化学习优化的集成式建筑能耗预测方法,其特征在于,所述预设要求包括:
10.基于TD3强化学习优化的集成式建筑能耗预测系统,其特征在于,包括:
...【技术特征摘要】
1.基于td3强化学习优化的集成式建筑能耗预测方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于td3强化学习优化的集成式建筑能耗预测方法,其特征在于,所述预处理包括:
3.根据权利要求1所述的基于td3强化学习优化的集成式建筑能耗预测方法,其特征在于,所述选择多特征数据集中与能耗预测相关的特征包括:
4.根据权利要求1所述的基于td3强化学习优化的集成式建筑能耗预测方法,其特征在于,所述至少两种深度训练模型包括但不限于:
5.根据权利要求1所述的基于td3强化学习优化的集成式建筑能耗预测方法,其特征在于,构建所述td3强化学习模型包括:定义状态空间及动作空间,其中,
6.根据权利要求1所述的基于td3强化学习优...
【专利技术属性】
技术研发人员:黄晶,吴风景,舒婷婷,钟宜国,叶肖华,严珂,
申请(专利权)人:杭州经纬信息技术股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。