System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于多智能体系统的通排风协同控制方法及装置制造方法及图纸_技高网

一种基于多智能体系统的通排风协同控制方法及装置制造方法及图纸

技术编号:41807824 阅读:10 留言:0更新日期:2024-06-24 20:27
本发明专利技术提供了一种基于多智能体系统的通排风协同控制方法及装置,环境智能体收集7种环境参数,包括温度、湿度、风速、CO<subgt;2</subgt;浓度、PM2.5、噪音、能耗;定义送风机智能体奖励函数R<subgt;s</subgt;,排风机智能体奖励函数R<subgt;p</subgt;;优化奖励函数R<subgt;s</subgt;、R<subgt;p</subgt;,找到最大化奖励函数R<subgt;s</subgt;和R<subgt;p</subgt;的行动;基于环境参数稳定性、能耗效率和响应时间,调整奖励函数R<subgt;s</subgt;、R<subgt;p</subgt;的权重;使用Pareto优化奖励函数,设定联合奖励函数R用于平衡送风机和排风机的目标。

【技术实现步骤摘要】

本专利技术涉及计算机,尤其涉及一种基于多智能体系统的通排风协同控制方法及装置


技术介绍

1、传统的控制方法如pid控制,无法有效应对复杂的环境变化;并且,单一的送风机或排风机无法同时满足多个环境参数的要求。现有技术缺乏对环境参数稳定性、能耗效率和响应时间的考虑。因此,本专利技术提供了一种基于多智能体系统的通排风协同控制方法及装置,旨在提高环境参数稳定性、能耗效率和响应时间。


技术实现思路

1、本专利技术的目的在于提供一种基于多智能体系统的通排风协同控制方法及装置,能够提高环境参数稳定性、能耗效率和响应时间,提供个性化的控制策略。

2、第一方面,本专利技术提供一种基于多智能体系统的通排风协同控制方法,包括:

3、s1、环境智能体收集7种环境参数,包括温度t、湿度rh、风速v、co2浓度c、pm2.5浓度p、送风机噪音ns和排风机噪音np、送风机能耗es和排风机能耗ep;

4、s2、定义送风机智能体奖励函数rs=(w11×t+w12×rh+w13×v+w14×c+w15×p-w16×ns-w17×es)+δws,δws表示送风机智能体权重系数调整的奖励δws,w11至w17是权重系数,用于平衡各个指标的权重;

5、s3、排风机智能体rp=(w21×c+w22×p-w23×ep-w24×np)+δwp,δwp表示排风机智能体权重系数调整的奖励,w21至w24是权重系数,用于平衡各个指标的权重;

6、s4、使用q-learning或deep q-networks优化奖励函数rs和rp,找到最大化奖励函数rs和rp的行动;实施ε-greedy策略,在每个决策时刻,以ε的概率随机选择一个动作,以1-ε的概率选择q表或神经网络中指示的最佳动作;设定学习率和折扣因子;

7、s5、基于环境参数稳定性、能耗效率和响应时间,调整奖励函数rs、rp的权重;

8、s6、使用pareto优化奖励函数,设定奖励函数r=rs+rp-λ×(||ss-sp||2)+δwc,δwc表示送风机和排风机协商过程中的权重系数调整奖励,λ是权重系数,用于平衡送风机和排风机的目标;||ss-sp||2是送风机和排风机策略之间的欧式距离的平方,兼顾送风机和排风机的目标。

9、本专利技术的方法有益效果为:

10、采用了基于环境参数稳定性、能耗效率和响应时间的奖励函数,引导送风机和排风机智能体做出有利于环境参数稳定、能耗效率高和响应时间短的决策。

11、采用了pareto优化联合奖励函数,在送风机和排风机智能体之间进行权衡,实现系统的整体最优。

12、采用了遗传算法或粒子群优化算法,有效地找到最大化联合奖励函数r的策略。

13、采用了纳什均衡策略,确保每个智能体在给定其他智能体策略的情况下,都选择了最优策略。

14、采用了kalman滤波估计环境参数和用户指令的噪声,提高系统的鲁棒性。

15、可选的,所述步骤s1包括:

16、s11、使用温湿度传感器、风速传感器、co2传感器、pm2.5传感器、噪音传感器、电表采集7种环境参数,获取实时数据,包括当前温度、当前湿度、当前风速、当前co2浓度、当前pm2.5浓度、当前噪音大小和当前能耗大小;

17、s12、数据采集频率根据环境变化速率和控制策略需求确定;每0.5-2秒采集一次温度、湿度数据;每2-10秒采集一次co2浓度数据;每30-90秒采集一次pm2.5数据;每30-90秒采集一次噪音数据;每0.5-15分钟采集一次能耗数据;

18、s13、数据对齐,对于高频率数据,直接使用原始数据;对于低频率数据,使用插补方法将其插补到高频率数据的时间点;将插补后的数据与高频率数据合并;并采用最大值-最小值缩放或标准差缩放进行数据对齐;

19、s14、将7种环境参数存储在关系数据库中;环境智能体持续感知环境参数,并更新关系数据库。

20、可选的,所述步骤s2包括:

21、δws=ks×(||wt-wt-1||2),ks是送风机智能体调整系数,用于控制其权重系数调整的幅度;||wt-wt-1||2是当前权重系数与上一时刻权重系数之间的距离的平方;通过调整权重系数,送风机智能体找到优化的策略;其中,t、rh、v、c、p是正向反馈,越高表明环境越需要净化,送风机需要更积极地工作;ns、es是负向反馈,越高表明送风机工作带来的负面影响越大,应该尽量降低。

22、可选的,所述步骤s3包括:

23、排风机智能体的奖励函数更专注于排除污染物和噪音控制,rp=(w21×c+w22×p-w23×ep-w24×np)+δwp,δwp表示排风机智能体权重系数调整的奖励:δwp=kp×(||wt-wt-1||2);kp是排风机智能体调整系数,用于控制其权重系数调整的幅度。其中,c、p是正向反馈,值越高表明环境越需要净化,排风机加强工作;ep、np是负向反馈,值越高,表明排风机工作效率越低,需要降低能耗和噪音。

24、可选的,所述步骤s4包括:

25、s41、优化奖励函数,使用q-learning或deep q-networks算法来优化奖励函数rs和rp;

26、q-learning算法:

27、初始化q表,用于存储在每个状态s下执行动作a的预期奖励;根据ε-greedy策略选择动作,观察结果并更新q表:

28、

29、α为学习率,γ为折扣因子;

30、deep q-networks算法:

31、使用深度神经网络来估计q函数,并通过经验回放池训练;训练目标是最小化预测q值与目标q值之间的差异:

32、

33、s42:实施ε-greedy策略

34、在每个决策时刻,以ε的概率随机选择一个动作,以1-ε的概率选择q表或神经网络中指示的最佳动作;随着时间推移,ε逐渐减少,趋向于选择最优动作。

35、s43:设定学习率和折扣因子,使用学习率控制q表或神经网络更新的速度,折扣因子控制未来奖励的当前价值。

36、可选的,所述步骤s5中括:

37、s51、环境参数稳定性,计算标准差σ,评估波动情况:

38、

39、xi是单个测量值,μ是平均值,n是测量次数,计算温度t和湿度rh的标准差σt和σh,设定温度波动范围为±1℃至±2℃与σt比较,设定湿度rh波动范围为±3%至±5%与σh比较;若σt和σh超过设定波动范围,增加与温度t和湿度rh相关的权重w11和w12,降低波动;

40、s52、能耗效率,使用奖励函数rs和rp来计算送风机和排风机的能耗的比例:能耗效率=(rs+rp)/(es+ep),es和ep是送风机和排风机的能耗,设定能耗效率的目标值大于0.7-0.9;若能耗效率不达标,增加与能耗es和ep相关的负向反馈权本文档来自技高网...

【技术保护点】

1.一种基于多智能体系统的通排风协同控制方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述步骤S1包括:

3.根据权利要求2所述的方法,其特征在于,所述步骤S2包括:

4.根据权利要求1所述的方法,其特征在于,所述步骤S3包括:

5.根据权利要求1所述的方法,其特征在于,所述步骤S5包括:

6.根据权利要求1所述的方法,其特征在于,所述步骤S6包括:

7.一种基于多智能体系统的通排风协同控制装置,其特征在于,包括:

【技术特征摘要】

1.一种基于多智能体系统的通排风协同控制方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述步骤s1包括:

3.根据权利要求2所述的方法,其特征在于,所述步骤s2包括:

4.根据权利要求1所述的方法,...

【专利技术属性】
技术研发人员:叶飞
申请(专利权)人:深圳市亚晔实业有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1