一种基于合作式多智能体强化学习的交通信号灯控制方法技术

技术编号：35003895 阅读：31 留言：0更新日期：2022-09-21 14:54

本发明专利技术公开了一种基于合作式多智能体强化学习的交通信号灯控制方法。该方法克服了传统强化学习单独控制各个路口的信号灯，没有考虑它们之间的相关性的缺点，提出了一种双层协调控制策略，通过局部合作机制和全局合作机制对路网中的交通信号灯进行协调控制。同时，该方法将车辆排放因素考虑在内，可以在改善路网交通状态的同时尽可能的减少车辆排放。交通状态的同时尽可能的减少车辆排放。交通状态的同时尽可能的减少车辆排放。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于合作式多智能体强化学习的交通信号灯控制方法

[0001]本专利技术涉及智能交通信号控制
，尤其涉及一种基于合作式多智能体强化学习的交通信号灯控制方法。

技术介绍

[0002]我国机动车移动污染源保有量大、增速快，极易造成交通拥堵，并引发严重的空气污染、噪声污染等环境问题。相比于新建、扩建道路等改善交通状况的方法，利用路口交通信号灯对路网交通状况进行调度优化具有更强的经济性、实用性，这也符合我国提出的数字城市和智慧城市的发展理念，强化学习是解决交通信号灯控制问题的代表性方法。
[0003]传统交通信号灯，无论交叉路口各个方向车辆数目如何变化，信号时间间隔都是不变的，这就很容易导致交通堵塞，增加车辆排放。为了改善路口的交通状况，人们将强化学习应用到交通信号灯控制任务中，与传统交通信号灯控制方法相比取得了更好的控制效果。然而很多基于强化学习的控制算法都单独的控制各个路口的交通信号灯，没有明确的考虑相邻路口之间的相互作用，即一个路口信号灯变化如何影响附近路口的交通状况。
[0004]随着经济的发展和社会的进步，道路运输对环境造成了严重的影响，引起了人们的广泛关注。交通规划师和交通工程师在解决交通问题或优化交通系统时，不再只关注拥堵，如何减少车辆排放问题也得到重视。车辆的运行模式与车辆排放密切相关，如车辆加速、减速、怠速和走走停停等情况都会增加车辆排放。而在交通网络中，路口的交通情况最为复杂，车辆在路口反复分流、合并、交叉。交通情况复杂，使得路口成为制约城市道路交通功能的瓶颈，该区域车辆排放明显高...

【技术保护点】

【技术特征摘要】
1.一种基于合作式多智能体强化学习的交通信号灯控制方法，其特征在于该方法包括以下步骤：步骤一：构建道路交叉口和交通信号灯的路网模型；步骤二：基于强化学习的交通信号灯控制模型构建；(a)状态空间State设计对于单个交叉口，使用当前信号灯的相位、每个车道车辆等待队列的长度、每个车道的车辆密度以及每个车道的车辆排放浓度来表示状态；(b)动作空间Action设计设计四种动作分别为：南北方向直行、南北方向左转、东西方向直行、东西方向左转；(c)奖励函数Reward设计时间步t时刻的奖励函数：R＝kR
E
+(1
‑
k)R
W
其中，k为权重系数，R
E
表示车辆排放部分奖励函数，R
W
表示车辆等待时间部分奖励函数；步骤三：构建合作式多智能体强化学习模型；所述合作式多智能体强化学习模型包括个体价值网络，邻近价值网络，全局价值网络和策略网络；该模型的输入为路网中各个路口的交通状态，输出信息为四种动作的概率值，并根据动作概率值进行随机抽样选择动作；所述合作式多智能体强化学习模型采用了局部合作机制和全局合作机制，其中局部合作机制利用局部合作因子来权衡个体奖励和邻近奖励，全局合作机制通过梯度更新协调因子来最大化全局目标；步骤四：信号灯控制Agent学习信号灯控制策略；将单个信号灯控制Agent的局部观测信息输入个体价值网络，所述信号灯控制Agent在环境中获取奖励和下一时刻的观测信息，更新所述Agent的个体价值网络参数；将所述信号控制Agent的个体奖励信息和...

【专利技术属性】
技术研发人员：任付越，赵晓东，张帆，董伟，赵晓丹，孔亚广，邹洪波，
申请(专利权)人：杭州电子科技大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人