一种基于信赖域贝叶斯的大规模网络信号控制优化方法技术

技术编号:34772333 阅读:13 留言:0更新日期:2022-08-31 19:36
本发明专利技术属于智能交通信号控制的技术领域,具体为一种基于信赖域贝叶斯的大规模网络信号控制优化方法。该方法主要包含模型准备,信赖域贝叶斯优化和终止迭代三部分内容。其中,模型准备部分主要是构建大规模信号控制优化模型,获取先验训练集以及初始化信赖域;信赖域贝叶斯优化部分是基于模型准备部分得到先验数据集优化得到下一批采样点(多组信号配时方案),并将结果输入至微观交通仿真模型中运行得到多组交通评价目标函数值,之后通过终止迭代部分判断迭代是否终止优化。迭代部分判断迭代是否终止优化。迭代部分判断迭代是否终止优化。

【技术实现步骤摘要】
一种基于信赖域贝叶斯的大规模网络信号控制优化方法


[0001]本专利技术属于智能交通信号控制的
,涉及信赖域贝叶斯优化算法领域以及区域交通网络信号优化方法,具体为一种基于信赖域贝叶斯的大规模网络信号控制优化方法。

技术介绍

[0002]大规模区域信号控制优化一直是交通信号控制领域的一大难题。现有解决大规模网络信号控制优化问题的方法主要有三种:基于动态规划的方法、基于多智能体强化学习方法和基于仿真优化方法。如Zhang and Su在《An optimization model and traffic light control scheme for heterogeneous traffic systems》中基于宏观模型和逻辑约束,将异构交通网络的信号优化问题设计成混合整数规划问题,并使用CPLEX或Gurobi进行求解;Chu等在《Multi

agent deep reinforcement learning for large

scale traffic signal control》中基于深度强化学习提出了一个用于解决自适应信号控制的多智能体强化学习算法,通过大量数据学习的策略来推断所有协调交叉口的最佳联合信号配时方案;Osorio and Bierlaire在《A simulation

based optimization framework for urban transportation problems》中使用低阶多项式近似和排队网络分析模型相结合的方法来表示绿信比与期望的出行时间之间的关系,最后采用基于元模型的信赖域优化算法获得最优解。
[0003]但是现有大规模网络信号控制优化方法存在以下问题:首先,基于分解的策略会导致搜索空间的局部化,无法获得全局空间的最优解。其次,现有的解析法无法很好地近似描述大规模信号控制问题的决策空间与环境系统状态之间的真实关系。最后,现有的基于学习的算法和优化算法需要大量的反馈数据或者几百上千次迭代才能获得满意的信号配时方案,往往会有很高的计算成本。

技术实现思路

[0004]针对现有方法存在的问题,本专利技术提出一种基于信赖域贝叶斯的大规模网络信号控制优化方法。基于现有的实际调查获得路网流量数据、原始信号配时方案和路网基础数据,使用微观交通仿真平台构建微观交通仿真模型;搭建大规模网络信号优化模型;设计基于微观交通仿真模型和信赖域贝叶斯优化算法的优化器,使用该优化器求解上述的大规模网络信号优化模型,直至获得大规模网络最优的信号配时方案。
[0005]本专利技术的技术方案:
[0006]一种基于信赖域贝叶斯的大规模网络信号控制优化方法,主要包含3个部分,分别为模型准备,信赖域贝叶斯优化和终止迭代。其中,模型准备部分主要是构建大规模信号控制优化模型,获取先验训练集以及初始化信赖域;信赖域贝叶斯优化部分是基于模型准备部分得到先验训练集优化得到下一批采样点(多组信号配时方案),并将结果输入至微观交通仿真模型中运行得到多组交通评价目标函数值,之后通过终止迭代部分判断迭代优化是
否终止。微观交通仿真模型是基于可靠的道路网络基础数据、网络中车辆属性及车辆比例数据、信号配时方案数据和网络各路段分流向的流量数据输入至微观交通仿真平台(如VISSIM,SUMO)中构建得到的。
[0007]具体步骤如下:
[0008]步骤1.模型准备
[0009]模型准备主要包含2部分。一是大规模信号控制优化模型的构建;二是获取信赖域贝叶斯优化所需要的先验训练集,并初始化信赖域。
[0010](1.1)构建大规模信号控制优化模型
[0011]大规模信号控制优化问题可以用一个普适性的大规模信号控制优化模型来表示。大规模信号控制优化模型使用交叉口各个相位的绿信比作为决策变量,变量限制条件参考信号控制通用标准,而各交叉口信号周期时间和相位结构及相位显示顺序预先设定,以及同一交叉口的所有相位的黄灯时间相同。该大规模网络信号控制优化模型用于获取信号配时方案,可用如下公式表示:
[0012][0013]s.t.
[0014][0015]x∈[lw,up]ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(3)其中,x表示交叉口绿信比,m为网络中信号控制交叉口的数量,n=[n1,

,n
m
]表示所有信号控制交叉口的相位数;C为所有交叉口信号周期时间,C=[c1,

,c
m
];S表示相位结构及相位显示顺序,S=[s1,

,s
m
];lw和up分别表示所有绿信比的下界和上界;I表示为所有交叉口相位的绿灯间隔时间矩阵。公式(1)中F表示交通评价目标函数,可以为延误、排队或平均出行时间等。公式(2)和(3)限定了交叉口绿信比的解集空间。上述模型可以有多种拓展形式,具体问题所对应的模型由使用者自行决定,只要是符合上述大规模信号控制优化模型基本框架的问题均可用本专利技术来解决。
[0016]为了衔接步骤(1.1)和步骤(1.2)以及后续的步骤2,需要将上述模型决策变量x转换成步骤(1.2)和后续步骤2中的信赖域贝叶斯的优化变量τ,即该优化变量的维度再通过公式(2)可得剩余相位的绿信比为
[0017](1.2)获取先验训练集和初始化信赖域
[0018]通过拉丁超立方体取样方法基于步骤(1.1)的模型选取t0组信号配时方案,输入至微观交通仿真模型获得先验训练集其中τ表示信赖域贝叶斯的优化变量(也就是步骤2中的优化变量),f表示信赖域贝叶斯优化的目标函数(也就是步骤2中的目标函数),令f(τ)=F(x)。同时,初始化迭代次数iter,成功计数器N
succ
,失败计数器N
fail
和信赖域基础边长L;令iter=0,N
succ
=0,N
fail
=0,L=L
init
。成功计数器表示某次迭代
中能够找到更好的结果,失败计数器表示某次迭代中无法找到更好的结果。信赖域是以训练集最优信号配时方案τ
best
为中心,以L作为基础边长,以d为边长数的超立方体。信赖域是表示下一次迭代的搜索空间,其每个维度的实际边长L
i
是通过根据其在高斯过程模型中的长度超参数λ
i
重新缩放,同时保持总体积L
d
不变的条件下获得的,i∈[1,d]且i为整数。实际边长L
i
可以通过公式(4)计算得到:
[0019][0020]步骤2.信赖域贝叶斯优化
[0021](2.1)使用步骤(1.2)获得的先验训练集基于局部高斯过程回归模型拟合目标函数f与优化变量τ之间的关系。需要说明的是,局部高斯过程回归相较全局高斯过程回归不同的是,前者使用的数据集是基于信赖域局部空间取样获得的,后者是全局空间取样获得的。如此本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于信赖域贝叶斯的大规模网络信号控制优化方法,其特征在于,具体步骤如下:步骤1.模型准备(1.1)构建大规模信号控制优化模型大规模网络信号控制优化模型用于获取信号配时方案,用如下公式表示:s.t.且e为整数
ꢀꢀꢀꢀ
(2)x∈[lw,up]
ꢀꢀꢀꢀꢀꢀ
(3)其中,x表示交叉口绿信比,m为网络中信号控制交叉口的数量,n=[n1,

,n
m
]表示所有信号控制交叉口的相位数;C为所有交叉口信号周期时间,C=[c1,

,c
m
];S表示相位结构及相位显示顺序,S=[s1,

,s
m
];lw和up分别表示所有绿信比的下界和上界;I表示为所有交叉口相位的绿灯间隔时间矩阵;公式(1)中F表示交通评价目标函数,包括延误、排队和平均出行时间;公式(2)和(3)限定了交叉口绿信比的解集空间;将模型决策变量x转换成信赖域贝叶斯的优化变量τ,即该优化变量的维度再通过公式(2)可得剩余相位的绿信比为(1.2)获取先验训练集和初始化信赖域通过拉丁超立方体取样方法基于步骤(1.1)的模型选取t0组信号配时方案,输入至微观交通仿真模型获得先验训练集其中τ表示信赖域贝叶斯的优化变量,f表示信赖域贝叶斯优化的目标函数,令f(τ)=F(x);同时,初始化迭代次数iter,成功计数器N
succ
,失败计数器N
fail
和信赖域基础边长L,令iter=0,N
succ
=0,N
fail
=0,L=L
init
;成功计数器表示某次迭代中能够找到更好的结果,失败计数器表示某次迭代中无法找到更好的结果;信赖域是以训练集最优信号配时方案τ
best
为中心,以L作为基础边长,以d为边长数的超立方体;信赖域是表示下一次迭代的搜索空间,其每个维度的实际边长L
i
是通过根据其在高斯过程模型中的长度超参数λ
i
重新缩放,同时保持总体积L
d
不变的条件下获得的,i∈[1,d]且i为整数,实际边长L
i
通过公式(4)计算得到:步骤2.信赖域贝叶斯优化(2.1)使用步骤(1.2)获得的先验训练集基于局部高斯过程回归模型拟合目标函数f与优化变量τ之间的关系,具体过程如下:将用于训练局部高斯过程回归模型的数据集记为D=D0,数据集大小为t=t0,则该过程
由公式(5)表示:f
1:t
~N(0,K)
ꢀꢀꢀ
(5)其中f
1:t
=(f(τ1)

f(τ
t
))
T
,K
ij
=k(τ
i

j
),k(τ
i

j
)为协方差核函数,协方差核函数选择Mat
é
rn 5/2核:其中λ表示长度超参数,λ=[λ1,


d
],决定高斯过程曲线的单调性和平滑性,且均为正整数;在训练高斯过程回归模型时,通过梯度法优化其边际似然函数的对数化形式,由此确定长度超参数λ的值,即:其中

f
1:tT
K<...

【专利技术属性】
技术研发人员:钟绍鹏龚云海洪思雨肖峰王仲
申请(专利权)人:大连理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1