【技术实现步骤摘要】
一种基于信赖域贝叶斯的大规模网络信号控制优化方法
[0001]本专利技术属于智能交通信号控制的
,涉及信赖域贝叶斯优化算法领域以及区域交通网络信号优化方法,具体为一种基于信赖域贝叶斯的大规模网络信号控制优化方法。
技术介绍
[0002]大规模区域信号控制优化一直是交通信号控制领域的一大难题。现有解决大规模网络信号控制优化问题的方法主要有三种:基于动态规划的方法、基于多智能体强化学习方法和基于仿真优化方法。如Zhang and Su在《An optimization model and traffic light control scheme for heterogeneous traffic systems》中基于宏观模型和逻辑约束,将异构交通网络的信号优化问题设计成混合整数规划问题,并使用CPLEX或Gurobi进行求解;Chu等在《Multi
‑
agent deep reinforcement learning for large
‑
scale traffic signal control》中基于深度强化学习提出了一个用于解决自适应信号控制的多智能体强化学习算法,通过大量数据学习的策略来推断所有协调交叉口的最佳联合信号配时方案;Osorio and Bierlaire在《A simulation
‑
based optimization framework for urban transportation problems》中使用低阶多项式近似和排队网络分 ...
【技术保护点】
【技术特征摘要】
1.一种基于信赖域贝叶斯的大规模网络信号控制优化方法,其特征在于,具体步骤如下:步骤1.模型准备(1.1)构建大规模信号控制优化模型大规模网络信号控制优化模型用于获取信号配时方案,用如下公式表示:s.t.且e为整数
ꢀꢀꢀꢀ
(2)x∈[lw,up]
ꢀꢀꢀꢀꢀꢀ
(3)其中,x表示交叉口绿信比,m为网络中信号控制交叉口的数量,n=[n1,
…
,n
m
]表示所有信号控制交叉口的相位数;C为所有交叉口信号周期时间,C=[c1,
…
,c
m
];S表示相位结构及相位显示顺序,S=[s1,
…
,s
m
];lw和up分别表示所有绿信比的下界和上界;I表示为所有交叉口相位的绿灯间隔时间矩阵;公式(1)中F表示交通评价目标函数,包括延误、排队和平均出行时间;公式(2)和(3)限定了交叉口绿信比的解集空间;将模型决策变量x转换成信赖域贝叶斯的优化变量τ,即该优化变量的维度再通过公式(2)可得剩余相位的绿信比为(1.2)获取先验训练集和初始化信赖域通过拉丁超立方体取样方法基于步骤(1.1)的模型选取t0组信号配时方案,输入至微观交通仿真模型获得先验训练集其中τ表示信赖域贝叶斯的优化变量,f表示信赖域贝叶斯优化的目标函数,令f(τ)=F(x);同时,初始化迭代次数iter,成功计数器N
succ
,失败计数器N
fail
和信赖域基础边长L,令iter=0,N
succ
=0,N
fail
=0,L=L
init
;成功计数器表示某次迭代中能够找到更好的结果,失败计数器表示某次迭代中无法找到更好的结果;信赖域是以训练集最优信号配时方案τ
best
为中心,以L作为基础边长,以d为边长数的超立方体;信赖域是表示下一次迭代的搜索空间,其每个维度的实际边长L
i
是通过根据其在高斯过程模型中的长度超参数λ
i
重新缩放,同时保持总体积L
d
不变的条件下获得的,i∈[1,d]且i为整数,实际边长L
i
通过公式(4)计算得到:步骤2.信赖域贝叶斯优化(2.1)使用步骤(1.2)获得的先验训练集基于局部高斯过程回归模型拟合目标函数f与优化变量τ之间的关系,具体过程如下:将用于训练局部高斯过程回归模型的数据集记为D=D0,数据集大小为t=t0,则该过程
由公式(5)表示:f
1:t
~N(0,K)
ꢀꢀꢀ
(5)其中f
1:t
=(f(τ1)
…
f(τ
t
))
T
,K
ij
=k(τ
i
,τ
j
),k(τ
i
,τ
j
)为协方差核函数,协方差核函数选择Mat
é
rn 5/2核:其中λ表示长度超参数,λ=[λ1,
…
,λ
d
],决定高斯过程曲线的单调性和平滑性,且均为正整数;在训练高斯过程回归模型时,通过梯度法优化其边际似然函数的对数化形式,由此确定长度超参数λ的值,即:其中
‑
f
1:tT
K<...
【专利技术属性】
技术研发人员:钟绍鹏,龚云海,洪思雨,肖峰,王仲,
申请(专利权)人:大连理工大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。