System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种智能网联环境下山地城市干线多车道汇入管控方法技术_技高网

一种智能网联环境下山地城市干线多车道汇入管控方法技术

技术编号:43030578 阅读:17 留言:0更新日期:2024-10-18 17:31
本发明专利技术公开了一种智能网联环境下山地城市干线多车道汇入管控方法,包括以下步骤:S1:建立智能网联环境下多车道汇入协同管控系统架构;S2:搭建智能网联环境下多车道汇入仿真路网;S3:构建工驾驶车辆及智能网联车辆模型;S4:设计智能体;分别包括信号控制智能体(Agent1)和可变限速控制智能体(Agent2);S5:构建步骤S3中的智能体神经网络;S6:经验池四元组数据存储;S7:进行MADDPG算法训练。本智能网联环境下山地城市干线多车道汇入管控方法具有能够具有能够在未来智能网联混合交通流环境下的多车道汇入区域实行精准控制,进而提升车辆通行效率及安全性的优点。

【技术实现步骤摘要】

本专利技术涉及智能交通管控,特别是涉及一种智能网联环境下山地城市干线多车道汇入管控方法


技术介绍

1、山地城市存在主干路网因多股车流汇集导致交通流量激增与车辆合流冲突的问题,由此引入了单向多车道匝道,形成多车道汇入区域。针对匝道合流控制问题,在人工驾驶环境下,根据研究场景的差异,传统解决方案主要采取单点匝道控制与多匝道协调控制的策略。针对新型的混合交通流合流控制问题,现有研究多对人工驾驶车辆建立一系列较强的假设,而忽略了驾驶人的不确定性极易对交通控制产生负面影响,所以智能网联混合交通流环境下的多车道汇入管控方法仍有待进一步研究。

2、目前智能网联环境下的合流控制主要包括反馈控制、启发式规则方法、最优控制方法、深度强化学习等,其中,反馈控制仅可以满足跟踪安全目标,对于非线性系统的性能表现不佳;启发式规则方法可以保障安全,但无法确保结果的最优性;最优控制方法虽具有高度的理论价值,但其计算复杂度高,求解效率低,且依赖于精确的系统模型;而深度强化学习通过神经网络学习状态到动作的映射,适合处理大规模状态空间和复杂、非线性系统,具有较强的泛化能力,且在智能网联混合交通流环境下,将深度强化学习与传统协同控制方法融合的研究较为少见。


技术实现思路

1、针对上述现有技术的不足,本专利申请所要解决的技术问题是如何提供一种能够精细化管控的智能网联环境下山地城市干线多车道汇入管控方法。

2、为了解决上述技术问题,本专利技术采用了如下的技术方案:

3、一种智能网联环境下山地城市干线多车道汇入管控方法,包括以下步骤:s1:搭建智能网联环境下多车道汇入仿真路网;s2:构建工驾驶车辆及智能网联车辆模型;s3:设计智能体;分别包括信号控制智能体(agent1)和可变限速控制智能体(agent2);s4:构建步骤s3中的智能体神经网络s5:经验池四元组数据存储;s6:进行maddpg算法训练。

4、作为优化,步骤s1中所述多车道汇入协同管控系统包括多车道汇入信号控制子系统和可变限速控制子系统;两者协同工作以优化城市干线的通行效率并减少车辆的总行程时间;所述系统中,智能联网车辆通过搭载先进的智能车载子系统,实现了车辆之间(v2v)以及车辆与路侧单元之间的高效通信;系统架构的核心由三个主要组成部分构成:车载信息获取模块、车载预警和控制模块以及车载通信模块。

5、作为优化,步骤s2中,搭建智能网联环境下多车道汇入仿真路网包括以下步骤a1:导入路网信息;a2:设置信号配时方案;a3:设置检测器。

6、作为优化,步骤s3构建工驾驶车辆及智能网联车辆模型中,人工驾驶车辆模型的构建采用sumo软件中默认的idm跟驰模型和lc2013换道模型来描述人工驾驶车辆的跟驰与换道行为;利用现场调查以及对山地城市干线多车道汇入交通流特性分析所得的数据作为输入进行仿真,实现对人工驾驶车辆表征模型的参数标定,通过不断优化模型参数,将仿真数据在可接受的误差范围内与实际观测数据相贴合;

7、构建智能网联车辆模型时,跟驰模型方面,采用sumo中的acc/cacc跟驰模型来刻画智能网联车辆的跟驰特性;换道模型方面,选用lc2013模型作为cav的换道模型,并结合cav的特性以及研究成果,对相应的参数进行调整,适应智能网联混合交通流环境。

8、作为优化,步骤s4中,分别设计了信号控制智能体(agent1)和可变限速控制智能体(agent2)智能体,其中,信号控制智能体(agent1)通过实时输出信号配时方案,实现对进入瓶颈区域车流的有序调节,可变限速控制智能体(agent2)通过输出分车道限速值,在主线上游受控区域实施可变限速来控制车流,从而缓解瓶颈区域通行能力下降所带来的交通压力。

9、作为优化,步骤s4中设计信号控制智能体(agent1)和可变限速控制智能体(agent2)智能体时,分别包括交通状态空间设计、动作空间设计和奖励机制设计;

10、信号控制智能体(agent1)的交通状态空间设计采用离散化交通状态编码技术(discrete traffic state encoding,dtse),通过将多车道汇入区域的进口道分割成不同的单元(cell),实现对进口道的网格化处理;可变限速控制智能体(agent2)的交通状态空间设计选取主线上游、主线瓶颈区、主线下游以及汇入匝道的实时占有率作为状态空间,全面而准确地刻画多车道汇入区域内混合交通流的运行情况;

11、信号控制智能体(agent1)的动作空间设计指信号灯相位相序方案和配时方案的变换,以确保交通流的安全与效率;可变限速控制智能体(agent2)的动作空间设计是动态调整主线上游车道的速度限制,以此来缓解车辆合流冲突,确保交通流的顺畅;

12、信号控制智能体(agent1)的奖励机制设计在于能够准确反映信号控制实施的实际效果或模拟结果;可变限速控制智能体(agent2)的奖励机制设计与信号控制智能体(agent1)协同工作,从而提高多车道汇入区域的通行效率并减轻交通拥堵,可变限速控制智能体(agent2)在从环境中收集奖励值时可能会遇到时间延迟的问题,对其控制效果可能产生不利影响。

13、作为优化,步骤s5中构建智能体神经网络时,通过pycharm平台,结合深度学习框架tensorflow实现maddpg算法;算法中的信号控制智能体(agent1)和可变限速控制智能体(agent2)各包含四个深度神经网络,分别为actor网络μ(oi;θi)、目标actor网络μ(oi;θi-)、critic网络q(s,a;wi)、目标critic网络q(s,a;wi-),每个神经网络又分为输入层、三个隐藏层、输出层,共有5层,层与层之间采用全连接;每个隐藏层均选用relu函数作为激活函数,包含64个神经元;actor网络的输出层采用sigmoid函数作为激活函数;而critic网络使用tensorflow中的concat函数将状态与动作拼接,relu函数的表达式如下:

14、r(x)=max(0,x)

15、sigmoid函数的表达式如下:

16、

17、作为优化,步骤s6中智能体与仿真环境交互过程中形成四元组,将每个仿真时刻的四元组存储起来形成经验池叫做经验回放;

18、在执行时,首先,通过代码完成初始化,包括:初始化sumo仿真环境,加载交通网络和交通流配置;初始化信号控制智能体(agent1)的actor网络μ(s1;θ1)和critic网络q(s,a;w1)、目标网络μ(s1;θ1-)、q(s,a;w1-);初始化可变限速控制智能体(agent2)的actor网络μ(s2;θ2)和critic网络q(s,a;w2)、目标网络μ(s2;θ2-)、q(s,a;w2-);初始化完成后启动仿真,开始进行经验收集,获取每个仿真回合的初始状态,在每个仿真时间步骤t时:信号控制智能体(agent1)会根据当前状态使用选择配时方案同时,可变限速控本文档来自技高网...

【技术保护点】

1.一种智能网联环境下山地城市干线多车道汇入管控方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种智能网联环境下山地城市干线多车道汇入管控方法,其特征在于,步骤S1中所述多车道汇入协同管控系统包括多车道汇入信号控制子系统和可变限速控制子系统;两者协同工作以优化城市干线的通行效率并减少车辆的总行程时间;所述系统中,智能联网车辆通过搭载先进的智能车载子系统,实现了车辆之间(V2V)以及车辆与路侧单元之间的高效通信;系统架构的核心由三个主要组成部分构成:车载信息获取模块、车载预警和控制模块以及车载通信模块。

3.根据权利要求2所述的一种智能网联环境下山地城市干线多车道汇入管控方法,其特征在于,步骤S2中,搭建智能网联环境下多车道汇入仿真路网包括以下步骤

4.根据权利要求3所述的一种智能网联环境下山地城市干线多车道汇入管控方法,其特征在于,步骤S4中步骤S3构建工驾驶车辆及智能网联车辆模型中,人工驾驶车辆模型的构建采用SUMO软件中默认的IDM跟驰模型和LC2013换道模型来描述人工驾驶车辆的跟驰与换道行为;利用现场调查以及对山地城市干线多车道汇入交通流特性分析所得的数据作为输入进行仿真,实现对人工驾驶车辆表征模型的参数标定,通过不断优化模型参数,将仿真数据在可接受的误差范围内与实际观测数据相贴合;

5.根据权利要求4所述的一种智能网联环境下山地城市干线多车道汇入管控方法,其特征在于,步骤S4中,分别设计了信号控制智能体(Agent1)和可变限速控制智能体(Agent2)智能体,其中,信号控制智能体(Agent1)通过实时输出信号配时方案,实现对进入瓶颈区域车流的有序调节,可变限速控制智能体(Agent2)通过输出分车道限速值,在主线上游受控区域实施可变限速来控制车流,从而缓解瓶颈区域通行能力下降所带来的交通压力。

6.根据权利要求5所述的一种智能网联环境下山地城市干线多车道汇入管控方法,其特征在于,步骤S4中设计信号控制智能体(Agent1)和可变限速控制智能体(Agent2)智能体时,分别包括交通状态空间设计、动作空间设计和奖励机制设计;

7.根据权利要求6所述的一种智能网联环境下山地城市干线多车道汇入管控方法,其特征在于,步骤S5中构建智能体神经网络时,通过PyCharm平台,结合深度学习框架Tensorflow实现MADDPG算法;算法中的信号控制智能体(Agent1)和可变限速控制智能体(Agent2)各包含四个深度神经网络,分别为Actor网络μ(oi;θi)、目标Actor网络μ(oi;θi-)、Critic网络q(s,a;wi)、目标Critic网络q(s,a;wi-),每个神经网络又分为输入层、三个隐藏层、输出层,共有5层,层与层之间采用全连接;每个隐藏层均选用ReLu函数作为激活函数,包含64个神经元;Actor网络的输出层采用Sigmoid函数作为激活函数;而Critic网络使用Tensorflow中的Concat函数将状态与动作拼接,ReLu函数的表达式如下:

8.根据权利要求7所述的一种智能网联环境下山地城市干线多车道汇入管控方法,其特征在于,步骤S7中,步骤S6中智能体与仿真环境交互过程中形成四元组,将每个仿真时刻的四元组存储起来形成经验池叫做经验回放;

9.根据权利要求8所述的一种智能网联环境下山地城市干线多车道汇入管控方法,其特征在于,步骤S7中,进行MADDPG算法训练时,控制智能体(Agent1)和(Agent2)从经验回放池中随机采样一批经验,首先使用时间差分法(Temporal Difference,TD)计算TD目标,公式如下:

...

【技术特征摘要】

1.一种智能网联环境下山地城市干线多车道汇入管控方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种智能网联环境下山地城市干线多车道汇入管控方法,其特征在于,步骤s1中所述多车道汇入协同管控系统包括多车道汇入信号控制子系统和可变限速控制子系统;两者协同工作以优化城市干线的通行效率并减少车辆的总行程时间;所述系统中,智能联网车辆通过搭载先进的智能车载子系统,实现了车辆之间(v2v)以及车辆与路侧单元之间的高效通信;系统架构的核心由三个主要组成部分构成:车载信息获取模块、车载预警和控制模块以及车载通信模块。

3.根据权利要求2所述的一种智能网联环境下山地城市干线多车道汇入管控方法,其特征在于,步骤s2中,搭建智能网联环境下多车道汇入仿真路网包括以下步骤

4.根据权利要求3所述的一种智能网联环境下山地城市干线多车道汇入管控方法,其特征在于,步骤s4中步骤s3构建工驾驶车辆及智能网联车辆模型中,人工驾驶车辆模型的构建采用sumo软件中默认的idm跟驰模型和lc2013换道模型来描述人工驾驶车辆的跟驰与换道行为;利用现场调查以及对山地城市干线多车道汇入交通流特性分析所得的数据作为输入进行仿真,实现对人工驾驶车辆表征模型的参数标定,通过不断优化模型参数,将仿真数据在可接受的误差范围内与实际观测数据相贴合;

5.根据权利要求4所述的一种智能网联环境下山地城市干线多车道汇入管控方法,其特征在于,步骤s4中,分别设计了信号控制智能体(agent1)和可变限速控制智能体(agent2)智能体,其中,信号控制智能体(agent1)通过实时输出信号配时方案,实现对进入瓶颈区域车流的有序调节,可变限速控制智能体(agent2)通过输出分车道限速值,在主线上游受控区域实施可变限速来控制车流,从而缓解瓶颈区域...

【专利技术属性】
技术研发人员:彭博蔡晓禹王少飞暨育雄叶青邢茹茹
申请(专利权)人:重庆交通大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1