当前位置: 首页 > 专利查询>吉林大学专利>正文

一种基于不完全信息博弈的智能车换道决策方法技术

技术编号:28747444 阅读:37 留言:0更新日期:2021-06-06 19:06
本发明专利技术公开了一种基于不完全信息博弈的智能车换道决策方法,首先在时间和空间上,对智能车换道意图和换道可行性进行建模;然后根据换道车辆及其周车的状态信息来建立收益矩阵;收益矩阵的求解采用博弈论中的帕累托最优和纳什均衡进行求解;为了解决不完全信息非合作动态博弈的行为信息未知问题,换道车辆对具有博弈冲突的车辆进行速度及加速度的纵向行为预测,所采用的方法是NARX神经网络模型;换道车辆的周车通过连续隐马尔科夫模型预测换道车辆的横向运动。博弈参与者通过预测他车未来的行为趋势来对收益矩阵的决策进行修正,在决策达到执行的阈值时执行。决策达到执行的阈值时执行。决策达到执行的阈值时执行。

【技术实现步骤摘要】
一种基于不完全信息博弈的智能车换道决策方法


[0001]本专利技术涉及智能驾驶领域,具体涉及一种基于不完全信息博弈的智能车换道决策方法。

技术介绍

[0002]为了把人们从大量的驾驶时间以及复杂的交通中解放出来,提高车辆的通行率,减少事故的发生,智能车的研究逐渐深入。旨在设计智能控制驾驶系统,代替人类驾驶汽车在交通环境中行驶,解决复杂的车辆行驶决策、规划和控制问题。智能车通常包含主控模块、决策与规划模块、环境感知模块和车辆控制模块,其中决策与规划模块作为智能车的核心模块尤为重要。
[0003]换道决策作为车辆核心行为决策之一,对驾驶的安全及通行的效率起着重要的作用。数据统计,由于车道变换所引起的交通事故占汽车总事故的4%~10%,并且导致了10%的道路堵塞问题。而在所有换道事故中,大约有75%的交通事故是由于驾驶员对于换道决策的判断失误而发生的,因此有必要提高车辆换道决策的安全性和高效性。
[0004]车道变换行为是驾驶员根据周围路况及周围车辆信息,以追求某种利益动机为目标,来调整车辆在交通中的位置,所采取的综合决策行为之一。根据换道意图的不同,车道变换通常可以分为强制性换道和任意性换道。一般有以下几种换道决策模型:基于规则的模型,以一系列固定规则确定是否采取换道行为,例如基于Gipps模型;基于离散选择的模型,依赖于逻辑或者概率模型来分析描述换道行为,换道行为的执行以概率来表示;基于人工智能模型,利用一系列人工智能算法来对换道行为进行建构分析,例如基于模糊的模型和人工神经网络模型;基于激励的模型,通常选择最大的收益来决定是否采取换道行为。
[0005]上述方法通常只关注于换道车辆,而没有充分考虑对周围车辆的影响,忽视了换道过程中的交互行为。在实际换道中,换道车辆与周围车辆的决策会相互影响,仅仅站在换道车辆的立场来考虑换道过程是不够的。基于博弈论的换道决策能考虑到与周车的交互,但是决策往往都是以V2X实现信息交互为前提,在信息不通信的情况下难以实现交互性的决策。同时,换道决策过程的时长会影响换道的安全性:换道越犹豫,初始决策的可行性变化就会越大;换道决策过程越短,换道考虑的环境动态变化信息就越少,容易错失最佳换道时机或者误判换道时机。

技术实现思路

[0006]为了解决上述现有技术存在的问题,本专利技术提出了一种基于不完全信息博弈的智能车换道决策方法,旨在引入不完全信息非合作动态博弈来制定换道决策,为了保证在信息不可通信情况下的交互性以及提高换道的可靠性和高效性,对不同车辆分别采用横向、纵向预测来弥补信息不可通信的问题,利用预测结果对决策进行修正,提高决策的可靠,减短决策过程,从而既保证了信息在不可通信情况下的交互性,又利用预测提高了决策的可靠性。
[0007]为实现上述目的,本专利技术采用的技术方案如下:
[0008]一种基于不完全信息博弈的智能车换道决策方法,其特征在于,包括以下步骤:
[0009]步骤一、产生换道意图:采集换道车辆及其周围车辆和环境信息,引入期望车速与期望间距的量化指标,当期望车速或期望间距超出阈值时,则换道车辆产生换道意图;
[0010]步骤二、判断换道的可行性:在车辆产生换道意图之后,判断换道车辆与目标车道前后车是否满足换道安全距离,进而判断换道的可行性;
[0011]步骤三、建立博弈收益矩阵:建立换道车辆CV与目标车道后车RV的非合作博弈的收益矩阵,该收益矩阵由速度收益、相对时距收益、期望跟车距离收益进行加权组合建立;
[0012]步骤四、求解收益矩阵:收益矩阵的全局帕累托最优解为换道策略最优解;以纳什均衡解作为换道策略次优解;若上述解都没有,则继续保持原策略解;
[0013]步骤五、对车辆状态进行更新:换道车辆在步骤四求解出当前换道策略解后,执行该策略过程中,通过换道轨迹及纵向轨迹对车辆状态信息进行更新;
[0014]步骤六、通过识别他车信息,对他车行为进行预测:针对换道车辆CV,采用NARX神经网络对目标车道后车RV纵向行为进行预测;针对目标车道后车RV,采用连续隐马尔可夫模型对换道车辆CV横向运动进行预测;
[0015]步骤七、利用步骤六的预测结果对步骤四的决策进行修正:换道车辆CV及目标车道车辆RV根据步骤六中对他车行为预测结果获得修正概率,对换道决策的执行概率进行修正;
[0016]步骤八、循环执行动态博弈决策:换道执行概率没有达到执行阈值时,换道车辆不执行换道,循环执行步骤四至步骤七,重新计算收益矩阵获得换道策略解,并对换道决策的换道执行概率进行修正,直到换道执行概率达到执行阈值或者换道意图消失。
[0017]与现有技术相比,本专利技术的积极效果是:
[0018]1.本专利技术针对换道车辆与目标车道车辆的竞争博弈行为,采用不完全信息非合作动态博弈的框架对换道过程中的交互行为进行深度建模分析。考虑了车辆在不可通信的情况下的交互性决策的制定方法,更加符合实际情况。
[0019]2.本专利技术对于收益矩阵的计算采用了改进的指标,从时间、空间及车速上充分考虑车辆的各项行为收益。在求解上以全局帕累托最优解为优先解,以纳什均衡解为次优解,在上述解都没有的情况下保持原策略解。在博弈中考虑了整体博弈系统的收益与各自收益的均衡解,更加符合人类博弈的心理。
[0020]3.本专利技术利用NARX神经网络模型对速度、加速度进行预测,将其作为表征车辆纵向行为的指标,利用了历史数据,提高预测的精确度。利用CHMM进行横向运动识别,用GMM来表示输出观测概率,对换道的行为概率进行量化。
[0021]4.在不完全信息的博弈框架下,车辆间不可通信,而本专利技术正是利用预测来弥补信息的不可获取,使决策包含更多的动态信息,使换道更快更可靠的执行。采用修正的方式,还可以加快决策过程,减少博弈回合,减少计算量。
附图说明
[0022]下面将通过附图及公式对本专利技术的具体实施方案作进一步阐述,其中:
[0023]图1是基于速度预测和博弈论的换道决策流程图;
[0024]图2是车辆换道场景示意图;
[0025]图3是换道决策详细流程图;
[0026]图4是NARX神经网络结构图;
[0027]图5是不同初始条件下的收益矩阵三维图;
[0028]图6是不同车速下的换道轨迹图
[0029]图7是速度预测及误差图
[0030]图8是加速度预测及误差图
[0031]图9是左换道预测结果图
[0032]图10是右换道预测结果图
具体实施方式
[0033]本专利技术的目的是在车辆信息不可通信的情况下,提供一种换道车辆与目标车道车辆博弈冲突时的决策方法。下面将结合附图和公式对本专利技术实施过程中所涉及的理论知识、适用场景及优势特点进一步详细阐述。
[0034]实施例
[0035]如图1所示,一种基于不完全信息博弈的智能车换道决策方法,根据实施步骤依次详细阐释:
[0036]一、产生换道意图:通过采集周围车辆及环境信息本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于不完全信息博弈的智能车换道决策方法,其特征在于,包括以下步骤:步骤一、产生换道意图:采集换道车辆及其周围车辆和环境信息,引入期望车速与期望间距的量化指标,当期望车速或期望间距超出阈值时,则换道车辆产生换道意图;步骤二、判断换道的可行性:在车辆产生换道意图之后,判断换道车辆与目标车道前后车是否满足换道安全距离,进而判断换道的可行性;步骤三、建立博弈收益矩阵:建立换道车辆CV与目标车道后车RV的非合作博弈的收益矩阵,该收益矩阵由速度收益、相对时距收益、期望跟车距离收益进行加权组合建立;步骤四、求解收益矩阵:以全局帕累托最优解为换道策略最优解;以纳什均衡解作为换道策略次优解;若上述解都没有,则继续保持原策略解;步骤五、对车辆状态进行更新:换道车辆在步骤四求解出当前换道策略解后,执行该策略过程中,通过换道轨迹及纵向轨迹对车辆状态信息进行更新;步骤六、通过识别他车信息,对他车行为进行预测:针对换道车辆CV,采用NARX神经网络对目标车道后车RV纵向行为进行预测;针对目标车道后车RV,采用连续隐马尔可夫模型对换道车辆CV横向运动进行预测;步骤七、利用步骤六的预测结果对步骤四的决策进行修正:换道车辆CV及目标车道车辆RV根据步骤六中对他车行为预测结果获得修正概率,对换道决策的执行概率进行修正;步骤八、循环执行动态博弈决策:换道执行概率没有达到执行阈值时,换道车辆不执行换道,循环执行步骤四至步骤七,重新计算收益矩阵获得换道策略解,并对换道决策的换道执行概率进行修正,直到换道执行概率达到执行阈值或者换道意图消失。2.如权利要求1所述的一种基于不完全信息博弈的智能车换道决策方法,其特征在于,所述步骤一包括以下过程:引入期望车速与期望间距的量化指标:引入期望车速与期望间距的量化指标:其中,VS(k)为当前步长的期望车速不满意度量化指标;V
des
为车辆期望车速;V为车辆实际车速;T
s
为采样时间;d0
min
为换道车辆CV与同车道前车PV的最小安全跟车距离;v
CV
和v
PV
分别为换道车辆CV与同车道前车PV的车速;τ
reaction
为驾驶员和车辆制动系统的反应时间总和;a
CVdec
为换道车辆CV的最大减速度;τ
safe
为最小安全跟车时间;若满足以下条件之一:VS(k)≥VS
thr
d0≤d0
min
则产生换道意图,即欲通过换道决策实现更大的行驶速度或跟车距离。3.如权利要求1所述的一种基于不完全信息博弈的智能车换道决策方法,其特征在于,所述步骤二包括以下过程:需同时满足以下两个条件,才能保证换道车辆CV换道的安全性:
其中,d1
min
为换道车辆CV与目标车道后车RV之间的最小换道安全距离;d2
min
为换道车辆CV与目标车道前车FV之间的最小换道安全距离。4.如权利要求1所述的一种基于不完全信息博弈的智能车换道决策方法,其特征在于,所述步骤三包括以下过程:收益矩阵形式为:其中,P代表换道车辆CV的收益,Q代表目标车道后车RV的收益,各自的两种行为组成四种策略组合;P、Q的计算包含三部分:(1)速度收益:其中,Part1为速度收益部分,v
front
为车辆前车的车速,v
self
为自车车速;(2)相对时距收益:其中,Part2为碰撞时距,v
RV
和v
CV
分别为目标车道后车RV和换道车辆CV车速,d1为目标车道后车RV和换道车辆CV的纵向间距,dc为换道车辆的换道纵向距离;(3)期望跟车距离收益:其中,Part3为期望跟车距离收益,y
front
和y
rear
分别为前后两辆车纵向间距,d
gap
为车辆之间的间距,d
des
为车辆期望间距;d
des
=0.0029*(v*3.6)2+0.3049*(v*3.6)+d
min
式中,v表示车辆车速,d
des
为所求的期望跟车间距,d
min
为静止最小安全距离;(4)总的收益矩阵计算:P
11
=α*Part1(v
FV
,v
CV
)+β*Part2(v
RV
,v
CV
)+γ*Part3(d
CVdes
)P
12
=α*Part1(v
FV
,v
CV
)

β*Part2(v
RV
,v
CV
)+γ*Part3(d
CVdes
)
P
21
=α*Part1(v
PV
,v
CV
)+γ*Part3(d
CVdes
)P
22
=α*Part1(v
PV
,v
CV
)

β*Part2(v
RV
,v
CV
)+γ*Part3(d
CVdes
)Q
11
=α*Part1(v
CV
,v
RV
)

【专利技术属性】
技术研发人员:赵海艳刘万陈伟轩靳英豪王金鹏
申请(专利权)人:吉林大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1