本发明专利技术公开了一种自动驾驶方法、装置和存储介质,涉及自动驾驶技术领域。自动驾驶方法包括:建立第一优化问题;将第一优化问题的部分约束条件转换为惩罚函数,形成第二优化问题;迭代执行i)~iii),直到达到预设的迭代次数:i)通过基于元启发式算法的搜索过程,获得第二优化问题的解;ii)根据第二优化问题的解确定第一优化问题的初始解,并采用梯度优化算法求解第一优化问题,确定第一目标函数的值以及相应的解;iii)在第一目标函数的值小于第一目标函数的最小值的情况下,采用第一目标函数的值更新最小值;将第一目标函数的最小值对应的解确定为自动驾驶的驾驶参数。从而可以获得质量更高的自动驾驶轨迹。
【技术实现步骤摘要】
自动驾驶方法、装置和存储介质
本专利技术涉及自动驾驶
,特别涉及一种自动驾驶方法、装置和存储介质。
技术介绍
自动驾驶决策规划领域的发展日臻成熟,目前主流想法是通过搜索采样技术(例如A*方法或者RRT、DP等方法)在简约解空间中得到概略的解,随后在这个概略解周围展开精细的梯度优化,通过精细的梯度优化方法得到一个局部最优解。这里“概略的解”的决定了最终梯度优化方法收敛到哪一个局部最优解。总之,主流的做法是将搜索采样方法视为车辆的运动决策环节,将局部开展的路径或轨迹规划环节视为规划环节,这两个环节合并起来称为运动决策规划。
技术实现思路
专利技术人经过分析后发现,在相关技术的运动决策规划方法中,一个非常关键的薄弱环节是决策部分。这是因为采用的搜索采样方法中构造的连通图的结构不够精细,或者搜索方法本身不具有完备性。以A*为例,A*搜索是一种“最优优先策略”,它所使用的启发函数能够提高搜索速度,但是牺牲了算法的完备性以及最优性,基于A*搜索的一系列常用决策方法,例如混合A*、ARA等算法均不具有完备性,也不具有最优性。随着其他上游技术困难逐步被解决,决策质量的这一隐患逐步从次要矛盾上升到决策规划模块的主要矛盾,成为了限制自动驾驶轨迹质量的瓶颈。本专利技术实施例所要解决的一个技术问题是:如何提高自动驾驶轨迹的质量。根据本专利技术一些实施例的第一个方面,提供一种自动驾驶方法,包括:建立第一优化问题,第一优化问题包括令驾驶过程中的不舒适值最小化第一目标函数,第一优化问题的解包括车辆的驾驶参数;将第一优化问题的部分约束条件转换为惩罚函数,形成第二优化问题,第二优化问题包括第二目标函数,第二目标函数表示第一目标函数与惩罚函数的和;迭代执行i)~iii),直到达到预设的迭代次数:i)通过基于元启发式算法的搜索过程,获得第二优化问题的解;ii)根据第二优化问题的解确定第一优化问题的初始解,并采用梯度优化算法求解第一优化问题,确定第一目标函数的值以及相应的解;iii)在第一目标函数的值小于第一目标函数的最小值的情况下,采用第一目标函数的值更新最小值;将第一目标函数的最小值对应的解确定为自动驾驶的驾驶参数。在一些实施例中,第一目标函数与预设时间段内各个时间的车轮转角的绝对值成正相关关系。在一些实施例中,第一目标函数为预设时间段内各个时间的车轮转角的角度的平方的总和。在一些实施例中,第一优化问题的约束条件包括车辆的运动学模型约束、车辆的速度约束、车轮转角约束、车辆的起点约束、车辆的终点约束;第二优化问题的约束条件包括车辆的速度约束、车轮转角约束。在一些实施例中,惩罚函数包括车辆在预设时刻的位置与终点的距离信息以及车辆在行驶过程中与障碍物的距离信息。在一些实施例中,在迭代执行i)~iii)之前,构建第二目标函数的解空间并初始化解空间中的多个粗搜索变量和多个精搜索变量;通过基于元启发式算法的搜索过程,获得第二优化问题的解包括:对于每个粗搜索变量,根据预设概率与其他粗搜索变量进行交叉变异操作以得到粗搜索变量的备选优化变量值,并在根据备选优化变量值计算的第二目标函数的值小于根据粗搜索变量的值计算的第二目标函数的值的情况下,采用备选优化变量值更新粗搜索变量的值;根据每个粗搜索变量的值对应的第二目标函数的值的倒数,确定每个粗搜索变量的权重;根据每个粗搜索变量的权重,采用轮盘赌的方式确定每个精搜索变量对应的粗搜索变量,其中,精搜索变量对应的粗搜索变量的值表示第二目标函数的解。在一些实施例中,对于每个粗搜索变量,根据预设概率与其他粗搜索变量进行交叉变异操作以得到粗搜索变量的备选优化变量值包括:对于每个粗搜索变量,响应于根据预设概率确定对粗搜索变量进行交叉变异操作,随机选择解空间的一个维度,并将粗搜索变量与其他粗搜索变量在选择的维度上的数值进行随机混合、得到粗搜索变量的备选优化变量值。在一些实施例中,元启发式算法为人工蜂群算法、禁忌搜索算法、遗传算法、模拟退火算法、蚁群算法、粒子群算法中的至少一种。在一些实施例中,梯度下降算法为内点算法或者序列二次规划算法。根据本专利技术一些实施例的第二个方面,提供一种自动驾驶装置,包括:第一优化问题建立模块,被配置为建立第一优化问题,第一优化问题包括令驾驶过程中的不舒适值最小化第一目标函数,第一优化问题的解包括车辆的驾驶参数;第二优化问题建立模块,被配置为将第一优化问题的部分约束条件转换为惩罚函数,形成第二优化问题,第二优化问题包括第二目标函数,第二目标函数表示第一目标函数与惩罚函数的和;优化问题求解模块,被配置为迭代执行i)~iii),直到达到预设的迭代次数:i)通过基于元启发式算法的搜索过程,获得第二优化问题的解;ii)根据第二优化问题的解确定第一优化问题的初始解,并采用梯度优化算法求解第一优化问题,确定第一目标函数的值以及相应的解;iii)在第一目标函数的值小于第一目标函数的最小值的情况下,采用第一目标函数的值更新最小值;驾驶参数确定模块,被配置为将第一目标函数的最小值对应的解确定为自动驾驶的驾驶参数。根据本专利技术一些实施例的第三个方面,提供一种自动驾驶装置,包括:存储器;以及耦接至存储器的处理器,处理器被配置为基于存储在存储器中的指令,执行前述任意一种自动驾驶方法。根据本专利技术一些实施例的第四个方面,提供一种计算机可读存储介质,其上存储有计算机程序,其中,该程序被处理器执行时实现前述任意一种自动驾驶方法。上述专利技术中的一些实施例具有如下优点或有益效果:在本专利技术的实施例中,采用将梯度优化算法嵌入到元启发算法的方式确定驾驶参数,决策与规划过程难以分割,二者通过相互作用以及不断的迭代计算,最终一次性地输出一条精细的优化轨迹。通过这种方式,可以获得质量更高的自动驾驶轨迹。通过以下参照附图对本专利技术的示例性实施例的详细描述,本专利技术的其它特征及其优点将会变得清楚。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为根据本专利技术一些实施例的驾驶方法的流程示意图。图2为根据本专利技术一些实施例的驾驶参数确定方法的流程示意图。图3为根据本专利技术一些实施例的自动驾驶装置的结构示意图。图4为根据本专利技术另一些实施例的自动驾驶装置的结构示意图。图5为根据本专利技术又一些实施例的自动驾驶装置的结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本专利技术及其应用或使用的任何限制。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围本文档来自技高网...
【技术保护点】
1.一种自动驾驶方法,包括:/n建立第一优化问题,所述第一优化问题包括令驾驶过程中的不舒适值最小化第一目标函数,所述第一优化问题的解包括车辆的驾驶参数;/n将第一优化问题的部分约束条件转换为惩罚函数,形成第二优化问题,所述第二优化问题包括第二目标函数,所述第二目标函数表示第一目标函数与惩罚函数的和;/n迭代执行i)~iii),直到达到预设的迭代次数:/ni)通过基于元启发式算法的搜索过程,获得第二优化问题的解;/nii)根据第二优化问题的解确定第一优化问题的初始解,并采用梯度优化算法求解第一优化问题,确定第一目标函数的值以及相应的解;/niii)在第一目标函数的值小于第一目标函数的最小值的情况下,采用所述第一目标函数的值更新所述最小值;/n将第一目标函数的最小值对应的解确定为自动驾驶的驾驶参数。/n
【技术特征摘要】
1.一种自动驾驶方法,包括:
建立第一优化问题,所述第一优化问题包括令驾驶过程中的不舒适值最小化第一目标函数,所述第一优化问题的解包括车辆的驾驶参数;
将第一优化问题的部分约束条件转换为惩罚函数,形成第二优化问题,所述第二优化问题包括第二目标函数,所述第二目标函数表示第一目标函数与惩罚函数的和;
迭代执行i)~iii),直到达到预设的迭代次数:
i)通过基于元启发式算法的搜索过程,获得第二优化问题的解;
ii)根据第二优化问题的解确定第一优化问题的初始解,并采用梯度优化算法求解第一优化问题,确定第一目标函数的值以及相应的解;
iii)在第一目标函数的值小于第一目标函数的最小值的情况下,采用所述第一目标函数的值更新所述最小值;
将第一目标函数的最小值对应的解确定为自动驾驶的驾驶参数。
2.根据权利要求1所述的自动驾驶方法,其中,所述第一目标函数与预设时间段内各个时间的车轮转角的绝对值成正相关关系。
3.根据权利要求1所述的自动驾驶方法,其中,所述第一目标函数为预设时间段内各个时间的车轮转角的角度的平方的总和。
4.根据权利要求1所述的自动驾驶方法,其中,
第一优化问题的约束条件包括车辆的运动学模型约束、车辆的速度约束、车轮转角约束、车辆的起点约束、车辆的终点约束;
第二优化问题的约束条件包括车辆的速度约束、车轮转角约束。
5.根据权利要求1或4所述的自动驾驶方法,其中,所述惩罚函数包括车辆在预设时刻的位置与终点的距离信息以及车辆在行驶过程中与障碍物的距离信息。
6.根据权利要求1所述的自动驾驶方法,其中,在迭代执行i)~iii)之前,构建所述第二目标函数的解空间并初始化解空间中的多个粗搜索变量和多个精搜索变量;
所述通过基于元启发式算法的搜索过程,获得第二优化问题的解包括:
对于每个粗搜索变量,根据预设概率与其他粗搜索变量进行交叉变异操作以得到所述粗搜索变量的备选优化变量值,并在根据所述备选优化变量值计算的第二目标函数的值小于根据所述粗搜索变量的值计算的第二目标函数的值的情况下,采用所述备选优化变量值更新所述粗搜索变量的值;
根据每个粗搜索变量的值对应的第二目标函数的值的倒数,确定每个粗搜索变量的权重;
根据每...
【专利技术属性】
技术研发人员:李柏,
申请(专利权)人:北京京东乾石科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。