System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术属于自动驾驶及人工智能等需要进行决策判断的,特别涉及一种基于推演格的底线决策方法及装置。本专利技术是在总结人类驾驶和决策的基础上,为自动驾驶或决策能像人类驾驶和决策一样能识别驾驶和决策场景,并根据驾驶和决策场景选择驾驶方法,根据驾驶方法就驾驶特性:如安全性、舒适性和最短时间等原则进行优化,选择最优驾驶方法来控制车辆进行驾驶的综合驾驶决策方法,同时解决了场景的泛化和不确定性问题。
技术介绍
1、国内外学者对无人驾驶车辆的运动行为决策均进行了深入的研究,方法及存在的问题如下:
2、一、基于有限状态机决策模型的状态划分问题。
3、(1)有限状态机的状态划分需要依据明确的边界条件。一方面要避免冲突状态强行划分而造成的无人车行为不连贯,另一方面也要能够判断处于“灰色地带”的无人车不同行为的最优性。
4、(2)基于有限状态机决策模型的复杂场景遍历问题。有限状态机需要人工设定规则库以泛化无人车行驶状态,这种模式使得状态机具有广度遍历优势。但随着环境场景的增多与复杂,有限状态机的规模也不断庞大,使得算法臃肿;而同一场景的深度遍历,即由于环境细节变化导致的决策结果变化,也很难通过状态遍历。
5、二、基于学习算法决策模型学习算法的训练结果与样本数量、样本质量和网络结构有关。如果学习模型过于复杂,会造成无法区分数
6、据本质和噪声的情况,泛化能力减弱;反之,如果学习模型过于简单,或者样本数量不足、对场景遍历不足,则会导致规则提炼不精准,出现欠学习问题。此外,学习算法模型逻辑解释性较
7、三、规则算法与学习算法结合的方式。顶层采用有限状态机,根据场景进行层级遍历;底层采用学习算法,基于具体场景分模块应用,可发挥学习算法优势,简化算法结构、增强场景遍历的深度,并可减小数据依赖量,保证决策结果的鲁棒性与正确性。采用该方法如何合理对接有限状态机与学习算法模型,以及学习算法的过学习、欠学习等问题。
8、四、端到端方法将更多作为决策子模块的解决方案,而非将决策系统作为一个整体进行端到端处理。通过这种方式可发挥学习算法的优势,但缺乏决策的可解释性与可调节性。
技术实现思路
1、为了解决上述问题,本专利技术实施例提供了一种基于推演格的底线决策方法及装置,参见图1,我们将自动驾驶系统分为四个模块:感知、识别、决策优化及状态和执行四个模块。包括以下过程:
2、(1)感知模块通过传感器感知驾驶场景中的各种数据,包括不局限于以下数据:车辆前、后面以及侧面影像数据、微波雷达数据、激光雷达数据、车辆实时状况数据;气候传感器感知气候条件;位置传感器感知地理位置;等等。
3、(2)认知由以上数据识别出交通标识、障碍物、道路类型、道路上的设施、障碍物类型、道路上物体的意图、本车意图、本车所处道路位置和位置特性等。
4、(3)人车交互命令,如人通过方向盘、刷车踏板、油门踏板和挂挡等识别出驾驶人的意图。
5、(4)识别模块将以上感知的数据进行识别,根据识别出的场景采用概念、特征和规则对驾驶场景进行建模(参见申请号为cn201610985211.4的描述),所谓特征是对概念外延进行分割的依据,认知的事物、事件和人机车交互动作等使用概念进行分类,利用特征对概念的外延作进一步分类,利用特征组合对驾驶场景进行建模,用来表示车辆所处的驾驶场景,结论用于标识所匹配的场景,这样可以用规则来对驾驶场景进行建模。
6、(5)决策优化及状态模块针对具体驾驶场景有多种驾驶方案,如遇到障碍物,对障碍物的类型进行判别;如果障碍物是禁止碾压的,则必须绕过障碍物;如果可以碾压的,则要判断障碍物的大小,根据障碍物的大小可以判断是以现有速度碾压过去还是减速碾压等等。
7、(6)针对具体的驾驶方案根据安全性、舒适性和最短时间等进行评估,选择最优驾驶方案,根据评估结果选择驾驶方案来控制车辆运行。
8、(7)如果评估结果不能满足要求,则寻找直接底线决策规则,按照底线决策规则再做评估,如果不能满足要求,再一次寻找上一层的底线决策规则直到最上层底线决策规则为止。
9、(8)执行模块根据最优方案控制车辆行驶,在行驶的过程中及时更新车辆的实时状态,从而形成闭环控制。
10、我们将场景建模为规则,利用场景知识库收集车辆所遭遇到的各种场景,利用驾驶方案库来收集在各种场景下所可以采取的驾驶方法,利用底线思维搜索规则的各种底线规则,利用推演格用于推理,实时匹配场景知识库中的规则。
11、如图1所示,底线决策把决策过程分为:(1)环境感知,用于感知环境;(2)识别层,用于对感知的数据进行识别;(3)决策优化及状态层,用于对场景进行精确匹配,匹配成功后根据设置的策略进行评估,评估满足时选择最优方法来执行,评估不满足时选择底线规则作评估,在决策时需局部目的状态作参考;(4)执行层,根据最优方案来控制执行。
12、所述技术方案如下:
13、一方面,本专利技术实施例提供了一种基于推演格的底线决策方法,所述方法包括:
14、s101:由底线规则集生成推演格。
15、s102:沿着推演格根节点下的第一个子节点开始,判断该节点所对应的特征是否成立;若该节点所对应的特征成立,则移动当前节点到下一节点;若该节点对应的特征不成立,则考察该子节点的邻接兄弟节点所对应的特征是否成立直至到达叶子节点;
16、若能到达叶子节点,则得到结论并设置currentrule为当前匹配的规则,并执行步骤s103;
17、若无法到达叶子节点,则判断default是否为空;若为空,则生成一条新的规则,该规则的前提是已经成功匹配的特征,结论为任意,并将currentrule设置为新生成的规则并执行步骤s104;若不为空,则设置currentrule为default并执行s103。
18、s103:根据当前规则的结论评估对应的策略是否满足,若满足,则执行对应的动作;若不满足,则执行步骤s104。
19、s104:根据直接底线规则,按照顺序评估对应的策略是否满足,若满足,则执行对应的动作,直至穷尽所有的底线规则集。
20、另一方面,本专利技术实施例还提供了一种基于推演格的底线决策装置,包括:
21、推演格生成模块,用于由底线规则集生成推演格。
22、判断模块,用于沿着推演格根节点下的第一个子节点开始,判断该节点所对应的特征是否成立;若该节点所对应的特征成立,则移动当前节点到下一节点;若该节点对应的特征不成立,则考察该子节点的邻接兄弟节点所对应的特征是否成立直至到达叶子节点;若能到达叶子节点,则得到结论并设置currentrule为当前匹配的规则,并送当前本文档来自技高网...
【技术保护点】
1.基于推演格的底线决策方法,其特征在于,所述方法包括:
2.根据权利要求1所述的基于推演格的底线决策方法,其特征在于,
3.根据权利要求2所述的基于推演格的底线决策方法,其特征在于,底线规则集的定义为:对于一条规则,知识库中该规则的所有底线规则组成的集合称为底线规则集。
4.根据权利要求3所述的基于推演格的底线决策方法,其特征在于,寻找已知规则rule的底线规则集ruleSet的方法如下:ruleSet=null;features=findAllfeaturesByRule(rule), ∀feature∈features,rules=findAllRulesByfeature(feature),∀rule1∈rules并且findAllFeaturesByRule(rule1)⊂features时,则ruleSet=ruleSet∪rule1;
5.根据权利要求4所述的基于推演格的底线决策方法,其特征在于,步骤S101具体包括:
6.根据权利要求5所述的基于推演格的底线决策方法,其特征在于,在步骤S11中,初始化过程
7.基于推演格的底线决策装置,其特征在于,包括:
8.一种机器可读存储介质,其特征在于,包括所述机器可读存储介质中存储有机器可执行指令,所述机器可执行指令被执行时,实现权利要求1-6所述的方法。
...【技术特征摘要】
1.基于推演格的底线决策方法,其特征在于,所述方法包括:
2.根据权利要求1所述的基于推演格的底线决策方法,其特征在于,
3.根据权利要求2所述的基于推演格的底线决策方法,其特征在于,底线规则集的定义为:对于一条规则,知识库中该规则的所有底线规则组成的集合称为底线规则集。
4.根据权利要求3所述的基于推演格的底线决策方法,其特征在于,寻找已知规则rule的底线规则集ruleset的方法如下:ruleset=null;features=findallfeaturesbyrule(rule), ∀feature∈features,rules=findallrulesbyfeature(feature),∀rule1∈rules并且findallfeaturesbyrule(rule1)⊂features时,则ruleset=ruleset∪r...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。