System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本公开总体说来涉及人工智能算法和自然语言处理,更具体地,涉及一种可解释的无人机任务决策方法及装置。
技术介绍
1、在相关领域中,随着人工智能相关技术的快速发展,对于各种智能任务的处理逐渐成为热门问题。针对与无人机领域的无人机任务的处理方面,已经提出了一些智能决策方法和系统。传统的智能决策系统主要依赖于规则基础系统和专家系统,通过预定义的规则集和逻辑集来进行决策。这些决策系统虽然具有较强的可解释性且在一些特定场景下表现出较强的适应性,但是由于其缺乏自适应性和灵活性,因此传统的决策系统难以应对例如无人机任务决策相关的复杂环境。
2、针对包括复杂环境的无人机任务的决策,目前亟需实现这种无人机任务相关决策的可解释性研究,并且需要一种改进的无人机任务相关的决策方法。
技术实现思路
1、本公开的实施例提供一种可解释的无人机任务决策方法及装置,通过利用shap算法对针对包括时间序列和动态环境的无人机任务数据的动态决策结果进行特征分析,提供对复杂的无人机调整决策方案的决策过程的全面解释。
2、在一个总体方面,提供了一种可解释的无人机任务决策方法,所述无人机任务决策方法包括:获取针对无人机决策任务的第一输入数据集,所述第一输入数据集是以表格形式存储的基于时间序列和动态环境的无人机任务数据,所述无人机任务数据包括针对目标任务的位置数据、与目标任务相关的至少一个障碍物的位置数据、与目标任务相关的当前航线数据、与目标任务相关的时间数据;将所述第一输入数据集输入到预先构建的第一预设决
3、可选地,所述将所述第一策略数据集和所述第一输入数据集输入到基于shap算法的特征分析模型,得到针对所述无人机决策任务的决策特征数据集的步骤可包括:针对所述第一策略数据集中的每种策略,从所述第一输入数据集中提取与每种策略相对应的当前输入数据;对每种策略的当前输入数据进行基于shap值的特征分析,并且基于与分析出的不同特征在不同策略所对应的情境下的边际贡献来进行特征提取,得到对每种策略的当前策略影响程度最大的特征集,作为针对每种策略的当前输入数据的决策特征数据集,并且将针对每种策略的当前输入数据的决策特征数据集进行汇总,得到针对所述无人机决策任务的决策特征数据集。
4、可选地,可通过以下公式来计算所述对每种策略的当前策略影响程度最大的特征集中包含的每个特征对应的边际贡献:
5、
6、其中,表示每个特征对应的边际贡献函数, u表示预设特征子集合作后得到的效用函数, n表示特征全集, n表示特征全集的数量, s表示特征子集的数量, i表示当前特征的序号, k是大于等于1且小于等于 n的整数。
7、可选地,所述第二预设决策模型的构建过程可包括:从所述决策特征数据集中选择多个特征;根据针对所述多个特征的预设评估参数,构建决策树的各个节点,直到满足预设终止条件时结束所述构建过程。
8、可选地,所述第一预设决策模型可包括基于强化学习算法的决策模型、基于深度学习算法的决策模型和基于贝叶斯网络算法的决策模型中的至少一者。
9、可选地,所述第一预设决策模型可包括基于强化学习算法的决策模型,并且所述将所述第一输入数据集输入到预先构建的第一预设决策模型,得到用于输出决策结果的第一策略数据集的步骤可包括:基于所述第一输入数据集,执行包括行动、反馈、调整、再行动的强化学习操作,得到满足使与预设累计奖励目标最大化的条件的决策结果,作为所述第一策略数据集。
10、可选地,所述第一预设决策模型可包括基于深度学习算法的决策模型,并且可通过以下方式来训练所述第一预设决策模型:获取针对无人机决策任务的第一样本数据集,所述第一样本数据集是以表格形式存储的基于时间序列和动态环境的样本无人机任务数据,所述样本无人机任务数据包括针对预设任务的位置数据、与预设任务相关的至少一个障碍物的位置数据、与预设任务相关的当前航线数据、与预设任务相关的时间数据;基于所述第一样本数据集,确定对应的样本策略数据集,所述对应的样本策略数据集包括用于指示无人机针对预设任务的下一动作的调整方案;基于所述第一样本数据集和所述对应的样本策略数据集,计算预设损失函数;根据所述预设损失函数,调整所述第一预设决策模型的模型参数,得到训练后的第一预设决策模型。
11、在另一总体方面,提供了一种可解释的无人机任务决策装置,所述无人机任务决策装置包括:数据获取模块,被配置为:获取针对无人机决策任务的第一输入数据集,所述第一输入数据集是以表格形式存储的基于时间序列和动态环境的无人机任务数据,所述无人机任务数据包括针对目标任务的位置数据、与目标任务相关的至少一个障碍物的位置数据、与目标任务相关的当前航线数据、与目标任务相关的时间数据;决策生成模块,被配置为:将所述第一输入数据集输入到预先构建的第一预设决策模型,得到用于输出决策结果的第一策略数据集,所述第一策略数据集包括用于指示无人机针对目标任务的下一动作的调整方案;特征分析模块,被配置为:将所述第一策略数据集和所述第一输入数据集输入到基于shap算法的特征分析模型,得到针对所述无人机决策任务的决策特征数据集,所述决策特征数据集包括与所述调整方案相对应的无人机决策特征数据;决策解释模块,被配置为:利用所述决策特征数据集构建基于决策树算法的第二预设决策模型,得到用于呈现针对所述调整方案的决策路径和决策理由的决策树数据,作为用于解释所述无人机决策任务的解释数据集。
12、可选地,所述将所述第一策略数据集和所述第一输入数据集输入到基于shap算法的特征分析模型,得到针对所述无人机决策任务的决策特征数据集的操作可包括:针对所述第一策略数据集中的每种策略,从所述第一输入数据集中提取与每种策略相对应的当前输入数据;对每种策略的当前输入数据进行基于shap值的特征分析,并且基于与分析出的不同特征在不同策略所对应的情境下的边际贡献来进行特征提取,得到对每种策略的当前策略影响程度最大的特征集,作为针对每种策略的当前输入数据的决策特征数据集,并且将针对每种策略的当前输入数据的决策特征数据集进行汇总,得到针对所述无人机决策任务的决策特征数据集。
13、可选地,可通过以下公式来计算所述对每种本文档来自技高网...
【技术保护点】
1.一种可解释的无人机任务决策方法,其特征在于,所述无人机任务决策方法包括:
2.根据权利要求1所述的无人机任务决策方法,其特征在于,所述将所述第一策略数据集和所述第一输入数据集输入到基于SHAP算法的特征分析模型,得到针对所述无人机决策任务的决策特征数据集的步骤包括:
3.根据权利要求2所述的无人机任务决策方法,其特征在于,通过以下公式来计算所述对每种策略的当前策略影响程度最大的特征集中包含的每个特征对应的边际贡献:
4.根据权利要求1所述的无人机任务决策方法,其特征在于,所述第二预设决策模型的构建过程包括:
5.根据权利要求1所述的无人机任务决策方法,其特征在于,所述第一预设决策模型包括基于强化学习算法的决策模型、基于深度学习算法的决策模型和基于贝叶斯网络算法的决策模型中的至少一者。
6.根据权利要求5所述的无人机任务决策方法,其特征在于,所述第一预设决策模型包括基于强化学习算法的决策模型,并且所述将所述第一输入数据集输入到预先构建的第一预设决策模型,得到用于输出决策结果的第一策略数据集的步骤包括:
7.
8.一种可解释的无人机任务决策装置,其特征在于,所述无人机任务决策装置包括:
9.一种计算机程序产品,其特征在于,所述计算机程序产品包括计算机程序/指令,所述计算机程序/指令被处理器执行时实现如权利要求1至7中的任一权利要求所述的可解释的无人机任务决策方法。
10.一种计算设备,其特征在于,所述计算设备包括:至少一个处理器;至少一个存储计算机可执行指令的存储器,其中,所述计算机可执行指令在被所述至少一个处理器运行时,促使所述至少一个处理器执行如权利要求1至7中的任一权利要求所述的可解释的无人机任务决策方法。
...【技术特征摘要】
1.一种可解释的无人机任务决策方法,其特征在于,所述无人机任务决策方法包括:
2.根据权利要求1所述的无人机任务决策方法,其特征在于,所述将所述第一策略数据集和所述第一输入数据集输入到基于shap算法的特征分析模型,得到针对所述无人机决策任务的决策特征数据集的步骤包括:
3.根据权利要求2所述的无人机任务决策方法,其特征在于,通过以下公式来计算所述对每种策略的当前策略影响程度最大的特征集中包含的每个特征对应的边际贡献:
4.根据权利要求1所述的无人机任务决策方法,其特征在于,所述第二预设决策模型的构建过程包括:
5.根据权利要求1所述的无人机任务决策方法,其特征在于,所述第一预设决策模型包括基于强化学习算法的决策模型、基于深度学习算法的决策模型和基于贝叶斯网络算法的决策模型中的至少一者。
6.根据权利要求5所述的无人机任务决策方法,其特征在于,所述第一预设决策模型包括基于强化...
【专利技术属性】
技术研发人员:杨阳,蔡怀广,白江波,章路,张文生,
申请(专利权)人:中国科学院自动化研究所,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。