System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种混合博弈下高阶思维发展的多智能体任务规划方法技术_技高网

一种混合博弈下高阶思维发展的多智能体任务规划方法技术

技术编号:44071758 阅读:6 留言:0更新日期:2025-01-17 16:08
本发明专利技术公开了一种混合博弈下高阶思维发展的多智能体任务规划方法,属于任务耦合规划技术领域,包括S1、学习者高阶思维引领下基于两阶段意图共享的多智能体强化学习;S2、混合博弈启发下面向学习者高阶思维的多智能体任务耦合规划,具体包括:S21、混合博弈启发下的多智能体模型的构建;S22、混合博弈启发下面向高阶思维的多智能体模型策略优化;S23、混合博弈启发下面向学习者高阶思维的多智能体任务耦合规划;S3、基于多智能体迁移策略的学习者高阶思维具身发展;本发明专利技术提供的一种混合博弈下高阶思维发展的多智能体任务规划方法,为学习者高阶思维的具身发展提供了坚实的支持和有力的推动。

【技术实现步骤摘要】

本专利技术涉及任务耦合规划,尤其是涉及一种混合博弈下高阶思维发展的多智能体任务规划方法


技术介绍

1、在当今快速发展的智能时代,高阶思维能力的培养对于学习者而言至关重要。高阶思维,涵盖了批判性思维、创造性思维和问题解决能力等核心要素,是学习者适应复杂多变环境、解决非线性问题、实现创新突破的关键。它不仅关乎个人的认知发展,更对社会的进步与科技的革新具有深远影响。因此,探索有效的高阶思维培养方法,成为教育领域亟待解决的重要课题。

2、多智能体强化学习作为人工智能领域的一个重要分支,因其强大的适应性和灵活性,在解决复杂任务和优化策略方面展现出巨大潜力。在多智能体系统中,各个智能体通过相互协作或竞争,共同探索环境,优化自身策略,以实现整体利益的最大化。这种机制不仅符合现实世界中多主体交互的复杂性,也为模拟和训练高阶思维能力提供了理想的实验平台。

3、混合博弈作为博弈论中的一种重要形式,允许智能体在策略选择上保持一定的随机性,从而增加了博弈的复杂性和不确定性。在混合博弈的框架下,智能体需要综合考虑对手的可能行为、自身资源的分配以及长期利益与短期收益之间的权衡,制定出更加灵活和鲁棒的策略。这种策略制定过程,与高阶思维中的批判性分析和创造性决策高度契合,为高阶思维的培养提供了新的视角和路径。

4、基于上述背景,本专利技术提出了一种混合博弈下高阶思维发展的多智能体任务规划方法。该方法旨在通过构建多智能体系统,模拟混合博弈环境,使学习者在参与多智能体交互的过程中,不断锻炼和提升其高阶思维能力。

5、此外,该方法还注重多智能体迁移策略的应用,以促进学习者高级思维的具身发展。迁移策略允许智能体将在一个任务中学到的知识和技能,有效地迁移到另一个相关但不同的任务中,从而加速学习进程,提高学习效率。这种迁移能力,对于学习者在面对新情境、新问题时能够迅速调用已有知识、灵活调整策略,具有重要的现实意义和应用价值。


技术实现思路

1、本专利技术的目的是提供一种混合博弈下高阶思维发展的多智能体任务规划方法,以解决上述
技术介绍
存在的问题。

2、为实现上述目的,本专利技术提供了一种混合博弈下高阶思维发展的多智能体任务规划方法,包括以下步骤:

3、s1、学习者高阶思维引领下基于两阶段意图共享的多智能体强化学习;

4、s2、混合博弈启发下面向学习者高阶思维的多智能体任务耦合规划,具体包括:

5、s21、混合博弈启发下的多智能体模型的构建;

6、s22、混合博弈启发下面向高阶思维的多智能体模型策略优化;

7、s23、混合博弈启发下面向学习者高阶思维的多智能体任务耦合规划;

8、s3、基于多智能体迁移策略的学习者高阶思维具身发展。

9、优选的,步骤s1具体包括:

10、s11、基于多智能体的学习者高阶思维的相关数据的获取与处理,具体为:通过先进的语言识别、图像识别机自然语言处理等技术,实时捕获学习者在文字等类型的高阶思维深度讨论中的思维特征,包括但不限于图像中的逻辑推理路径、文字中的批判性思维表达和创新性观点阐述等,捕获公式为:

11、(1)

12、其中,表示高阶思维深度讨论内容数据集,表示捕获函数,表示语音识别,表示图像识别,表示自然语言处理模块的输出;

13、将捕获到的高阶思维数据经过预处理后,输入到多智能体系统中进行协同处理,多智能体系统通过其内部的通信与协作机制,对高阶思维数据进行深度挖掘与分析,提取出能够反映学习者高阶思维能力的关键特征,公式为:

14、(2)

15、其中,表示高阶思维特征向量几何,表示处理函数,表示多智能体系统的通信与协作机制;

16、s12、基于两阶段意图共享的多智能体强化学习。

17、优选的,步骤s12具体包括:

18、每个智能体各自维护了一个值网络,首先独立地对其所观测到的高阶思维深度讨论内容数据集进行解析,根据局部观测生成一个初步的意向动作,具体公式为:

19、(3)

20、随后,进入第一轮意图共享阶段,智能体将其意向动作广播给系统中的其他所有智能体,假设系统中智能体总数为n;在第一轮意图共享完成后,各智能体不仅依据自身的局部观测,还结合接收到的其他智能体的意向动作信息,评估这些信息对于自身当前决策的重要性;

21、通过计算v值来衡量每个接收到的意向动作信息对其决策过程的潜在影响,具体而言,对于一个给定的动作k,计算当智能体提供智能体动作信息,智能体采取不同最优动作时,v的最大值和最小值,具体公式为:

22、(4)

23、(5)

24、为了建立一个统一的量化标准,对其最大值和最小值进行归一化处理,具体公式为:

25、(6)

26、若某智能体的意向动作信息对另一智能体的决策重要性超过预设的阈值,则该智能体将被纳入后者的依赖对象集合中;

27、然后,进入第二轮意图共享阶段,在这一阶段,每个智能体都会将其依赖对象集合发送给系统中的其他所有智能体,通过这一轮的信息交换,智能体们能够构建一个更为全面的依赖关系图,该图是一个有向图,用于直观展示智能体之间的依赖关系。

28、优选的,步骤s12中通过循环依赖去除算法,检测和消除依赖关系图中的循环依赖,具体为:

29、初始化,对所有的节点,设置visited(r)=false和onstack(r)=false;

30、visited(r)是一个状态标记,用于指示节点r是否已被访问过,visited(r) =false表示在初始化阶段,假设所有节点都未被访问过。onstack(r)同样是一个状态标记,用于指示节点r是否当前在dfs栈中,onstack(r) = false表示在初始化阶段,假设所有节点都不在栈中;

31、深度优先搜索(dfs),对于每个未被访问的节点r,执行以下操作:

32、将标记为已访问,设置visited(r)=true;

33、将压入dfs栈,设置onstack(r)=true;

34、对于的每个邻接节点w(即存在从r到w的有向边),若w未被访问,则递归地对w执行深度优先搜索,若w已被访问且仍在栈中(即visited(w)=true且onstack(r)=true),则检测到循环依赖;

35、将从栈中弹出,设置onstack(r)=false;

36、循环依赖消除,一旦检测到循环依赖,通过调整依赖关系,用于确保得到的图是一个有向无环图;

37、在得到无环的依赖关系图后,智能体的决策过程将遵循以下规则:若某智能体被其他智能体所依赖,则它无法重新进行决策,其最终动作将直接采用其初步生成的意向动作;相反,若某智能体不被任何智能体所依赖,则它根据所依赖的智能体的意向动作信息,结合自身的局部观测,重新进行决策,以优化其动本文档来自技高网...

【技术保护点】

1.一种混合博弈下高阶思维发展的多智能体任务规划方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种混合博弈下高阶思维发展的多智能体任务规划方法,其特征在于,步骤S1具体包括:

3.根据权利要求2所述的一种混合博弈下高阶思维发展的多智能体任务规划方法,其特征在于,步骤S12具体包括:

4.根据权利要求3所述的一种混合博弈下高阶思维发展的多智能体任务规划方法,其特征在于,步骤S12中通过循环依赖去除算法,检测和消除依赖关系图中的循环依赖,具体为:

5.根据权利要求1所述的一种混合博弈下高阶思维发展的多智能体任务规划方法,其特征在于,步骤S21具体包括:

6.根据权利要求1所述的一种混合博弈下高阶思维发展的多智能体任务规划方法,其特征在于,步骤S22具体包括:

7.根据权利要求1所述的一种混合博弈下高阶思维发展的多智能体任务规划方法,其特征在于,步骤S23具体包括:

8.根据权利要求7所述的一种混合博弈下高阶思维发展的多智能体任务规划方法,其特征在于,启发式搜索任务耦合规划算法具体为:>

9.根据权利要求1所述的一种混合博弈下高阶思维发展的多智能体任务规划方法,其特征在于,步骤S3具体包括:

10.根据权利要求9所述的一种混合博弈下高阶思维发展的多智能体任务规划方法,其特征在于,步骤S31中的正交化算法,具体为:

...

【技术特征摘要】

1.一种混合博弈下高阶思维发展的多智能体任务规划方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种混合博弈下高阶思维发展的多智能体任务规划方法,其特征在于,步骤s1具体包括:

3.根据权利要求2所述的一种混合博弈下高阶思维发展的多智能体任务规划方法,其特征在于,步骤s12具体包括:

4.根据权利要求3所述的一种混合博弈下高阶思维发展的多智能体任务规划方法,其特征在于,步骤s12中通过循环依赖去除算法,检测和消除依赖关系图中的循环依赖,具体为:

5.根据权利要求1所述的一种混合博弈下高阶思维发展的多智能体任务规划方法,其特征在于,步骤s21具体包括:

...

【专利技术属性】
技术研发人员:韩中美柯聪聪黄昌勤
申请(专利权)人:浙江师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1