基于注意力机制的人群疏散仿真方法及系统技术方案

技术编号：41793795 阅读：2 留言：0更新日期：2024-06-24 20:19

本发明专利技术公开了一种基于注意力机制的人群疏散仿真方法及系统，属于人群疏散计算机仿真技术领域。包括：获取真实疏散场景，基于真实疏散场景构建的疏散仿真场景模型，并通过人群基本信息对疏散仿真场景模型进行初始化设置；对待疏散人群进行分组并选出每组的领导者和跟随者，基于疏散仿真场景模型，通过双层路径规划方法获取待疏散人群的疏散路径；其中，在顶层，通过引入多头注意力机制的MADDPG算法对领导者进行全局路径规划，获取最优路径；在底层，将跟随者视为智能体通过避障算法进行避障规划，以使跟随者以最优无碰撞速度跟随领导者沿最优路径疏散。能够更好地指导人群进行疏散，提高疏散效率，解决现有人群疏散仿真效率低的问题。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及人群疏散计算机仿真，特别是涉及一种基于注意力机制的人群疏散仿真方法及系统。

技术介绍

1、本部分的陈述仅仅是提到了与本专利技术相关的
技术介绍
，并不必然构成现有技术。

2、随着城市化进程和社会经济的高速发展，城市居民的人口规模大幅增加，人群疏散问题已经成为公共安全领域的重要组成部分，当人群聚集在复杂多样的建筑物和公共设施中，发生拥挤踩踏事故的概率会提高。

3、如何有效避免发生人群踩踏事故，保护人民的生命健康和财产安全成为当前公共管理领域亟待解决的难题。在此背景下，合理规划人群疏散路径被视为预防安全事故的关键措施。然而实地疏散演练难以组织且成本过高，疏散过程难以重现，也不适用于目前复杂的建筑物。因此，基于计算机仿真的疏散模拟技术已成为了当下研究人群疏散的主要手段。

4、现有的人群疏散仿真模型大多基于假设性的场景和规则，没有考虑真实的情况，没有把仿真模型与真实场景结合在一起，但真实场景中蕴涵着大量的信息，现有的模型缺乏对其有效的保存和利用。因此，提高计算机仿真技术的真实性是研究者们亟待解决的问题。

5、为了解决现有的路径规划方法疏散效率低的问题，提高疏散仿真的效率，近些年来不少研究者将人工智能领域的研究热点-深度强化学习引入到人群疏散领域。在人群疏散的背景下，深度强化学习能够根据实时变化的环境条件和人群行为快速做出决策，同时考虑到复杂的空间结构、人流动态和可能出现的障碍，从而更有效地指导人群疏散过程，除此之外，深度强化学习也应用在了多智能体领域，使多智能体之间共同合作，解决高维问题。

6、lowe等人提出的多智能体深度确定性策略梯度(multi-agent deepdeterministic policy gradient，maddpg)算法提高了人群整体的疏散效率，但是该算法也存在一些问题，比如算法前期的随机决策会导致盲目搜索的情况，某些经验被重复搜索，而且当疏散场景比较复杂时动作和状态空间巨大，会存在信息冗余，智能体不能从大量信息中获取关键信息，降低了智能体的学习效率。这些问题严重影响了maddpg算法在人群疏散领域的应用。

技术实现思路

1、为了解决现有技术的不足，本专利技术提供了一种基于注意力机制的人群疏散仿真方法、系统、电子设备及计算机可读存储介质，将多头注意力机制和随机网络蒸馏引入多智能体深度确定性策略梯度(multi-agent deep deterministic policy gradient，maddpg)算法，使其适用于更加具体的环境和需求，能够更好地指导人群进行疏散，提高疏散效率。

2、第一方面，本专利技术提供了一种基于注意力机制的人群疏散仿真方法；

3、一种基于注意力机制的人群疏散仿真方法，包括：

4、获取真实疏散场景，基于真实疏散场景构建的疏散仿真场景模型，并通过人群基本信息对疏散仿真场景模型进行初始化设置；

5、对待疏散人群进行分组并选出每组的领导者和跟随者，基于疏散仿真场景模型，通过双层路径规划方法获取待疏散人群的疏散路径；

6、其中，在顶层，通过引入多头注意力机制的maddpg算法对领导者进行全局路径规划，获取最优路径；在底层，将跟随者视为智能体通过避障算法进行避障规划，以使跟随者以最优无碰撞速度跟随领导者沿最优路径疏散。

7、进一步的，使用k-medoids算法对待疏散人群进行分组，并量化领导者特点，以选出每组的领导者和跟随者。

8、进一步的，通过引入多头注意力机制的maddpg算法对领导者进行全局路径规划包括：

9、引入多头注意力机制的maddpg算法对领导者进行全局路径规划，得到所有成功疏散的路径并存储至经验池；

10、遍历经验池中所有路径，根据预设的奖励函数对每条路径进行评估，获取最优路径。

11、优选的，在智能体的actor网络中，通过多头注意力机制对输入状态进行处理，获取多个向量，基于动作空间，根据多个向量进行动作选择；

12、在智能体的critic网络中，通过多头注意力机制对输入状态和动作进行处理，获取智能体的编码向量，根据编码向量计算每个智能体的价值函数，获取累计奖励。

13、进一步的，将随机网络蒸馏引入maddpg算法，通过随机网络蒸馏计算内在奖励，以指导智能体学习。

14、进一步的，将跟随者视为智能体通过避障算法进行避障规划包括：

15、确定智能体的速度障碍区域，智能体根据速度障碍区域生成可行速度空间；

16、根据可行速度空间，计算智能体的无碰撞速度并筛选出最优无碰撞速度；

17、根据领导者的位置，确定智能体的行进方向，以使智能体根据行进方向和最优无碰撞速度进行位置更新。

18、进一步的，使用yolo v3目标检测模型从真实疏散场景中提取特征作为maddpg算法的状态空间。

19、第二方面，本专利技术提供了一种基于注意力机制的人群疏散仿真系统；

20、一种基于注意力机制的人群疏散仿真系统，包括：

21、初始化模块，被配置为：获取真实疏散场景，基于真实疏散场景构建的疏散仿真场景模型，并通过人群基本信息对疏散仿真场景模型进行初始化设置；

22、疏散仿真模块，被配置为：对待疏散人群进行分组并选出每组的领导者和跟随者，基于疏散仿真场景模型，通过双层路径规划方法获取待疏散人群的疏散路径；

23、其中，在顶层，通过引入多头注意力机制的maddpg算法对领导者进行全局路径规划，获取最优路径；在底层，将跟随者视为智能体通过避障算法进行避障规划，以使跟随者以最优无碰撞速度跟随领导者沿最优路径疏散。

24、第三方面，本专利技术提供了一种电子设备；

25、一种电子设备，包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令，所述计算机指令被处理器运行时，完成上述基于注意力机制的人群疏散仿真方法的步骤。

26、第四方面，本专利技术提供了一种计算机可读存储介质；

27、一种计算机可读存储介质，用于存储计算机指令，所述计算机指令被处理器执行时，完成上述基于注意力机制的人群疏散仿真方法的步骤。

28、与现有技术相比，本专利技术的有益效果是：

29、1、本专利技术提供的技术方案，将随机网络蒸馏rnd引入maddpg算法，将rnd提供的内在奖励与环境给予的外在奖励相结合代替常规的奖励函数，使得智能体能更好的探索环境，提高学习效率。

30、2、本专利技术提供的技术方案，将多头注意力机制引入maddpg算法，通过多头注意力机制来加强信息筛选，使智能体更加关注与其协作的智能体的状态和行为，以便更好的完成疏散任务；提高了模型对输入数据的理解和表示能力，在处理输入时可以同时关注输入的不同方面，并将不同方面进行合并；有助于提升模型对复杂输入的处理效果，并更准确地捕捉不同方面之间的交互和依赖关系。

31、3、本发本文档来自技高网...

【技术保护点】

1.基于注意力机制的人群疏散仿真方法，其特征在于，包括：

2.如权利要求1所述的基于注意力机制的人群疏散仿真方法，其特征在于，使用K-medoids算法对待疏散人群进行分组，并量化领导者特点，以选出每组的领导者和跟随者。

3.如权利要求1所述的基于注意力机制的人群疏散仿真方法，其特征在于，通过引入多头注意力机制的MADDPG算法对领导者进行全局路径规划包括：

4.如权利要求3所述的基于注意力机制的人群疏散仿真方法，其特征在于，

5.如权利要求1所述的基于注意力机制的人群疏散仿真方法，其特征在于，将随机网络蒸馏引入MADDPG算法，通过随机网络蒸馏计算内在奖励，以指导智能体学习。

6.如权利要求1所述的基于注意力机制的人群疏散仿真方法，其特征在于，将跟随者视为智能体通过避障算法进行避障规划包括：

7.如权利要求1所述的基于注意力机制的人群疏散仿真方法，其特征在于，使用YOLOV3目标检测模型从真实疏散场景中提取特征作为MADDPG算法的状态空间。

8.基于注意力机制的人群疏散仿真系统，其特征在于，包括：

9.一种电子设备，其特征在于，包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令，所述计算机指令被处理器运行时，完成权利要求1-7任一项所述的方法。

10.一种计算机可读存储介质，其特征在于，用于存储计算机指令，所述计算机指令被处理器执行时，完成权利要求1-7任一项所述的方法。

...

【技术特征摘要】

1.基于注意力机制的人群疏散仿真方法，其特征在于，包括：

2.如权利要求1所述的基于注意力机制的人群疏散仿真方法，其特征在于，使用k-medoids算法对待疏散人群进行分组，并量化领导者特点，以选出每组的领导者和跟随者。

3.如权利要求1所述的基于注意力机制的人群疏散仿真方法，其特征在于，通过引入多头注意力机制的maddpg算法对领导者进行全局路径规划包括：

4.如权利要求3所述的基于注意力机制的人群疏散仿真方法，其特征在于，

5.如权利要求1所述的基于注意力机制的人群疏散仿真方法，其特征在于，将随机网络蒸馏引入maddpg算法，通过随机网络蒸馏计算内在奖励，以指导智能体学习。

6.如权利要...

【专利技术属性】
技术研发人员：刘弘，张冲，李文浩，魏宏来，孙磊，杜林楠，
申请(专利权)人：山东师范大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人