无场景限制应急逃生智能体决策生成方法和系统技术方案

技术编号:37960684 阅读:9 留言:0更新日期:2023-06-30 09:35
本发明专利技术属于应急逃生决策计算技术领域,涉及一种无场景限制应急逃生智能体决策生成方法和系统,包括:获得若干智慧体采集的灾害场景环境信息,根据所述环境信息生成事故场景时间序列信息;将事故场景时间序列信息划分为若干均匀块,根据均匀块确定智慧体环境多模态数据;根据多模态数据生成灾害场景演变的可视化模型;根据多模态数据构建情绪模型,计算当前智能体的情绪因子;根据灾害场景环境信息通过随机模型获得随机因子;对灾害逃离决策体模型进行训练,得出成熟的灾害逃离决策体模型;将待测场景的环境信息输入成熟的灾害逃离决策体模型生成最佳智能体应急逃生决策。其能够实时计算任意灾害场所最优逃生策略,有效引导人群疏散,降低损失。降低损失。降低损失。

【技术实现步骤摘要】
无场景限制应急逃生智能体决策生成方法和系统


[0001]本专利技术涉及一种无场景限制应急逃生智能体决策生成方法和系统,属于应急逃生决策计算


技术介绍

[0002]研究表明,在灾害发生时,人群疏散受到多模态数据影响,合理的逃生行为对逃生成功率至关重要。但是在突发场景下,人难以瞬间做出正确逃生决策行为,同时聚集人群存在许多潜在危险,容易形成逃生踩踏以及其他难以抗拒的行为,此时需要场所管理人员依据应急方案正确疏导人群逃生。此时,好的应急方案可以大大提高场所安全性,减少事故造成的伤亡。
[0003]采用多智能体并行训练的强化学习模型,可以有效获取灾害场所的物理场信息,由此训练决策模型,使得该模型在耦合灾害物理场中可以做出最佳逃生行为决策,从而引导事故场景中的人群疏散,降低损失,提高事故存活率。
[0004]现有的多智能体并行训练的强化学习逃生模型无法考虑到具有时间序列的物理场数据、场地的静态元素与动态元素、人群碰撞、多感官数据情绪模型以及随机因子,只能根据预设好的场景数据进行的决策。本专利技术针对上述问题进行改进和优化,在极大程度上还原了发生灾害时,人群的真实行为。多智能体在训练时将自行避让场景中的人与障碍物,加入情绪因子后,少部分多智能体可能会受到消极情绪的影响,无法冷静应对灾情,模拟了真实发生灾情时,人群反应的多样性。另外,现有的多智能体并行训练的强化学习逃生模型无法依据时间序列变换物理场数据或者无法依据感官来划分场景数据,使得训练完成的逃生模型没有普遍性与真实性,本专利技术可作为任意灾情下的实时逃生演练模型,根据灾情演变的局部信息以及场地元素,构建虚拟器官,分别获得视、听、嗅、触多角度数据,通过训练得到最合理的应急预案和逃生行为。

技术实现思路

[0005]针对上述问题,本专利技术的目的是提供了一种无场景限制应急逃生智能体决策生成方法、系统和可读介质,其能够实时计算任意场所的灾害最优逃生行为,从而有效引导事故场景中的人群疏散,降低损失,为场地提供应急预案。
[0006]为实现上述目的,本专利技术提出了以下技术方案:一种无场景限制应急逃生智能体决策生成方法,包括:获得若干智慧体采集的灾害场景环境信息事故场景时间序列信息,根据所述环境信息生成事故场景时间序列信息;将所述事故场景时间序列信息划分为若干均匀块,根据所述均匀块确定智慧体环境多模态数据;根据所述智慧体环境多模态数据生成灾害场景演变的可视化模型;根据所述智慧体环境多模态数据构建情绪模型,计算当前智能体的情绪因子;根据灾害场景环境信息通过随机模型获得随机因子;通过智慧体环境多模态数据、情绪因子、随机因子和可视化模型对所述灾害逃离决策体模型进行训练,得出成熟的灾害逃离决策体模型;将待测场景的环境信息输入所述成熟的灾害逃离决策体模型生
成最佳智能体应急逃生决策。
[0007]进一步,所述灾害场景环境信息为使用虚拟传感器模拟真实人体,生成的灾害场景多模态数据的感知结果,所述灾害场景环境信息包括静态元素和动态元素,所述动态元素包括:演变动态灾害时间序列信息和不演变动态元素,所述演变动态灾害时间序列信息通过CAE获得事故发展时间序列规律,将所述事故发展时间序列规律、静态元素和不演变动态元素结合获得灾害场景时间序列信息。
[0008]进一步,将所述事故场景时间序列信息划分为若干均匀块的方法为:按照预设二维矩阵获取所述灾害场景时间序列信息的矩阵分片数据,将两个分片数据间的单元立方体作为单元格,记录每一个所述单元格的索引,并计算所述单元格在其内部节点之间的演变动态灾害时间序列信息;遍历所有所述单元格,从而得到三维均匀块矩阵,并对所述灾害场景时间序列信息中的每个节点数据进行预处理。
[0009]进一步,所述均匀块确定智慧体环境多模态数据的方法为:通过矩形切片或圆形切片,实时获取智能体周围均匀块的环境信息,得到所述智能体周围的多模态环境数据。
[0010]进一步,当所述智能体周围的多模态数据存在较多的危险元素数据,所述情绪因子较大;当所述智能体周围的多模态数据存在较少的危险元素数据,所述情绪因子较少。
[0011]进一步,所述随机因子为随机模型给所述不演变动态元素的开关赋予的操作值,用于表征灾害场景中存在的不演变动态元素的开闭概率。
[0012]进一步,所述通过智慧体环境多模态数据、情绪因子、随机因子和可视化模型对所述灾害逃离决策体模型进行训练,使用相对位置势函数构建正向奖励函数和负向奖励函数,所述正向奖励函数用于奖励智能体靠近出口的逃生行为,所述负向奖励函数用于惩罚智能体靠近危险元素的行为。
[0013]进一步,所述得出成熟的灾害逃离决策体模型的方法为:对所述灾害逃离决策体模型进行训练直至首个智能体成功逃生,将所述智能体在逃生时对应灾害逃离决策体模型复制至下一次的智能体群。
[0014]本专利技术还公开了一种无场景限制应急逃生智能体决策生成系统,包括:环境信息获取模块,用于获得若干智慧体采集的灾害场景环境信息;多模态数据获取模块,用于将所述环境信息划分为若干均匀块,根据所述均匀块确定智慧体环境多模态数据;可视化模型获取模块,用于根据所述智慧体环境多模态数据生成灾害场景演变的可视化模型;情绪因子获取模块,用于根据所述智慧体环境多模态数据构建情绪模型,计算当前智能体的情绪因子;随机因子获取模块,用于根据灾害场景环境信息通过随机模型获得随机因子;模型训练模块,用于通过智慧体环境多模态数据、情绪因子、随机因子和可视化模型对所述灾害逃离决策体模型进行训练,得出成熟的灾害逃离决策体模型;模型输出模块,用于将待测场景的环境信息输入所述成熟的灾害逃离决策体模型生成最佳智能体应急逃生决策。
[0015]本专利技术还公开了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行以实现如上述任一项所述的无场景限制应急逃生智能体决策生成方法。
[0016]本专利技术由于采取以上技术方案,其具有以下优点:
[0017]1、本专利技术能够实时计算任意灾害场所中的最优逃生行为,从而有效引导事故场景中的人群疏散,降低损失,为场地提供应急预案。
[0018]2、本专利技术借助灾害场景构建软件建立灾害场景演变的可视化模型,更加立体的展现灾害演变的全过程。
[0019]3、本专利技术通过将灾害场景时间序列信息划分为若干均匀块,减少了场景灾害数据处理数据量,进一步减少了训练成本。
[0020]4、本专利技术依据人在逃生时的真实感受,将环境信息分为听觉、视觉、嗅觉、触觉等多种数据,使得训练模型能够更加真实地反映出人在逃生时的决策行为。
[0021]5、本专利技术将环境因素划分为静态元素与动态元素,动态元素包含了演变动态元素与不演变动态元素,考虑到了门窗、隔离带等可以人为操作的物品,丰富训练场景环境,增加训练有效性。
[0022]6、本专利技术使用多智能体并行训练可以显著的提高强化学习的效率,增强模型精度。
[0023]7、本专利技术增加了情绪模型与社会动力学,真实的反映了灾害发生时人群的情绪本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种无场景限制应急逃生智能体决策生成方法,其特征在于,包括:获得若干智慧体采集的灾害场景环境信息,根据所述环境信息生成事故场景时间序列信息;将所述事故场景时间序列信息划分为若干均匀块,根据所述均匀块确定智慧体环境多模态数据;根据所述智慧体环境多模态数据生成灾害场景演变的可视化模型,将智能体的虚拟器官设置在所述可视化模型中,获得感知模型;根据所述感知模型构建情绪模型,计算当前智能体的情绪因子;根据所述环境信息和所述感知模型通过随机模型获得随机因子;通过智慧体环境多模态数据、情绪因子、随机因子和可视化模型对所述灾害逃离决策体模型进行训练,得出成熟的灾害逃离决策体模型;将待测场景的环境信息输入所述成熟的灾害逃离决策体模型生成最佳智能体应急逃生决策。2.如权利要求1所述的无场景限制应急逃生智能体决策生成方法,其特征在于,所述灾害场景环境信息为使用虚拟传感器模拟真实人体,生成的灾害场景多模态数据的感知结果,所述灾害场景环境信息包括静态元素和动态元素,所述动态元素包括:演变动态灾害时间序列信息和不演变动态元素,所述演变动态灾害时间序列信息通过CAE获得事故发展时间序列规律,将所述事故发展时间序列规律、静态元素和不演变动态元素结合获得灾害场景时间序列信息。3.如权利要求2所述的无场景限制应急逃生智能体决策生成方法,其特征在于,将所述事故场景时间序列信息划分为若干均匀块的方法为:按照预设二维矩阵获取所述灾害场景时间序列信息的矩阵分片数据,将两个分片数据间的单元立方体作为单元格,记录每一个所述单元格的索引,并计算所述单元格在其内部节点之间的演变动态灾害时间序列信息;遍历所有所述单元格,从而得到三维均匀块矩阵,并对所述灾害场景时间序列信息中的每个节点数据进行预处理。4.如权利要求1所述的无场景限制应急逃生智能体决策生成方法,其特征在于,所述均匀块确定智慧体环境多模态数据的方法为:通过矩形切片或圆形切片,实时获取智能体周围均匀块的环境信息,得到所述智能体周围的多模态环境数据。5.如权利要求1所述的无场景限制应急逃生智能体决策生成方法,其特征在于,当所述智能体周围的多模态数据存在较多的危险元素数据,...

【专利技术属性】
技术研发人员:陈超丁乐薛娜傅佳豪祁俊龙万超纪杨旭
申请(专利权)人:华北科技学院中国煤矿安全技术培训中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1