System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及强化学习,尤其涉及个体移动干预方法、设备、存储介质和程序产品。
技术介绍
1、目前,通常利用个体的具体行为和接触网络,定制化地为每个人制定流行病控制策略。
2、然而,这种方式在面对复杂城市中的大量个体时,通常面临着巨大的计算负担,尤其是在大规模人群的动态变化情况下,难以实时生成有效的流行病控制策略,无法及时进行个体移动干预。
3、因此,相关技术中存在个体移动干预的实时性较差的技术问题。
技术实现思路
1、本申请的主要目的在于提供一种个体移动干预方法、设备、存储介质和程序产品,旨在解决个体移动干预的实时性较差的技术问题。
2、为实现上述目的,本申请提出一种个体移动干预方法,所述的方法包括:
3、获取对待管控城市进行划分得到的多个时空区域内的流行病相关数据,各所述时空区域分别对应一个智能体;
4、通过各所述智能体分别对应的强化学习算法,对对应时空区域的流行病相关数据进行计算,得到对应时空区域的目标干预措施;
5、基于所述目标干预措施,对对应时空区域内的个体进行移动干预。
6、在一实施例中,所述通过各所述智能体分别对应的强化学习算法,对对应时空区域的流行病相关数据进行计算,得到对应时空区域的目标干预措施的步骤,包括:
7、基于所述多个时空区域内的流行病相关数据,计算全局的流行病相关数据;
8、通过各所述智能体分别对应的强化学习算法,对对应时空区域的流行病相关数据,以及全局
9、在一实施例中,所述基于所述目标干预措施,对对应时空区域内的个体进行移动干预的步骤之后,包括:
10、获取移动干预后的各时空区域内的感染个体数量;
11、基于各所述时空区域对应的感染个体数量、预设干预成本、健康与社会经济之间的预设平衡权重,以及预设倾向权重,通过预设奖励函数计算奖励值,其中,所述预设倾向权重用于表征倾向采取干预措施或者倾向控制成本;
12、基于所述奖励值,对所述强化学习算法进行迭代训练,直至达到感染人数和干预成本最小化的目标,以更新所述智能体。
13、在一实施例中,所述预设干预成本是对应时空区域采取的目标干预措施的成本之和;所述预设平衡权重是基于对应时空区域的经济系统的承受能力以及医疗系统的承受能力确定的。
14、在一实施例中,所述基于所述目标干预措施,对对应时空区域内的个体进行移动干预的步骤,包括:
15、基于各所述时空区域对应的目标干预措施、预设的不同干预措施的干预人数限制,确定各所述时空区域内的可干预个体比例;
16、基于各所述时空区域内的可干预个体比例,确定各所述时空区域内的目标个体,对对应时空区域内的目标个体进行移动干预。
17、在一实施例中,所述基于各所述时空区域内的可干预个体比例,确定各所述时空区域内的目标个体的步骤,包括:
18、基于各所述时空区域的流行病相关数据中第一时间段内的确诊病例访问的场所,确定所述第一时间段内的高风险场所;
19、基于所述流行病相关数据,确定在第二时间段内访问所述高风险场所的第一个体的感染风险;
20、基于所述第一个体的社会属性,确定所述第一个体的社交接触风险;
21、基于所述感染风险、社交接触风险以及所述可干预个体比例,从各所述时空区域对应第一个体中确定目标个体。
22、在一实施例中,所述基于所述感染风险、社交接触风险以及所述可干预个体比例,从各所述时空区域对应第一个体中确定目标个体的步骤,包括:
23、将所述第一个体按所述感染风险从高到低进行排序,当所述第一个体中存在感染风险为零的个体和/或者存在感染风险相同的个体时,将所述感染风险为零的个体和/或者所述感染风险相同的个体按所述社交接触风险从高到低进行排序,得到排序后的第二个体,其中,若排序越靠前,则干预优先级越高;
24、基于所述可干预个体比例和所述干预优先级,从所述第二个体中确定目标个体。
25、此外,为实现上述目的,本申请还提出一种个体移动干预设备,所述设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序配置为实现如上文所述的个体移动干预方法的步骤。
26、此外,为实现上述目的,本申请还提出一种存储介质,所述存储介质为计算机可读存储介质,所述存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上文所述的个体移动干预方法的步骤。
27、此外,为实现上述目的,本申请还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,所述计算机程序被处理器执行时实现如上文所述的个体移动干预方法的步骤。
28、本申请提出的一个或多个技术方案,至少具有以下技术效果:
29、本申请获取对待管控城市进行划分得到的多个时空区域内的流行病相关数据;通过各所述智能体分别对应的强化学习算法,对对应时空区域的流行病相关数据进行计算,得到对应时空区域的目标干预措施,由于各所述时空区域分别对应一个智能体,各智能体能够分别对各时空区域的流行病相关数据进行计算,各智能体所需计算的数据量减少,降低了计算负担;因此,即使在大规模人群的动态变化情况下,也能够实时生成有效的目标干预措施,基于所述目标干预措施,对对应时空区域内的个体进行移动干预,从而实现及时地进行个体移动干预。
本文档来自技高网...【技术保护点】
1.一种个体移动干预方法,其特征在于,所述的方法包括:
2.如权利要求1所述的方法,其特征在于,所述通过各所述智能体分别对应的强化学习算法,对对应时空区域的流行病相关数据进行计算,得到对应时空区域的目标干预措施的步骤,包括:
3.如权利要求1所述的方法,其特征在于,所述基于所述目标干预措施,对对应时空区域内的个体进行移动干预的步骤之后,包括:
4.如权利要求3所述的方法,其特征在于,所述预设干预成本是对应时空区域采取的目标干预措施的成本之和;所述预设平衡权重是基于对应时空区域的经济系统的承受能力以及医疗系统的承受能力确定的。
5.如权利要求1所述的方法,其特征在于,所述基于所述目标干预措施,对对应时空区域内的个体进行移动干预的步骤,包括:
6.如权利要求5所述的方法,其特征在于,所述基于各所述时空区域内的可干预个体比例,确定各所述时空区域内的目标个体的步骤,包括:
7.如权利要求6所述的方法,其特征在于,所述基于所述感染风险、社交接触风险以及所述可干预个体比例,从各所述时空区域对应第一个体中确定目标个体的步骤
8.一种个体移动干预设备,其特征在于,所述设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序配置为实现如权利要求1至7中任一项所述的个体移动干预方法的步骤。
9.一种存储介质,其特征在于,所述存储介质为计算机可读存储介质,所述存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的个体移动干预方法的步骤。
10.一种计算机程序产品,其特征在于,所述计算机程序产品包括计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的个体移动干预方法的步骤。
...【技术特征摘要】
1.一种个体移动干预方法,其特征在于,所述的方法包括:
2.如权利要求1所述的方法,其特征在于,所述通过各所述智能体分别对应的强化学习算法,对对应时空区域的流行病相关数据进行计算,得到对应时空区域的目标干预措施的步骤,包括:
3.如权利要求1所述的方法,其特征在于,所述基于所述目标干预措施,对对应时空区域内的个体进行移动干预的步骤之后,包括:
4.如权利要求3所述的方法,其特征在于,所述预设干预成本是对应时空区域采取的目标干预措施的成本之和;所述预设平衡权重是基于对应时空区域的经济系统的承受能力以及医疗系统的承受能力确定的。
5.如权利要求1所述的方法,其特征在于,所述基于所述目标干预措施,对对应时空区域内的个体进行移动干预的步骤,包括:
6.如权利要求5所述的方法,其特征在于,所述基于各所述时空区域内的可干预个体比例,确...
【专利技术属性】
技术研发人员:罗羽枭,尹凌,朱克忞,
申请(专利权)人:中国科学院深圳先进技术研究院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。