一种基于节点相似度的流行病传播网络重构方法和系统技术方案

技术编号:28129128 阅读:20 留言:0更新日期:2021-04-19 11:48
本发明专利技术涉及一种基于节点相似度的流行病传播网络重构方法和系统,属于流行病数据重构分析领域,首先整合流调报告初步建立局部流行病传播网络,接着基于网络结构和节点属性定义了三类流行病传播网络的节点相似性指标,然后通过计算节点对的相似性指标向局部流行病传播网络中添加可能的缺失边来重构流行病传播网络,最后对比了不同指标下的网络重构准确度,本发明专利技术解决了现有流行病分析中传播链难挖掘、传播特征难以准确分析、大量流调报告利用率低等问题,构建出了能够如实反映病毒传播途径的流行病传播网络,可以基于构建的流行病传播网络有效挖掘流行病传播链,分析病毒传播速度,预测病毒的时空传播范围。预测病毒的时空传播范围。

【技术实现步骤摘要】
一种基于节点相似度的流行病传播网络重构方法和系统


[0001]本专利技术涉及一种基于节点相似度的流行病传播网络重构方法和系统,属于流行病数据重构分析


技术介绍

[0002]自古以来,人类社会便遭受着各种各样流行病的侵扰,其中有些疾病对人类的发展历程产生了深远的影响。面对流行病的传播,如何抓紧病毒传播窗口期,切实控制传染源,切断传播途径是遏制疫情传播蔓延的关键。然而,随着现代交通的发展,由于公共交通低廉的出行成本和政府政策的鼓励,越来越多的城市居民选择公共交通作为日常出行方式,乘客之间频繁的近距离接触无法避免。在这种背景下,流行病一旦爆发,其特点往往是空间传播范围广,传播路径难以挖掘。
[0003]流行病学调查,简称“流调”,是疫情应对中的一项基本工作,通过调查流行病病例的发病和就诊情况、临床特征、危险因素和暴露史等流行病学相关信息,能够为判定密切接触者、划定消毒范围等提供依据。单独的个案流调报告或聚集性流调报告往往只能反映某一例或几例病例之间的传播关系,不能挖掘出流行病的传播特征和传播链,因此需要整合大量流调报告,通过构建网络的方法将不同病例的传播情况建立联系。然而,目前关于整合大量流调报告的研究只针对流行病的宏观层面进行基本统计分析(如病例的性别、年龄分布等),并未从微观层面上分析流行病是如何在个体之间进行传播的。此外,由于调查时间及范围的限制、被调查者隐瞒或遗忘等原因,流调报告中的人员接触信息是不完整的,存在接触情况的缺失问题。

技术实现思路

[0004]针对现有技术的不足,本专利技术提供一种基于节点相似度的流行病传播网络重构方法和系统,首先整合大量流调报告初步建立局部流行病传播网络,接着基于网络结构和节点属性定义了三类流行病传播网络的节点相似性指标,然后通过计算节点对的相似性指标向局部流行病传播网络中添加可能的缺失边来重构流行病传播网络,最后对比了不同指标下的网络重构准确度,本专利技术采用的基于节点相似度的流行病传播网络重构方案,解决了现有流行病分析中传播链难挖掘、传播特征难以准确分析、大量流调报告利用率低等问题,构建出了能够如实反映病毒传播途径的流行病传播网络,可以基于构建的流行病传播网络有效挖掘流行病传播链,分析病毒传播速度,预测病毒的时空传播范围,有助于制定防控策略,具有良好的实际应用价值。
[0005]本专利技术的目的在于提供一种基于节点相似度的流行病传播网络重构方法和系统,在考虑到现有流行病分析中传播链难挖掘、传播特征难以准确分析、大量流调报告利用率低等问题,采用本专利技术提出的流行病传播网络重构方法能够有效利用流调报告的信息,并结合多源数据渠道,构建出能够如实反映病毒传播途径的流行病传播网络,并且为流行病分析提供了一种新思路

可以基于构建的流行病传播网络有效挖掘流行病传播链,分析病
毒传播速度,预测病毒的时空传播范围。
[0006]本专利技术采用以下技术方案:
[0007]一种基于节点相似度的流行病传播网络重构方法,包括:
[0008]步骤1:基于流调报告建立局部流行病传播网络;
[0009]步骤2:定义节点相似度指标;
[0010]步骤3:基于节点相似度指标重构流行病传播网络。
[0011]优选的,所述步骤1具体为:通过整合流调报告绘制流调报告汇总表,提取其中的节点集和连边集来构建局部流行病传播网络,并定义网络中的缺失边,包括以下步骤:
[0012]1.1、整合流调报告;
[0013]1.2、提取节点集和连边集;
[0014]1.3、建立局部流行病传播网络;
[0015]1.4、定义流行病传播网络的缺失边。
[0016]优选的,所述步骤1.1具体为:
[0017]汇总所有已获得的流调报告(此处假定能够获得的流调报告中只包含确诊病例及其密接的信息,而不包含密接的密接信息),从中提取病例信息,包括基本人员情况、发病和就诊情况、临床特征、危险因素、暴露史、密接人员等特征,绘制流调报告汇总表,其中,流调报告汇总表的索引为所有确诊病例,表头为病例的所有特征,以便步骤1.2 提取流行病传播网络的节点集和连边集;接着,基于整合好的病例信息分析传染病的流行病学特征,包括确诊病例、疑似病例等随时间变化情况,确诊病例的地区分布情况,确诊病例的人群特征,死亡数、粗病死率和病死率密度等;
[0018]优选的,所述步骤1.2具体为:
[0019]首先,提取流调报告汇总表中的所有确诊病例,将其作为流行病传播网络中的确诊病例节点集V1;接着,提取流调报告汇总表中的“密接人员”特征列,将该列的所有密接人员作为流行病传播网络中的密接人员节点集V2;然后,去除确诊病例节点集V1和密接人员节点集V2中的重复节点,如果某节点同时出现在V1和V2中,则直接删除V2中的该节点,在此基础上,汇总确诊病例节点集V1和密接人员节点集V2,得到人员节点集V,即V=V1∪V2;最后,从人员节点集V中任意选择两个节点V
x
、V
y
,如果流调报告中记录了这两个节点所代表的两个人员之间存在密接关系,则认为节点对V
x
、V
y
之间存在连边e
xy
,通过遍历人员节点集V中的所有节点的两两组合得到连边集E0;
[0020]优选的,所述步骤1.3具体为:
[0021]整合步骤1.2得到的人员节点集V和连边集E0即可得到基于流调报告建立的局部流行病传播网络G0,局部流行病传播网络包含两类人员节点(确诊病例节点和密接人员节点);由于步骤1.1假定流调报告中只包含确诊病例及其密接的信息,而不包含密接的密接信息,因此根据步骤1.2所构建的局部流行病传播网络中只包含“确诊病例与密接人员连边”和“确诊病例与确诊病例连边”这以及两类连边;
[0022]优选的,所述步骤1.4具体为:
[0023]由于调查时间及范围的限制、被调查者隐瞒或遗忘等原因,步骤1.3建立的局部流行病传播网络G0中可能存在两个节点之间具有密接关系但流调时未被记录的情况,此时将这两个节点之间的连边定义为流行性传播网络的缺失边;根据节点的种类不同,可将缺失
边分为三种类型:确诊病例与确诊病例连边、确诊病例与其他确诊病例的密接人员连边、密接人员与密接人员连边;基于步骤2所提出的方法,步骤3对上述缺失边进行挖掘。
[0024]优选的,所述步骤2具体为:为了挖掘步骤1.4提出的缺失边,考虑网络结构和节点属性,分别提出了三种流行病传播网络中的节点相似度指标,从而为步骤3的缺失边挖掘和网络重构提供方法支撑,包括以下步骤:
[0025]2.1、定义基于网络结构的相似度指标;
[0026]2.2、定义基于节点属性的相似度指标;
[0027]2.3、定义基于网络结构和节点属性的相似度指标。
[0028]优选的,所述步骤2.1具体为:
[0029]考虑如果在局部流行病传播网络G0中,两个未相连的人员节点(既包含确诊病例节点,也包含本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于节点相似度的流行病传播网络重构方法,其特征在于,包括:步骤1:基于流调报告建立局部流行病传播网络;步骤2:定义节点相似度指标;步骤3:基于节点相似度指标重构流行病传播网络。2.根据权利要求1所述的基于节点相似度的流行病传播网络重构方法,其特征在于,所述步骤1,包括以下步骤:1.1、整合流调报告;1.2、提取节点集和连边集;1.3、建立局部流行病传播网络;1.4、定义流行病传播网络的缺失边。3.根据权利要求2所述的基于节点相似度的流行病传播网络重构方法,其特征在于,所述步骤1.1具体为:汇总所有已获得的流调报告,此处假定能够获得的流调报告中只包含确诊病例及其密接的信息,而不包含密接的密接信息,从中提取病例信息,包括基本人员情况、发病和就诊情况、临床特征、危险因素、暴露史、密接人员特征,绘制流调报告汇总表,其中,流调报告汇总表的索引为所有确诊病例,表头为病例的所有特征;接着,基于整合好的病例信息分析传染病的流行病学特征,包括确诊病例、疑似病例等随时间变化情况,确诊病例的地区分布情况,确诊病例的人群特征,死亡数、粗病死率和病死率密度;所述步骤1.2具体为:首先,提取流调报告汇总表中的所有确诊病例,将其作为流行病传播网络中的确诊病例节点集V1;接着,提取流调报告汇总表中的“密接人员”特征列,将该列的所有密接人员作为流行病传播网络中的密接人员节点集V2;然后,去除确诊病例节点集V1和密接人员节点集V2中的重复节点,如果某节点同时出现在V1和V2中,则直接删除V2中的该节点,在此基础上,汇总确诊病例节点集V1和密接人员节点集V2,得到人员节点集V,即V=V1∪V2;最后,从人员节点集V中任意选择两个节点V
x
、V
y
,如果流调报告中记录了这两个节点所代表的两个人员之间存在密接关系,则认为节点对V
x
、V
y
之间存在连边e
xy
,通过遍历人员节点集V中的所有节点的两两组合得到连边集E0;所述步骤1.3具体为:整合步骤1.2得到的人员节点集V和连边集E0即可得到基于流调报告建立的局部流行病传播网络G0,局部流行病传播网络包含两类人员节点,即确诊病例节点和密接人员节点;由于步骤1.1假定流调报告中只包含确诊病例及其密接的信息,而不包含密接的密接信息,因此根据步骤1.2所构建的局部流行病传播网络中只包含“确诊病例与密接人员连边”和“确诊病例与确诊病例连边”这以及两类连边;所述步骤1.4具体为:步骤1.3建立的局部流行病传播网络G0中存在两个节点之间具有密接关系但流调时未被记录的情况,此时将这两个节点之间的连边定义为流行性传播网络的缺失边;根据节点的种类不同,将缺失边分为三种类型:确诊病例与确诊病例连边、确诊病例与其他确诊病例的密接人员连边、密接人员与密接人员连边。4.根据权利要求1所述的基于节点相似度的流行病传播网络重构方法,其特征在于,所
述步骤2包括以下步骤:2.1、定义基于网络结构的相似度指标;2.2、定义基于节点属性的相似度指标;2.3、定义基于网络结构和节点属性的相似度指标。5.根据权利要求4所述的基于节点相似度的流行病传播网络重构方法,其特征在于,所述步骤2.1具体为:如果在局部流行病传播网络G0中,两个未相连的人员节点有很多共同邻居节点,即共同密接接触者,此处的人员节点既包含确诊病例节点,也包含密接人员节点,那么这两个节点之间很大可能存在缺失边;根据节点之间的共同邻居数来定义基于网络结构的相似度指标S
结构
,即:式中,表示节点对V
x
、V
y
基于网络结构的相似度指标,其值越大说明节点对V
x
、V
y
之间存在连边的可能性越高;Γ(x)和Γ(y)分别代表节点V
x
和节点V
y
的邻居;所述步骤2.2具体为:以轨迹为例提出...

【专利技术属性】
技术研发人员:王晖李学庆刘诗炎李大庆李建欣
申请(专利权)人:北京航空航天大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1