基于急性呼吸道传染病感染人群的数据分析方法及系统技术方案

技术编号:34950648 阅读:61 留言:0更新日期:2022-09-17 12:27
本发明专利技术公开了一种基于急性呼吸道传染病感染人群的数据分析方法及系统,属于大数据治理中的公共卫生领域,本发明专利技术要解决的技术问题为感染人群数据分散、平台不统一、数据共享不及时、相关人员定位不精准以及协查反馈慢,采用的技术方案为:数据共享交换:通过传染病共享交换中心节点将感染人员数据推送至共享交换子节点;数据融合:数据同步后,利用手机号、姓名以及身份证号码三种关键信息对户籍信息、行程信息、传染病疫苗接种信息以及传染病抗原监测信息进行多源数据匹配及融合,形成感染人员标准库;应用主题库建设;分析展示:基于应用主题库,对感染人员进行一键直查及监测分析。对感染人员进行一键直查及监测分析。对感染人员进行一键直查及监测分析。

【技术实现步骤摘要】
基于急性呼吸道传染病感染人群的数据分析方法及系统


[0001]本专利技术涉及大数据治理中的公共卫生领域,具体地说是一种基于急性呼吸道传染病感染人群的数据分析方法及系统。

技术介绍

[0002]目前传染病防治和管控等信息系统缺乏整体联动,各地方建设的传染病防治管控系统独立建设、分散部署,建设规模、模式、环境、架构不一致,暂未形成标准化、规范化的数据共享模式,急需在现有信息化工作基础上整合完善标准统一、上下协同、互联互通的传染病管理平台。
[0003]同时感染人员数据准确性不足。目前对感染人员协同排查、流调等主要通过人工对涉疫人员手机号码进行手工调查,没有做到人、身份证、手机号“三统一”,提供的手机定位信息也只能精确到地市级,还需要二次计算匹配,将位置信息落位到区县级才能下发使用,导致排查效率低、难度大,难以迅速落地精准排查。同时,由于“时空伴随”数据算法不够精准,导致下发的手机信令数据量较大,基层需逐一电话调查,排查任务重、时间长、不精准。此外,火车、飞机同乘数据算法也尚未根据病毒传播特点进行调整。
[0004]故如何避免感染人群数据分散、平台不统一、数据共享不及时、相关人员定位不精准以及协查反馈慢等漏洞是目前亟待解决的技术问题。

技术实现思路

[0005]本专利技术的技术任务是提供一种基于急性呼吸道传染病感染人群的数据分析方法及系统,来解决感染人群数据分散、平台不统一、数据共享不及时、相关人员定位不精准以及协查反馈慢的问题。
[0006]本专利技术的技术任务是按以下方式实现的,一种基于急性呼吸道传染病感染人群的数据分析方法,该方法具体如下:
[0007]数据共享交换:通过传染病共享交换中心节点将感染人员数据推送至共享交换子节点;
[0008]数据融合:数据同步后,利用手机号、姓名以及身份证号码三种关键信息对户籍信息、行程信息、传染病疫苗接种信息以及传染病抗原监测信息进行多源数据匹配及融合,形成感染人员标准库;
[0009]应用主题库建设:对感染人员协同调查、流行病学调查、隔离管控信息补充补全,形成完整详细的协查信息库、流调信息库、风险人员库和隔离管控人员库;
[0010]分析展示:基于应用主题库,对感染人员进行一键直查及监测分析。
[0011]作为优选,数据共享交换具体如下:
[0012]在共享交换子节点使用kafka group消费组订阅共享交换中心节点的感染风险人员资源目录主题topic;
[0013]在数据新增的情况下,监听到数据和文件变化,通知共享交换子节点通过pull方
式实时将已经使用国密算法SM2/SM3/SM4加密的最新当日和/或最新ID新增原始数据文件拉取至本节点;
[0014]原始数据文件通过数字信封和数据签名的验证,保证数据文件的数据完整性;
[0015]在原始数据文件的完整性验证无误后,通过SM2/SM3/SM4解密算法将数据文件的感染人员数据进行解密为明文数据,同时存入感染人员原始主题库,并对姓名、身份证及手机敏感信息进行加密存储,防止数据泄露。
[0016]作为优选,数据融合具体如下:
[0017]利用BF(暴力匹配)算法依次逐步将姓名、身份证号及手机号匹配其他数据源数据;
[0018]匹配成功后,补齐缺失的姓名、身份证及手机关键数据信息;
[0019]补全数据时,添加补全数据来源,并根据数据来源信息利用Kafka Connect实时监测各类数据变化,进行实时更新补全数据;
[0020]当关键信息数据发生改变和新增,利用incrementing自增模式、timestamp时间戳模式集timestamp+incrementing时间戳自增混合模式三种方式实现新增数据的同步,同时进行关键字段的同步和更新,补全和更新关键字段包括人员姓名、身份证号、停留场所、停留时间、所在位置、传染病疫苗接种及传染病抗原检测信息;
[0021]补全关键信息后,形成融合库,为开展快速流调和感染人员排查提供数据支撑。
[0022]更优地,利用BF(暴力匹配)算法进行数据匹配具体如下:
[0023]在主串中,检查起始位置分别是0、1、2

n

m且长度为m的n

m+1个子串,比对模式串匹配字段,在匹配过程中依次将姓名、身份证号及手机号信息以及人口信息、行程信息、传染病疫苗接种数据及传染病抗原检测的各类数据进行匹配。
[0024]作为优选,应用主题库建设具体如下:
[0025]将融合库信息逐级分配给网格员或者基层单位,由基层人员对传染病风险人员进行流行病学分析和管控信息填报补充,同时将汇集的数据通过实体提取、关系提取、事件抽取及属性抽取的NLP技术对其中文本内容进行关键信息提取;
[0026]经过实体对齐后,将同一风险人员关键信息存储到图数据库Neo4j中,形成涉疫风险人员流调知识图谱,同时形成协查信息库、感染人员信息库及隔离管控人员库应用主题库,最终形成信息完整且可用的高质的数据,实现本感染人员全程可溯、管控、分析等业务闭环分析数据基础。
[0027]作为优选,关键信息包括姓名、性别、年龄、联系电话、住址所在地市、现住址、诊断类型、感染来源、密切接触者信息、发病日期、是否关联聚集性事件、负责流调单位、人员时序GIS空间轨迹和时空伴随人员的信息。
[0028]作为优选,分析展示具体如下:
[0029]利用应用主题库,使用展示本区域“人数清、人头清、位置清和状态清”四清情况,并展示感染人群感染分析和态势分析;
[0030]通过流调、协查及管控信息结合知识图谱推理及GIS地图通过Echart和百度地图API相结合,并采用路径排序算法和TransE算法对风险人员和病例患者的行为轨迹回放、密接人群关系推演、传播模式分析和潜在感染人群发现分析及空间传播地理展示。
[0031]一种基于急性呼吸道传染病感染人群的数据分析系统,该系统包括,
[0032]数据共享交换模块,用于通过订阅共享交换中心节点的感染人员库表数据,完成数据文件的安全推送,并将已经通过国密算法进行加密的原始数据进行存储,形成原始库;
[0033]数据融合模块,用于综合利用身份证信息、行程信息、传染病疫苗接种以及传染病抗原检测信息,补齐风险人员的姓名、证件号码和手机号码、时空伴随人员姓名、伴随时间、伴随人员轨迹及位置信息,并对多源数据信息进行匹配及融合,形成感染人员标准库形成标准库;
[0034]应用主题库建设模块,用于对感染人员协同调查、流行病学调查、隔离管控信息补充补全,形成完整详细的协查信息库、流调信息库、风险人员库和隔离管控人员库;
[0035]分析展示模块,用于基于应用主题库,进行感染人员的人群、轨迹及传播模式的相关梳理分析展示,形成可监控、可预测、可预警的人员排查、管控及分析体系,为传染病防控提供科学的决策数据支持。
[0036]一种电子设备,包括:存储器和至少本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于急性呼吸道传染病感染人群的数据分析方法,其特征在于,该方法具体如下:数据共享交换:通过传染病共享交换中心节点将感染人员数据推送至共享交换子节点;数据融合:数据同步后,利用手机号、姓名以及身份证号码三种关键信息对户籍信息、行程信息、传染病疫苗接种信息以及传染病抗原监测信息进行多源数据匹配及融合,形成感染人员标准库;应用主题库建设:对感染人员协同调查、流行病学调查、隔离管控信息补充补全,形成完整详细的协查信息库、流调信息库、风险人员库和隔离管控人员库;分析展示:基于应用主题库,对感染人员进行一键直查及监测分析。2.根据权利要求1所述的基于急性呼吸道传染病感染人群的数据分析方法,其特征在于,数据共享交换具体如下:在共享交换子节点使用kafka group消费组订阅共享交换中心节点的感染风险人员资源目录主题topic;在数据新增的情况下,监听到数据和文件变化,通知共享交换子节点通过pull方式实时将已经使用国密算法SM2/SM3/SM4加密的最新当日和/或最新ID新增原始数据文件拉取至本节点;原始数据文件通过数字信封和数据签名的验证;在原始数据文件的完整性验证无误后,通过SM2/SM3/SM4解密算法将数据文件的感染人员数据进行解密为明文数据,同时存入感染人员原始主题库,并对姓名、身份证及手机敏感信息进行加密存储。3.根据权利要求1所述的基于急性呼吸道传染病感染人群的数据分析方法,其特征在于,数据融合具体如下:利用BF算法依次逐步将姓名、身份证号及手机号匹配其他数据源数据;匹配成功后,补齐缺失的姓名、身份证及手机关键数据信息;补全数据时,添加补全数据来源,并根据数据来源信息利用Kafka Connect实时监测各类数据变化,进行实时更新补全数据;当关键信息数据发生改变和新增,利用incrementing自增模式、timestamp时间戳模式集timestamp+incrementing时间戳自增混合模式三种方式实现新增数据的同步,同时进行关键字段的同步和更新,补全和更新关键字段包括人员姓名、身份证号、停留场所、停留时间、所在位置、传染病疫苗接种及传染病抗原检测信息;补全关键信息后,形成融合库。4.根据权利要求3所述的基于急性呼吸道传染病感染人群的数据分析方法,其特征在于,利用BF算法进行数据匹配具体如下:在主串中,检查起始位置分别是0、1、2

n

m且长度为m的n

m+1个子串,比对模式串匹配字段,在匹配过程中依次将姓名、身份证号及手机号信息以及人口信息、行程信息、传染病疫苗接种数据及传染病抗原检测的各类数据进行匹配。5.根据权利要求1所述的基于急性呼吸道传染病感染人群的数据分析方法,其特征在于,...

【专利技术属性】
技术研发人员:刘昊东李向阳
申请(专利权)人:山东健康医疗大数据有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1