一种目标区域数据分析方法、系统及电子设备技术方案

技术编号:37248786 阅读:17 留言:0更新日期:2023-04-20 23:27
一种目标区域数据分析方法,包括:采用基于卡方检验的方法,对未检测人员关键属性进行判断;采用基于区域摄像头采集数据,对相关人员是否属于该区域信息进行判断;基于确诊人员和知识图谱技术,获取密接人员和目标区域关系图;根据未检测检测人员关键属性、相关人员是否属于该区域信息和取密接人员和目标区域关系图,对目标区域数据进行分析。本发明专利技术能够快速整合不同部门的数据,打破数据孤岛,同时利用高科技手段填补实有人口数据中的漏报、漏登人员,减轻基层工作人员负担,帮助政府部门有的放矢,精准管理。对于目标区域内相关人员未检测原因进行排查,助力应检尽检,进一步降低疫情传播风险,对有困难的人员能够精准帮扶。对有困难的人员能够精准帮扶。对有困难的人员能够精准帮扶。

【技术实现步骤摘要】
一种目标区域数据分析方法、系统及电子设备


[0001]本专利技术涉及的是数据分析领域,特别涉及一种目标区域数据分析方法、系统及电子设备。

技术介绍

[0002]随着新时代的要求,新形势下对目标楼栋、社区、区域的管理成为大部分管理部门的新选择。此举把对人员流动、经济发展的影响控制在最小范围,同时也对相关目标区域的精细化管理提出新的挑战。
[0003]目前相关单位使用的各类信息平台普遍存在数据壁垒,不同部门间接入了不同数据且未打通,数据有重复、未清洗、时效不足等问题,形成了很多信息孤岛。在区域目标期间时间紧,任务重,需要在短时间内整合各个部门的数据,同时筛选出有效数据进行分析。现有技术中,如何在短时间内从不同部门多个维度的繁杂数据中提取有用信息助力精准施策的问题亟待解决。

技术实现思路

[0004]鉴于上述问题,提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的一种目标区域数据分析方法、系统及电子设备。
[0005]为了解决上述技术问题,本申请实施例公开了如下技术方案:
[0006]一种目标区域数据分析方法,包括:
[0007]S100.采用基于卡方检验的方法,对未检测人员关键属性进行判断;
[0008]S200.采用基于区域摄像头采集数据,对相关人员是否属于该区域信息进行判断;
[0009]S300.基于确诊人员和知识图谱技术,获取密接人员和目标区域关系图;
[0010]S400.根据未检测检测人员关键属性、相关人员是否属于该区域信息和取密接人员和目标区域关系图,对目标区域数据进行分析。
[0011]进一步的,S100的具体方法包括:
[0012]S101.将不同平台的数据经过ETL操作导入至大数据集群;
[0013]S102.建设数据仓库,根据业务需求将其分为来源库、原始库、资源库和应用库四层结构;
[0014]S103.将户籍、一标三实、人脸采集数据合并去重后过滤掉殡葬火化人员作为目标区域内实有人口数据;
[0015]S104.结合专家经验和未检测人员相关维度属性,推测未检测人员为孕产妇、年老行动不便人员或婴幼儿;
[0016]S105.筛选出具有上述相关属性的人员,将相关属性数据分别与未检测人员数据联立处理,判断相关属性人员是否对检测有影响;
[0017]S106.获取目标区域内具有关键属性的人员信息并推送给对应工作人员。
[0018]进一步的,将相关属性数据分别与未检测人员数据联立处理,具体包括:选用卡方
检验评价该属性与是否检测间的关系,首先假设该属性对未检测有影响,选择四格表卡方检验,求出实际的观测值;所用的算法公式为:
[0019][0020]其中A代表实际观测值,T代表理论推断值,先假设样本的实际观测值与理论值之间没有显著性差异,如果假设检验成立,A和T的值不会相差过大;最后得出的χ2值,如果大于则表明该假设不成立,反之则成立。
[0021]进一步的,S200的具体方法包括:
[0022]S201.小区出入口的摄像头在感知到人员、车辆出入时会即时抓拍人脸信息,同时将信息回传至服务器;
[0023]S202.服务器上的人脸信息处理进程在接收到人脸信息时会将其加入队列,然后异步加载人脸信息至数据库;
[0024]S203.通过AI智能识别人脸信息,获取对应人员的身份证号、姓名信息;
[0025]S204.统计相关人员每周车辆、骑行、步行进出平均次数以及小区周边核酸检测点近一个月核酸检测次数;
[0026]S205.利用KMEANS算法将各个字段的数据分为高、中、低三类,过滤出确定属于或不属于该小区人员的信息,新增是否属于该区域字段,得到训练样本;
[0027]S206.根据贝叶斯定理计算P(x
i
|C)的概率,其中x
i
代表某个条件,C代表是否属于该区域人员;
[0028]S207.根据拉普拉斯定理对概率进行平滑处理;
[0029]S208.筛选出尚不明确是否属于该区域的人员信息,利用极大似然估计计算出属于该区域的概率P1和不属于该区域的概率P2,若P1>P2则表明该人员属于该区域;
[0030]S209.将待补充的人员信息与实有人口表信息合并,生成完整的区域实有人口信息表,帮助目标区域精细化管理。
[0031]进一步的,贝叶斯定理公式为:
[0032][0033]P(c)是类先验概率,P(x|c)是类标记c的似然概率,d代表X中总共有多少样本。
[0034]进一步的,S300的具体方法包括:
[0035]S301.获取确诊人员的身份证号、姓名信息;
[0036]S302.根据确诊人员行程信息与现有人、地、事、物、组织数据融合形成知识图谱,不同的维度的数据聚合在同一知识图谱中,图谱节点间指向是相互的;
[0037]S303.将确诊人员节点的初始值设为10,其余节点的初始值设为1,计算各个节点的RANK值;以确诊人员的RANK最低值为目标关注线,获取RANK值高于目标关注线的非确诊人员和场所信息作为目标关注对象;
[0038]S304.将目标关注对象发送给一线工作人员,助力目标人员的管控和目标区域的消杀工作。
[0039]进一步的,计算每个节点的RANK值,所用算法公式为:
[0040][0041]其中,i和j分别代表某个节点i和除i外的任意一个节点,N代表图谱中节点总数,L(j)代表节点j有多少个指向节点,q代表阻尼系数,确诊人员节点的初始值为10,其他节点初始值为1,最终每个节点的Rank值由其指向节点个数及指向节点的值决定。
[0042]本专利技术还公开了一种目标区域数据分析系统,包括:照相采集模块、大数据组件模块、数据计算模块、知识图谱模块、消息发送模块;其中:
[0043]照相采集模块,提供了一组包含摄像头的智能硬件设备,当其感知到有人员经过时,会主动抓拍人脸信息,并利用网卡将信息回传至服务器;
[0044]大数据组件模块,能为PB级别数据提供高效的数据计算、存储和传输服务,组件采用分布式集群,多节点设备,能够保证在某地机器全部宕机的情况下数据不丢失,具有极高的容灾能力;
[0045]数据计算模块,基于SPARK计算引擎提供基于内存的高效计算服务,同时提供了丰富的机器学习算子;提供的异步队列能短时间内处理大量信息,同时能够设置调度任务合理利用服务器资源;
[0046]知识图谱模块,选用开源分布式图数据库NebulaGraph,提供了网页查询功能和丰富的API,能够高效、快速地生成知识图谱和处理多层级的数据;
[0047]消息发送模块,能够基于网卡,给手机推送邮件或短信,同时具备批量发送的能力。
[0048]本专利技术还公开了一种电子设备,包括:
[0049]存储器,用于存储可由处理器执行的指令;
[0050]处本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种目标区域数据分析方法,其特征在于,包括:S100.采用基于卡方检验的方法,对未检测人员关键属性进行判断;S200.采用基于区域摄像头采集数据,对相关人员是否属于该区域信息进行判断;S300.基于确诊人员和知识图谱技术,获取密接人员和目标区域关系图;S400.根据未检测检测人员关键属性、相关人员是否属于该区域信息和取密接人员和目标区域关系图,对目标区域数据进行分析。2.如权利要求1所述的一种目标区域数据分析方法,其特征在于,S100的具体方法包括:S101.将不同平台的数据经过ETL操作导入至大数据集群;S102.建设数据仓库,根据业务需求将其分为来源库、原始库、资源库和应用库四层结构;S103.将户籍、一标三实、人脸采集数据合并去重后过滤掉殡葬火化人员作为目标区域内实有人口数据;S104.结合专家经验和未检测人员相关维度属性,推测未检测人员为孕产妇、年老行动不便人员或婴幼儿;S105.筛选出具有上述相关属性的人员,将相关属性数据分别与未检测人员数据联立处理,判断相关属性人员是否对检测有影响;S106.获取目标区域内具有关键属性的人员信息并推送给对应工作人员。3.如权利要求2所述的一种目标区域数据分析方法,其特征在于,将相关属性数据分别与未检测人员数据联立处理,具体包括:选用卡方检验评价该属性与是否检测间的关系,首先假设该属性对未检测有影响,选择四格表卡方检验,求出实际的观测值;所用的算法公式为:其中A代表实际观测值,T代表理论推断值,先假设样本的实际观测值与理论值之间没有显著性差异,如果假设检验成立,A和T的值不会相差过大;最后得出的χ2值,如果大于则表明该假设不成立,反之则成立。4.如权利要求1所述的一种目标区域数据分析方法,其特征在于,S200的具体方法包括:S201.小区出入口的摄像头在感知到人员、车辆出入时会即时抓拍人脸信息,同时将信息回传至服务器;S202.服务器上的人脸信息处理进程在接收到人脸信息时会将其加入队列,然后异步加载人脸信息至数据库;S203.通过AI智能识别人脸信息,获取对应人员的身份证号、姓名信息;S204.统计相关人员每周车辆、骑行、步行进出平均次数以及小区周边核酸检测点近一个月核酸检测次数;S205.利用KMEANS算法将各个字段的数据分为高、中、低三类,过滤出确定属于或不属于该小区人员的信息,新增是否属于该区域字段,得到训练样本;
S206.根据贝叶斯定理计算P(x
i
|C)的概率,其中x
i
代表某个条件,C代表是否属于该区域人员;S207.根据拉普拉斯定理对概率进行平滑处理;S208.筛选出尚不明确是否属于该区域的人员信息...

【专利技术属性】
技术研发人员:刘恒张龙涛
申请(专利权)人:武汉众智数字技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1