System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于字典的视图库敏感人员数据识别的方法和系统技术方案_技高网

一种基于字典的视图库敏感人员数据识别的方法和系统技术方案

技术编号:41557829 阅读:5 留言:0更新日期:2024-06-06 23:42
本发明专利技术提出了一种基于字典的视图库敏感人员数据识别的方法和系统,通过使用数据匹配引擎进行敏感数据的快速识别,引擎使用接口过滤字典、资产类型字典、数据提取字典、图像范围识别字典、图像质量补偿字典;根据接口过滤字典过滤非标准协议接口,嵌入数据提取字典编号;在数据提取时快速找到数据提取字典,完成所有目标字段的快速提取;根据视频协议探测并生成资产类型字典;图像分析时,根据图像范围识别字典对图像进行裁剪,减少识别范围;根据图像补偿字典提前进行图像补偿,加快敏感数据识别。本发明专利技术所述的系统和方法,为视图库敏感数据的提取与分析提供了一种快速识别的方式。

【技术实现步骤摘要】

本专利技术涉及视频监控领域,提出一种基于字典的视图库敏感数据识别的方法,并基于该方法实现的视图库敏感数据分析系统。在前端设备通过接口传输图像到视图库的过程中,根据定义的字典信息,快速识别并过滤出ga/t1400标准协议的图像数据,提取出待入库的人员图像信息以及相应的摄像头资产信息,从字典中获取该摄像头的图片拍摄特征进行快速图像处理及质量补偿,在人员图像识别后,将甄别到的敏感人员数据进行即时阻断,防止敏感人员数据存入视图库系统中。缩略语及名词解释ga/t1400:规定了公安视频图像信息应用系统的设计原则、系统结构、视频图像信息对象、统一标识编码、系统功能、系统性能、接口协议结构、安全性、电磁兼容性、环境适应性、电源适应性、可靠性、运行与维护等通用技术要求。其中各接口协议结构定义为rest结构,rest服务通过http的方法实现,消息体采用json进行封装。rest:表述性状态转移(representational state transfer)。rest是一种软件架构风格,包括了用于创建具有良好扩展性的web服务的一系列原则。rest是一系列互相协调的限制,可用于设计分布式的超媒体系统,使其具有很高的性能和可维护性。json:是一种轻量级的数据交换格式。


技术介绍

1、随着城市大脑、平安城市等公安安防系统的大规模建设,各地信息化建设不断地深入,视频图像监控数据量增长迅速。各地摄像头24小时不间断图像抓拍,导致一些关键敏感人员也被无差异的拍摄与存储,对这些数据的保密和防止外泄带来了极大的风险。

2、传统的敏感数据过滤方式,是根据http传输的接口文本数据中,根据定义的正则表达式进行关键信息的提取,再根据提取出的图像数据进行人员的识别,匹配到敏感人员的数据进行过滤。这种方式存在以下几个问题影响识别性能:

3、1.ga/t1400基于的是http协议,网络中除了标准的ga/t1400请求,也存在着大量http的其他数据请求,这些请求也被无差别的进行正则表达式的匹配,浪费了大量的时间。

4、2.ga/t1400定义的每个接口中的字段比较多,达几十个。每个字段均需要定义一个正则表达式进行匹配,单个接口的数据提取需要匹配多次规则,耗时长。

5、3.受拍摄环境影响或是型号较老的摄像头,拍摄照片的质量较差。图像识别时每次都需要进行图像质量的预分析来进行图像质量补偿;另外,图像分析时人物的获取是针对图片完整的范围,而实际人物活动范围较图片范围小很多。最终导致图像分析时间长。

6、基于上述问题,传统的敏感数据接口过滤方式,由于冗余的http请求分析、多次使用正则表达式进行数据提取、图像分析慢等原因,导致处理过滤并阻断请求耗用时间长,延时高。因此,需要一种方法来快速识别视图库中的敏感人员信息。


技术实现思路

1、有鉴于此,本专利技术提出了一种基于字典的视图库敏感人员数据识别的方法和系统。通过在网络中串接视图库敏感数据分析系统,定义接口过滤字典、数据提取字典、资产类型字典、图像范围识别字典、图像质量补偿字典,在接口预处理阶段过滤非标准协议接口,在数据提取阶段快速匹配并提取图像数据,在图像分析阶段提前进行图像质量补偿和缩小识别范围,达到快速识别敏感数据的目的。

2、本专利技术所述的一种基于字典的视图库敏感人员数据识别的系统,从三个方面来提高敏感人员数据的分析速度:

3、1.在接口预处理阶段,在网络侧代理拦截到http请求,根据字典中定义的uri识别标准的ga/t1400接口,直接丢弃非标准的请求,并在识别到的http请求头域中添加待使用的数据提取字典的编号,用于快速找到待匹配的字典。

4、2.在接口数据提取阶段,根据字典编号快速找到数据提取字典。根据字典中定义的人员信息、图像信息等字段的位置,在一次请求解析中,直接忽略非目标数据字段,定位到目标字段,完成所有目标字段数据的提取,实现数据的快速提取。

5、3.在图像分析阶段,根据视频协议探测并生成资产类型字典,存储资产编号、厂商、型号等信息。在图像识别前,从资产类型字典中找到设备的厂商和型号,并从图像质量补偿字典中获得该设备的图像补偿参数,直接进行图像补偿。省去了图像补偿前,为得到相关补偿参数而进行的图像质量分析、噪声分析、人员角度识别等预处理的动作,加快图像识别。识别完成后,获得人物活动范围,动态地生成摄像头与人物活动的范围关系,形成图像范围识别字典。经多张图片训练后,待人物活动范围识别基本稳定后,后续直接对图像裁剪以缩小识别范围。仅从人物活动范围中提取人物,不再全图片范围内识别,减少图像识别的大小,提升图像识别效率。

6、图1为本专利技术所述的视图库敏感数据分析系统的内部构成,内部模块包含网络代理模块、数据匹配引擎、接口预处理模块、资产发现模块、数据提取模块、图像分析模块、日志告警模块、数据库模块以及web前台。其中网络代理模块、数据匹配引擎、接口预处理模块、资产发现模块、数据提取模块、图像分析模块为视图库敏感数据分析系统的核心模块,用以提供接口数据的过滤、字典的定义与匹配、图像数据的提取、图像数据分析的功能。

7、1.网络代理模块负责的功能为:

8、1)拦截来自视图库系统间的所有接口访问请求。

9、2)将接收到的数据交由数据匹配引擎进行接口数据匹配,将识别到的包含敏感人员数据的接口执行丢弃动作。

10、2.数据匹配引擎负责管理系统中用到的字典文件,字典文件使用json格式存储,并由数据匹配引擎加载至系统内存哈希池中供其他模块使用,包含接口过滤字典、资产类型字典、数据提取字典、图像范围识别字典、图像质量补偿字典,各类字典负责的功能为:

11、1)接口过滤字典

12、字典文件中包含ga/t1400定义的uri的特征前缀、method、应用的数据提取字典编号。接口预处理模块基于此字典进行接口预处理,并在识别到的http消息头域中增加数据提取字典的编号,用于快速找到待匹配的字典。

13、2)资产类型字典

14、字典文件中包含摄像头编号、设备厂商、设备类型。资产发现模块将发现的摄像头资产存于此字典文件,图像分析模块进行图像分析时,根据此字典中记录的设备厂商和类型得到相应的图像补偿信息,进行快速补偿。

15、3)数据提取字典

16、字典文件中包含ga/t1400定义的消息体内摄像头资产信息、图像信息的字段位置,包括不限于摄像头编号、拍摄时间、人员编号、图像url、图像数据、图像格式、图像宽度、图像高度、图像大小等。各字段的位置以jsonpath形式存储在字典文件中,即“imageheight:xxx.xxx.xxx”。数据提取模块基于此字典按照路径直接找到相应字段进行提取。

17、4)图像范围识别字典

18、字典文件中包含摄像头编号、有效图像的相对位置、有效图像范围的长度和宽度。在字典动态生成阶段,识别的所有人物的活动范围,进行合并,得到最大的人物活动本文档来自技高网...

【技术保护点】

1.一种基于字典的视图库敏感人员数据识别的系统,其特征在于定义接口过滤字典、资产类型字典、数据提取字典、图像范围识别字典、图像质量补偿字典,通过在网络代理流量中过滤非标准协议接口,在数据提取阶段快速匹配并提取图像数据,在图像分析阶段进行提前图像质量补偿和缩小识别范围的方式,以提供视图库中敏感数据的快速识别,该系统包含网络代理模块、数据匹配引擎、接口预处理模块、资产发现模块、数据提取模块、图像分析模块、日志告警模块、数据库模块以及WEB前台,其中:

2.如权利要求1所述的一种基于字典的视图库敏感人员数据识别的系统,其特征在于,根据接口过滤字典识别并丢弃非GA/T1400协议接口,接口过滤字典包含GA/T1400定义的URI的特征前缀、Method、应用的数据提取字典编号。

3.如权利要求1所述的一种基于字典的视图库敏感人员数据识别的系统,其特征在于,根据视频协议主动探知网络中的摄像头设备存储在资产类型字典中,资产类型字典包含摄像头编号、设备厂商、设备类型。

4.如权利要求1所述的一种基于字典的视图库敏感人员数据识别的系统,其特征在于,根据接口预处理中嵌入的数据提取字典编号,从数据提取字典数据中找出目标字段,一次性提取所有的目标字段数据,直接丢弃非字典定义的字段数据,数据提取字典文件中包含GA/T1400定义的消息体内摄像头资产信息、图像信息的字段位置,包括不限于摄像头编号、拍摄时间、人员编号、图像URL、图像数据、图像格式、图像宽度、图像高度、图像大小。

5.如权利要求1所述的一种基于字典的视图库敏感人员数据识别的系统,其特征在于,动态生成图像范围识别字典,分析人物活动范围,匹配一定时间和次数后,生成图像范围识别字典,字典生成阶段结束后由图像分析模块根据此字典信息进行有效范围的裁剪,字典文件中包含摄像头编号、人物活动有效图像的相对位置、人物活动有效图像范围的长度和宽度。

6.如权利要求1所述的一种基于字典的视图库敏感人员数据识别的系统,其特征在于,在资产类型字典中根摄像头编号检索出设备厂商和设备类型,结合图像质量补偿字典中的设备厂商、设备类型和图像补偿参数的关系,与目标敏感人员图像匹配前,根据图像补偿参数提前进行图像质量补偿,字典中包含的图像补偿算法包括不限于图像去噪算法、线性滤波参数、高斯滤波参数、中值滤波参数、亮度调整比例、对比度调整比例、灰度增强参数、饱和度参数、色温调整参数、图像旋转角度。

7.如权利要求1所述的一种基于字典的视图库敏感人员数据识别的系统,其特征在于使用数据匹配引擎进行敏感数据的快速识别,引擎使用接口过滤字典、资产类型字典、数据提取字典、图像范围识别字典、图像质量补偿字典;根据接口过滤字典过滤消息,并在HTTP消息中添加数据提取字典编号,加快字典获取和信息提取速度,根据在资产类型字典找到的资产厂商和类型,在图像补偿字典中提取补偿参数进行图像补偿,从图像范围识别字典中裁剪待识别的图像范围。

8.一种基于字典的视图库敏感人员数据识别的方法其特征在于采用权利要求1-7所述之一种基于字典的视图库敏感人员数据识别的系统,通过对代理的所有流量进行分析,根据接口过滤字典过滤非HTTP请求和非GA/T1400标准的请求数据;通过视频协议RTSP、Onvif、SIP等协议主动探知网络中的摄像头设备,识别摄像头的厂商、类型等信息,存储在资产类型字典中;根据定义的数据提取字典,在消息解析的过程中直接丢弃非字典文件中标识的字段数据;根据一定时间及次数匹配后动态生成的图像范围字典,对图像进行分析前的裁剪;根据图像补偿字典对图像提前进行图像质量补偿,加快人脸匹配速度。

...

【技术特征摘要】

1.一种基于字典的视图库敏感人员数据识别的系统,其特征在于定义接口过滤字典、资产类型字典、数据提取字典、图像范围识别字典、图像质量补偿字典,通过在网络代理流量中过滤非标准协议接口,在数据提取阶段快速匹配并提取图像数据,在图像分析阶段进行提前图像质量补偿和缩小识别范围的方式,以提供视图库中敏感数据的快速识别,该系统包含网络代理模块、数据匹配引擎、接口预处理模块、资产发现模块、数据提取模块、图像分析模块、日志告警模块、数据库模块以及web前台,其中:

2.如权利要求1所述的一种基于字典的视图库敏感人员数据识别的系统,其特征在于,根据接口过滤字典识别并丢弃非ga/t1400协议接口,接口过滤字典包含ga/t1400定义的uri的特征前缀、method、应用的数据提取字典编号。

3.如权利要求1所述的一种基于字典的视图库敏感人员数据识别的系统,其特征在于,根据视频协议主动探知网络中的摄像头设备存储在资产类型字典中,资产类型字典包含摄像头编号、设备厂商、设备类型。

4.如权利要求1所述的一种基于字典的视图库敏感人员数据识别的系统,其特征在于,根据接口预处理中嵌入的数据提取字典编号,从数据提取字典数据中找出目标字段,一次性提取所有的目标字段数据,直接丢弃非字典定义的字段数据,数据提取字典文件中包含ga/t1400定义的消息体内摄像头资产信息、图像信息的字段位置,包括不限于摄像头编号、拍摄时间、人员编号、图像url、图像数据、图像格式、图像宽度、图像高度、图像大小。

5.如权利要求1所述的一种基于字典的视图库敏感人员数据识别的系统,其特征在于,动态生成图像范围识别字典,分析人物活动范围,匹配一定时间和次数后,生成图像范围识别字典,字典生成阶段结束后由图像分析模块根据此字典信息进行有效范围的裁...

【专利技术属性】
技术研发人员:闵超王晓波
申请(专利权)人:慧盾信息安全科技苏州股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1