一种基于大数据的信息安全分析方法和系统技术方案

技术编号:39050665 阅读:13 留言:0更新日期:2023-10-12 19:43
本发明专利技术适用于信息安全技术领域,尤其涉及一种基于大数据的信息安全分析方法和系统,所述方法包括:获取待传输数据,从待传输数据中提取未检测图像;对未检测图像进行像素分析,将未检测图像划分为第一类图像和第二类图像;对第一类图像进行文本识别以及二维码识别,提取图像内容信息;根据图像内容信息进行模拟执行操作,根据模拟执行操作的结果判定对应未检测图像的安全性。本发明专利技术通过对待传输数据进行图像的提取,对提取的图像进行内容识别,根据识别得到的内容在隔离沙箱中进行模拟访问,从而判定访问页面的安全性,基于识别结果判定图像的安全性,实现了对图像数据的安全评估,保证了信息安全。证了信息安全。证了信息安全。

【技术实现步骤摘要】
一种基于大数据的信息安全分析方法和系统


[0001]本专利技术属于信息安全
,尤其涉及一种基于大数据的信息安全分析方法和系统。

技术介绍

[0002]信息安全的定义为:为数据处理系统建立和采用的技术、管理上的安全保护,为的是保护计算机硬件、软件、数据不因偶然和恶意的原因而遭到破坏、更改和泄露。
[0003]在当前的信息传输过程中,为了保证数据安全,通常会对数据进行扫描,但是对于图片内容,往往直接认为其为安全数据,因此如何对图片内容进行安全性检测,成为了保证数据安全的重要一环。

技术实现思路

[0004]本专利技术实施例的目的在于提供一种基于大数据的信息安全分析方法,旨在解决现有技术无法对图像数据进行安全性管理的问题。
[0005]本专利技术实施例是这样实现的,一种基于大数据的信息安全分析方法,所述方法包括:
[0006]获取待传输数据,从待传输数据中提取未检测图像;
[0007]对未检测图像进行像素分析,将未检测图像划分为第一类图像和第二类图像,所述第一类图像中包含可读取数据,第二类图像中不包含可读取内容;
[0008]对第一类图像进行文本识别以及二维码识别,提取图像内容信息;
[0009]根据图像内容信息进行模拟执行操作,根据模拟执行操作的结果判定对应未检测图像的安全性。
[0010]优选的,所述对未检测图像进行像素分析,将未检测图像划分为第一类图像和第二类图像的步骤,具体包括:
[0011]对未检测图像进行预处理,将其转化为二值图像;
[0012]对二值化图像中的像素进行统计,按照像素的灰度值进行像素分类,得到多个像素区域;
[0013]对各个像素区域进行形状识别,判定其是否包含文本或者二维码,据此将其划分为第一类图像和第二类图像。
[0014]优选的,所述对第一类图像进行文本识别以及二维码识别,提取图像内容信息的步骤,具体包括:
[0015]对第一类图像进行文本识别,得到文本识别结果;
[0016]对第一类图像进行二值化处理后,提取各个像素区域,提取二维码图像;
[0017]基于文本识别结果和二维码图像进行信息提取,得到图像内容信息。
[0018]优选的,所述根据图像内容信息进行模拟执行操作,根据模拟执行操作的结果判定对应未检测图像的安全性的步骤,具体包括:
[0019]创建隔离沙箱,对图像内容信息进行内容扩充,得到扩充访问链接;
[0020]在隔离沙箱中构建虚拟系统,并按照顺序对扩充访问链接进行逐个访问,得到访问界面;
[0021]记录进入各个访问界面的过程中被调取的数据内容并识别访问界面,判定是否存在风险链接,若存在,则判定对应未检测图像存在风险。
[0022]优选的,判定未检测图像存在风险时,对该未检测图像进行拦截。
[0023]优选的,对未检测图像进行拦截之后,以预设图像对其进行替换。
[0024]本专利技术实施例的另一目的在于提供一种基于大数据的信息安全分析系统,所述系统包括:
[0025]数据获取模块,用于获取待传输数据,从待传输数据中提取未检测图像;
[0026]图像分类模块,用于对未检测图像进行像素分析,将未检测图像划分为第一类图像和第二类图像,所述第一类图像中包含可读取数据,第二类图像中不包含可读取内容;
[0027]图像内容提取模块,用于对第一类图像进行文本识别以及二维码识别,提取图像内容信息;
[0028]安全性检测模块,用于根据图像内容信息进行模拟执行操作,根据模拟执行操作的结果判定对应未检测图像的安全性。
[0029]优选的,所述图像分类模块包括:
[0030]二值化处理单元,用于对未检测图像进行预处理,将其转化为二值图像;
[0031]像素分区单元,用于对二值化图像中的像素进行统计,按照像素的灰度值进行像素分类,得到多个像素区域;
[0032]识别分类单元,用于对各个像素区域进行形状识别,判定其是否包含文本或者二维码,据此将其划分为第一类图像和第二类图像。
[0033]优选的,所述图像内容提取模块包括:
[0034]文本识别单元,用于对第一类图像进行文本识别,得到文本识别结果;
[0035]二维码提取单元,用于对第一类图像进行二值化处理后,提取各个像素区域,提取二维码图像;
[0036]内容识别单元,用于基于文本识别结果和二维码图像进行信息提取,得到图像内容信息。
[0037]优选的,所述安全性检测模块包括:
[0038]链接扩充单元,用于创建隔离沙箱,对图像内容信息进行内容扩充,得到扩充访问链接;
[0039]链接访问模块,用于在隔离沙箱中构建虚拟系统,并按照顺序对扩充访问链接进行逐个访问,得到访问界面;
[0040]风险判定单元,用于记录进入各个访问界面的过程中被调取的数据内容并识别访问界面,判定是否存在风险链接,若存在,则判定对应未检测图像存在风险。
[0041]本专利技术实施例提供的一种基于大数据的信息安全分析方法,通过对待传输数据进行图像的提取,对提取的图像进行内容识别,根据识别得到的内容在隔离沙箱中进行模拟访问,从而判定访问页面的安全性,基于识别结果判定图像的安全性,实现了对图像数据的安全评估,保证了信息安全。
附图说明
[0042]图1为本专利技术实施例提供的一种基于大数据的信息安全分析方法的流程图;
[0043]图2为本专利技术实施例提供的对未检测图像进行像素分析,将未检测图像划分为第一类图像和第二类图像的步骤的流程图;
[0044]图3为本专利技术实施例提供的对第一类图像进行文本识别以及二维码识别,提取图像内容信息的步骤的流程图;
[0045]图4为本专利技术实施例提供的根据图像内容信息进行模拟执行操作,根据模拟执行操作的结果判定对应未检测图像的安全性的步骤的流程图;
[0046]图5为本专利技术实施例提供的一种基于大数据的信息安全分析系统的架构图;
[0047]图6为本专利技术实施例提供的一种图像分类模块的架构图;
[0048]图7为本专利技术实施例提供的一种图像内容提取模块的架构图;
[0049]图8为本专利技术实施例提供的一种安全性检测模块的架构图。
具体实施方式
[0050]为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。
[0051]可以理解,本申请所使用的术语“第一”、“第二”等可在本文中用于描述各种元件,但除非特别说明,这些元件不受这些术语限制。这些术语仅用于将第一个元件与另一个元件区分。举例来说,在不脱离本申请的范围的情况下,可以将第一xx脚本称为第二xx脚本,且类似地,可将第二xx脚本称为第一xx脚本。
[0052]如图1所示,为本专利技术实施例提供的一种基于大数据的信息安全分析方法的流程图,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于大数据的信息安全分析方法,其特征在于,所述方法包括:获取待传输数据,从待传输数据中提取未检测图像;对未检测图像进行像素分析,将未检测图像划分为第一类图像和第二类图像,所述第一类图像中包含可读取数据,第二类图像中不包含可读取内容;对第一类图像进行文本识别以及二维码识别,提取图像内容信息;根据图像内容信息进行模拟执行操作,根据模拟执行操作的结果判定对应未检测图像的安全性。2.根据权利要求1所述的基于大数据的信息安全分析方法,其特征在于,所述对未检测图像进行像素分析,将未检测图像划分为第一类图像和第二类图像的步骤,具体包括:对未检测图像进行预处理,将其转化为二值图像;对二值化图像中的像素进行统计,按照像素的灰度值进行像素分类,得到多个像素区域;对各个像素区域进行形状识别,判定其是否包含文本或者二维码,据此将其划分为第一类图像和第二类图像。3.根据权利要求2所述的基于大数据的信息安全分析方法,其特征在于,所述对第一类图像进行文本识别以及二维码识别,提取图像内容信息的步骤,具体包括:对第一类图像进行文本识别,得到文本识别结果;对第一类图像进行二值化处理后,提取各个像素区域,提取二维码图像;基于文本识别结果和二维码图像进行信息提取,得到图像内容信息。4.根据权利要求2所述的基于大数据的信息安全分析方法,其特征在于,所述根据图像内容信息进行模拟执行操作,根据模拟执行操作的结果判定对应未检测图像的安全性的步骤,具体包括:创建隔离沙箱,对图像内容信息进行内容扩充,得到扩充访问链接;在隔离沙箱中构建虚拟系统,并按照顺序对扩充访问链接进行逐个访问,得到访问界面;记录进入各个访问界面的过程中被调取的数据内容并识别访问界面,判定是否存在风险链接,若存在,则判定对应未检测图像存在风险。5.根据权利要求4所述的基于大数据的信息安全分析方法,其特征在于,判定未检测图像存在风险时,对该未检测图像进行拦截。6.根据权利要求5所述的基于大数据的信...

【专利技术属性】
技术研发人员:陶继伟
申请(专利权)人:深圳市赛凌伟业科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1