System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术属于信息安全,具体涉及一种基于多源异构日志的数据交互路径关联推理方法、系统。
技术介绍
1、数据作为数字经济时代下新的生产要素,在流动共享中实现价值创造,同时也面临着被泄露的巨大风险。数据安全已成为国家安全的重要组成部分,我国相继发布了多个法律法规强化数据安全监管,其中数据溯源是数据安全监管的重要组成部分。传统数据溯源装置通过核心交换机侧的流量镜像等手段,捕获所有流经http(hyper text transferprotocol,超文本传输协议)服务器和数据库服务器的输入、输出信息,再据此通过比对数据记录的id(identity,身份标识)号、字段内容等,确定http服务器和数据库表的关系。
2、随着数据安全等级的不断提升,传统的流量解析已无法解密高安全等级的加密数据流量,也无法将带有隐私信息的数据记录直接转发到数据溯源装置上。在数据溯源装置上,http服务器的访问日志记录和数据库访问日志记录仅记录了部分请求响应信息,不涉及敏感信息。因此,http请求分析与数据库请求分析只能独立工作,在进行数据溯源时无法将http请求分析和数据库请求分析关联起来以获得更加全面的数据信息,数据溯源的准确性差。
技术实现思路
1、为克服上述现有技术的不足,本专利技术提供一种基于多源异构日志的数据交互路径关联推理方法,包括:
2、基于http服务器的日志数据,生成http交互日志数组列表,根据所述http交互日志数组列表中的访问时间列表构造对应的时间位图,根据时间位图
3、基于数据库的日志数据,生成数据库交互日志数组列表,根据所述数据库交互日志数组列表中的访问时间列表构造对应的时间位图,根据时间位图和所述数据库交互日志数组列表生成访问表模式数组列表;
4、对所述访问路径模式数组列表和所述访问表模式数组列表进行关联推理,确定访问路径模式列表和所述访问表模式列表之间的关联数组列表。
5、优选的,所述基于http服务器的日志数据,生成http交互日志数组列表,包括:
6、对http服务器的每条日志数据进行解析,获得解析后的每条http日志数据;
7、对解析后的每条http日志数据进行归一化处理,获得每条http日志数组;
8、根据所述每条http日志数组获得所述http交互日志数组列表。
9、优选的,所述解析后的每条http日志数据包括时间戳、源ip、源端口、目的ip、目的端口、请求url、请求长度、响应代码、响应长度;
10、所述每条http日志数组包括访问时间、访问动作、访问路径、访问请求者标识、访问响应者标识;
11、所述对解析后的每条http日志数据进行归一化处理包括:
12、基于所述http日志数据的时间戳生成所述访问时间;基于所述http日志数据的http协议的合法请求方法生成所述访问动作;基于所述http日志数据的http请求中的url生成所述访问路径,所述访问路径包括url路径和请求参数;基于所述http日志数据的http请求的源ip生成所述访问请求者标识;基于所述http日志数据的目的ip和目的端口生成所述访问响应者标识。
13、优选的,所述根据所述http交互日志数组列表中的访问时间列表构造对应的时间位图,根据时间位图和所述http交互日志数组列表生成访问路径模式数组列表包括:
14、将http交互日志数组列表中的访问路径的请求参数的参数值修改为参数名,获得参数处理后的http交互日志数组列表;
15、对参数处理后的所述http交互日志数组列表按照访问动作、访问路径二元组进行聚合操作,对每一访问动作、访问路径二元组构造对应的访问时间列表、访问请求者标识列表、访问响应者标识列表,生成每一访问路径模式集合;
16、基于每一访问路径模式集合中的访问时间列表构造对应的时间位图,生成对应的访问路径模式数组;其中,时间位图包括访问时间位图和扩展访问时间位图;
17、根据每一访问路径模式数组生成所述访问路径模式数组列表。
18、优选的,所述基于数据库的日志数据,生成数据库交互日志数组列表,包括:
19、对数据库的每条日志数据进行解析,获得解析后的每条数据库日志数据;
20、对解析后的每条数据库日志数据进行归一化处理,获得每条数据库日志数组;
21、根据所述每条数据库日志数据数组获得所述数据库交互日志数组列表。
22、优选的,所述解析后的每条数据库的日志数据包括时间戳、源ip、源端口、目的ip、目的端口、请求信息;
23、所述每条数据库日志数组包括访问时间、数据处理动作、访问表标识、访问请求者标识、访问响应者标识;
24、所述对解析后的每条数据库的日志数据进行归一化处理包括:
25、基于所述数据库日志数据的时间戳生成所述访问时间;在语句语法分析器中将日志中的语句转化为抽象语法树中抽取获得所述数据处理动作;在语句语法分析器中将日志中的语句转化为抽象语法树中抽取获得所述访问表标识;基于所述数据库日志数据的数据库请求的源ip生成所述访问请求者标识;基于所述数据库日志数据的目的ip和目的端口生成所述访问响应者标识。
26、优选的,所述根据所述数据库交互日志数组列表中的访问时间列表构造对应的时间位图,根据时间位图和所述数据库交互日志数组列表生成访问表模式数组列表包括:
27、将所述数据库交互日志数组列表按照数据处理动作、访问表标识二元组进行聚合操作,对每一数据处理动作、访问表标识二元组构造对应的访问时间列表、访问请求者标识列表、访问响应者标识列表,生成每一访问表模式集合;
28、基于每一访问表模式集合中的访问时间列表构造对应的时间位图,生成对应的访问表模式数组;其中,时间位图包括访问时间位图和扩展访问时间位图;
29、根据每一访问表模式数组生成所述访问表模式数组列表。
30、优选的,所述对所述访问路径模式数组列表和所述访问表模式数组列表进行关联推理,确定访问路径模式列表和所述访问表模式列表之间的关联数组列表包括:
31、基于每一所述访问路径模式数组,根据所述访问路径模式数组中的时间位图与每一所述访问表模式数组中的时间位图的匹配度,筛选出与所述访问路径模式数组关联的访问表模式数组列表。
32、优选的,所述根据所述访问路径模式数组中的时间位图与每一所述访问表模式数组中的时间位图的匹配度,筛选出与所述访问路径模式数组关联的访问表模式数组列表,包括:
33、将所述访问路径模式数组中访问时间位图与每一所述访问表模式数组的扩展访问时间位图进行按位与运算,获得每一结果位图中1的个数;
34、将所述每一结果位图中1的个数与所述访问路径模式数组中访问时间位图中第二数值的个数的比值确定为访问路径模式数组本文档来自技高网...
【技术保护点】
1.一种基于多源异构日志的数据交互路径关联推理方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述基于HTTP服务器的日志数据,生成HTTP交互日志数组列表,包括:
3.根据权利要求2所述的方法,其特征在于,所述解析后的每条HTTP日志数据包括时间戳、源IP、源端口、目的IP、目的端口、请求URL、请求长度、响应代码、响应长度;
4.根据权利要求3所述的方法,其特征在于,所述根据所述HTTP交互日志数组列表中的访问时间列表构造对应的时间位图,根据时间位图和所述HTTP交互日志数组列表生成访问路径模式数组列表包括:
5.根据权利要求1所述的方法,其特征在于,所述基于数据库的日志数据,生成数据库交互日志数组列表,包括:
6.根据权利要求5所述的方法,其特征在于,所述解析后的每条数据库的日志数据包括时间戳、源IP、源端口、目的IP、目的端口、请求信息;
7.根据权利要求6所述的方法,其特征在于,所述根据所述数据库交互日志数组列表中的访问时间列表构造对应的时间位图,根据时间位图和所述数据库
8.根据权利要求4所述的方法,其特征在于,所述对所述访问路径模式数组列表和所述访问表模式数组列表进行关联推理,确定访问路径模式列表和所述访问表模式列表之间的关联数组列表包括:
9.根据权利要求8所述的方法,其特征在于,所述根据所述访问路径模式数组中的时间位图与每一所述访问表模式数组中的时间位图的匹配度,筛选出与所述访问路径模式数组关联的访问表模式数组列表,包括:
10.根据权利要求7所述的方法,其特征在于,所述对所述访问路径模式数组列表和所述访问表模式数组列表进行关联推理,确定访问路径模式列表和所述访问表模式列表之间的关联数组列表包括:
11.根据权利要求10所述的方法,其特征在于,所述根据访问表模式数组中的时间位图与每一访问路径模式数组中的时间位图的匹配度筛选出与访问表模式数组关联的访问路径模式数组列表,包括:
12.根据权利要求4所述的方法,其特征在于,所述基于每一访问路径模式集合中的访问时间列表构造对应的访问时间位图,包括:
13.根据权利要求12所述的方法,其特征在于,所述基于每一访问路径模式集合中的访问时间列表构造对应的扩展访问时间位图包括:
14.根据权利要求7所述的方法,其特征在于,所述基于每一访问表模式集合中的访问时间列表构造对应的访问时间位图包括:
15.根据权利要求14所述的方法,其特征在于,所述基于每一访问表模式集合中的访问时间列表构造对应的扩展访问时间位图包括:
16.一种基于多源异构日志的数据交互路径关联推理系统,其特征在于,所述系统包括:HTTP处理单元、数据库处理单元、关联推理单元;所述HTTP处理单元与所述关联推理单元相连,所述数据库处理单元与所述关联推理单元相连;
17.根据权利要求16所述的系统,其特征在于,所述HTTP处理单元用于:
18.根据权利要求16所述的系统,其特征在于,所述数据库处理单元用于:
19.一种电子设备,其特征在于,包括:至少一个处理器和存储器;所述存储器和处理器通过总线相连;
20.一种可读存储介质,其特征在于,其上存有执行程序,所述执行程序被执行时,实现如权利要求1至15中任一项所述的基于多源异构日志的数据交互路径关联推理方法。
...【技术特征摘要】
1.一种基于多源异构日志的数据交互路径关联推理方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述基于http服务器的日志数据,生成http交互日志数组列表,包括:
3.根据权利要求2所述的方法,其特征在于,所述解析后的每条http日志数据包括时间戳、源ip、源端口、目的ip、目的端口、请求url、请求长度、响应代码、响应长度;
4.根据权利要求3所述的方法,其特征在于,所述根据所述http交互日志数组列表中的访问时间列表构造对应的时间位图,根据时间位图和所述http交互日志数组列表生成访问路径模式数组列表包括:
5.根据权利要求1所述的方法,其特征在于,所述基于数据库的日志数据,生成数据库交互日志数组列表,包括:
6.根据权利要求5所述的方法,其特征在于,所述解析后的每条数据库的日志数据包括时间戳、源ip、源端口、目的ip、目的端口、请求信息;
7.根据权利要求6所述的方法,其特征在于,所述根据所述数据库交互日志数组列表中的访问时间列表构造对应的时间位图,根据时间位图和所述数据库交互日志数组列表生成访问表模式数组列表包括:
8.根据权利要求4所述的方法,其特征在于,所述对所述访问路径模式数组列表和所述访问表模式数组列表进行关联推理,确定访问路径模式列表和所述访问表模式列表之间的关联数组列表包括:
9.根据权利要求8所述的方法,其特征在于,所述根据所述访问路径模式数组中的时间位图与每一所述访问表模式数组中的时间位图的匹配度,筛选出与所述访问路径模式数组关联的访问表模式数组列表,包括:
10.根据权利要求7所述的方法,其特征在于,所述对所述访问路径模式...
【专利技术属性】
技术研发人员:陈利跃,罗晨,周贤富,夏洪涛,王文,梅文明,蒋鸿城,杨力强,周鹏,沈思琪,邵志鹏,费稼轩,孙歆,王新哲,魏思佳,何阳,姚启桂,徐增荣,严冬,周旭祥,陈逍潇,陆鑫,周慧凯,魏玉杭,
申请(专利权)人:国网智能电网研究院有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。