System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及数据处理,特别是涉及一种日志文件处理方法、装置、计算机设备和存储介质。
技术介绍
1、流量日志文件处理常用的方法有两种:log.parse(控制台命令工具)插桩处理和日志后处理解析,然而二者不具有普遍适应性,具体为:1、log.parse插桩处理不适用于生产环境(存在生产安全问题);2、日志分析是工业界常用的软件测试、运维方法,适用于生产、预发、开发环境,但日志解析要求人员对业务很熟悉,需要其将对象进行关联,这种方发有巨大人力成本消耗且不具备通用性。
2、因此,亟需提出一种智能化且具有普适性的日志文件处理方法、装置、计算机设备和存储介质。
技术实现思路
1、基于此,有必要针对上述技术问题,提供一种智能化且具有普适性的日志文件处理方法、装置、计算机设备和存储介质。
2、一方面,提供一种日志文件处理方法,所述方法包括:
3、获取程序运行链路的日志文件;
4、基于所述程序运行链路的日志文件,提取目标文本以及所述目标文本对应的程序行为特征;
5、基于机器学习算法,确定所述目标文本以及所述目标文本对应的程序行为特征之间的对应关系;
6、基于所述对应关系,确定影响程序行为的关键文本。
7、可选的,所述程序运行链路的日志文件的获取方法包括:
8、获取用户请求;
9、基于所述用户请求,确定所述用户请求对应的目标程序运行链路;
10、基于所述目标程序运行链路,获取所述用户
11、可选的,基于所述程序运行链路的日志文件,提取目标文本以及所述目标文本对应的程序行为特征包括:
12、基于用户请求对应的程序运行日志文件,提取由n个文本特征{x1,x2,…,xn}组成的目标文本logk,其中,k表示文本标识;
13、基于所述目标文本,提取所述目标文本对应的目标程序行为特征,以基于所述目标程序行为特征构建的数组对象确定哈希值va,其中,a表示程序行为特征标识;
14、基于所述目标文本及其对应的哈希值,生成目标数组为(logk,va)。
15、可选的,基于机器学习算法,确定所述目标文本以及所述目标文本对应的程序行为特征之间的对应关系包括:
16、获取目标数组(logk,va);
17、定义主成分分析法为所述机器学习算法,基于所述主成分分析法确定所述目标文本中的文本特征与所述目标文本对应的程序行为特征之间的对应关系包括:
18、va=∑pixi
19、其中,pi表示权重,xi表示目标文本logk中的第i个文本特征。
20、可选的,基于所述对应关系,确定影响程序行为的关键文本包括:
21、获取多个目标数组;
22、基于所述多个目标数组,获取多个目标文本中的文本特征与所述目标文本对应的程序行为特征之间的对应关系;
23、对多个对应关系进行比较,基于比较结果,确定影响程序行为的关键文本。
24、可选的,对多个对应关系进行比较,基于比较结果,确定影响程序行为的关键文本包括:
25、响应于检测到第一对应关系v1等于第二对应关系v2时,∑pi(di-si)=0~(di≠si=>pi=0),表示第一对应关系中的文本特征di和第二对应关系中的文本特征si对应的文本不是影响程序行为的关键文本;
26、响应于检测到第一对应关系v1不等于第二对应关系v2时,基于主成分分析策略获取多个对应关系中文本特征的pi值,将最大的pi值对应文本特征对应的文本确定为影响程序行为的关键文本。
27、可选的,在基于所述对应关系,确定影响程序行为的关键文本之后,所述方法还包括:
28、提取所述关键文本中的目标文本特征,定义所述目标文本特征为影响程序行为的关键影响变量,并将所述关键影响变量发送至用户终端。
29、另一方面,提供了一种日志文件处理装置,所述装置包括:
30、日志文件获取模块,用于获取程序运行链路的日志文件;
31、特征提取模块,用于基于所述程序运行链路的日志文件,提取目标文本以及所述目标文本对应的程序行为特征;
32、对应关系确定模块,用于基于机器学习算法,确定所述目标文本以及所述目标文本对应的程序行为特征之间的对应关系;
33、关键文本确定模块,用于基于所述对应关系,确定影响程序行为的关键文本。
34、再一方面,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
35、获取程序运行链路的日志文件;
36、基于所述程序运行链路的日志文件,提取目标文本以及所述目标文本对应的程序行为特征;
37、基于机器学习算法,确定所述目标文本以及所述目标文本对应的程序行为特征之间的对应关系;
38、基于所述对应关系,确定影响程序行为的关键文本。
39、又一方面,提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
40、获取程序运行链路的日志文件;
41、基于所述程序运行链路的日志文件,提取目标文本以及所述目标文本对应的程序行为特征;
42、基于机器学习算法,确定所述目标文本以及所述目标文本对应的程序行为特征之间的对应关系;
43、基于所述对应关系,确定影响程序行为的关键文本。
44、上述日志文件处理方法、装置、计算机设备和存储介质,所述方法包括:获取程序运行链路的日志文件;基于所述程序运行链路的日志文件,提取目标文本以及所述目标文本对应的程序行为特征;基于机器学习算法,确定所述目标文本以及所述目标文本对应的程序行为特征之间的对应关系;基于所述对应关系,确定影响程序行为的关键文本,本申请基于智能化且具有普适性的关键特征提取方法,以用于对日志文件进行快速处理,提高了数据处理效率,降低了人工成本。
本文档来自技高网...【技术保护点】
1.一种日志文件处理方法,其特征在于,所述方法包括:
2.根据权利要求1所述的日志文件处理方法,其特征在于,所述程序运行链路的日志文件的获取方法包括:
3.根据权利要求1所述的日志文件处理方法,其特征在于,基于所述程序运行链路的日志文件,提取目标文本以及所述目标文本对应的程序行为特征包括:
4.根据权利要求3所述的日志文件处理方法,其特征在于,基于机器学习算法,确定所述目标文本以及所述目标文本对应的程序行为特征之间的对应关系包括:
5.根据权利要求4所述的日志文件处理方法,其特征在于,基于所述对应关系,确定影响程序行为的关键文本包括:
6.根据权利要求5所述的日志文件处理方法,其特征在于,对多个对应关系进行比较,基于比较结果,确定影响程序行为的关键文本包括:
7.根据权利要求1所述的日志文件处理方法,其特征在于,在基于所述对应关系,确定影响程序行为的关键文本之后,所述方法还包括:
8.一种日志文件处理装置,其特征在于,所述装置包括:
9.一种计算机设备,包括存储器、处理器及存储在存储器
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法。
...【技术特征摘要】
1.一种日志文件处理方法,其特征在于,所述方法包括:
2.根据权利要求1所述的日志文件处理方法,其特征在于,所述程序运行链路的日志文件的获取方法包括:
3.根据权利要求1所述的日志文件处理方法,其特征在于,基于所述程序运行链路的日志文件,提取目标文本以及所述目标文本对应的程序行为特征包括:
4.根据权利要求3所述的日志文件处理方法,其特征在于,基于机器学习算法,确定所述目标文本以及所述目标文本对应的程序行为特征之间的对应关系包括:
5.根据权利要求4所述的日志文件处理方法,其特征在于,基于所述对应关系,确定影响程序行为的关键文本包括:
6.根据权利要求5所述的...
【专利技术属性】
技术研发人员:陈北华,
申请(专利权)人:广州品唯软件有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。