The invention discloses a method and a device for processing log data, the method comprises: a sample log analytical treatment of the input and output format of the analytical results; analytical results confirm receiving user instructions after analyzing the sample log records collected by log parsing rules; according to the log the rules of the record source log data to the user specified service for analytical processing, save the log data obtained the business format and the data warehouse. Log parsing rules parsed for sample log using the technical scheme, the realization of the storage management log data on business format analysis, in order to achieve, control standard, log data.
【技术实现步骤摘要】
一种处理日志数据的方法和装置
本专利技术涉及计算机
,具体涉及一种处理日志数据的方法和装置。
技术介绍
企业、公司尤其是互联网公司,日常业务往往会产生大量的日志数据,对这些数据进行管理是一项非常浩大而又需要规范化设计的任务。例如,有些数据是无用数据需要丢弃,有些数据需要按生成时间进行入库等等。由于这些数据繁杂不一,格式各异,在统一管理上存在难题。
技术实现思路
鉴于上述问题,提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的处理日志数据的方法和装置。依据本专利技术的一个方面,提供了一种处理日志数据的方法,包括:对输入的一条样例日志进行解析处理,输出格式化的解析结果;接收用户的解析结果确认指令后,记录解析所述样例日志所采用的日志解析规则;根据所记录的所述日志解析规则,对用户指定的业务的源日志数据进行解析处理,得到该业务的格式化的日志数据并保存到数据仓库中。可选地,该方法还包括:接收关于指定业务的日志统计请求;根据所述日志统计请求,对数据仓库中的所述指定业务的格式化的日志数据进行统计计算,输出统计计算结果。可选地,所述对用户输入的一条样例日志进行解析处理,输出格式化的解析结果包括:预设多个日志内容识别引擎,用于分别识别不同格式的日志内容并解析成一个或多个字段;将所述样例日志依次输入到所述多个日志内容识别引擎中;将各日志内容识别引擎的输出各字段进行汇总得到所述格式化的解析结果。可选地,其中,所述记录解析所述样例日志所采用的日志解析规则包括:将有输出结果的各日志内容识别引擎的识别解析规则汇总记录为解析所述样例日志所采用的日志解析规则。可选地,该 ...
【技术保护点】
一种处理日志数据的方法,其中,该方法包括:对输入的一条样例日志进行解析处理,输出格式化的解析结果;接收用户的解析结果确认指令后,记录解析所述样例日志所采用的日志解析规则;根据所记录的所述日志解析规则,对用户指定的业务的源日志数据进行解析处理,得到该业务的格式化的日志数据并保存到数据仓库中。
【技术特征摘要】
1.一种处理日志数据的方法,其中,该方法包括:对输入的一条样例日志进行解析处理,输出格式化的解析结果;接收用户的解析结果确认指令后,记录解析所述样例日志所采用的日志解析规则;根据所记录的所述日志解析规则,对用户指定的业务的源日志数据进行解析处理,得到该业务的格式化的日志数据并保存到数据仓库中。2.如权利要求1所述的方法,其中,该方法还包括:接收关于指定业务的日志统计请求;根据所述日志统计请求,对数据仓库中的所述指定业务的格式化的日志数据进行统计计算,输出统计计算结果。3.如权利要求1所述的方法,其中,所述对用户输入的一条样例日志进行解析处理,输出格式化的解析结果包括:预设多个日志内容识别引擎,用于分别识别不同格式的日志内容并解析成一个或多个字段;将所述样例日志依次输入到所述多个日志内容识别引擎中;将各日志内容识别引擎的输出各字段进行汇总得到所述格式化的解析结果。4.如权利要求3所述的方法,其中,所述记录解析所述样例日志所采用的日志解析规则包括:将有输出结果的各日志内容识别引擎的识别解析规则汇总记录为解析所述样例日志所采用的日志解析规则。5.如权利要求3所述的方法,其中,该方法还包括:当所述样例日志中存在各日志内容识别引擎均无法识别的内容时,通过自定义识别接口输出该内容;通过自定义识别接口接收人工识别后输入的识别结果和相应的识别解析规则;将该人工识别后输入的识别解析规则记录为解析所述样例日志所采用的日志解析规则的一部分。6.一种处理日志数据...
【专利技术属性】
技术研发人员:李铮,侯怀锋,高飞龙,郑超平,张超,郑扬,张娟娜,
申请(专利权)人:北京奇虎科技有限公司,奇智软件北京有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。