System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 异常日志检测方法、系统、设备、存储介质及产品技术方案_技高网

异常日志检测方法、系统、设备、存储介质及产品技术方案

技术编号:43161059 阅读:7 留言:0更新日期:2024-11-01 19:54
本申请实施例公开了一种异常日志检测方法、系统、设备、存储介质及产品,涉及日志监控技术领域,公开了异常日志检测方法,包括:将各待检测日志各自划分为各个日志分词,并将各日志分词分别转化为数字,得到各待检测日志各自对应的数字序列;将各数字序列划分为各个簇,其中,同一簇中非簇心数字序列与簇心所对应的数字序列的相似度均大于或者等于预设相似度阈值,且,同一数字序列不存在于多个簇中;将各待检测日志中用户标注异常的日志对应的簇作为异常簇,并将异常簇中的数字序列各自对应的待检测日志作为异常日志。本申请实施例旨在解决如何提出一种简便的异常日志的检测方法的技术问题。

【技术实现步骤摘要】

本申请实施例涉及日志监控,尤其涉及异常日志检测方法、系统、设备、存储介质及产品


技术介绍

1、异常日志是软件或系统在运行过程中遇到异常情况或错误时生成的日志记录。通常情况下,异常日志包含有关错误的详细信息,可以帮助开发人员或系统管理员诊断和解决问题。

2、由于软件或系统在运行过程中产生的日志数量较多,且日志中包含正常运行日志和异常日志,为了精准识别这些异常日志,通常会通过异常检测算法模型进行筛选。但是,异常检测算法模型的构建并非易事。异常检测算法模型不仅需要庞大的数据资源作为基石来确保模型的准确性和稳定性,还依赖于丰富的先验知识来指导模型的设计和调优。

3、因此,如何提出一种简便的异常日志的检测方法,是本领域技术人员尚待解决的技术问题。

4、上述内容仅用于辅助理解本申请实施例的技术方案,并不代表承认上述内容是现有技术。


技术实现思路

1、本申请实施例的主要目的在于提供一种异常日志检测方法、系统、设备、存储介质及产品,旨在解决如何提出一种简便的异常日志的检测方法的技术问题。

2、为实现上述目的,本申请实施例提出一种异常日志检测方法,所述的方法包括:

3、将各个待检测日志各自划分为各个日志分词,并将各所述日志分词分别转化为数字,得到各所述待检测日志各自对应的数字序列;

4、将各所述数字序列划分为各个簇,其中,同一簇中非簇心数字序列与簇心所对应的数字序列的相似度均大于或者等于预设相似度阈值,且,同一数字序列不存在于多个簇中;

5、将各所述待检测日志中用户标注异常的日志对应的簇作为异常簇,并将所述异常簇中的数字序列各自对应的待检测日志作为异常日志。

6、在一实施例中,计算同一簇中非簇心数字序列与簇心所对应的数字序列的相似度的步骤,包括:

7、确定簇心所对应的数字序列的第一数字数量、非簇心数字序列的第二数字数量以及所述簇心的数字序列与所述非簇心数字序列中的相同数字的第三数字数量;

8、计算所述第一数字数量与所述第二数字数量的和值,并将所述第三数字数量与所述和值的比值作为所述非簇心数字序列与所述簇心的数字序列的相似度。

9、在一实施例中,所述将各所述数字序列划分为各个簇的步骤之后,还包括:

10、在获取目标日志后,将所述目标日志划分为各个目标日志分词,并分别将各所述目标日志分词转化为数字,得到目标数字序列,其中,所述目标日志指的是新接收的且未划分簇类的日志;

11、确定所述目标数字序列分别与各所述簇的簇心的相似度,并确定各所述相似度中的最大相似度;

12、若检测到所述最大相似度大于或者等于所述预设相似度阈值,则将所述最大相似度所对应的簇心作为目标簇心,并将所述目标数字序列划分至所述目标簇心对应的簇。

13、在一实施例中,将各所述日志分词转化为数字,得到所述待检测日志对应的数字序列的步骤包括:

14、计算各所述日志分词各自对应的词频,按照各所述日志分词在所述待检测日志中的顺序,将各所述日志分词对应的所述词频组成所述待检测日志对应的数字序列。

15、在一实施例中,将各所述日志分词转化为数字,得到所述待检测日志对应的数字序列的步骤包括:

16、将各所述日志分词映射至同一向量空间,得到各所述日志分词各自对应的实数向量,按照各所述日志分词在所述待检测日志中的顺序,将各所述日志分词对应的所述实数向量组成所述待检测日志各自对应的数字序列。

17、在一实施例中,所述将各所述数字序列划分为各个簇的步骤之前,还包括:

18、分别统计各所述数字序列中包含的数字的数量,并确定各所述数量中的最大数量;

19、使用预设数字填充各所述数字序列中数字数量小于所述最大数量的数字序列,填充后的各所述数字序列中数字的数量达到所述最大数量。

20、本申请实施例还提出一种异常日志检测系统,所述系统包括:

21、字符转换模块,用于将各个待检测日志各自划分为各个日志分词,并将各所述日志分词分别转化为数字,得到各所述待检测日志各自对应的数字序列;

22、日志分类模块,用于将各所述数字序列划分为各个簇,其中,同一簇中非簇心数字序列与簇心所对应的数字序列的相似度均大于或者等于预设相似度阈值,且,同一数字序列不存在于多个簇中;

23、检测模块,用于将各所述待检测日志中用户标注异常的日志对应的簇作为异常簇,并将所述异常簇中的数字序列各自对应的待检测日志作为异常日志。

24、本申请实施例还提出一种异常日志检测设备,所述设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序配置为实现如上所述的异常日志检测方法的步骤。

25、本申请实施例还提出一种存储介质,所述存储介质为计算机可读存储介质,所述存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的异常日志检测方法的步骤。

26、本申请实施例还提出一种计算机程序产品,所述计算机程序产品包括计算机程序,所述计算机程序被处理器执行时实现如上所述的异常日志检测方法的步骤。

27、本申请实施例提出的一个或多个技术方案,至少具有以下技术效果:

28、本申请实施例通过将各待检测日志各自划分为各个日志分词,并将各日志分词分别转化为数字,得到各待检测日志各自对应的数字序列,能够将待检测日志转化为数字序列,以便于计算机识别;然后将各数字序列划分为各个簇,其中,同一簇中非簇心数字序列与簇心所对应的数字序列的相似度均大于或者等于预设相似度阈值,且,同一数字序列不存在于多个簇中,能够在无先验知识的前提下,将相似度高的数字序列划分至同一簇,即,将相似度高的待检测日志划分至同一簇;然后将各待检测日志中用户所选中的日志对应的簇作为异常簇,并将异常簇中的数字序列各自对应的待检测日志作为异常日志,能够在用户在待检测日志中选中一个异常日志的前提下,将与用户所选中的日志相似度较高的待检测日志自动识别为异常日志。从而本申请实施例能够在不使用先验知识的前提下,较为简便的检测出异常日志。

本文档来自技高网...

【技术保护点】

1.一种异常日志检测方法,其特征在于,所述的方法包括:

2.如权利要求1所述的方法,其特征在于,计算同一簇中非簇心数字序列与簇心所对应的数字序列的相似度的步骤,包括:

3.如权利要求1所述的方法,其特征在于,所述将各所述数字序列划分为各个簇的步骤之后,还包括:

4.如权利要求1所述的方法,其特征在于,将各所述日志分词转化为数字,得到所述待检测日志对应的数字序列的步骤包括:

5.如权利要求1所述的方法,其特征在于,将各所述日志分词转化为数字,得到所述待检测日志对应的数字序列的步骤包括:

6.如权利要求1至5中任一项所述的方法,其特征在于,所述将各所述数字序列划分为各个簇的步骤之前,还包括:

7.一种异常日志检测系统,其特征在于,所述系统包括:

8.一种异常日志检测设备,其特征在于,所述设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序配置为实现如权利要求1至6中任一项所述的异常日志检测方法的步骤。

9.一种存储介质,其特征在于,所述存储介质为计算机可读存储介质,所述存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至6中任一项所述的异常日志检测方法的步骤。

10.一种计算机程序产品,其特征在于,所述计算机程序产品包括计算机程序,所述计算机程序被处理器执行时实现如权利要求1至6中任一项所述的异常日志检测方法的步骤。

...

【技术特征摘要】

1.一种异常日志检测方法,其特征在于,所述的方法包括:

2.如权利要求1所述的方法,其特征在于,计算同一簇中非簇心数字序列与簇心所对应的数字序列的相似度的步骤,包括:

3.如权利要求1所述的方法,其特征在于,所述将各所述数字序列划分为各个簇的步骤之后,还包括:

4.如权利要求1所述的方法,其特征在于,将各所述日志分词转化为数字,得到所述待检测日志对应的数字序列的步骤包括:

5.如权利要求1所述的方法,其特征在于,将各所述日志分词转化为数字,得到所述待检测日志对应的数字序列的步骤包括:

6.如权利要求1至5中任一项所述的方法,其特征在于,所述将各所述数字序列划分为各个簇的步骤之前,还包括...

【专利技术属性】
技术研发人员:古英杰陈子锋孙奇陈立强肖旸朱博吴佳平舒敏根初瑞兰建明
申请(专利权)人:中移信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1