System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 踪迹表示学习制造技术_技高网

踪迹表示学习制造技术

技术编号:44298009 阅读:2 留言:0更新日期:2025-02-18 20:17
本发明专利技术在训练多分支DNN对序列进行编码时通过使用多任务学习(MTL)和自监督式学习(SSL)技术避免深度神经网络(DNN)训练中的过度拟合。在实施例中,计算机第一次训练DNN以执行第一任务。DNN包含:第一分支中的第一编码器、第二分支中的第二编码器以及组合来自第一分支和第二分支的数据的解释器层。DNN第二次训练以执行第二任务。在第一次训练和第二次训练之后,发生生产编码和推断。第一编码器将稀疏特征向量编码为从中推断推论的密集特征向量。在实施例中,将日志消息的序列编码为编码的踪迹。异常检测器推断该序列是否异常。在实施例中,日志消息是数据库命令。

【技术实现步骤摘要】
【国外来华专利技术】

本专利技术涉及避免深度神经网络(dnn)训练中的过度拟合。本文是用于训练多分支dnn对序列进行编码的多任务学习(mtl)和自监督式学习(ssl)技术。


技术介绍

1、异常检测在保护计算机系统免受无论是恶意还是意外的有害活动侵害方面发挥着重要作用,因此在业界引起了广泛关注。数据库容易受到各种攻击。分析系统日志的机器学习(ml)算法在检测此类活动中起着重要作用。数据库日志表示由消息组成的结构化数据序列,其中每条消息由描述该消息的属性组成。

2、在本文中被称为踪迹,消息子序列对于异常检测任务尤为重要。将踪迹信息转换成数值向量的现有方法通常直接从消息中提取手工制作的特征,随后将跨消息的特征聚合为踪迹表示。聚合是通过严格计算每个特征的统计数据(诸如均值、众数、总和、最小值和最大值)来完成的。这些方法的主要限制是(i)要求手动定义的聚合策略,(ii)对携带不同信息的消息赋予相等的权重,(iii)特征空间维数和稀疏性,(iv)未捕获语义,以及(v)丢失消息排序。为了解决这些限制,要求一种数据驱动的方法。


技术实现思路

【技术保护点】

1.一种计算机实现的方法,包括:

2.如权利要求1所述的方法,其中神经网络不包括选自以下各项的至少一项:

3.如权利要求1所述的方法,其中:

4.如权利要求1所述的方法,其中:

5.如权利要求1所述的方法,还包括第一分支在第一次训练和第二次训练期间接受相同宽度的特征向量。

6.如权利要求1所述的方法,其中自监督式任务是选自包括第一任务和第二任务的组的任务。

7.如权利要求6所述的方法,其中:

8.一种计算机实现的方法,包括:

9.如权利要求8所述的方法,其中日志消息的序列是数据库命令的序列。

10.一种计算机实现的方法,包括:

11.一种或多种存储指令的计算机可读非暂态介质,当指令由一个或多个处理器执行时,使得执行如权利要求1-10中的任一项所述的步骤。

【技术特征摘要】
【国外来华专利技术】

1.一种计算机实现的方法,包括:

2.如权利要求1所述的方法,其中神经网络不包括选自以下各项的至少一项:

3.如权利要求1所述的方法,其中:

4.如权利要求1所述的方法,其中:

5.如权利要求1所述的方法,还包括第一分支在第一次训练和第二次训练期间接受相同宽度的特征向量。

6.如权利要求1所述的方法,其中自监督式任务是选自包括第一...

【专利技术属性】
技术研发人员:M·尼克里克N·米洛科维奇A·施纽利M·卡塞里尼M·瓦西奇R·卡萨诺娃F·施密特
申请(专利权)人:甲骨文国际公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1