使用滚动窗口的连续学习神经网络系统技术方案

技术编号:23605586 阅读:31 留言:0更新日期:2020-03-28 06:27
一种公开方法、一种分析计算机确定与用于随时间推移而发生的交互的交互数据相关联的滚动窗口。所述分析计算机可以检取用于在所述滚动窗口中发生的交互的交互数据。然后,所述分析计算机可以基于历史交互数据生成伪交互数据。所述分析计算机可以任选地嵌入用于在所述滚动窗口内发生的所述交互的所述交互数据和所述伪交互数据以形成交互数据矩阵。然后,所述分析计算机可以使用所述交互数据矩阵形成神经网络模型,所述神经网络模型是从所述滚动窗口中的所述交互数据和所述伪交互数据导出的。

Continuous learning neural network system using rolling window

【技术实现步骤摘要】
使用滚动窗口的连续学习神经网络系统相关申请交叉引用本申请是2018年9月20日提交的第62/734,149号美国专利申请的非临时申请,所述美国专利申请的全文以引用的方式并入本文中。
技术介绍
网络攻击正变得越来越动态和自动化。可以跟踪和分析网络攻击以预测未来的攻击。然而,在使用所有先前数据执行完整的数据分析之前,可能会发生新的网络攻击。虽然自动化学习可以解决一些问题,但这些模型会随时间推移而偏移。为了应对这种威胁,需要一种自动化解决方案来监控传入的数据。本专利技术的实施例单独地和共同地解决了这种问题和其它问题。
技术实现思路
一个实施例涉及一种方法,包括:由分析计算机确定与用于随时间推移而发生的交互的交互数据相关联的滚动窗口;由所述分析计算机检取用于在所述滚动窗口中发生的交互的交互数据;由所述分析计算机基于历史交互数据生成伪交互数据;以及由所述分析计算机使用用于在所述滚动窗口内发生的交互的所述交互数据和所述伪交互数据形成神经网络模型。另一个实施例涉及一种分析计算机,包括:处理器;耦合到所述处理器的计算机可读介质,所述计算机可读介质包括可由所述处理器执行以实施方法的代码,所述方法包括:确定与用于随时间推移而发生的交互的交互数据相关联的滚动窗口;检取用于在所述滚动窗口中发生的交互的交互数据;基于历史交互数据生成伪交互数据;以及使用用于在所述滚动窗口内发生的交互的所述交互数据和所述伪交互数据——交互数据矩阵——形成神经网络模型。关于本专利技术的实施例的更多细节可以见于具体实施方式和附图说明。<br>附图说明图1示出根据实施例的示例监控系统。图2示出根据一些实施例的分析计算机的示例框图。图3示出说明根据实施例的学习过程的示例图。图4示出根据实施例的监控方法的示例流程图。图5示出说明根据一些实施例的动态嵌入确定方法的示例流程图。图6示出说明根据一些实施例的伪交互数据生成方法的示例流程图。具体实施方式在论述实施例之前,可以进一步详细地描述一些术语。“机器学习模型”可以包括人工智能的应用,它向系统提供了从经验中自动地学习和改进而无需明确地被编程的能力。机器学习模型可以包括一组软件例程和参数,它们可以基于“特征向量”或其它输入数据预测过程的输出(例如,计算机网络攻击者的标识、计算机的认证、基于用户搜索查询的合适推荐等)。可以在训练过程中确定软件例程的结构(例如,子例程的数量和它们之间的关系)和/或参数的值,所述训练过程可以使用正被建模的过程的实际结果,例如,不同类的输入数据的标识。机器学习模型的示例包括支持向量机(SVM)、通过在不同分类的输入之间建立间隙或边界来对数据进行分类的模型,以及神经网络,即,通过响应于输入而激活来执行功能的人工“神经元”的集合。在一些实施例中,神经网络可以包括卷积神经网络、递归神经网络等。“模型数据库”可以包括可以存储机器学习模型的数据库。机器学习模型可以以各种形式存储在模型数据库中,所述形式是例如定义机器学习模型的参数或其它值的集合。模型数据库中的模型可以与传达所述模型的某个方面的关键字相关联地存储。例如,用于评估新闻文章的模型可以与关键字“新闻”、“宣传”和“信息”相关联地存储在模型数据库中。服务器计算机可以访问模型数据库并从模型数据库检取模型,修改模型数据库中的模型,从模型数据库删除模型,或将新模型添加到模型数据库。“特征向量”可以包括表示某个对象或实体的一组可测量属性(或“特征”)。特征向量可以包括以数组或向量结构形式用数字表示的数据的集合。特征向量还可以包括可以被表示为数学向量的数据的集合,可以对所述数学向量执行例如标量积的向量运算。可以从输入数据确定或生成特征向量。特征向量可以用作机器学习模型的输入,使得机器学习模型产生某种输出或分类。基于输入数据的性质,可以以各种方式实现特征向量的构造。例如,对于将单词分类为正确拼写或错误拼写的机器学习分类器,对应于例如“LOVE”的单词的特征向量可以被表示为向量(12,15,22,5),它对应于输入数据字中的每个字母的字顺索引。对于更复杂的“输入”,例如人类实体,示例性特征向量可以包括例如人的年龄、身高、体重、相对幸福的数值表示等的特征。可以在特征存储区中以电子方式表示和存储特征向量。此外,可以将特征向量归一化,即,使特征向量具有单位量值。例如,可以将对应于“LOVE”的特征向量(12,15,22,5)归一化为大约(0.40,0.51,0.74,0.17)。“滚动窗口”可以包括时间范围。在一些实施例中,滚动窗口可以包括期间可能会发生数据(例如,交互数据)的时间范围。例如,滚动窗口可以包括过去的小时、日、周、月等的范围。在一些实施例中,滚动窗口可以包括开始时间和结束时间。在其它实施例中,滚动窗口可以包括预定数量的数据的范围。例如,第一滚动窗口可以包括前500个数据项目,第二滚动窗口可以包括数据项目501到1000等。“交互”可以包括互惠作用或影响。“交互”可以包括各方、各装置和/或各实体之间的通信、联系或交换。示例交互可以包括装置对由服务器计算机托管的安全网页的登录尝试。额外示例交互包括两方之间的交易和两个装置之间的数据交换。在一些实施例中,交互可以包括用户请求访问安全数据、安全网页、安全位置等。在其它实施例中,交互可以包括付款交易,在所述付款交易中,两个装置可以交互以促进付款。“交互数据”可以包括与交互相关联的数据。交互数据可以包括表示交互和/或与交互相关联的任何合适的数据。在一些实施例中,用于随时间推移而发生的交互的交互数据可以包括时间戳和实体标识符(例如,用户标识符、IP地址等)。交互数据的示例可以是网页登录尝试数据。在一些实施例中,交互数据可以包括HTTP标头数据包数据。HTTP标头数据包数据可以包括例如授权、浏览器类型、连接、日期、预期、已转发、来自、主机、警告等的数据字段。“伪交互数据”可以包括类似于交互数据的数据。在一些实施例中,伪交互数据可以包括与交互数据相似的数据元素。例如,如果交互数据包括IP地址和日期,则伪交互数据也可以包括IP地址和日期。在一些实施例中,伪交互数据可以包括被确定为与当前交互数据相似的历史交互数据。在其它实施例中,伪交互数据可以包括生成的交互数据。“历史交互数据”可以包括过去的交互数据。例如,未包括在当前滚动窗口内的交互数据(例如,其时间戳在滚动窗口的开始时间之前)可以是历史交互数据。“拓扑图”可以包括由边缘连接的不同顶点的平面中的图的表示。拓扑图中的不同顶点可以被称为“节点”。每个节点可以表示事件的特定信息,或可以表示实体或对象的简档的特定信息。可以由一组边缘E使节点彼此相关。“边缘”可以被描述为由作为图G=(V,E)的子集的两个节点构成的无序对,其中G是包括由一组边缘E连接的一组顶点(节点)V的图。例如,拓扑图可以表示交易网络,在所述交易网络中,表示交易的节点可以由边缘连接到与交易相关的一个或多个节点,例如表示装置、用户、交易类型等的信息的节点。边缘可以与被称为“权重”的数值相本文档来自技高网...

【技术保护点】
1.一种方法,包括:/n由分析计算机确定与用于随时间推移而发生的交互的交互数据相关联的滚动窗口;/n由所述分析计算机检取用于在所述滚动窗口中发生的交互的交互数据;/n由所述分析计算机基于历史交互数据生成伪交互数据;以及/n由所述分析计算机使用用于在所述滚动窗口内发生的交互的所述交互数据和所述伪交互数据形成神经网络模型。/n

【技术特征摘要】
20180920 US 62/734,1491.一种方法,包括:
由分析计算机确定与用于随时间推移而发生的交互的交互数据相关联的滚动窗口;
由所述分析计算机检取用于在所述滚动窗口中发生的交互的交互数据;
由所述分析计算机基于历史交互数据生成伪交互数据;以及
由所述分析计算机使用用于在所述滚动窗口内发生的交互的所述交互数据和所述伪交互数据形成神经网络模型。


2.根据权利要求1所述的方法,其中所述滚动窗口包括期间发生所述交互数据的时间范围,且其中所述方法还包括:
由所述分析计算机嵌入用于在所述滚动窗口内发生的所述交互的所述交互数据和所述伪交互数据以形成交互数据矩阵,且其中使用所述交互数据矩阵形成所述神经网络模型。


3.根据权利要求2所述的方法,其中生成所述伪交互数据还包括:
由所述分析计算机确定所述历史交互数据中的一个或多个数据趋势,所述一个或多个数据趋势包括在所述滚动窗口内和外发生的交互;以及
由所述分析计算机基于所述一个或多个数据趋势生成多个伪交互以形成所述伪交互数据。


4.根据权利要求3所述的方法,其中确定所述一个或多个数据趋势还包括:
由所述分析计算机将至少所述历史交互数据集群成一个或多个社区组,其中所述一个或多个社区组中的每个社区组包括表示具有相似特性的交互的数据。


5.根据权利要求4所述的方法,其中形成所述神经网络模型还包括:
由所述分析计算机拆分所述交互数据矩阵的一部分以形成测试样本;
由所述分析计算机将所述测试样本存储到数据库中;
由所述分析计算机用未包括在所述测试样本中的所述交互数据矩阵训练神经网络;
基于所述训练,由所述分析计算机确定部分地定义所述神经网络模型的多个神经网络权重;
由所述分析计算机使用所述测试样本评估所述神经网络模型;以及
基于所述评估,由所述分析计算机将所述神经网络模型存储在模型数据库中。


6.根据权利要求5所述的方法,其中所述神经网络为卷积神经网络或递归神经网络。


7.根据权利要求1所述的方法,还包括:
确定一个或多个误差矩阵;以及
用机器学习模型和所述一个或多个误差矩阵嵌入用于在所述滚动窗口内发生的所述交互的所述交互数据和所述伪交互数据以形成交互数据矩阵,且其中形成所述神经网络模型包括使用所述交互数据矩阵来形成所述神经网络模型。


8.根据权利要求7所述的方法,其中确定所述一个或多个误差矩阵还包括:
由所述分析计算机使用用于在所述滚动窗口内发生的所述交互的所述交互数据的第一部分训练模型;
由所述分析计算机使用用于在所述滚动窗口内发生的所述交互的所述交互数据的第二部分评估所述模型;
由所述分析计算机基于所述评估确定误差矩阵和总误差;
由所述分析计算机确定所述总误差是否超出预定误差阈值;以及
如果所述总误差超出所述预定误差阈值,则由所述分析计算机将所述误差矩阵存储在数据库中。


9.根据权利要求1所述的方法,还包括:
由所述分析计算机将所述神经网络模型存储在模型数据库中。


10.根据权利要求9所述的方法,还包括:
由所述分析计算机接收包括请求数据的请求消息;以及
由所述分析计算...

【专利技术属性】
技术研发人员:T·科罗列夫斯卡亚T·D·哈利斯李玥
申请(专利权)人:维萨国际服务协会
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1