一种工控OT网络多目标渗透测试方法及系统技术方案

技术编号：35191607 阅读：16 留言：0更新日期：2022-10-12 18:12

一种工控OT网络多目标渗透测试方法及系统，其包括收集被测网络信息，生成攻击图；从攻击图中抽象出马尔可夫模型并赋予状态转换奖励；采用强化学习算法与马尔可夫模型进行交互，获得最优攻击策略；调用渗透测试工具，对最优攻击策略进行验证，其解决了现有的渗透测试方法存在的测试目标单一和测试方法繁琐的技术问题，且本发明专利技术可以满足渗透测试工程师基于自身经验改动部分攻击步骤后重新给出指导，具有较大的灵活性，可广泛应用于大数据处理领域。域。域。

全部详细技术资料下载

【技术实现步骤摘要】
一种工控OT网络多目标渗透测试方法及系统

[0001]本专利技术涉及大数据处理领域，尤其是涉及一种工控OT网络多目标渗透测试方法及系统。

技术介绍

[0002]工控OT(Operation Technology)网络用于管理工业基础设施，连接控制设备与被控制设备，如工业控制系统(ICS)和数据采集与监视控制系统(SCADA)等。传统的工业控制系统是独立的与互联网隔离的系统，近年来，随着工业控制系统的联网，工业控制系统封闭性和专有性被打破，众多攻击案例表明网络攻击穿越了IT网络向OT网络渗透。
[0003]渗透测试是一种典型分析技术，从攻击者的视角评估系统安全性，可以用于辅助漏洞修复、安全加固等，当前对网络的自动渗透测试通常输出一条最优攻击路径，用于辅助安全防护者优先修补最优路径上的漏洞，渗透测试需要大量的专业知识，传统的渗透测试需要由专家执行，渗透测试由于人力成本高昂，只能采取定期对系统进行测试评估，难以通过频繁测试实现对系统状态的掌握，当前业界投入大量资源研发自动渗透测试工具，用于辅助进行渗透测试，减少专家的工作量。
[0004]其中，基于强化学习进行自动渗透测试的方法由于具有在和环境交互过程中总结经验的特点，很适合渗透测试场景，得到了广泛使用。目前大部分采取IT网络渗透测试，部分应用采用强化学习和真实环境进行交互，但其训练过程中往往需要大量的尝试攻击模块，训练过程并没有比遍历式的执行效率高，一些现有技术使了MulVAL工具获得攻击图，然后在攻击图上提取部分节点作为马尔可夫模型，进行强化学习训练，该...

【技术保护点】

【技术特征摘要】
1.一种工控OT网络多目标渗透测试方法，其特征在于，包括以下步骤：收集被测网络信息，生成攻击图；从所述攻击图中抽象出马尔可夫模型并赋予状态转换奖励；采用强化学习算法与所述马尔可夫模型进行交互，获得最优攻击策略；调用渗透测试工具，对所述最优攻击策略进行验证。2.根据权利要求1所述的一种工控OT网络多目标渗透测试方法，其特征在于，收集被测网络信息，具体通过以下方式实现：对被测网络系统进行信息扫描；工控网络渗透测试目标的设置；收集并建立漏洞数据集进行数据存储。3.根据权利要求1所述的一种工控OT网络多目标渗透测试方法，其特征在于，生成攻击图，具体通过以下方式实现：根据网络上各主机之间的连通性关系和漏洞前后条件关系推导出各个漏洞之间的关系，形成攻击图，利用收集到的主机配置信息，通过MulVAL工具获得攻击图。4.根据权利要求1所述的一种工控OT网络多目标渗透测试方法，其特征在于，从所述攻击图中抽象出马尔可夫模型并赋予状态转换奖励，具体通过以下方式实现：将攻击图上的所有节点作为马尔可夫过程的状态，攻击图上的节点拥有不同的奖励，代表马尔可夫过程中，进入该状态会获得的奖励。5.根据权利要求1所述的一种工控OT网络多目标渗透测试方法，其特征在于，采用强化学习算法与所述马尔可夫模型进行交互，具体通过以下方式实现：每一幕开始，选定任意初始状态s,由预测值网络计算出该s下所有动作对应的Q值，选择最大的Q值对应的动作a,施加到环境MDP模型中，在这里具体过程是查询马尔可夫模型图，如果状态之间有有向边连接，则成功返回下一状态s
’
，其编号与a相同，查询奖励矩阵获得奖励r；如果没有有向边相连,则返回下一状态s
’
，其编号与s相同，查询奖励矩阵获得奖励r，并将该经验(s,a,r,s
’
)放入回放换缓冲区中；每一次和环境进行交互将经验放入回放缓冲区后，神经网络都会进行多次训练，回放缓冲区是一个固定大小的存放经验的存储区，在训练神经网络时，随机的从回放缓冲区中获取经验，将其中(s,...

【专利技术属性】
技术研发人员：王凯，吴贤生，王子博，张耀方，王佰玲，
申请(专利权)人：威海天之卫网络空间安全科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人