System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于资产指纹大模型的工控设备分类方法技术_技高网

一种基于资产指纹大模型的工控设备分类方法技术

技术编号:44529642 阅读:3 留言:0更新日期:2025-03-07 13:19
本发明专利技术涉及一种基于资产指纹大模型的工控设备分类方法,方法为基于对工业控制系统中的设备信息和流量信息进行旁路抓取并建模形成设备指纹后使用Llama3模型训练,最终实现对工业控制系统中设备的识别和分类。具体包括:利用工业控制网络中设备特征和流量特征,建立设备指纹库;选取合适的基础大模型llama‑3‑8b‑bnb‑4bit模型并将设备指纹库输入该模型进行训练,形成资产指纹大模型;通过对工控系统中的设备信息和流量信息进行二次抓取建模,输入资产指纹大模型对网络中的的设备进行分类。本发明专利技术方法能够区别于传统的设备分类方法,利用设备指纹和资产指纹大模型在不占用工控系统资源的情况下实现设备识别和分类。

【技术实现步骤摘要】

本专利技术属于工控安全领域,具体说是一种基于资产指纹大模型的工控设备分类方法


技术介绍

1、油气管网的广域互联特性使其面临广泛的攻击面和多样化的攻击模式,从信息域到物理域的攻击成为安全生产的重大风险源。传统以功能安全为核心的生产安全控制策略面临挑战,迫切需要解决油气管网工控系统的信息安全与功能安全综合预警与管控问题。工控设备分类方法对油气管网工控系统安全至关重要,它有助于精确评估风险、制定针对性安全策略、优化设备维护管理、快速响应安全事件、确保合规性、指导技术升级,以及实现成本效益最大化。

2、目前,国内外已有很多学者关注工控设备分类方法的研究,但是工业设备的识别特征往往受到底层网络协议及通信机制的限制,增加了特征提取复杂性和训练数据采集难度,同时分类模型准确率差异性严重,需对工业指纹采集及分类模型研究,解决设备特征通用性问题,提升工控设备分类的准确性。

3、油气管网工控设备分类是发掘运行状态异常或非法接入设备的基础,如何利用现场网络流量或工艺数据准确建模工控设备状态并对设备进行分类是现阶段急需解决的问题。特定于工控系统的工控设备指纹通常受网络协议和通信方式的制约,导致指纹提取和训练数据获取难度较大,分类模型准确率差异性严重。


技术实现思路

1、针对上述技术不足,本专利技术的目的为一种基于资产指纹大模型的工控设备分类方法,通过抓取工控系统中的流量和信息建立工控设备训练指纹库,并将其输入llama-3-8b-bnb-4bit模型进行训练形成资产指纹大模型,接下来对工控系统流量和信息进行二次抓取形成测试指纹库,输入资产指纹大模型,以实现设备分类。

2、本专利技术为实现上述目的所采用的技术方案是:

3、一种基于资产指纹大模型的工控设备分类方法,包括以下步骤:

4、抓取工业控制系统中的设备信息和流量信息,建立工业控制系统中设备的训练指纹库;

5、选取基础大模型并将训练指纹库输入该模型进行训练,得到资产指纹大模型;

6、对工业控制系统进行二次旁路检测,抓取新的设备信息和流量信息建立工业控制系统中设备的测试指纹库;

7、将测试指纹库输入资产指纹大模型,模型根据已有学习,自动识别设备,实现工控设备分类。

8、所述建立工业控制系统中设备的训练指纹库,包括以下步骤:

9、特征提取:从网络数据包的头部提取多个特征,并额外增加有效载荷熵、协议以及源和目标端口类别;

10、特征选择:使用基于特征重要性的投票方法去除不必要的特征;

11、构建最终特征集:使用遗传算法从特征选择后的特征中进行特征筛选,使用剩余的特征构建训练指纹库。

12、所述特征提取,具体为:

13、利用多种不同的算法计算每个设备的所有特征的重要性得分,并通过加权求和的投票方式,保留得分大于阈值的特征作为对设备有用的特征,其数学表示为:

14、

15、其中,为fi特征的总得分,fi为每个特征,algorithms是使用的所有算法的集合,为每种算法对特征重要性评分。

16、所述选取基础大模型并将训练指纹库输入该模型进行训练,具体为:

17、选取llama-3-8b-bnb-4bit模型作为工控设备分类的llama3模型;

18、选取adamw优化器对llama-3-8b-bnb-4bit模型进行优化;

19、使用余弦退火算法对优化后的模型进行微调;

20、设置基于样本量的训练轮数预测函数,基于该函数得到模型训练最佳轮数区间。

21、所述adamw优化器具体为:

22、

23、其中,θt,i是在时间步t的第i个参数,η是学习率,是偏差校正的一阶动量估计,是偏差校正的二阶动量估计,ωt,i是权重衰减系数,ε是一个常数。

24、所述余弦退火算法具体为:

25、

26、其中,ηt是在时间步t的学习率,ηmax和ηmin分别是学习率的最小值和最大值,tcur是当前的训练周期数,tmax是一个完整的余弦周期所包含的训练周期数。

27、所述基于样本量的训练轮数预测函数,具体为:

28、

29、其中,α表示微调轮数函数的调整常数,β表示微调轮数函数的线性系数,x表示训练集样本量。

30、一种基于资产指纹大模型的工控设备分类系统,包括:

31、训练指纹库构建模块,用于抓取工业控制系统中的设备信息和流量信息,建立工业控制系统中设备的训练指纹库;

32、大模型训练模块,用于选取基础大模型并将训练指纹库输入该模型进行训练,得到资产指纹大模型;

33、测试指纹库构建模块,用于对工业控制系统进行二次旁路检测,抓取新的设备信息和流量信息建立工业控制系统中设备的测试指纹库;

34、设备分类模块,用于将测试指纹库输入资产指纹大模型,模型根据已有学习,自动识别设备,实现工控设备分类。

35、一种基于资产指纹大模型的工控设备分类装置,包括存储器和处理器;所述存储器,用于存储计算机程序;所述处理器,用于当执行所述计算机程序时,实现所述的一种基于资产指纹大模型的工控设备分类方法。

36、一种计算机可读存储介质,所述存储介质上存储有计算机程序,当所述计算机程序被处理器执行时,实现所述的一种基于资产指纹大模型的工控设备分类方法。

37、本专利技术具有以下有益效果及优点:

38、1.本专利技术将llama3模型微调后形成的资产指纹大模型应用于工控设备分类,为工业系统设备分类领域提供了新的视角。

39、2.本专利技术区别于现有有监督和无监督的机器学习算法,通过llama-3-8b-bnb-4bit基础大语言模型进行训练,所得的资产指纹大模型有助于提高识别设备和对设备进行分类的准确性。

本文档来自技高网...

【技术保护点】

1.一种基于资产指纹大模型的工控设备分类方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于资产指纹大模型的工控设备分类方法,其特征在于,所述建立工业控制系统中设备的训练指纹库,包括以下步骤:

3.根据权利要求2所述的一种基于资产指纹大模型的工控设备分类方法,其特征在于,所述特征提取,具体为:

4.根据权利要求1所述的一种基于资产指纹大模型的工控设备分类方法,其特征在于,所述选取基础大模型并将训练指纹库输入该模型进行训练,具体为:

5.根据权利要求4所述的一种基于资产指纹大模型的工控设备分类方法,其特征在于,所述AdamW优化器具体为:

6.根据权利要求4所述的一种基于资产指纹大模型的工控设备分类方法,其特征在于,所述余弦退火算法具体为:

7.根据权利要求4所述的一种基于资产指纹大模型的工控设备分类方法,其特征在于,所述基于样本量的训练轮数预测函数,具体为:

8.一种基于资产指纹大模型的工控设备分类系统,其特征在于,包括:

9.一种基于资产指纹大模型的工控设备分类装置,其特征在于,包括存储器和处理器;所述存储器,用于存储计算机程序;所述处理器,用于当执行所述计算机程序时,实现如权利要求1-7任一项所述的一种基于资产指纹大模型的工控设备分类方法。

10.一种计算机可读存储介质,其特征在于,所述存储介质上存储有计算机程序,当所述计算机程序被处理器执行时,实现如权利要求1-7任一项所述的一种基于资产指纹大模型的工控设备分类方法。

...

【技术特征摘要】

1.一种基于资产指纹大模型的工控设备分类方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于资产指纹大模型的工控设备分类方法,其特征在于,所述建立工业控制系统中设备的训练指纹库,包括以下步骤:

3.根据权利要求2所述的一种基于资产指纹大模型的工控设备分类方法,其特征在于,所述特征提取,具体为:

4.根据权利要求1所述的一种基于资产指纹大模型的工控设备分类方法,其特征在于,所述选取基础大模型并将训练指纹库输入该模型进行训练,具体为:

5.根据权利要求4所述的一种基于资产指纹大模型的工控设备分类方法,其特征在于,所述adamw优化器具体为:

6.根据权利要求4所述的一种基于资产指纹大模型的工控设备分类方法...

【专利技术属性】
技术研发人员:赵剑明金子雯孙铁良盛川吕峰王天宇黄河曾鹏
申请(专利权)人:中国科学院沈阳自动化研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1