【技术实现步骤摘要】
基于机器学习的网络安全评估方法、装置、设备及介质
[0001]本专利技术涉及网络安全
,特别涉及一种基于机器学习的网络安全评估方法、装置、设备及介质。
技术介绍
[0002]网络安全风险评估主要是通过获取待评估目标数据,并通过把数据输入对应的评分模型来生成针对待评估目标的网络安全评分。现有的网络安全风险评估方法主要是采用基于规则的评分模型,即通过专家根据经验给出一套计算公式及其参数的权重,再根据事先制定好的模型规则进行评分,生成待评估目标的网络安全风险值。
[0003]上述方法的关键问题在于专家对计算公式的设计以及权重的选取,而专家评价的准确程度,主要取决于专家的阅历经验以及知识丰富的广度和深度。这就要求参加评价的专家对评价的系统具有较高的学术水平和丰富的实践经验。总的来说,专家评分法具有使用简单、直观性强的特点,但其理论性和系统性尚有欠缺,有时难以保证评价结果的客观性和准确性。
[0004]此外,基于专家经验的评价系统往往有着较强的针对性,即只适用于特定的场景或系统,针对新的业务需求,往往需要重新进行专家评估以及系统搭建,会引入大量的重复工作,不具有普遍性和通用性,专家的时间成本也比较高,在出现特征维度变化的情况下往往需要重新评估,因此专家评价的方法难以满足大数据环境下的网络安全评估要求。
[0005]此外,部分使用机器学习方法进行网络安全评分的模型也存在着精准性差的原因,在网络安全场景下,数据存在多源异构的特性,而不同维度、不同类型的数据使用的处理及训练方式不同,在进行网络安全风险评 ...
【技术保护点】
【技术特征摘要】
1.一种基于机器学习的网络安全评估方法,其特征在于,包括:获取待评估网络的网络安全相关数据,并将所述网络安全相关数据划分为连续型数据、文本数据、标签型数据以及类别型数据;将所述连续型数据输入第一子模型,所述第一子模型输出浮点型第一特征值,其中,所述第一子模型是以历史连续型数据为样本训练深度神经网络得到的;将所述文本数据分词后输入第二子模型,所述第二子模型输出浮点型第二特征值,其中,所述第二子模型是以历史文本数据为样本训练预训练模型和文本卷积层得到的;将所述类别型数据输入第三子模型,所述第三子模型输出浮点型第三特征值,其中,所述第三子模型是以历史类别型数据为样本训练树模型得到的;将所述浮点型第一特征值、所述浮点型第二特征值、所述浮点型第三特征值以及所述标签型数据输入第四子模型,所述第四子模型输出所述待评估网络的网络安全风险评分,其中,所述第四子模型是以历史浮点型第一特征值、历史浮点型第二特征值、历史浮点型第三特征值、历史标签型数据以及历史评分标签为样本训练逻辑回归模型得到的,所述第一子模型、所述第二子模型、所述第三子模型以及所述第四子模型构成风险评估模型。2.如权利要求1所述的基于机器学习的网络安全评估方法,其特征在于,所述历史评分标签是根据所述历史连续型数据、所述历史文本数据、所述历史类别型数据以及所述历史标签型数据评估得到的。3.如权利要求1所述的基于机器学习的网络安全评估方法,其特征在于,以历史文本数据为样本训练预训练模型和文本卷积层得到所述第二子模型,包括:将所述历史文本数据分词后的词向量输入所述预训练模型,将所述预训练模型输出的词嵌入之后的结果输入所述文本卷积层,所述文本卷积层的输出为历史浮点型第二特征值。4.如权利要求1所述的基于机器学习的网络安全评估方法,其特征在于,以历史类别型数据为样本训练树模型得到所述第三子模型,包括:将所述历史类别型数据中的每个安全漏洞指标作为训练数据集一条样本数据,每个安全漏洞指标对应多个特征,每个特征对应一个特征值,对每个特征对应的特征值进行编码,得到每个特征对应的编码特征值,每个安全漏洞指标对应的多个特征的编码特征值构成每个安全漏洞指标的特征值;构建多棵回归树,不同回归树的根节点映射的安全漏洞指标不同,每棵回归树包括非叶子节点和叶子节点,每个非叶子节点映射所述训练数据集中的一个安全漏洞指标,每个叶子节点映射基于该棵回归树中与该叶子节点相关联的非叶子节点的安全漏洞指标的特征值得到的预测结果,针对每棵回归树中的每个非叶子节点,对所述训练数据集中当前未映射有非叶子节点的所有安全漏洞指标分别计算收益值,将收益值最大的安全漏洞指标映射到该非叶子节点上;将多棵回归树结合样本数据,进行训练,得到所述第三子模型。5.如权利要求4所述的基于机器学习的网络安全评估方法,其特征在于,对所述训练数据集中当前未映射有非叶子节点的所有安全漏洞指标分别计算收益值,包括:将每个非叶子节点视为当前分裂点,通过以下公式计算收益值:
其中,表示当前分裂点对应的收益值,为当前分裂点对应的特征集合,为当前分裂点分裂后的左子节点对应的特征集合,为当前分裂点分裂后的右子节点对应的特征集合,为前一棵回归树对应的损失函数的泰勒展开项的一阶导数,为前一棵回归树对应的损失函数的泰勒展开项的二...
【专利技术属性】
技术研发人员:胡维,梁露露,李季,
申请(专利权)人:北京源堡科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。