一种服务网格单元安全防护策略集推荐方法技术

技术编号:32222071 阅读:12 留言:0更新日期:2022-02-09 17:27
发明专利技术公开了一种服务网格单元安全防护策略集推荐方法,涉及数据安全技术领域。本发明专利技术包括如下步骤:步骤S1:服务网格单元与安全防护策略聚类计算;步骤S2:服务网格单元的隶属度矩阵计算;步骤S3:安全防护策略隶属度计算;步骤S4:生成随机森林;步骤S5:安全防护策略个性化在线推荐。本发明专利技术通过对服务资源网格和安全策略进行聚类后,计算每个服务网格单元或安全策略对每个簇的隶属度,在计算隶属度时也充分考虑了服务网格单元的基本安全属性、时空、行为等多种因素耦合情况,根据隶属度和评分矩阵构造监督学习模型的训练数据,并离线训练随机森林模型,提高个性化安全防护策略推荐效率。率。率。

【技术实现步骤摘要】
一种服务网格单元安全防护策略集推荐方法


[0001]本专利技术属于数据安全
,特别是涉及一种服务网格单元安全防护策略集推荐方法。

技术介绍

[0002]由于服务网格内各单元数量庞大,同时时空条件变化较快,各类服务网格单元的安全防护策略很难穷尽所有应用场景,随着数据中心规模越来越大,服务单元生产速度会随着数据和应用增加呈现指数级的增长,策略的生产速度往往赶不上服务网格结构变化与服务单元增长的速度。
[0003]结合服务应用场景和防护要求,将安全防护策略集的优化结果,进行个性化推荐。实现在不同主机环境下、不同任务、不同时间段、不同安全态势下的服务网格单元安全防护策略动态调整,根据服务网格单元固有安全特征和安全事件实时动态特征,寻找最佳匹配效果的安全防护策略,实现安全防护策略的个性化推荐。
[0004]但考虑到服务网格单元与策略特征均是多维属性,我们在考虑多因素耦合的前提下,采用基于聚类和随机森林的协同过滤算法实现快速的个性化安全防护策略推荐。已有基于聚类的协同过滤算法主要通过缩小最邻近数据资源(或安全策略)的搜索空间提高推荐的效率。虽然聚类过程可离线完成,但最邻近搜索仍然是一个在线的过程。本申请文件针对这一点进行了改进。

技术实现思路

[0005]本专利技术的目的在于提供一种服务网格单元安全防护策略集推荐方法,通过对服务资源网格和安全策略进行聚类后,计算每个服务网格单元或安全策略对每个簇的隶属度,在计算隶属度时也充分考虑了服务网格单元的基本安全属性、时空、行为等多种因素耦合情况,根据隶属度和评分矩阵构造监督学习模型的训练数据,并离线训练随机森林模型,进行评分预测,解决了现有的服务网格各单元应用效果差、数据资源防护低的问题。
[0006]为解决上述技术问题,本专利技术是通过以下技术方案实现的:
[0007]本专利技术为一种服务网格单元安全防护策略集推荐方法,包括如下步骤:
[0008]步骤S1:服务网格单元与安全防护策略聚类计算;
[0009]步骤S2:服务网格单元的隶属度矩阵计算;
[0010]步骤S3:安全防护策略隶属度计算;
[0011]步骤S4:生成随机森林;
[0012]步骤S5:安全防护策略个性化在线推荐。
[0013]作为一种优选的技术方案,所述步骤S1中,服务网格单元与安全防护策略聚类计算包括特征分析与提取和聚类计算;
[0014]所述服务网格单元安全特征包括基本安全属性、时空属性和行为属性;所述安全属性包括单元基本信息、敏感属性、安全属性、组织结构属性、分级分类属性、关键词表属
性;所述时空属性包括时间范围、业务/应用/任务/用户组类别、服务承载环境风险度;所述行为属性包括最近1、2、3、5、7、15、28天的该服务网格单元查看数据事件次数、写入数据次数、修改数据次数、传输数据次数、交换数据次数、应用数据次数安全事件的行为习惯和规律;
[0015]所述安全防护策略特征包括策略基本属性、时空属性和行为属性,所述基本属性包括策略规则设计的资源属性范围、规则复杂度、规则数量、安全服务数量;所述时空属性包括时间范围、业务/应用/任务/用户组类别、服务承载环境风险度;所述安全策略行为属性,包括:最近1、2、3、5、7、15、28天的安全防护策略中查看数据事件次数、写入数据事件次数、修改数据事件次数、传输数据事件次数、交换数据次数事件、应用数据事件次数;所述查看数据事件中使用策略的网格单元数量占用总网格单元数量比值;所述写入数据事件中使用策略的网格单元数量占用总网格单元数量比值;所述修改数据事件中使用策略的网格单元数量占用总网格单元数量比值;所述传输数据事件中使用策略的网格单元数量占用总网格单元数量比值;所述交换数据事件中使用策略的网格单元数量占用总网格单元数量比值;所述应用数据事件中使用策略的网格单元数量占用总网格单元数量比值。
[0016]作为一种优选的技术方案,所述聚类计算采用二分k

means聚类算法对服务网格单元与安全防护策略进行特征聚类;所述二分k

means聚类算法先将所有样本划分为两簇,再对所有簇中样本数最多的簇进行再次二分,重复此步骤直到簇数达到预先设定的正整数k为止;所述二分k

means聚类算法具体流程如下:
[0017]步骤K1:在样本集中随机选取两个样本作为初始簇中心;
[0018]步骤K2:计算所有样本与簇中心的相似度,并将这些样本划分到与其相似度最高的簇中;
[0019]步骤K3:计算各簇中所有样本的均值,作为新的簇中心;
[0020]步骤K4:重复步骤K1和步骤K3步骤,直到所有簇中心都不再改变;
[0021]步骤K5:从划分后的簇中选取样本数最多的簇,对其进行步骤K1至步骤K4的划分;
[0022]步骤K6:重复步骤K5直到簇数达到k为止。
[0023]作为一种优选的技术方案,所述步骤S2中,采用向量的余弦值表示服务网格单元样本与簇中心的相似度,作为样本对簇的隶属度,簇中心为该簇中所有样本的均值;所述隶属度矩阵公式为:
[0024][0025]式中,U表示服务网格单元样本数量,N表示簇数量;
[0026]所述务网格单元样本u,簇中心为v,则u属于簇v的隶属度表达公式为:
[0027]sim
D
(u,v)=α
D
sim
DB
(u,v)+β
D
sim
DT
(u,v)+ε
D
sim
DS
(u,v)+χ
D
sim
DA
(u,v);
[0028]式中,α
D
,β
D
,ε
D
,χ
D
分别代表服务网格单元基本安全属性、时间属性、空间属性和行为属性的权重系数。
[0029]作为一种优选的技术方案,所述步骤S3中,安全防护策略隶属度计算公式为:
[0030][0031]式中,K表示安全防护策略数量,M表示簇数量。
[0032]作为一种优选的技术方案,所述步骤S4中,生成随机森林的具体步骤如下:
[0033]步骤R1:将服务网格单元的隶属度矩阵、安全防护策略隶属度矩阵进行合并得到随机森林模型的训练样本;
[0034]步骤R2:数据转换后,将输出变量已存在的样本作为随机森林模型的训练样本;
[0035]步骤R3:确定算法的初始参数,随机设定一下参数的初始值:决策树棵数L、特征属性个数m;
[0036]步骤R4:采用Bootstrap算法对样本数据进行采样,随机生成L个训练集,并在每个训练集中随机选出预测试样本;
[0037]步骤R5:利用每个训练集剩下的样本来分别生成决策树,共L棵,在生成过程中,每次选择属性前,均从全部特征属性中选出m个属性作为每一个决策树分叉点的决策属性;
...

【技术保护点】

【技术特征摘要】
1.一种服务网格单元安全防护策略集推荐方法,其特征在于,包括如下步骤:步骤S1:服务网格单元与安全防护策略聚类计算;步骤S2:服务网格单元的隶属度矩阵计算;步骤S3:安全防护策略隶属度计算;步骤S4:生成随机森林;步骤S5:安全防护策略个性化在线推荐。2.根据权利要求1所述的一种服务网格单元安全防护策略集推荐方法,其特征在于,所述步骤S1中,服务网格单元与安全防护策略聚类计算包括特征分析与提取和聚类计算;所述服务网格单元安全特征包括基本安全属性、时空属性和行为属性;所述安全属性包括单元基本信息、敏感属性、安全属性、组织结构属性、分级分类属性、关键词表属性;所述时空属性包括时间范围、业务/应用/任务/用户组类别、服务承载环境风险度;所述行为属性包括最近1、2、3、5、7、15、28天的该服务网格单元查看数据事件次数、写入数据次数、修改数据次数、传输数据次数、交换数据次数、应用数据次数安全事件的行为习惯和规律;所述安全防护策略特征包括策略基本属性、时空属性和行为属性,所述基本属性包括策略规则设计的资源属性范围、规则复杂度、规则数量、安全服务数量;所述时空属性包括时间范围、业务/应用/任务/用户组类别、服务承载环境风险度;所述安全策略行为属性,包括:最近1、2、3、5、7、15、28天的安全防护策略中查看数据事件次数、写入数据事件次数、修改数据事件次数、传输数据事件次数、交换数据次数事件、应用数据事件次数;所述查看数据事件中使用策略的网格单元数量占用总网格单元数量比值;所述写入数据事件中使用策略的网格单元数量占用总网格单元数量比值;所述修改数据事件中使用策略的网格单元数量占用总网格单元数量比值;所述传输数据事件中使用策略的网格单元数量占用总网格单元数量比值;所述交换数据事件中使用策略的网格单元数量占用总网格单元数量比值;所述应用数据事件中使用策略的网格单元数量占用总网格单元数量比值。3.根据权利要求2所述的一种服务网格单元安全防护策略集推荐方法,其特征在于,所述聚类计算采用二分k

means聚类算法对服务网格单元与安全防护策略进行特征聚类;所述二分k

means聚类算法先将所有样本划分为两簇,再对所有簇中样本数最多的簇进行再次二分,重复此步骤直到簇数达到预先设定的正整数k为止;所述二分k

means聚类算法具体流程如下:步骤K1:在样本集中随机选取两个样本作为初始簇中心;步骤K2:计算所有样本与簇中心的相似度,并将这些样本划分到与其相似度最高的簇中;步骤K3:计算各簇中所有样本的均值,作为新的簇中心;步骤K4:重复步骤K1和步骤K3步骤,直到所有簇中心都不再改变;步骤K5:从划分后的簇中选取样本数最多的簇,对其进行步骤K1至步骤K4的划分;步骤K6:重复步骤K5直到簇数达到k为止。4.根据权利要求1所述的一种服务网格单元安全防护策略集推荐方法,其特征在于,所述步骤S2中,采用向量的余弦值表示服务网格单元样本与簇中心的相似度,作为样本对簇的隶属度,簇中心为该簇中所有样本的均值;...

【专利技术属性】
技术研发人员:周保琢周鑫袁志成
申请(专利权)人:安徽省观智数科信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1