【技术实现步骤摘要】
一种面向空天地信息网络的加密流量非均衡处理方法
[0001]本专利技术涉及卫星通信
,特别涉及一种面向空天地信息网络的加密流量非均衡处理方法。
技术介绍
[0002]真实的空天地信息网络不同类型加密流量数据分布差异极大,由于深度学习算法模型倾向于对非均衡的样本流量中的少数类样本类型识别为多数类样本,识别结果可靠性大幅度下滑。
技术实现思路
[0003]本专利技术针对现有技术的缺陷,提供了一种面向空天地信息网络的加密流量非均衡处理方法,在同一会话中选择少数类近邻生成样本,通过对算法存在的对少数类样本的边界选取问题进行条件限制,解决了加密流量应用识别的非均衡问题。
[0004]为了实现以上专利技术目的,本专利技术采取的技术方案如下:
[0005]一种面向空天地信息网络的加密流量非均衡处理方法,包括以下步骤:
[0006]S1:构建Borderline
‑
SMOTE算法;
[0007]Borderline
‑
SMOTE通过设置规则来判断有哪些少数类样本需要依据规则合成新数据,从而解决了没有考虑真实加密流量数据分布情况,对近邻的样本盲目生成的问题。设训练集合的少数类别的样本集合为T,然后在训练集合中确定每个样本x
i
的最邻近k采样样本,并将含有多数类别采样的数量表示为k
′
。如果。如果样本周围少数类样本超过一半,样本安全,不需要进行过采样;如果k=k
′
,此时近邻样本全部为多数类样本 ...
【技术保护点】
【技术特征摘要】
1.一种面向空天地信息网络的加密流量非均衡处理方法,其特征在于,包括以下步骤:S1:构建Borderline
‑
SMOTE算法;Borderline
‑
SMOTE通过设置规则来判断有哪些少数类样本需要依据规则合成新数据,从而解决了没有考虑真实加密流量数据分布情况,对近邻的样本盲目生成的问题;设训练集合的少数类别的样本集合为T,然后在训练集合中确定每个样本x
i
的最邻近k采样样本,并将含有多数类别采样的数量表示为k
′
;如果;如果样本周围少数类样本超过一半,样本安全,不需要进行过采样;如果k=k
′
,此时近邻样本全部为多数类样本,判定为噪声,不进行处理;剩下的少数类样本均被判定为危险样本,处于多数类样本和少数类样本的边界;S2:流量分割;将连续的原始流量数据文件被分割为若干个独立的流量;连续的原始流量数据中包含不同大小的包p
i
,P={p1,p2,...,p
N
},其中N表示原始流量中数据包的数量;对于一个单独的数据包p
i
来说,定义为式(1)所示:p
i
=(x
i
,t
i
,b
i
)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)x
i
表示五元组,分别是源IP、目的IP、源端口、目的端口、传输层协议;t
i
表示第i个数据包开始的时间,b
i
表示其大小;有两种常见的分割流量的方式,基于网络流(flow)或是基于会话(sessi...
【专利技术属性】
技术研发人员:王哓龙,李源,徐佳康,许海涛,
申请(专利权)人:北京鹏鹄物宇科技发展有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。