【技术实现步骤摘要】
一种基于LSTM的恶意流量检测方法及装置
[0001]本专利技术属于异常流量检测
,尤其涉及一种基于LSTM的恶意流量检测方法及装置。
技术介绍
[0002]网络流量作为信息的重要载体,通过分析网络流量可以具体直观地了解通信双方的行为活动,对网络关键节点的流量进行采集汇聚,对系统进行整体感知,异常告警,实施动态实时可视化检测,重点分析异常登录行为、异常数据包传输、异常用户IP地址等信息,是构建异常流量检测算法必须重点考虑的问题。IDS(Intrusion Detection System,入侵检测系统)是常用的进行网络流量分析的技术,目前也出现了众多进行流量检测的算法,如深度学习、熵值计算等,但网络异常流量在时间和空间上都具有一定的相关性,传统的深度学习算法难以满足实时性的要求,不适用于真实的网络环境。
[0003]目前基于特征字段的方法在异常流量检测领域具有较为广泛的应用,通过分析已知流量数据,从中提取字符串作为特征字段,建立特征字段库对流量数据进行匹配检查。该方法可以较好的检测出已知病毒的攻击,但对于攻击变种检测效果不佳,而且特征字段库的建立、维护和更新较为困难,需要占据额外存储。
[0004]也有一些专家将卷积神经网络(CNN)与长短期卷积神经网络(LSTM)进行混合来检测异常流量,现有的基于LSTM的卷积神经网络异常流量检测方法,通过在CNN提取单个数据包空间特征的基础上,充分挖掘攻击流量的结构特点,利用LSTM提取数据流的时间特征,向LSTM部分输出一个高维数据包向量,LSTM部分将高 ...
【技术保护点】
【技术特征摘要】
1.一种基于LSTM的恶意流量检测方法,其特征在于包括以下步骤:步骤1:获取原始网络流量;步骤2:根据网络实际情况及攻击模式,选取数据包数、字节数、流持续时间和每秒平均请求数作为检测指标;步骤3:利用PCA对前述检测指标进行线性变换,求解检测指标的特征值和特征向量,计算各检测指标的方差贡献率,选取累计贡献率大于设定值的前m个检测指标进入检测模型;步骤4:将历史流量数据和经PCA处理后提取的前m个检测指标,及对应的网络状态放入LSTM网络;所述LSTM网络包括输入层、LSTM
‑
1层、LSTM
‑
2层、全连接层、softmax分类层和输出层;采用Adam算法对LSTM网络进行训练,包括:步骤4.1:根据损失函数对每个参数的梯度的一阶矩估计和二阶矩估计进行动态调整,得到每个参数的学习速率;步骤4.2:对时间序列向量化,将网络流分成包,保留包的时间步长信息;步骤4.3:将每个数据包中的流量字节按照时间顺序依次输入至LSTM
‑
1层网络中,为每个数据包生成一个数据包向量,将这些向量按照网络流内通信双方的交互顺序进行排列,形成数据包向量序列;步骤4.4:将步骤4.3得到的数据包向量放至LSTM
‑
2层学习网络流特征,即学习每个数据包向量之间的序列关系,形成一个网络流向量;步骤4.5:将LSTM
‑
1层和LSTM
‑
2层得到的多级特征向量进行融合连接,输入到全连接的神经网络中进行学习;步骤4.6:对步骤4.5全连接层输出的向量进行维度转换,并进行softmax分类;步骤4.7:根据历史数据预测网络状态,如输出结果为正常,则返回到步骤4;如输出结果为异常,则将此流量信息放至异常流量库中,并执行步骤5;步骤5:对异常流量数据进行熔断处理;控制器检测该网络流量中是否存在攻击流的特征信息;若有,则暂停其对目标服务器的访问;若没有,则再次对该流量数据进行核实,核实结果属于“正常”流量,则返回步骤4;核实结果属于“异常”流量,则将此流量信息放至异常流量库中,并将熔断网络流的信息作为SDN交换机的流表进行下发,执行熔断处理。2.根据权利要求1所述基于LSTM的恶意流量检测方法,其特征在于:所述LSTM
‑
1层和LSTM
‑
2层两阶段LSTM网络,其结构包括三个乘法门构成的专门记忆单元,分别为遗忘门、输入门和输出门;所述遗忘门用来学习信息在记忆单元中存储的时间,并决定当前是否需要忘记之前时间点的某些信息,通过sigmoid函数对信息进行读取,0表示完全丢弃,1表示完全保留;具体表达式如下:f
t
=σ
a
(e
f
·
[h
t
‑1,x
l
]+d
f
)其中,f
t
表示LSTM网络的更新遗忘门,σ
a
(x)为遗忘门激活函数,e
f
为遗忘门权值矩阵,h
t
‑1为上一层的输出门,x
l
为源网络流,d
f
为偏置向量;所述输入门决定需要学习的信息,由sigmoid层对输入值进行更新,利用tanh层创建一个新的候选值向量并加入到状态中;
其中,e
i
为输入门权重矩阵,d
i
为偏置向量,σ
c
(x)为输入门激活函数,e
c
与d
c
分别代表tanh函数权重与系统偏置向量,w
t
为候选状态;由上式可得:c
t
=f
t
c
t
‑1+i
L
w
t
其中c
t
为状态信息;所述输出门决定最终输出的值;首先通过sigmoid确定输出状态,再通过tanh函数将输出信息进行映射;输出门h
t
如下:h
t
=σ
b
(e
o
·
[h
t
‑1,x
l
]+d
o
)tanh(c
t
)其中,e
o
为输出门权重矩阵...
【专利技术属性】
技术研发人员:李雪,王忠,刘延飞,范青刚,陈菁,刘鑫,
申请(专利权)人:中国人民解放军火箭军工程大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。