一种基于基线行为刻画的通联异常发现方法及装置制造方法及图纸

技术编号：30641538 阅读：22 留言：0更新日期：2021-11-04 00:39

本发明专利技术公开一种基于基线行为刻画的通联异常发现方法及装置，包括对待测流量数据进行数据清洗及预处理，得到流量矩阵y；利用CapsNet模型构建自编码器，并基于所述自编码器，获取流量矩阵y的重构流量矩阵根据流量矩阵y与重构流量矩阵得到通联异常发现结果。本发明专利技术可以从输入数据中自动提取特征，可将流量特征之间的特定位置以及数据之间的排列顺序作为学习的特征，且向量的方向可以表示特征值的大小、相对位置等属性，既能识别正常行为并且对已知的异常行为进行检测，又能发现新型未知的网络攻击。新型未知的网络攻击。新型未知的网络攻击。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于基线行为刻画的通联异常发现方法及装置

[0001]本专利技术属于网络安全与计算机科学的交叉
，尤其涉及一种基于基线行为刻画的通联异常发现方法及装置，其提出一种异常通联行为发现模型，它基于胶囊自编码器建立正常行为基线，为发现没有明显特征或未知的网络异常行为提供线索。本专利技术涵盖网络流量数据预处理、基于胶囊自编码器的模型训练、通联关系异常检测。

技术介绍

[0002]随着网络在社会生活中地位越来越高，人们对网络的依赖也越来越强。然而，互联网的普及在给人们生活带来便利的同时，网络安全问题也日益严峻。在各种网络攻击中，非法入侵、DDoS攻击等恶意网络通信行为严重及其引发的数据泄露等事件影响用户对互联网的使用，并且随着技术的发展和进步，网络恶意攻击的流量特性变的日益复杂和隐蔽。这些攻击事件严重危害了用户的信息安全，并可能造成巨大的经济损失。因此如何在网络空间中检测网络中的恶意攻击源头和保障用户的信息安全是一个值得深入研究的课题。
[0003]网络攻击行为发生时往往会在网络流量中留下行为痕迹，因此基于流量的异常行为检测是一种常见的网络安全检测方法。目前异常流量检测领域主要有基于统计的方法、基于机器学习和深度学习模型的方法。基于统计的异常流量检测的效果取决于规则的编写，基于机器学习和深度学习模型的异常流量检测的效果取决于流量特征的选取和模型的设计。
[0004]在实际应用中，由于目前的防御技术不足或者为了保证业务系统运行放宽安全策略等原因，导致少部分没有明显特征或未知的异常难以识别，未知威胁流量一旦...

【技术保护点】

【技术特征摘要】
1.一种基于基线行为刻画的通联异常发现方法，其步骤包括：1)对待测流量数据进行数据清洗及预处理，得到一流量矩阵y；2)利用CapsNet模型构建自编码器，并基于所述自编码器，获取流量矩阵y的重构流量矩阵3)根据流量矩阵y与重构流量矩阵得到通联异常发现结果。2.如权利要求1所述的方法，其特征在于，数据清洗包括：字段归一化、无意义数据剔除和非主要字段的缺失字段填充。3.如权利要求1所述的方法，其特征在于，通过以下策略进行预处理：1)利用one
‑
hot编码方法，将清洗后网络流量数据中的符号特征数据转换成数值数据；2)基于Min
‑
Max归一化方法，将数值数据归一化；3)根据会话对待测流量数据进行切分，且依据设定的流量矩阵y大小，得到流量矩阵y。4.如权利要求3所述的方法，其特征在于，通过以下步骤对待测流量数据进行切分：1)设定待测流量数据为包含不同数据包p
k
的集合，且数据包p
k
＝(a
k
，len
k
，t
k
)，其中k＝1，2，...，|P|，|P|表示数据包个数，a
k
是第k个数据包的五元组，所述五元组包括：源IP、源端口、目的IP、目的端口和传输层协议，len
k
是第k个数据包的字节长度，len
k
∈(0，∞)，t
k
是第k个数据包的开始时间，t
k
∈(0，∞)；2)依据五元组，对各数据包p
k
进行分组，得到待测...

【专利技术属性】
技术研发人员：刘俊荣，潘海琪，卢志刚，崔泽林，崔苏苏，姜波，
申请(专利权)人：中国科学院信息工程研究所，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人