一种基于深度学习的Webshell流量检测方法技术

技术编号：36861411 阅读：32 留言：0更新日期：2023-03-15 18:34

本发明专利技术公开了一种基于深度学习的Webshell流量检测方法，属于网络安全技术领域，包括以下步骤：获取流量数据包并进行预处理，获得预设格式的HTTP报文；对HTTP报文中正常文件与Webshell之间的差异字段进行特征提取后进行拼接，获得特征值；基于BERT模型对特征值进行编码，获得对应的特征向量；将特征向量输入到设计优化后的多维空间TextCNN检测模型中进行二分类任务，检测流量数据包中的Webshell。本发明专利技术结合设计优化的多维空间TextCNN检测模型学习不同空间维度的特征信息，能够从时间维度找到关联，能够从空间维度上挖掘信息，最终实现更高的检测精确度。最终实现更高的检测精确度。最终实现更高的检测精确度。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于深度学习的Webshell流量检测方法

[0001]本专利技术属于网络安全
，特别是涉及一种基于深度学习的Webshell流量检测方法。

技术介绍

[0002]Webshell是一种由编程语言如PHP、JSP和ASP等写成的程序，该程序拥有获取服务器基本信息，操作文件和数据库，执行系统命令等功能。攻击者通常通过Web服务的漏洞如sql注入、文件上传、命令执行等将Webshell代码以独立文件或追加到已有文件的方式保存到服务器中，然后通过直接或间接的方式来访问该Webshell，从而实现对服务器的控制。因此，对Web服务器可能存在的Webshell进行有效地检测，能够保障服务器的稳定运行，避免受到黑客的攻击破坏，更好地维护网络空间安全。
[0003]目前检测Webshell的检测技术大致可以分为三大类：基于文件的检测、基于日志的检测和基于流量的检测。
[0004]基于文件的检测通常是分析文件的文本特征和统计特征，类似白盒测试，需要拿到文件的源码。基于日志的检测根据服务器日志文件中的网站访问信息，具有轻量化的特点。基于流量的检测方法即通过攻击者和Webshell通信时产生的流量特征来进行检测。流量与日志的检测类似于黑盒测试，无需获取文件源码，可保证用户的隐私。
[0005]以上三类检测方法都在一定程度上存在不足：基于文件的检测方法在检测时往往需要消耗大量的计算资源和时间，同时由于涉及到源码的扫描行为，存在一定程度上的隐私问题，并且无法应对新型无文件落地的内存马。基于日志的检测方法依赖...

【技术保护点】

【技术特征摘要】
1.一种基于深度学习的Webshell流量检测方法，其特征在于，包括以下步骤：获取流量数据包并进行预处理，获得预设格式的HTTP报文；对所述HTTP报文中正常文件与Webshell之间的差异字段进行特征提取后进行拼接，获得特征值；基于BERT模型对所述特征值进行编码，获得对应的特征向量；构建多维空间TextCNN检测模型，将所述特征向量输入到设计优化后的多维空间TextCNN检测模型中进行二分类任务，检测所述流量数据包中的Webshell。2.根据权利要求1所述的基于深度学习的Webshell流量检测方法，其特征在于，所述流量数据包为pcap格式，对流量数据包进行预处理的过程包括：对所述流量数据包进行解析，提取出每一条HTTP请求报文，基于请求方法，将所述HTTP请求报文中的字段保存为CSV格式。3.根据权利要求2所述的基于深度学习的Webshell流量检测方法，其特征在于，将所述HTTP请求报文中的字段保存为CSV格式的过程还包括：在数据传输过程中，基于HTTP协议对所述HTTP请求报文中的特殊字符进行URL解码的处理。4.根据权利要求1所述的基于深度学习的Webshell流量检测方法，其特征在于，所述HTTP报文中正常文件与Webshell之间的差异字段包括：请求方法、请求载荷、请求载荷的长度、User
‑
Agent、Cookie、Accept
...

【专利技术属性】
技术研发人员：江魁，余志航，
申请(专利权)人：深圳大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人