一种网页后门检测方法、装置、终端及存储介质制造方法及图纸

技术编号：22025040 阅读：24 留言：0更新日期：2019-09-04 02:06

本发明专利技术涉及一种网页后门检测方法、装置、终端及存储介质，所述方法包括：获取待检测文件；提取所述待检测文件的特征；将所述待检测文件的特征输入支持向量机预测模型，并通过所述预测模型输出检测结果；其中，所述预测模型的生成方法包括：计算黑白样本集合的词向量；碰撞所述黑白样本集合，以获得能够分类所述黑白样本集合的分类特征；使用所述词向量对所述分类特征进行扩充。本发明专利技术能够自动实现特征的自动提取，并且具有语义信息，使得特征更加客观有效；人工干预少，效率高，在检出率和误报率方面有一定的精度。

A Backdoor Detection Method, Device, Terminal and Storage Media for Web Pages

全部详细技术资料下载

【技术实现步骤摘要】
一种网页后门检测方法、装置、终端及存储介质
本专利技术涉及信息安全
，尤其涉及一种网页后门检测方法、装置、终端及存储介质。
技术介绍
webshell，顾名思义：web指的是在web服务器上，而shell是用脚本语言编写的脚本程序，webshell就是web的一个管理工具，可以对web服务器进行操作的权限，也叫webadmin。webshell一般是被网站管理员用于网站管理、服务器管理等等一些用途，但是由于webshell的功能比较强大，可以上传下载文件，查看数据库。甚至可以调用一些服务器上系统的相关命令(比如创建用户，修改删除文件之类的)，通常被黑客利用，黑客通过一些上传方式，将自己编写的webshell上传到web服务器的页面的目录下，然而通过页面访问的形式进行入侵，或者通过插入一句话连接本地的一些相关工具直接对服务器进行入侵操作。
技术实现思路
本专利技术所要解决的技术问题在于，提供一种网页后门检测方法、装置、终端及存储介质，可实现自动化选取特征，并且具有语义信息，使得特征更加客观有效。为了解决上述技术问题，第一方面，本专利技术提供了一种网页后门检测方法，包括：获取待检测文件；提取所述待检测文件的特征；将所述待检测文件的特征输入支持向量机预测模型，并通过所述预测模型输出检测结果；其中，所述预测模型的生成方法包括：计算黑白样本集合的词向量；碰撞所述黑白样本集合，以获得能够分类所述黑白样本集合的分类特征；使用所述词向量对所述分类特征进行扩充。第二方面，本专利技术提供了一种网页后门检测装置，包括：获取模块，用于获取待检测文件；提取模块，用于提取所述待检测...

【技术保护点】
1.一种网页后门检测方法，其特征在于，包括：获取待检测文件；提取所述待检测文件的特征；将所述待检测文件的特征输入支持向量机预测模型，并通过所述预测模型输出检测结果；其中，所述预测模型的生成方法包括：计算黑白样本集合的词向量；碰撞所述黑白样本集合，以获得能够分类所述黑白样本集合的分类特征；使用所述词向量对所述分类特征进行扩充。

【技术特征摘要】
1.一种网页后门检测方法，其特征在于，包括：获取待检测文件；提取所述待检测文件的特征；将所述待检测文件的特征输入支持向量机预测模型，并通过所述预测模型输出检测结果；其中，所述预测模型的生成方法包括：计算黑白样本集合的词向量；碰撞所述黑白样本集合，以获得能够分类所述黑白样本集合的分类特征；使用所述词向量对所述分类特征进行扩充。2.根据权利要求1所述的一种网页后门检测方法，其特征在于，所述计算黑白样本集合的词向量具体包括：获取所述黑白样本，对所述黑白样本的文本进行分词；统计所述文本中的每个词的词频；根据所述词频进行哈夫曼编码；根据所述哈夫曼编码对所述文本进行词向量训练。3.根据权利要求1所述的一种网页后门检测方法，其特征在于，所述使用所述词向量对所述分类特征进行扩充包括：计算所述分类特征所对应的词向量与其他词向量的距离；选取与所述分类特征的距离小于预设阈值的词作为所述分类特征的同义词，并将所述同义词扩充为所述分类特征。4.根据权利要求3所述的一种网页后门检测方法，其特征在于，所述预测模型生成方法还包括模型训练，所述模型训练包括：采用监督学习对黑样本和白样本进行特征提取；将所述特征输入支持向量机进行训练学习；生成所述预测模型。5.根据权利要求1所述的一种网页后门检测方法，其特征在于，当所述待检测文件经检测后确认为webshell时，将所述待检测文件和所述样本集合重新进行深度学习，以更新所述预测模型。6.一种网页后门检测装置，其特征在于，包括：获取模块，用于获取待检测文件；提取模块，用于提取所述待检测文件的特征；检测模块，用于将所述待检测文件的特征输入支持向量机预测模型，并通过所述预测模型输出检测结果；预测模型生成模块，包括特征选取模块，用于从样本集合中选取分类特征，所述特征选取模块包括：词向量计算模块，用于计算黑白样本集合的词向量；黑白样本碰撞模块，用于碰撞所述黑白样本集合，以获得能够分类所述黑白样本集合的分类特征；特征扩充模块，用于使用所述词向量对所述分类特征进行扩充。7.根据权利要求6所述的一种网页后门检测装置，其特征在于，所述词向量计算模块包括：分词模块...

【专利技术属性】
技术研发人员：张壮，董志强，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人