一种基于支持向量机的恶意脚本静态检测方法技术

技术编号:9668246 阅读:113 留言:0更新日期:2014-02-14 06:58
基于支持向量机的恶意脚本检测方法,包括以下步骤:1)从互联网抓取网页,获得网页链接;2)获取链接对应的Javascript脚本内容;3)对基于脚本的web入侵如SQL注入等进行分析,得到入侵相关的特征,并根据入侵特征对获取的脚本内容进行特征提取,将每个脚本转化成基于特征的特征向量;4)利用分类算法SVM获得最佳分类模型,并利用该模型对获得的特征向量进行分类,判断该脚本是否恶意脚本以做相关后续处理。

【技术实现步骤摘要】

本专利技术涉及恶意脚本测量技术,尤其是恶意Javascript的静态检测方法。
技术介绍
随着网络信息化的飞速发展,信息安全问题越来越受到重视。计算机病毒、木马、恶意脚本代码是计算机网络最主要的安全威胁。恶意脚本通过构造特殊的网页,其中包含木马,病毒,蠕虫或攻击性程序,在用户访问这些网页时传播到用户计算机中。恶意脚本是隐藏在脚本语言中的特殊代码,如js文件等,由于具有规范的脚本语言的格式,语法等,我们容易得到文件静态特征的大量信息,从中分析恶意脚本与良性脚本间的区别。JavaScript是一种轻量级的基于对象和事件驱动的脚本语言。在HTML基础上使用JavaScript可以开发交互式Web网页,使得网页与用户实现实时的,动态的交互。但是,JavaScript也容易被用于恶意攻击,如跨站脚本攻击,SQL注入攻击及被动下载攻击等。JavaScript有两个特点:第一,JavaScript是一种像文件一样的描述语言,通过浏览器就可以直接执行;其二、JavaScript编写在HTML文件中,直接查看网页的原始码,就可以看到JavaScript程序,所以没有保护,任何人都可以通过HTML文件复制程序。这两个特点使JavaScript容易成为恶意程序的载体。根据恶意脚本的执行状态可将目前的检测方法分为静态分析方法和动态分析方法:1、动态检测则是在可控的环境中运行恶意脚本,通过观测执行状态,进程等来判别恶意脚本,如监视系统端口,网络连接,注册表,系统配置文件调动等,来检测异常程序进行。该方法得运行恶意代码,增加了系统的风险,而且效率不高。2、静态检测是在不运行恶意脚本的情况下,根据恶意脚本的特征,结构等来识别,如统计恶意特征码,利用判断矩阵法对不同的统计方法加权,然后加权几何平均法得出检测结果。该方法虽然检测效率高,但是对于特征要求明显,且并不善于检测未知恶意代码。因此,由于静态方法具有检测效率高、资源消耗小等特点,将基于机器学习的特征选择和智能检测方法用于恶意脚本检测将具有较明显的优势。
技术实现思路
为了克服现有技术,尤其是静态检测技术,对于恶意脚本攻击无法识别未知恶意脚本的问题,本专利技术提出了一种检测效率高,未知恶意脚本检测准确性良好的基于SVM的恶意脚本静态检测方法。该方法结合分类技术以及静态检测技术,结合分析对恶意脚本进行特征提取后,运用机器学习技术SVM进行分类。基于支持向量机的恶意脚本检测方法,包括以下步骤:I)、从互联网抓取网页,获得网页链接;2)、获取链接对应的Javascript脚本内容;3)、对基于脚本的web入侵如SQL注入等进行分析,得到入侵相关的特征,并根据入侵特征对获取的脚本内容进行特征提取,将每个脚本转化成基于特征的特征向量;4)、利用分类算法SVM获得最佳分类模型,并利用该模型对获得的特征向量进行分类,判断该脚本是否恶意脚本以做相关后续处理。进一步,详述步骤3)中所述分析提取的特征,根据JavaScript的一些基本常规的特征,并从恶意脚本的角度,选择了如表1所示的27个特征。其中,恶意JavaScript和良性JavaScript特殊关键字的使用频率不同,如JavaScript为了编码而经常使用escape函数。因此我们提出eval函数数量,setTimeout等函数数量,DOM修正函数数量等特征,提取特殊函数,关键字的特征。JavaScript经常使用混淆技术来规避这些特征的提取,为了减少混淆的影响,提取了如空白符占总字符长度比例,字符串最大熵,整体脚本的熵等特征。表1测试样本的27个特征值本文档来自技高网
...

【技术保护点】
基于支持向量机的恶意脚本检测方法,包括以下步骤:1)、从互联网抓取网页,获得网页链接;2)、获取链接对应的Javascript脚本内容;3)、对基于脚本的web入侵如SQL注入等进行分析,得到入侵相关的特征,并根据入侵特征对获取的脚本内容进行特征提取,将每个脚本转化成基于特征的特征向量;4)、利用分类算法SVM获得最佳分类模型,并利用该模型对获得的特征向量进行分类,判断该脚本是否恶意脚本以做相关后续处理。

【技术特征摘要】
1.基于支持向量机的恶意脚本检测方法,包括以下步骤:1)、从互联网抓取网页,犾得网页链接;2)、获取链接对应的Javascript脚本内容;3)、对基于脚本的web入侵如SQL注入等进行分析,得到入侵相关的特征,并根据入侵特征对获取的脚本内容进行特征提取,将每个脚本转化成基于特征的特征向量;4)、利用分类算法SVM获得最佳分类模型,并利用该模型对获得的特征向量进行分类, 判断该脚本是否恶意脚本以做相...

【专利技术属性】
技术研发人员:王卫红秦绪佳吕银均
申请(专利权)人:浙江工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1