一种基于语义分析的无害化处理识别方法技术

技术编号：31847569 阅读：32 留言：0更新日期：2022-01-12 13:28

本发明专利技术公开了一种基于语义分析的无害化处理识别方法，通过静态分析提取目标系统源码的自然语义与程序语义，并利用构建的程序语义特征模型识别无害化处理，能够有效识别无害化处理，提高了准确性。另外，这一方法可用于污点分析方法中进一步使用，对提高污点分析效率有显著效果，也能极大地降低基于污点分析的漏洞挖掘方法的误报率。挖掘方法的误报率。挖掘方法的误报率。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于语义分析的无害化处理识别方法

[0001]本专利技术涉及计算机安全
，尤其涉及一种基于语义分析的无害化处理识别方法。

技术介绍

[0002]输入型的漏洞是Web应用程序中最为普遍且威胁最大的漏洞类型之一，这一类漏洞通常是指由恶意的外部输入所引起的安全问题，比如SQL注入漏洞和XSS漏洞等。近几年，为检测这类漏洞，研究者提出很多方法对Web应用进行分析，其中，静态代码分析以其高效率的优点被广泛研究。这一方法能够在不运行程序的情况下，获取程序内部的结构和特性，进而分析程序中潜在的安全问题。在众多静态分析方法中，基于污点数据流分析的方法是一个研究热点。它对程序中的数据流动进行跟踪，根据数据的源头与使用是否到达敏感函数，判断是否存在安全风险。这一方法对于数据的源头与使用进行建模，和人工审计代码寻找漏洞时的方法相似，具备一定的准确性。然而，静态污点分析方法同样存在误报率较高的问题。
[0003]在目前的污点分析方法中，方法重点更偏向解决别名传播的分析问题，以提升污点分析的效果。无害化处理识别是污点分析的重要组成部分，也是污点分析结果是否有效的重要影响因素。在现有的无害化处理识别方法中，常使用的方法为库函数字典或关键字匹配。但实际上，由于Web应用的开发环境复杂，代码量大，难以确定一个有效的关键字集合对无害化处理进行有效识别。也就是说，现有的识别方法可能存在较多的漏报与误报，而这也会进一步影响到污点分析结果的准确性。

技术实现思路

[0004]为了克服上述现有技术的不足，本专利技术提供一种基...

【技术保护点】

【技术特征摘要】
1.一种基于语义分析的无害化处理识别方法，分为自然语义分析与程序语义分析两个部分，其中：所述自然语义分析部分执行如下步骤1）至3）：1) 收集数据变换函数、异常处理函数和返回错误代码初始集合，并进行分词得到关键词集合；2) 使用关键词集合对目标Web应用程序源码进行分析，并进行新一轮的分词，构建新的可疑关键词集合；3) 根据步骤2）得到的可疑关键词集合对目标Web应用程序源码进行第二轮分析，构建可疑的数据变换函数、异常处理函数和返回错误代码集合；所述程序语义分析部分包含回溯过滤、安全检查识别两个阶段，执行如下步骤4）至5）：4) 回溯过滤：对于可疑的数据变换函数，使用数据流分析获取其数据流图，判断是否满足无害化处理条件，若满足则保留，不满足则将其剔除；对于可疑的异常处理函数和返回错误代码，首先使用控制流分析获取程序的控制流图，进而对集合中的每一个可疑元素进行分析，判断是否符合类安全检查的语义模型，是则保留，否则删除该元素；5) 安全检查识别：对于回溯过滤后的数据变换函数、异常处理函数和返回错误代码集合，进一步识别程序中的安全检查语句，判断其是否符合安全检查的语义模型，是则保留，否则删除，得到最终的无害化处理集合。2.如权利要求1所述的无害化处理识别方法，其特征在于，步骤1）通过收集编程语言库函数集合，得到数据变换函数、异常处理函数和返回错误代码初始集合，分词时将带有负向语义的高频词汇作为关键词集合。3.如权利要求1所述的无害化处理识别方法，其特征在于，在步骤4）中，符合无害化处理的数据变换函数应满足如下条件：
①ꢀ
函数输入值经过函数内语句传播后，必须能够到达函数输出口，即返回值；
②ꢀ
函数内语句的操作对象，应和输入值直接或间接相关，函数内不应出现与输入值毫无关联的数据传播链。4.如权利要求1所述的无害化处理识别方法，其特征在于，在步骤4）中，定义所述类安全检查的语义模型如下：假设分支语句整体为N，使用N(R
j
)表示其中特定的一条分支语句，用表示这一条分支中使用的函数与指令；可疑的异常处理函数和错误代码返回集合为D，D
i<...

【专利技术属性】
技术研发人员：陈夏润，杨洲，永志，方莹，刘宇航，
申请(专利权)人：北京雁翎网卫智能科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人