一种基于makefile文件依赖的源码分析方法技术

技术编号：14113679 阅读：96 留言：0更新日期：2016-12-07 11:04

本发明专利技术提供一种基于makefile文件依赖的源码分析方法，包括如下步骤：1)依赖关系提取阶段：a.信息转换，对makefile处理得到对应中间文件；b.冗余信息处理，去除中间文件中冗余信息；c.依赖信息提取，从中间文件中提取依赖信息；d.结束；2)源码信息提取阶段：a.解析源码内容，得到源码信息；b.符号转换，对源码信息中符号处理；c.建立索引，对数据建立映射；d.结束；3)对象定义查找阶段：a.确认查找文件范围，查找对应依赖文件列表；b.确认定义位置，从数据映射中查找符号信息；c.结束；基于makefile文件依赖的源码分析方法首先确定文件查找范围，然后确定符号定义位置信息。对文件范围进行限定，很大程度上提升了源码分析中符号定义查找的准确性。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及源码分析领域，是一种利用文件依赖关系进行源码分析的方法，从而解决了在源码分析中符号对象定位问题。
技术介绍
源码文件本质上属于文本，传统的人工阅读代码效率低下，人们开始研究如何根据编译过程中的中间文件来分析源码，并将源码的实现过程展现出来，从而快速理解编程者的思想，也给我们分析源代码提供了便利。当前对源码内容进行分析的方式主要有两种，分别是静态分析方式、动态分析方式。静态分析是指在不执行源码程序的情况下，用词法分析、语法分析等将源码生成对应的中间结构，对中间结构的处理减少了无关信息的干扰，对于查询结果准确性有很大的帮助。通过静态分析的方式对中间结构进行分析提取信息，已经成为较为主流的分析方式。其中基于IR的定位技术使用基于潜在语义索引的搜索引擎，允许用户通过写自然语言查询的命令提取源码信息元素，如类、类型、函数、文件等。对于用makefile组织的大型源码进行的分析，因为其文件组织关系记录在makefile文件中，在分析过程中会出现因为依赖关系不明确而出现的对象定位错误的问题。这些错误导致分析人员对源码的理解产生偏差，因此源码分析过程中保证对象定位准确性是重要的一环。文件间依赖关系是指当一个文件中需要引用其他文件中的函数、数据结构或者变量等时，在引用之前需要包含其对应的头文件，即该文件的实现依赖于这些文件的实现。解决因为依赖关系不明确而产生的对象定位错误的主要策略是对查找文件范围进行明确。在本系统中，我们提出了对文件依赖关系进行利用的方法，即对makefile中记录的信息进行提取并处理，生成可供查找的结构来确定对象定义查找的文件范围，同时通...
一种基于makefile文件依赖的源码分析方法

【技术保护点】
一种基于makefile文件依赖关系的源码分析方法，其特征在于，包括以下步骤：1)依赖关系提取阶段：a信息转换；b冗余信息处理；c依赖信息提取；d结束；2)源码信息提取阶段：A解析源码内容；b符号转换；c建立索引；d结束；3)对象定义查找阶段：a确认查找的文件范围；b确认文件内查找结果；c结束。

【技术特征摘要】
1.一种基于makefile文件依赖关系的源码分析方法，其特征在于，包括以下步骤：1)依赖关系提取阶段：a信息转换；b冗余信息处理；c依赖信息提取；d结束；2)源码信息提取阶段：A解析源码内容；b符号转换；c建立索引；d结束；3)对象定义查找阶段：a确认查找的文件范围；b确认文件内查找结果；c结束。2.根据权利要求1所述的基于makefile文件依赖关系的源码分析方法，其特征在于，其中步骤1)-a中所说的信息转换是指用编译器对makefile文件处理生成记录有源码文件依赖关系的中间文件，对该文件继续进行分析。3.根据权利要求1所述的基于makefile文件依赖关系的源码分析方法，其特征在于，其中步骤1)-b中冗余信息处理是指将中间文件中与依赖关系无关的数据进行判断并剔除，提高系统内存利用率和执行速度。4.根据权利要求1所述的基于makefile文件依赖关系的源码分析方法，其特征在于，其中步骤1)-c中依赖信息提取是将中间文件中的依赖信息判断并提取生成可查询的数据结构。5.根据权利要求1所述的基于makefile文件依赖关系的源码分析方法，其特征在于，其中步骤2)-a中解析...

【专利技术属性】
技术研发人员：谷凤伟，陈鹏，王金今，薛飞，黄皓，
申请(专利权)人：南京大学，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人