一种基于控制流图的代码错误自动检出方法技术

技术编号：35151621 阅读：15 留言：0更新日期：2022-10-05 10:30

本发明专利技术涉及一种基于控制流图的代码错误自动检出方法。本发明专利技术根据提交代码生成控制流图；根据提交代码的控制流图与数据库中已有的代码进行比对，找到结构上最相似的代码；通过计算每个节点的代码相似度来判断该节点是否可能出错；通过找到数据库内与源代码逻辑相似的正确代码，从而进一步定位代码的错误位置。本发明专利技术通过发挥控制流图的特点，弥补了现有在线测评系统的短板。目前在线测评系统中大多只有代码检测抄袭系统，而没有代码错误自动检出系统，通过本系统能帮助用快速定位自己程序的错误位置，从而加快编程效率。在教学活动中，减少教师为学生检查代码的时间，从而大大减轻教师的负担，将时间更多的用在教学任务上。将时间更多的用在教学任务上。将时间更多的用在教学任务上。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于控制流图的代码错误自动检出方法

[0001]本专利技术属于代码错误自动检出
，涉及一种基于控制流图的代码错误自动检出方法。

技术介绍

[0002]国外学者在20世纪70年代便出现了关于文本复制检测的相关研究，诸多学者们开始主要针对程序代码克隆复制检测技术进行研究。目前代码克隆技术主要有以下几类：
[0003]一、现有基于tree的代码查重技术：T.Kamiya，S.Kusumoto(2002)等人发现基于token的查重方法速度快，所需资源更少。但却无法检测所有类型的代码克隆。而基于树的查重方法可以检测所有类型的代码克隆，但它速度慢且需要大量计算资源。因此提出了一种基于树和基于token的方法相结合的高速，高精度代码查重方法，以提高检测代码克隆的效率和准确性。曾杰，贲可荣(2020)等人提出一种基于程序向量树的代码查重方法，通过实验分析发现，对于Moderately Type
‑
3和Type
‑
4类型的表面相似程度较低的代码克隆而言，利用该方法进行检测具有明显优势，但是该方法目前只针对Java程序，以及评测数据集BigCloneBench只包含Java程序，因此迁移到其他程序语言需要进一步提出针对性的二叉树生成规则。
[0004]二、基于图的代码查重技术：Komondoor R，Horwitz S(2001)介绍了使用程序依赖图PDG(Program Dependence Graph)和程序切片来查找表示克隆的同构PDG子图。该方法可以找到不连续的代码...

【技术保护点】

【技术特征摘要】
1.一种基于控制流图的代码错误自动检出方法，其特征在于：具体包括如下步骤：步骤1、生成控制流图：设数据库中的待检测代码有n份，编号为1,2,3,
…
,n；在编译代码时，编号为i的代码生成对应的控制流图G[i]，G[i]中会生成m+1个节点的第j(0≤j≤m)个节点为N[i][j]，其对应的源代码为C[i][j]；步骤2、子图匹配：将待检测代码的控制流图G[i]与正确代码C[k]生成的控制流图G[k]进行子图同构和节点的匹配，若两个程序的控制流图最多相差一个节点并且通过简单的加边加点的操作后两图同构，则认为这两份控制流图是能匹配的；子图同构指的是给定两个图G＝(V,E,u,v)和G'＝(V',E',u',v')，S是G'的子图，如果存在一个函数f:V
→
V'，且f是从G到S的同构，那么，称f是从G到G'的子图同构；经过子图同构算法之后，得到一个结构相似度的集合S，取S中的最大值S[k]，表示代码i与k最为相似，即K＝argmax(S[k])；步骤3、分支修正：在获得图同构的相关映射之后，直接进行后续的操作，由于在匹配过程中没有将节点的具体的代码内容加入考虑，一个节点的分支对应关系有可能发生颠倒，容易发生误判；因此进行分支修正，对于源控制流图的每一个分支的节点，将其与目标控制流图的分支节点使用基于字符的文本相似度计算进行相应的相似度检测，将相似度最高的两个节点...

【专利技术属性】
技术研发人员：单振宇，周婉婧，陈雨欣，
申请(专利权)人：杭州师范大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人