基于图神经网络的软件源码漏洞检测方法技术

技术编号：37819692 阅读：9 留言：0更新日期：2023-06-09 09:53

本发明专利技术涉及网络通讯信息安全技术领域，具体涉及基于图神经网络的软件源码漏洞检测方法。本发明专利技术提取软件源码漏洞特征，针对漏洞特征进行词义分析。利用图神经网络，构建软件源码漏洞检测模型，对源码漏洞进行二次检测，去掉重读的源码，得到正确的代码。通过该检测模型的训练，每个漏洞特征节点将自身的特征信息传递给邻域节点，从而将漏洞特征进一步聚合并融合。再通过激活函数，将图神经网络中的漏洞节点信息进行变换，增强模型的检测能力。无论漏洞节点与邻域节点如何变化，最终的节点中心长度保持一致。在多级权重实时更新的条件下，聚合的信息特征也逐一采集到图节点中，由此获取的表征数据更加真实，最大限度地提高了源码漏洞检测效果。漏洞检测效果。漏洞检测效果。

全部详细技术资料下载

【技术实现步骤摘要】
基于图神经网络的软件源码漏洞检测方法

[0001]本专利技术涉及网络通讯信息安全
，具体涉及基于图神经网络的软件源码漏洞检测方法。

技术介绍

[0002]近些年来，数字化时代降临，信息安全形势较为严峻。一方面，需要面对网络数据的外部攻击，另一方面需要解决网络数据的内部攻击。软件源码泄露问题作为内部攻击的主要问题，其检测效果亟待加强。
[0003]软件源码漏洞是目前亟待解决的数据安全问题，设计相应的检测方法势在必行。在源码出现漏洞时，应用程序受到源码漏洞的影响，可以使攻击者在不与用户作出任何交互的条件下自行应答，从而出现信息泄露的问题。针对数据安全的源码漏洞问题，现有技术提出了多种解决方案。其中，基于CNN
‑
GAP可解释性模型的方法，与基于关系图卷积网络的方法的应用较为广泛。基于CNN
‑
GAP可解释性模型的方法，主要是通过CAM类的激活函数，对代码存在的漏洞情况进行标记，并利用CNN
‑
GAP卷积神经网络
‑
全局平均池化模型，对已经标记漏洞进行检测，检测完成之后将正确代码输出，将存在漏洞的代码进行处理，保证漏洞检测的精准度。常规的漏洞检测方法通过激活函数的方式，标识出存在漏洞的代码，并未对代码中的词义进行分析，导致检测效果不佳。
[0004]基于关系图卷积网络的方法，主要是利用RGCN关系图卷积网络模型，通过训练预测源码中的漏洞，在真实的代码漏洞上进行测试，由此提高漏洞检测精准度。以上两种方法虽然在一定程度上提高了漏洞检测...

【技术保护点】

【技术特征摘要】
1.基于图神经网络的软件源码漏洞检测方法，其特征在于，包括以下步骤：步骤1、将源码中的语言利用向量化表示，从源码的上下文考量，量化源码输入路径，同时增加与漏洞检测相关的数据信息，利用注意力机制，将上下文源码数据融合到一起，用一个单一的向量表示，从而提取出源码漏洞特征；步骤2、对于每条源码输入路径，将其转化为图神经网络作为输入数值，输入路径中的每一个节点都存在一个源码词语映射，由此构成了一个大型的节点源码语料库；步骤3、任意一条源码输入路径中，通过一个或多个漏洞源码信息，则增加该条路径的漏洞权重，路径中任意一个词向量P＝{NodeM
i
，NodeM
i+1
，
…
，NodeM
n
}，经过漏洞代码存在的漏洞节点之后，相同的权重赋予在多个漏洞节点上，而这条路径上并未赋予任何权重，通过是否增加权重来判别漏洞源码输入路径与正常源码输入路径；步骤4、从漏洞源码输入路径中，对每一个向量元素进行特征提取，通过图神经网络更新路径中涉及的每个权重参数，组成一个完整的漏洞特征，其表达式如下：T
i
＝δ(K
·
X
i
·
j+n
‑1+B)式中，T
i
为漏洞源码输入路径中每一个漏洞的特征参数；δ为激活函数；K为权重的权值矩阵；X
i
·
j+n
‑1为漏洞源码输入路径的向量元素；B为偏置因子；为通过图神经网络重新组成的漏洞特征；tanh为非线性激活函数；步骤5、随机选取了一个漏洞特征...

【专利技术属性】
技术研发人员：张金宝，宗烜逸，瞿燕，周子杰，
申请(专利权)人：南通大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人