System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及网络安全,尤其涉及一种开源组件链路预测方法、装置、电子设备及存储介质。
技术介绍
1、开源组件是可应用于软件应用程序开发的第三方组件,开发者使用开源组件进行软件应用程序开发可以加快开发进程和降低开发成本。在开源领域中,不同软件应用程序开发项目之间通常存在着密切的依赖关系,这种依赖关系对开发者至关重要,可以让其清晰地知晓哪些项目是依赖于自己的开源组件完成的,以及自己的项目依赖了哪些其他的开源组件。
2、然而,目前缺乏将链路预测技术应用于网络安全领域的相关技术,尤其是对于大规模的开源组件依赖关系的预测,导致开发者管理和维护开源组件的效率较低。
技术实现思路
1、为了解决开发者管理和维护开源组件的效率较低的问题,本申请实施例提供了一种开源组件链路预测方法、装置、电子设备及存储介质。
2、第一方面,本申请实施例提供了一种开源组件链路预测方法,包括:
3、响应于开源组件链路预测请求;
4、获取待预测开源组件的属性信息,并对所述待预测开源组件的属性信息进行特征提取,得到所述待预测开源组件的属性特征向量;
5、将所述待预测开源组件的属性特征向量输入训练的依赖关系预测模型,得到依赖关系预测结果,其中,所述依赖关系预测模型是根据从预先构建的表征开源组件之间的依赖关系的第一知识图谱中提取的样本开源组件的属性信息与样本开源组件之间的依赖关系,基于预设神经网络模型进行训练获得的;
6、根据所述待预测开源组件的属性信息和所述依
7、在一种实施方式中,对所述待预测开源组件的属性信息进行特征提取,得到所述待预测开源组件的属性特征向量,具体包括:
8、根据预设词嵌入模型对所述待预测开源组件的属性信息进行特征降维表示,得到所述待预测开源组件的属性特征向量。
9、在一种实施方式中,所述依赖关系预测模型是通过以下方式训练获得的:
10、对所述第一知识图谱中包含的开源组件进行采样处理,得到采样的开源组件;
11、从采样的开源组件中提取具有依赖关系的开源组件作为正样本开源组件,以及无依赖关系的开源组件作为负样本开源组件;
12、根据所述采样的开源组件构建采样知识图谱;
13、根据每两个采样的开源组件之间的依赖关系的权重,生成所述采样知识图谱对应的邻接矩阵;
14、根据所述正样本开源组件的属性信息、所述负样本开源组件的属性信息与所述采样知识图谱对应的邻接矩阵,基于所述预设神经网络模型进行训练获得所述依赖关系预测模型。
15、在一种实施方式中,根据所述正样本开源组件的属性信息、所述负样本开源组件的属性信息与所述采样知识图谱对应的邻接矩阵,基于所述预设神经网络模型进行训练获得所述依赖关系预测模型,具体包括:
16、分别根据所述预设词嵌入模型对所述每一正样本开源组件的属性信息和所述每一负样本开源组件进行特征降维表示,得到所述每一正样本开源组件的属性特征向量和所述每一负样本开源组件的属性特征向量;
17、根据各正样本开源组件的属性特征向量和各负样本开源组件的属性特征向量,生成样本开源组件的属性特征向量矩阵;
18、根据所述样本开源组件的属性特征向量矩阵和所述采样知识图谱对应的邻接矩阵对所述预设神经网络模型进行训练,得到所述依赖关系预测模型。
19、在一种实施方式中,在根据所述采样的开源组件构建采样知识图谱之后,还包括:
20、获取所述第一知识图谱的拓扑结构信息和所述第一知识图谱中的开源组件的属性特征向量;以及
21、获取所述采样知识图谱的拓扑结构信息和所述采样的开源组件的属性特征向量;
22、对所述第一知识图谱的拓扑结构信息和所述采样知识图谱的拓扑结构信息进行t假设检验;以及
23、对所述第一知识图谱中的开源组件的属性特征向量和所述采样的开源组件的属性特征向量进行t假设检验;
24、若确定有任一t假设检验未通过,则重新进行采样。
25、在一种实施方式中,所述拓扑结构信息包括以下信息中的至少一种信息:度数分布信息、集聚系数信息和直径信息,所述度数分布表征知识图谱中与各节点相连的边数的分布,所述集聚系数表征知识图谱中各节点之间的集聚程度,所述直径表征知识图谱中的最大路径包含的边数。
26、第二方面,本申请实施例提供了一种开源组件链路预测装置,包括:
27、响应单元,用于响应于开源组件链路预测请求;
28、特征提取单元,用于获取待预测开源组件的属性信息,并对所述待预测开源组件的属性信息进行特征提取,得到所述待预测开源组件的属性特征向量;
29、预测单元,用于将所述待预测开源组件的属性特征向量输入训练的依赖关系预测模型,得到依赖关系预测结果,其中,所述依赖关系预测模型是根据从预先构建的表征开源组件之间的依赖关系的第一知识图谱中提取的样本开源组件的属性信息与样本开源组件之间的依赖关系,基于预设神经网络模型进行训练获得的;
30、生成单元,用于根据所述待预测开源组件的属性信息和所述依赖关系预测结果生成对应的表征所述待预测开源组件之间的依赖关系的第二知识图谱。
31、在一种实施方式中,所述特征提取单元,具体用于根据预设词嵌入模型对所述待预测开源组件的属性信息进行特征降维表示,得到所述待预测开源组件的属性特征向量。
32、在一种实施方式中,所述预测单元,具体用于通过以下方式训练获得所述依赖关系预测模型:对所述第一知识图谱中包含的开源组件进行采样处理,得到采样的开源组件;从采样的开源组件中提取具有依赖关系的开源组件作为正样本开源组件,以及无依赖关系的开源组件作为负样本开源组件;根据所述采样的开源组件构建采样知识图谱;根据每两个采样的开源组件之间的依赖关系的权重,生成所述采样知识图谱对应的邻接矩阵;根据所述正样本开源组件的属性信息、所述负样本开源组件的属性信息与所述采样知识图谱对应的邻接矩阵,基于所述预设神经网络模型进行训练获得所述依赖关系预测模型。
33、在一种实施方式中,所述预测单元,具体用于分别根据所述预设词嵌入模型对所述每一正样本开源组件的属性信息和所述每一负样本开源组件进行特征降维表示,得到所述每一正样本开源组件的属性特征向量和所述每一负样本开源组件的属性特征向量;根据各正样本开源组件的属性特征向量和各负样本开源组件的属性特征向量,生成样本开源组件的属性特征向量矩阵;根据所述样本开源组件的属性特征向量矩阵和所述采样知识图谱对应的邻接矩阵对所述预设神经网络模型进行训练,得到所述依赖关系预测模型。
34、在一种实施方式中,所述装置,还包括:
35、第一获取单元,用于在根据所述采样的开源组件构建采样知识图谱之后,获取所述第一知识图谱的拓扑结构信息和所述第一知识图谱中的开源组件的属本文档来自技高网...
【技术保护点】
1.一种开源组件链路预测方法,其特征在于,包括:
2.如权利要求1所述的方法,其特征在于,对所述待预测开源组件的属性信息进行特征提取,得到所述待预测开源组件的属性特征向量,具体包括:
3.如权利要求2所述的方法,其特征在于,所述依赖关系预测模型是通过以下方式训练获得的:
4.如权利要求3所述的方法,其特征在于,根据所述正样本开源组件的属性信息、所述负样本开源组件的属性信息与所述采样知识图谱对应的邻接矩阵,基于所述预设神经网络模型进行训练获得所述依赖关系预测模型,具体包括:
5.如权利要求3所述的方法,其特征在于,在根据所述采样的开源组件构建采样知识图谱之后,还包括:
6.如权利要求5所述的方法,其特征在于,所述拓扑结构信息包括以下信息中的至少一种信息:度数分布信息、集聚系数信息和直径信息,所述度数分布表征知识图谱中与各节点相连的边数的分布,所述集聚系数表征知识图谱中各节点之间的集聚程度,所述直径表征知识图谱中的最大路径包含的边数。
7.一种开源组件链路预测装置,其特征在于,包括:
8.如权利要求7
9.如权利要求8所述的装置,其特征在于,
10.如权利要求9所述的装置,其特征在于,
11.如权利要求9所述的装置,其特征在于,还包括:
12.如权利要求11所述的装置,其特征在于,所述拓扑结构信息包括以下信息中的至少一种信息:度数分布信息、集聚系数信息和直径信息,所述度数分布表征知识图谱中与各节点相连的边数的分布,所述集聚系数表征知识图谱中各节点之间的集聚程度,所述直径表征知识图谱中的最大路径包含的边数。
13.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1~6任一项所述的开源组件链路预测方法。
14.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1~6任一项所述的开源组件链路预测方法中的步骤。
...【技术特征摘要】
1.一种开源组件链路预测方法,其特征在于,包括:
2.如权利要求1所述的方法,其特征在于,对所述待预测开源组件的属性信息进行特征提取,得到所述待预测开源组件的属性特征向量,具体包括:
3.如权利要求2所述的方法,其特征在于,所述依赖关系预测模型是通过以下方式训练获得的:
4.如权利要求3所述的方法,其特征在于,根据所述正样本开源组件的属性信息、所述负样本开源组件的属性信息与所述采样知识图谱对应的邻接矩阵,基于所述预设神经网络模型进行训练获得所述依赖关系预测模型,具体包括:
5.如权利要求3所述的方法,其特征在于,在根据所述采样的开源组件构建采样知识图谱之后,还包括:
6.如权利要求5所述的方法,其特征在于,所述拓扑结构信息包括以下信息中的至少一种信息:度数分布信息、集聚系数信息和直径信息,所述度数分布表征知识图谱中与各节点相连的边数的分布,所述集聚系数表征知识图谱中各节点之间的集聚程度,所述直径表征知识图谱中的最大路径包含的边数。
7...
【专利技术属性】
技术研发人员:徐帅健妮,
申请(专利权)人:中国电信股份有限公司技术创新中心,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。