System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及软件隐私合规分析,特别是涉及一种软件隐私合规检测方法、设备、存储介质及产品。
技术介绍
1、随着软件和用户数量的不断地增加,软件用户隐私信息泄露的问题频繁地出现。因此,各行业的软件虽给用户带来形式上便捷,但也给用户的数字财产、隐私和个人信息带来了极大的安全风险,因此,如何构建有效地自动化合规检测方法成为了现在的研究难点,其中构建有效的隐私合规数据集、提升隐私合规检测模型的检测精度,以及准确发现海量软件中侵犯隐私的合规软件并确定其存在违规行为,是当前隐私合规软件检测方法中最重要的挑战。
2、为了有效地挖掘出这些非合规软件中的隐藏特征,现有的研究工作中主要尝试代码插桩的方法,构建api(application program interface)测试脚本,检测软件中的api和权限等软件行为是否有非合规行为。但是,这些人为构建的hook代码脚本对软件行为的覆盖面较窄,且需要检测人员有较高的专业知识以应对不同的检测任务。此外,每一个软件的检测都需要人为定制相关检测策略和特定行为检测的代码脚本。因此,这些传统隐私合规软件检测精度的上限较低,并且这些工具的检测速度较慢。为此,研究人员尝试通过机器学习方法自动化地来检测非合规软件,但是现有基于机器学习的软件隐私合规检测方法存在以下一些问题。
3、第一,当前缺乏公开且有效的隐私合规数据集。人工智能的方法无法进行有监督的训练,这直接阻碍了软件隐私合规智能化检测的进程,导致很多现有先进的算法无法进行深入研究,辅助研究人员开发有效的检测工具。
4、第二
5、第三,当前研究缺乏自主且快速的合规检测方法。由于现有的检测工具都是基于动态模拟用户点击功能的方法。这些动态的行为涉及到软件中的代码运行和api调用,所以通过代码脚本扫描软件的非合规行为需要研究人员检测较长的时间。此外,编写对应的代码脚本还需要操作人员有较高的专业技能,这些操作都极大提升了检测人员门槛,延缓了检测进度。
6、因此,亟需一种检测效果更好且对检测人员门槛要求更低的软件隐私合规检测方法。
技术实现思路
1、本专利技术的目的是提供一种软件隐私合规检测方法、设备、存储介质及产品,可提供更好的检测效果且对检测人员门槛要求低。
2、为实现上述目的,本专利技术提供了如下方案:
3、一种软件隐私合规检测方法,包括:
4、提取各样本软件对应的样本特征;所述样本特征包括:app与目标api间的调用序列、目标api与目标api间的调用序列、目标api与class间的调用序列、目标api与目标权限间的调用序列以及app与目标权限间的调用序列;所述目标api为与用户隐私信息相关的api;所述目标权限为与用户隐私相关的权限;所述样本软件为违反隐私合规政策的软件;
5、基于各样本软件对应的样本特征构建各样本软件对应的异构图;所述异构图的节点包括app、api、class和权限;所述异构图的边为边连接的两个节点之间的调用序列;
6、在当前迭代轮次下,采用强化学习根据上一迭代轮次下强化学习奖励函数值对各所述异构图进行处理得到当前迭代轮次下各样本软件对应的元路径;
7、根据当前迭代轮次下各样本软件对应的元路径生成当前迭代轮次下各样本软件对应的路径实例,并采用图表征模型对当前迭代轮次下各样本软件对应的路径实例进行处理得到当前迭代轮次下各样本软件对应的路径实例中各节点的向量表示;
8、利用训练集对上一迭代轮次下的软件隐私合规检测模型进行训练得到当前迭代轮次下的软件隐私合规检测模型;所述训练集包括当前迭代轮次下各样本软件对应的路径实例中各节点的向量表示和各样本软件的检测结果,所述检测结果包括违反隐私合规政策和不违反隐私合规政策;初始迭代轮次下的软件隐私合规检测模型为图嵌入模型;
9、根据当前迭代轮次下各样本软件对应的路径实例中各节点的向量表示计算当前迭代轮次下强化学习奖励函数值,更新迭代轮次,进入下次迭代,直到达到设定迭代轮次;
10、将待检测软件对应的样本特征输入最后一次迭代轮次下的软件隐私合规检测模型得到所述待检测软件的检测结果。
11、可选的,在当前迭代轮次下,采用强化学习根据上一迭代轮次下强化学习奖励函数值对各所述异构图进行处理得到当前迭代轮次下各样本软件对应的元路径,具体为:
12、在当前迭代轮次下,将所述异构图中的边作为所述强化学习中的动作,将所述异构图作为所述强化学习中的环境数据,采用强化学习根据上一迭代轮次下强化学习奖励函数值从所述异构图中为每个样本提取出一个样本路径。
13、可选的,强化学习中的动作价值函数为:
14、其中,qπ()表示动作价值函数,v()表示状态价值函数,a()表示动作优势函数,a表示强化学习中的动作集合,s表示强化学习中的状态,a表示强化学习中的动作,θ表示duelingdqn算法中的卷积层参数,α表示duelingdqn算法中的第一全连接层参数,β表示duelingdqn算法中的第二全连接层参数,a'表示a中任意一个动作,表示动作优势函数的平均值,sqrt()表示求平方根,|a|表示动作空间的大小。
15、可选的,强化学习中的损失函数为loss(θ)=eπ[(qπ(s,a;θ)-qπ(s,a))2],其中,loss()表示强化学习中的损失函数,eπ[]表示期望函数,qπ()表示动作价值函数,s表示强化学习中的状态,a表示强化学习中的动作,θ表示duelingdqn算法中的卷积层参数。
16、可选的,利用训练集对上一迭代轮次下的软件隐私合规检测模型进行训练得到当前迭代轮次下的软件隐私合规检测模型的过程中的损失函数为:
17、其中,表示对图嵌入模型进行训练的损失函数,x表示样本软件的检测结果,yi表示图表征模型输出的第i个节点的向量表示,emb'[i]表示图嵌入模型预测的第i个节点的预测的向量表示。
18、一种计算机设备,包括:存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序以实现上述所述软件隐私合规检测方法。
19、一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述所述软件隐私合规检测方法。
20、一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述所述软件隐私合规检测方法。
21、根据本专利技术提供的具体实施例,本专利技术公开了以下技术效果:
22、本专利技术提取各样本软件对应的样本特征;基于各样本软件对应的样本特征构建各样本软件对应的异构图;在当前迭代轮次下,采用强化学习根据上一迭代轮次下强化本文档来自技高网...
【技术保护点】
1.一种软件隐私合规检测方法,其特征在于,包括:
2.根据权利要求1所述的软件隐私合规检测方法,其特征在于,在当前迭代轮次下,采用强化学习根据上一迭代轮次下强化学习奖励函数值对各所述异构图进行处理得到当前迭代轮次下各样本软件对应的元路径,具体为:
3.根据权利要求1所述的软件隐私合规检测方法,其特征在于,强化学习中的动作价值函数为:
4.根据权利要求1所述的软件隐私合规检测方法,其特征在于,强化学习中的损失函数为Loss(θ)=Eπ[(Qπ(s,a;θ)-Qπ(s,a))2],其中,Loss()表示强化学习中的损失函数,Eπ[]表示期望函数,Qπ()表示动作价值函数,s表示强化学习中的状态,a表示强化学习中的动作,θ表示DuelingDQN算法中的卷积层参数。
5.根据权利要求1所述的软件隐私合规检测方法,其特征在于,利用训练集对上一迭代轮次下的软件隐私合规检测模型进行训练得到当前迭代轮次下的软件隐私合规检测模型的过程中的损失函数为:
6.一种计算机设备,包括:存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程
7.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1-5中任一项所述软件隐私合规检测方法。
8.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1-5中任一项所述软件隐私合规检测方法。
...【技术特征摘要】
1.一种软件隐私合规检测方法,其特征在于,包括:
2.根据权利要求1所述的软件隐私合规检测方法,其特征在于,在当前迭代轮次下,采用强化学习根据上一迭代轮次下强化学习奖励函数值对各所述异构图进行处理得到当前迭代轮次下各样本软件对应的元路径,具体为:
3.根据权利要求1所述的软件隐私合规检测方法,其特征在于,强化学习中的动作价值函数为:
4.根据权利要求1所述的软件隐私合规检测方法,其特征在于,强化学习中的损失函数为loss(θ)=eπ[(qπ(s,a;θ)-qπ(s,a))2],其中,loss()表示强化学习中的损失函数,eπ[]表示期望函数,qπ()表示动作价值函数,s表示强化学习中的状态,a表示强化学习中的动作,θ表示duelingdqn算法中的卷积...
【专利技术属性】
技术研发人员:蔡立志,杨康,吴建华,刘振宇,张孟,周悦,
申请(专利权)人:上海计算机软件技术开发中心,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。