【技术实现步骤摘要】
检测业务预测模型安全性的方法及装置
本说明书一个或多个实施例涉及计算机
,尤其涉及一种检测业务预测模型安全性的方法及装置。
技术介绍
随着机器学习技术的不断发展与普及,越来越多的领域采用通过机器学习算法生成的业务预测模型,针对业务对象进行业务预测。比如,基于预先生成的人脸识别模型进行人脸识别,以及基于商品推荐模型向某用户推荐某商品等。然而在上述业务预测模型发布上线之后,往往会有恶意攻击者对其进行攻击。在业务预测模型受到攻击的情况下,基于其所得到的预测结果往往是不准确的。因此,希望提供一种检测业务预测模型安全性的方案,以便能够及时有效地发现业务预测模型的安全性问题。
技术实现思路
本说明书一个或多个实施例描述了一种检测业务预测模型安全性的方法及装置,可以有效地对业务预测模型进行安全检测。第一方面,提供了一种检测业务预测模型安全性的方法,包括:在所述业务预测模型针对第一业务对象进行业务预测的过程中,获取所述业务预测模型的各层网络中各神经元的激活处理结果;根据所述各层网络中各神经元的激活处理结果,识别所述第一业务对象是否为异常对象;至少根据所述第一业务对象的识别结果,确定所述业务预测模型是否受到安全攻击。第二方面,提供了一种检测业务预测模型安全性的装置,包括:获取单元,用于在所述业务预测模型针对第一业务对象进行业务预测的过程中,获取所述业务预测模型的各层网络中各神经元的激活处理结果;识别单元,用于根据所述各层网络中各神经元的激 ...
【技术保护点】
1.一种检测业务预测模型安全性的方法,所述业务预测模型用于针对业务对象进行业务预测;其包括多层网络,其中每层网络包括多个神经元,每个神经元对应于一个激活函数以产生激活处理结果;所述方法包括:/n在所述业务预测模型针对第一业务对象进行业务预测的过程中,获取所述业务预测模型的各层网络中各神经元的激活处理结果;/n根据所述各层网络中各神经元的激活处理结果,识别所述第一业务对象是否为异常对象;/n至少根据所述第一业务对象的识别结果,确定所述业务预测模型是否受到安全攻击。/n
【技术特征摘要】
1.一种检测业务预测模型安全性的方法,所述业务预测模型用于针对业务对象进行业务预测;其包括多层网络,其中每层网络包括多个神经元,每个神经元对应于一个激活函数以产生激活处理结果;所述方法包括:
在所述业务预测模型针对第一业务对象进行业务预测的过程中,获取所述业务预测模型的各层网络中各神经元的激活处理结果;
根据所述各层网络中各神经元的激活处理结果,识别所述第一业务对象是否为异常对象;
至少根据所述第一业务对象的识别结果,确定所述业务预测模型是否受到安全攻击。
2.根据权利要求1所述的方法,所述根据所述各层网络中各神经元的激活处理结果,识别所述第一业务对象是否为异常对象,包括:
对所述各层网络中各神经元的激活处理结果进行拼接,得到第一拼接向量;
将所述第一拼接向量输入预先训练的第一分类模型,得到所述第一分类模型对所述第一业务对象的打分,所述打分表示所述第一业务对象为异常对象的概率;
根据所述打分,识别所述第一业务对象是否异常对象。
3.根据权利要求1所述的方法,所述根据所述各层网络中各神经元的激活处理结果,识别所述第一业务对象是否为异常对象,包括:
将所述各层网络中各神经元的激活处理结果,分别输入预先训练的、对应于所述各层网络的多个子分类模型,分别得到所述多个子分类模型对所述第一业务对象的多个打分,所述打分表示所述第一业务对象为异常对象的概率;
基于所述多个打分,得到所述第一业务对象的综合分;
根据所述综合分,识别所述第一业务对象是否为异常对象。
4.根据权利要求1所述的方法,所述根据所述各层网络中各神经元的激活处理结果,识别所述第一业务对象是否为异常对象,包括:
获取所述各层网络中各神经元的历史处理结果的历史分布;
将所述各层网络中各神经元的激活处理结果,分别与对应的历史分布进行比对,得到多个比对结果;
根据所述多个比对结果的融合结果,识别所述第一业务对象是否为异常对象。
5.根据权利要求1所述的方法,所述根据所述各层网络中各神经元的激活处理结果,识别所述第一业务对象是否为异常对象,包括:
获取历史样本集;其中的各历史样本已基于所述业务预测模型完成预测;
基于所述第i层网络中各神经元的激活处理结果,以及所述历史样本集中各历史样本的第i层网络中各神经元的激活处理结果,计算对应于所述第i层网络的统计量;其中,i为正整数;
基于所述各层网络的统计量,识别所述第一业务对象是否为异常对象。
6.根据权利要求5所述的方法,所述统计量包括以下任一种:局部固有维度LID以及概率密度KD。
7.根据权利要求5所述的方法,所述基于所述各层网络的统计量,识别所述第一业务对象是否为异常对象,包括:
对所述各层网络的统计量进行拼接,得到第二拼接向量;
将所述第二拼接向量输入预先训练的第二分类模型,得到所述第二分类模型对所述第一业务对象的打分,所述打分表示所述第一业务对象为异常对象的概率;
根据所述打分,识别所述第一业务对象是否异常对象。
8.根据权利要求7所述的方法,还包括:
采用降维方法,对所述第二拼接向量进行降维处理;
基于降维处理后的第二拼接向量,对所述第一业务对象进行可视化展示;
所述降维方法包括以下任一种:主成分分析PCA方法、最小绝对收缩和选择算子LASSO方法、线性判别式分析LDA方法、小波分析方法以及T分布和随机近邻嵌入TSNE方法。
9.根据权利要求1所述的方法,所述至少根据所述第一业务对象的识别结果,确定所述业务预测模型是否受到安全攻击,包括:
获取其它业务对象的识别结果;
基于所述第一业务对象的识别结果以及所述其它业务对象的识别结果,统计异常对象的占比;
在所述占比超过预定比例时,确定所述业务预测模型受到数据攻击。
10.根据权利要求1所述的方法,所述至少根据所述第一业务对象的识别结果,确定所述业务预测模型是否受到安全攻击,包括:
若所述第一业务对象的识别结果为异常对象,且相较于正常对象,所述各层网络中各神经元的激活处理结果的扰动值均小于预定数值,则确定所述业务预测模型受到对抗样本攻击。
11.根据权利要求1所述的方法,所述业务对象包括以下任一种:用户、商户、商品以及事件;所述业务预测模型用于预测所述业务对象的分类或回归值。
<...
【专利技术属性】
技术研发人员:宗志远,
申请(专利权)人:支付宝杭州信息技术有限公司,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。