对抗样本生成模型的训练方法及装置制造方法及图纸

技术编号：29588076 阅读：21 留言：0更新日期：2021-08-06 19:47

本说明书实施例提供一种生成对抗样本的生成模型的训练方法和装置，该方法包括，首先获取原始样本构成的样本集，其中包括正常样本和风险样本；还获取风险检测模型及其对应的损失函数。针对样本集中各个原始样本，利用生成模型生成扰动变换，并将其叠加在对应原始样本上，得到各个原始样本对应的各个变换样本；利用风险检测模型确定各个变换样本的各个风险预测值；以正常样本对应的标签值为比对标签值，分别将各个风险预测值代入前述损失函数，得到各个变换样本的对抗损失；至少根据各个变换样本的对抗损失的综合确定总对抗损失；以最小化总对抗损失为目标，调整生成模型中的参数。

全部详细技术资料下载

【技术实现步骤摘要】
对抗样本生成模型的训练方法及装置
本说明书一个或多个实施例涉及机器学习领域，尤其涉及对抗样本生成模型的训练方法和装置。
技术介绍
机器学习的迅猛发展使得各种机器学习的模型在各种各样的业务场景得到应用。例如在安全和风控场景中，已经通过机器学习训练出一些风险检测模型，用于识别出有风险或有安全隐患的对象。例如，通过风险检测模型识别垃圾账号，识别高风险的交易，识别高风险操作，等等。在识别出这样的风险对象后往往会对其进行拦截，以确保系统和用户的安全。鉴于已有的风险检测模型常常在鲁棒性方面存在不足，希望能有改进的方案，可以针对风险检测模型进行优化，以提升其鲁棒性，更好地适用于风险检测场景中的攻防特点。
技术实现思路
本说明书一个或多个实施例描述了一种对抗样本生成模型的训练方法和装置，可以模拟攻击者的攻击过程生成对抗样本，从而可以利用这样的对抗样本，从攻防对抗的角度对风险检测模型进行优化，增强其鲁棒性和安全性。根据第一方面，提供了一种用于生成对抗样本的生成模型的训练方法，包括：获取原始样本构成的样本集，其中包括正常样本和风险样本；获取风险检测模型及其对应的损失函数，所述风险检测模型为生成模型所所针对的模型；针对所述样本集中各个原始样本，利用所述生成模型生成扰动变换，并将其叠加在对应原始样本上，得到各个原始样本对应的各个变换样本；利用所述风险检测模型确定所述各个变换样本的各个风险预测值；以正常样本对应的标签值为比对标签值，分别将所述各个风险预测值代入所述损失...

【技术保护点】
1.一种用于生成对抗样本的生成模型的训练方法，包括：/n获取原始样本构成的样本集，其中包括正常样本和风险样本；/n获取风险检测模型及其对应的损失函数，所述风险检测模型为生成模型所所针对的模型；/n针对所述样本集中各个原始样本，利用所述生成模型生成扰动变换，并将其叠加在对应原始样本上，得到各个原始样本对应的各个变换样本；/n利用所述风险检测模型确定所述各个变换样本的各个风险预测值；/n以正常样本对应的标签值为比对标签值，分别将所述各个风险预测值代入所述损失函数，得到各个变换样本的对抗损失；/n至少根据所述各个变换样本的对抗损失的综合确定总对抗损失；/n以最小化总对抗损失为目标，调整所述生成模型中的参数。/n

【技术特征摘要】
1.一种用于生成对抗样本的生成模型的训练方法，包括：
获取原始样本构成的样本集，其中包括正常样本和风险样本；
获取风险检测模型及其对应的损失函数，所述风险检测模型为生成模型所所针对的模型；
针对所述样本集中各个原始样本，利用所述生成模型生成扰动变换，并将其叠加在对应原始样本上，得到各个原始样本对应的各个变换样本；
利用所述风险检测模型确定所述各个变换样本的各个风险预测值；
以正常样本对应的标签值为比对标签值，分别将所述各个风险预测值代入所述损失函数，得到各个变换样本的对抗损失；
至少根据所述各个变换样本的对抗损失的综合确定总对抗损失；
以最小化总对抗损失为目标，调整所述生成模型中的参数。

2.根据权利要求1所述的方法，其中，所述各个变换样本包括，原始风险样本对应的变换风险样本，和原始正常样本对应的变换正常样本；
至少根据所述各个变换样本的对抗损失的综合确定总对抗损失，包括：
根据各个变换风险样本的对抗损失之和，确定第一损失项；
根据各个变换正常样本的对抗损失之和，确定第二损失项；
根据第一损失项和第二损失项的组合，确定所述总对抗损失。

3.根据权利要求2所述的方法，其中，
确定第一损失项，包括：
根据各个变换风险样本的对抗损失之和，以及各个变换风险样本对应的扰动变换的大小度量值之和，确定所述第一损失项；
确定第二损失项，包括：
根据各个变换正常样本的对抗损失之和，以及各个变换正常样本对应的扰动变换的大小度量值之和，确定所述第二损失项。

4.根据权利要求3所述的方法，其中，所述扰动变换的大小度量值为，所述扰动变换的二阶范数，或者二阶范数的平方。

5.根据权利要求2或3所述的方法，其中，根据第一损失项和第二损失项的组合，确定所述总对抗损失，包括：
根据所述第一损失项和第二损失项的加权求和，得到所述总对抗损失。。

6.根据权利要求1所述的方法，其中，所述样本为以下之一：账号、交易、文本片段、用户操作。

7.一种优化风险检测模型的方法，包括：
获取原始样本构成的样本集，其中包括正常样本和风险样本；
获取根据权利要求1的方法训练的生成模型；
对于所述样本集中各个原始样本，利用所述生成模型生成扰动变换，并将其叠加在对应原始样本上，得到各个原始样本对应的各个变换样本；
利用所述样本集中各个原始样本对应的原始标签和各个变换样本，更新风险检测模型。

8.根据权利要求7所述的方法，其中，利用所述样本集中各个原始样本对应的原始标签和各个变换样本，更新风险检测模型，包括：
利用损失函数，针对所述原始标签，确定风险检测模型针对包含所述各个变换样本的样本总集的总预测损失；
以总预测损失最小化为目标，调整风险检测模型的模型参数。

9.一种用于生成对抗样本的生成模型的训练装置，包括：
第一获取单元，配置为获取原始样本构成的样本集，其中...

【专利技术属性】
技术研发人员：李辉，王维强，
申请(专利权)人：支付宝杭州信息技术有限公司，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人