可证明鲁棒的能够解释的机器学习模型的系统技术方案

技术编号：37351066 阅读：39 留言：0更新日期：2023-04-22 21:50

用于鲁棒机器学习(ML)的系统和方法包括攻击检测器，该攻击检测器包括一个或多个深度神经网络，深度神经网络使用从生成式对抗网络(GAN)生成的对抗示例来训练，基于输入是对抗性的可能性来产生警觉性得分。通过在操作的推断阶段期间部署的ML模型的类型和尺寸来动态地适配各种类型和尺寸的独立鲁棒ML模型的动态集成并且所有模型都被训练以执行基于ML的预测。自适应集成响应于从攻击检测器接收的警觉性得分。具有能够解释的神经网络模型的数据保护器模块被配置为预先筛选集成的训练数据，以检测初始训练数据中的潜在数据投毒或后门触发。触发。触发。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】可证明鲁棒的能够解释的机器学习模型的系统

[0001]本申请涉及网络安全。更具体地，本申请涉及用于机器学习系统的能够解释的安全措施。

技术介绍

[0002]在诸如自主汽车操作和国防等许多关键应用中，保护不受恶意影响的机器学习(ML)模型系统的安全性是重要的关注点。可以独立地改进ML算法，但是此类措施可能不足以处理日益复杂的攻击场景。近年来，对各种形式的ML欺骗技术的研究迅速增长，诸如(a)防止经由微小的表面改变(例如，点或涂料的应用)来识别或强制错误识别物理对象，(b)训练检测器以接受错误输入的能力，以及(c)外部推断ML模型并自主地生成强制错误的能力。
[0003]对抗输入生成集中在修改由ML模型正确处理的输入以使其行为不当。这些对抗输入通常是有效输入的较小的(对于给定的度量)变化，并且实际上是人类察觉不到的。它们已经在诸如图像和视频分析、音频转录和文本分类的许多领域中被发现或构建。大多数公布的攻击依赖于随机搜索技术来识别特定模型的对抗示例。然而，许多此类攻击最终对ML模型和架构是有效的，而不是开发攻击的模型和架构。诸如期望过变换之类的技术使得创建可以被传送到物理世界中并且抵抗诸如相机角度和照明条件之类的各种类型的噪声的对抗输入成为可能。可以向任何图像添加对抗的补丁以强制错误分类。最后，通用攻击是最难以创建的，因为它们涉及可以应用于任何有效输入以导致相同错误分类的扰动。
[0004]数据投毒涉及在训练集中引入不正确标记的(或“中毒的”)数据，目的是迫使所得模型产生特定错误。后门攻击引入具有名义上正确...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种用于鲁棒机器学习的系统，包括：处理器；以及非暂时性存储器，在所述非暂时性存储器上存储有由所述处理器执行的模块，所述模块包括：攻击检测器，包括一个或多个深度神经网络，所述深度神经网络使用从包括生成式对抗网络(GAN)的多个模型生成的对抗示例来训练，所述攻击检测器被配置为基于输入是对抗性的可能性来产生警觉性得分；以及各种类型和尺寸的独立鲁棒机器学习(ML)模型的动态集成，并且所有模型都被训练以执行基于机器学习的预测，其中，控制函数在操作的推断阶段期间动态地适配针对所述动态集成部署的ML模型的类型和尺寸，其中，所述控制函数响应于从所述攻击检测器接收的所述警觉性得分。2.根据权利要求1所述的系统，其中，所述控制函数还基于包括可用系统存储器和最大时间中的一个的参数来选择ML模型的类型和尺寸，以根据所述预测的紧急程度来计算所述预测。3.根据权利要求1所述的系统，其中，所训练的攻击检测器通过调整所述警觉性得分以针对更快速的响应要求更小的鲁棒性和更精益的ML模型，在操作的推断阶段期间对输入的快速性作出反应。4.根据权利要求1所述的系统，其中，所述攻击检测器通过调整所述警觉性得分以要求更大的鲁棒性，对输入是对抗性的高可能性作出反应。5.根据权利要求1所述的系统，所述模块还包括：数据保护器模块，包括能够解释的神经网络模型，所述能够解释的神经网络模型被配置为：学习用于解释类预测的原型；形成依赖于潜在空间的几何结构的初始训练数据的类预测，其中，所述类预测确定测试输入如何同类于来自每个类的输入的原型部分，并且在来自无关类的原型部分被激活的条件下，检测初始训练数据中的潜在数据投毒或后门触发。6.根据权利要求1所述的系统，其中，数据保护器模块还被配置为：识别潜在空间几何结构中的异常，并且将能够解释的预测的可视化发送到用户界面，以指导定位到所激活的原型部分的附加训练。7.根据权利要求1所述的系统，其中，数据保护器还被配置为：采用训练数据的潜在空间嵌入，其中距离对应于当前上下文中感知或含...

【专利技术属性】
技术研发人员：德米特里，
申请(专利权)人：西门子股份公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人