基于GAN的数据混淆决策器制造技术

技术编号:32029559 阅读:24 留言:0更新日期:2022-01-27 12:52
本发明专利技术涉及基于GAN的数据混淆决策器,尤其涉及用于保护与数据相关联的信息的隐私的方法及系统。本发明专利技术认识到由于隐私问题等特定方可能会犹豫共享其数据。本发明专利技术还认识到当前在多方之间共享数据的方法,诸如安全多方计算、匿名化或区块链技术,不能使特定方在没有第三方干预的情况下决定与其数据相关联的混淆级别。根据本发明专利技术描述的各种实施例,特定方可确定与其数据相关联的混淆级别,从而在共享和聚合数据时向各方灌输他们的数据受到保护和保密的信心。和保密的信心。和保密的信心。

【技术实现步骤摘要】
基于GAN的数据混淆决策器


[0001]本专利技术涉及一种基于GAN的数据混淆决策器。

技术介绍

[0002]网络可以监控和分析其数据以检测异常等原因。例如,特定网络可能会执行自己的机制来检测其网络内的异常情况。还可以共享来自多方或网络的数据以进行分析,诸如用于警报关联、异常检测、网络性能监控等。在某些情况下,与分析来自单方或网络的数据相比,聚合来自多方或网络的数据可以增强可对数据执行的分析。然而,本文认识到由于隐私问题等,特定方可能会犹豫共享其数据。

技术实现思路

[0003]本专利技术的实施例通过提供保护与数据相关联的信息和数据本身的隐私的方法、系统和装置来解决并克服本文描述的一个或多个缺点,从而可以将其与其他数据聚合以进行分析。此外,根据各种实施例,将其数据与另一方或网络聚合的一方或网络可以控制与其数据相关联的混淆级别,以便控制其数据和涉及其数据的信息的隐私。
[0004]在一个示例方面,从工业系统的一个或多个装置收集原始数据。神经网络可以学习原始数据的数据分布。此外,诸如混淆级别决策器(OLD)系统的系统可以获取涉及与原始数据相关联的混淆相关的参数值。基于参数值、OLD系统,特别是OLD系统的神经网络,可以在不公开原始数据的情况下生成表示原始数据的合成数据。在各种示例中,可以生成合成数据以根据与原始数据相关联的混淆来保护原始数据。OLD系统可以将合成数据发送到分析系统,使得表示工业系统原始数据的合成数据可以与其他工业系统的数据聚合。在一个示例中,神经网络可以对原始数据建模以确定原始数据的第一数据分布。此外,神经网络可以生成合成数据,使得合成数据定义第二数据分布,其中,定义第一数据分布和第二数据分布之间的差异。在该示例中,差异在第一数据分布相比于第二数据分布的精度容差内。此外,与原始数据相关联的混淆可以随着参数值变化而变化,并且第一数据分布和第二数据分布之间的差异可以随着参数值变化而变化。
[0005]在另一个示例方面,OLD系统可以耦接到工业系统的一个或多个装置。OLD系统可以包括输入端口,其被配置为从工业系统的一个或多个装置收集原始数据。OLD系统可以还包括生成式对抗网络(GAN),其被配置为获取涉及与原始数据相关联的混淆的参数值。GAN可以进一步配置为在不公开原始数据的情况下,基于参数值生成表示原始数据的合成数据。GAN可以根据与原始数据相关联的混淆来生成合成数据以保护原始数据。
[0006]在又一个示例方面,一种系统包括被配置为生成原始数据的多个工业网络。每个工业网络都可以被配置为包括生成式对抗网络(GAN),其被配置为获取涉及与原始数据相关联的混淆的参数值。每个GAN可以进一步配置为在不公开原始数据的情况下,基于参数值生成表示原始数据的合成数据。该系统可以还包括耦接到多个工业网络中的每一个的收集器装置。收集器装置可以被配置为从多个工业网络获取并聚合合成数据。在一些示例中,该
系统可以还包括耦接到收集器装置的分析系统。分析系统可被配置为对来自多个工业网络的合成数据进行评估,以在不接收原始数据的情况下分析来自多个工业系统的原始数据。
附图说明
[0007]当结合附图阅读时,从以下详细描述中可以最好地理解本专利技术的前述和其他方面。出于说明本专利技术的目的,在附图中示出了目前优选的实施例,然而应当理解,本专利技术不限于所公开的具体手段。附图中包括以下图:
[0008]图1是根据示例实施例的示例系统的框图,该示例系统包括多个工厂或工业环境或系统,其分别包括混淆级别决策器(OLD)系统。
[0009]图2是根据示例实施例的OLD系统的框图。
[0010]图3是根据示例实施例的可由OLD系统执行的方法的流程图。
[0011]图4示出了可以在其中实现本公开的实施例的计算环境。
具体实施方式
[0012]本专利技术认识到由于隐私问题等,特定方可能会犹豫共享其数据。本专利技术进一步认识到当前在多方之间共享数据的方法,诸如安全多方计算、匿名化或区块链技术,不能使特定方在没有第三方干预的情况下决定与其数据相关联的混淆级别。根据本专利技术描述的各种实施例,特定方可以确定与其数据相关联的混淆级别,从而在共享和聚合数据时向各方灌输他们的数据受到保护和保密的信心。
[0013]参考图1,示例工业系统100包括多个工厂或工业环境或系统,每个工厂或工业环境或系统可定义运营技术(OT)网络。特别地,示例工业系统100包括第一工厂102a、第二工厂102b和第三工厂102c,但是应当理解,工业系统100可以根据需要包括任何数量的工厂或OT网络。工厂102a

c可以定义私有或关键生产网络,诸如用于工业自动化的网络、金融网络、用于铁路自动化和控制的网络、生命关键系统等。工厂102a

c中的每一个都可以定义混淆级别决策器(OLD)系统或装置104。特别地,第一工厂102a可以包括第一OLD系统104a,第二工厂102b可以包括第二OLD系统104b,并且第三工厂102c可以包括第三OLD系统104c。每个OLD系统104可以被配置为向一个或多个数据评估系统,例如向分析系统108提供数据。在一些情况下,OLD系统104可以将数据发送到收集器106,该收集器可以聚合数据并将聚合数据提供给分析系统108。分析系统108可以定义例如但不限于入侵检测系统(IDS)、安全信息和事件管理(SIEM)系统或取证分析系统。分析系统108可以是公共互联网的一部分或者是不如工厂102a

c的OT网络安全的IT网络的一部分。
[0014]例如,如果发送到收集器106的数据不受保护,黑客可能会嗅探和/或操纵(例如,更改、删除、创建)在收集器106上或从工厂102a

c传送的收集数据。再举一个例子,黑客可能会使用嗅探到的数据来获取竞争优势,例如,除了识别数据本身之外,还可以识别与数据相关联的机密逻辑或属性。在示例实施例中,为了防止这种嗅探以及其他潜在漏洞,OLD系统104生成可由特定工厂所定义的OT网络外部的网络内的系统(例如分析系统108)分析的合成数据。可以生成合成数据以保护原始数据集的隐私,同时保持原始数据集的实用性。本专利技术认识到保护隐私的其他方法,诸如编码、匿名化等,可能不适用于包括具有跨网络的不同和/或遗留应用的异构OT网络的工业环境。
[0015]本专利技术认识到,除了原始数据本身之外,生成合成数据并将合成数据而不是原始或真实数据提供给分析系统108可以保护与原始数据相关的各种信息。在某些情况下,可以生成合成数据以屏蔽与相应原始数据相关联的值。作为进一步的示例而非限制,与工厂102a

c中的每一者相关的各种资产所有者的身份、与工厂102a

c相关的逻辑或商业秘密以及各种工厂102a

c的部件或系统,可以通过生成用于表示原始数据的合成数据来保护。本专利技术还认识到在某些情况下,这种从合成数据得到的隐私保护可以激励或允许各种工厂102a

c在收本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于保护与数据相关联的信息的隐私的方法,包括:从工业系统的一个或多个装置收集原始数据;获取涉及与所述原始数据相关联的混淆的参数值;以及基于所述参数值,在不公开所述原始数据的情况下,生成表示所述原始数据的合成数据,其中,根据与所述原始数据相关联的所述混淆,进一步生成所述合成数据以保护所述原始数据。2.根据权利要求1所述的方法,所述方法还包括:将所述合成数据发送到分析系统,使得表示所述工业系统的所述原始数据的所述合成数据能够与其他工业系统的数据聚合。3.根据权利要求1所述的方法,所述方法还包括:通过神经网络对所述原始数据进行建模,以确定所述原始数据的第一数据分布;以及通过所述神经网络生成所述合成数据,使得所述合成数据定义第二数据分布,其中,在所述第一数据分布和所述第二数据分布之间定义差异,所述差异在所述第一数据分布相比于所述第二数据分布的精度容差内。4.根据权利要求3所述的方法,其中,与所述原始数据相关联的所述混淆随着所述参数值变化而变化,并且所述第一数据分布和所述第二数据分布之间的所述差异随着所述参数值变化而变化。5.根据权利要求4所述的方法,其中,与所述原始数据相关联的所述混淆随着所述参数值增加而增加。6.根据权利要求4所述的方法,...

【专利技术属性】
技术研发人员:萨菲亚
申请(专利权)人:西门子股份公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1