用于实现隐私防火墙的系统和方法技术方案

技术编号:16309601 阅读:20 留言:0更新日期:2017-09-27 03:14
披露了用于保护隐私防火墙后面的私有数据的系统和方法。一种用于实现隐私防火墙从而确定并提供来自私有电子数据的非私有信息的系统包括数据储存库、处理设备、以及非瞬态处理器可读存储介质。所述存储介质包括编程指令,所述编程指令当被执行时使得所述处理设备:分析私有电子数据语料库从而识别所述数据的具有非私有信息的第一一个或多个部分以及所述数据的具有私有信息的第二一个或多个部分,将所述数据的所述第一一个或多个部分标记为被允许使用,判定所述数据的所述第二一个或多个部分是否包括非私有元素,并且如果所述数据的所述第二一个或多个部分包括非私有元素,则提取所述非私有元素并将所述非私有元素标记为被允许使用的信息。

System and method for implementing a privacy firewall

Systems and methods for protecting private data behind a privacy firewall are disclosed. A system for implementing a private firewall to determine and provide non private information from proprietary electronic data, including a data storage library, a processing device, and a non transient processor readable storage medium. The storage medium includes programming instructions, the programming instructions when executed so that the analysis of electronic data processing equipment: private corpus to identify the data with non private information of the first one or more parts and the data has private information in 21 or more parts, the the data of the first one or more parts labeled were allowed to use the data to determine whether the 21 or more parts including non private elements, and if the data of the 21 or more parts including non private elements, to extract the non private the element and the non private tag elements are allowed to use the information.

【技术实现步骤摘要】
【国外来华专利技术】用于实现隐私防火墙的系统和方法相关申请的交叉引用本申请要求2014年11月26日提交的题为“SYSTEMSANDMETHODSFORDATAPRIVACYFIREWALL(用于数据隐私防火墙的系统和方法)”的美国临时专利申请序列号62/084,656的权益,所述美国临时专利申请的全部公开内容通过引用结合在此。
技术介绍

本说明书总体上涉及提供隐私防火墙以保护私有和敏感数据,并且更具体地,涉及用于提供对从私有和敏感数据获得的非私有信息的访问的系统和方法。技术背景目前,可以通过将与数据有关的用户活动匿名化并暴露所述已匿名化数据以便浏览和使用来提供对私有和/或敏感数据的访问。然而,此类方法可能无法有效地保护隐私,因为所述数据可以被操纵以从中提取私有信息。此类方法还可能由于数据被匿名化到不再有用的程度而失败。相应地,存在对以下系统和方法的需要,所述系统和方法不对私有数据匿名化,而是从中发现并提取非私有元素,其方式为使得不破坏所述数据的隐私,但私有数据中所包含的数据是有用的。
技术实现思路
在一个实施例中,一种用于实现隐私防火墙从而确定并提供来自私有电子数据的非私有信息的系统包括具有私有电子数据语料库的数据储存库、处理设备、以及非瞬态处理器可读存储介质。所述非瞬态计算机可读存储介质包括一条或多条编程指令,所述一条或多条编程指令当被执行时使得所述处理设备:分析所述电子数据语料库从而识别所述数据的具有非私有信息的第一一个或多个部分以及所述数据的具有私有信息的第二一个或多个部分,将所述数据的所述第一一个或多个部分标记为被允许在所述隐私防火墙外部使用,判定所述数据的所述第二一个或多个部分是否包括非私有元素,并且如果所述数据的所述第二一个或多个部分包括非私有元素,则提取所述非私有元素并将所述非私有元素标记为被允许在所述隐私防火墙外部使用的信息。在另一实施例中,一种用于实现隐私防火墙从而确定并提供来自私有电子数据的非私有信息的方法包括:由处理设备分析包含在储存库中的私有电子数据语料库从而识别所述数据的包括非私有信息的第一一个或多个部分以及所述数据的包括私有信息的第二一个或多个部分;由所述处理设备将所述数据的所述第一一个或多个部分标记为被允许在所述隐私防火墙外部使用;由所述处理设备判定所述数据的所述第二一个或多个部分是否包括非私有元素;以及如果所述数据的所述第二一个或多个部分包括非私有元素,则由所述处理设备提取所述非私有元素并且由所述处理设备将所述非私有元素标记为被允许在所述隐私防火墙外部使用的信息。在又另一实施例中,一种用于通过隐私防火墙提供来自私有电子数据的非私有信息的系统包括:所述隐私防火墙后面的数据储存库、处理设备、以及非瞬态处理器可读存储介质。所述数据储存库包括:已经被标记为非私有信息的私有电子数据语料库、将不分发的私有信息、有待分发的私有信息的非私有元素、或已去私有化的私有信息。所述非瞬态处理器可读存储介质包括一条或多条编程指令,所述一条或多条编程指令当被执行时使得所述处理设备:从所述隐私防火墙外部的用户接收搜索字符串;在所述数据储存库中搜索所述电子数据的与所述搜索字符串相对应的一个或多个部分;并且如果所述电子数据的所述一个或多个部分包含所述非私有信息、所述有待分发的私有信息的所述非私有元素、或所述已去私有化的私有信息,则提供对所述搜索字符串的响应。所述搜索字符串包括问题,并且所述响应包含:包含所述非私有信息、所述有待分发的私有信息的所述非私有元素、或所述已去私有化的私有信息的所述电子数据的所述一个或多个部分中所包含的信息。鉴于以下具体描述结合附图将更完整地理解由在此描述的实施例提供的这些和附加特征。附图说明附图中阐明的实施例在本质上是说明性的且示例性的并且并不旨在限制由权利要求书限定的主题。当结合以下附图阅读时,能够理解说明性实施例的以下详细描述,其中,相同的结构用相同的参考标号指示,并且在附图中:图1根据本文所示出和所描述的一个或多个实施例描绘了针对用于提供对隐私防火墙后面数据的访问的系统的说明性计算网络的示意性描绘;图2描绘了来自图1的服务器计算设备的示意性描绘,进一步展示了根据本文所示出和所描述的一个或多个实施例可以用于提供数据的硬件和软件;图3根据在此示出和描述的一个或多个实施例描绘了来自图1的隐私防火墙的各个层的示意性描绘;图4根据在此示出和描述的一个或多个实施例描绘了描绘了响应于请求而提供数据的示意性方法的流程图;图5根据在此示出和描述的一个或多个实施例描绘了图形用户界面的示意性搜索输入屏幕的示意性描绘;图6根据在此示出和描述的一个或多个实施例描绘了包含自动完成选项的图形用户界面的示意性搜索输入屏幕的示意性描绘;图7根据在此示出和描述的一个或多个实施例描绘了描绘了对数据进行分析和分类的示意性方法的流程图;且图8根据在此示出和描述的一个或多个实施例描绘了描绘了判定私有数据是否包含非私有信息的示意性方法的流程图。具体实施方式总体上参考附图,在此所述的实施例是针对用于实现隐私防火墙从而限制对位于所述隐私防火墙边界内部的服务器上所存储的私有数据语料库的访问的系统和方法。在具体实施例中,在此所述的系统和方法总体上可以被实现以保证私有数据保持安全,同时仍然响应于一个或多个用户所提交的问题提供信息性答案,其中,所述答案是从所述私有数据获得的。一般可以假定隐私防火墙后面的所有数据都是私有数据。然而,所述数据的某些部分实际上可能包含非私有信息。另外,所述数据的包含私有信息的剩余部分还可能包含非私有元素。所述非私有信息和来自所述私有信息的所述非私有元素可以被标记为可用于在维持数据的隐私的同时回答用户所提交的问题。在此所披露的方法和系统可以用于例如:其中关于数据的使用是否将“跨用户”(即,实体的私有数据是否将被所述实体之外的任何人看见或推出)可能存在不确定性的实例,或其中期望提供不需要高度受控制的访问的数据储存库的情况。可以应用隐私防火墙的实例的非限制性示例包括:从人A推出的将只会影响人A并且数据储存库访问严格受控制的数据,从人A推出的可以影响人B或者数据储存库访问不受严格控制的数据,可以被映射(比如通过用户ID或互联网协议(IP)地址)至执行具体动作的用户的数据,必须遵守搜索字符串保留策略的数据(例如,必须在具体时间段内被移除或去私有化的数据),必须遵守隐私标准的数据,以及被稍微去私有化的数据(即,用户ID或IP地址已经被移除)。如在此所使用的,术语“非私有信息”指包含下述信息的数据,个人或实体将将不会对所述信息有任何隐私期望。所述非私有信息可以存储在储存库中,其中,储存库中所存储的所有数据最初被假定是私有的。这样,可以确定所述数据包含非私有信息。如在此所使用的非私有信息的示意性示例是跨广泛不同的源非常常用的数据。非私有信息的另一示意性示例是不明确地与具体个人或实体相关的数据。而非私有信息的又另一示意性示例是涉及来自搜索字符串的搜索缩小构造的数据,比如人口统计、数据源、历史间隔、地理范围等。非私有信息的又另一示意性示例是涉及非私有网络浏览活动的数据,比如互联网上的任何人轻易可访问的公开信息、包含数据的公开可获得的电子文件夹等。在一些实施例中,非私有信息还可以被称为非敏感数据。在一些实施例中,对某数据是否被视本文档来自技高网...
用于实现隐私防火墙的系统和方法

【技术保护点】
一种用于实现隐私防火墙来确定并提供来自私有电子数据的非私有信息的系统,所述系统包括:数据储存库,所述数据储存库包括所述私有电子数据语料库;处理设备;以及非瞬态处理器可读存储介质,其中,所述非瞬态处理器可读存储介质包括一条或多条编程指令,当所述一条或多条编程指令被执行时使得所述处理设备:分析所述私有电子数据语料库,从而识别包括非私有信息所述数据的的第一一个或多个部分以及包括私有信息的所述数据的第二一个或多个部分;将所述数据的所述第一一个或多个部分标记为被允许在所述隐私防火墙外部使用;判定所述数据的所述第二一个或多个部分是否包括非私有元素;并且如果所述数据的所述第二一个或多个部分包括非私有元素,则:提取所述非私有元素,并且将所述非私有元素标记为被允许在所述隐私防火墙外部使用的信息。

【技术特征摘要】
【国外来华专利技术】2014.11.26 US 62/084,6561.一种用于实现隐私防火墙来确定并提供来自私有电子数据的非私有信息的系统,所述系统包括:数据储存库,所述数据储存库包括所述私有电子数据语料库;处理设备;以及非瞬态处理器可读存储介质,其中,所述非瞬态处理器可读存储介质包括一条或多条编程指令,当所述一条或多条编程指令被执行时使得所述处理设备:分析所述私有电子数据语料库,从而识别包括非私有信息所述数据的的第一一个或多个部分以及包括私有信息的所述数据的第二一个或多个部分;将所述数据的所述第一一个或多个部分标记为被允许在所述隐私防火墙外部使用;判定所述数据的所述第二一个或多个部分是否包括非私有元素;并且如果所述数据的所述第二一个或多个部分包括非私有元素,则:提取所述非私有元素,并且将所述非私有元素标记为被允许在所述隐私防火墙外部使用的信息。2.如权利要求1所述的系统,其中,所述非瞬态处理器可读存储介质进一步包括:一条或多条编程指令,当所述一条或多条编程指令被执行时,使得所述处理设备将来自从第二一个或多个部分的未提取数据标记为被拒绝在所述隐私防火墙外部使用。3.如权利要求1所述的系统,其中,当一条或多条编程指令被执行时,使得所述处理设备分析所述私有电子数据语料库,进一步使得所述处理设备:判定所述私有电子数据语料库是否是从已排除列表上的源获得;并且如果所述私有电子数据语料库是从所述已排除列表上的源获得,则将所述私有电子数据语料库标记为被拒绝在所述隐私防火墙外部使用。4.如权利要求1所述的系统,其中,当一条或多条编程指令被执行时,使得所述处理设备判定所述数据的所述第二一个或多个部分,进一步使得所述处理设备:判定所述数据的所述第二一个或多个部分是否包括已经在其他位置出现的一个或多个元素;并且如果所述一个或多个子部分已经出现在其他位置,则将所述元素标记为非私有元素。5.如权利要求1所述的系统,其中,当一条或多条编程指令被执行时,使得所述处理设备判定所述数据的所述第二一个或多个部分是否包括非私有元素,进一步使得所述处理设备:判定所述数据的所述第二一个或多个部分是否包括已经从阈值数量个不同源出现的一个或多个元素;并且如果所述一个或多个元素已经从至少所述阈值数量个不同源出现,则将所述一个或多个元素标记为非私有元素。6.如权利要求1所述的系统,其中,当一条或多条编程指令被执行时,使得所述处理设备判定所述数据的所述第二一个或多个部分是否包括非私有元素,进一步使得所述处理设备:判定所述数据的所述第二一个或多个部分是否包括包含了已经是公共知识的信息的一个或多个元素;并且如果所述一个或多个元素包含已经是公共知识的信息,则将所述一个或多个元素标记为非私有元素。7.如权利要求1所述的系统,其中,当一条或多条编程指令被执行时,使得所述处理设备判定所述数据的所述第二一个或多个部分,进一步使得所述处理设备:判定所述数据的所述第二一个或多个部分是否包括较复杂的一个或多个元素,使得所述一个或多个元素可被要求为专用信息;并且如果所述一个或多个元素较复杂,则将所述一个或多个元素标记为被拒绝在所述隐私防火墙外部使用。8.如权利要求1所述的系统,其中,当一条或多条编程指令被执行时,使得所述处理设备判定所述数据的所述第二一个或多个部分是否包括非私有元素,进一步使得所述处理设备:判定所述数据的所述第二一个或多个部分是否包括具有可识别序列的一个或多个子部分;并且如果所述一个或多个子部分具有可识别序列,则将所述一个或多个子部分标记为被拒绝分布在所述隐私防火墙外部。9.如权利要求1所述的系统,其中,当一条或多条编程指令被执行时,使得所述处理设备判定所述数据的所述第二一个或多个部分是否包括非私有元素,进一步使得所述处理设备:判定所述数据的所述第二一个或多个部分是否包括具有精确时间戳的一个或多个元素;并且如果所述一个或多个元素具有精确时间戳,则将所述一个或多个元素标记为被拒绝在所述隐私防火墙外部使用。10.如权利要求1所述的系统,其中,当一条或多条编程指令被执行时,使得所述处理设备判定所述数据的所述第二一个或多个部分是否包括非私有元素,进一步使得所述处理设备:判定所述数据的所述第二一个或多个部分是否包括具有低于粒度阈值的时间戳的一个或多个元素;并且如果所述时间戳低于所述粒度阈值,则:将所述一个或多个元素调整至高于所述粒度阈值的时间范围,并且将所述一个或多个经调整元素标记为非私有元素。11.如权利要求1所述的系统,其中,当一条或多条编程指令被执行时,使得所述处理设备判定所述数据的所述第二一个或多个部分是否包括非私有元素,进一步使得所述处理设备:判定所述数据的所述第二一个或多个部分是否包括具有低于粒度阈值的地理位置的一个或多个元素;并且如果所述地理位置低于所述粒度阈值,则:将所述一个或多个元素调整至高于所述粒度阈值的地理位置,并且将所述一个或多个经调整元素标记为非私有元素。12.如权利要求1所述的系统,进一步包括一条或多条编程指令,当所述一条或多条编程指令被执行时,使得所述处理设备:通过...

【专利技术属性】
技术研发人员:W·基尔加隆
申请(专利权)人:里德爱思唯尔股份有限公司雷克萨斯尼克萨斯分公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1