减少总量泄漏的加密数据上的加密搜索制造技术

技术编号:35979061 阅读:20 留言:0更新日期:2022-12-17 22:48
一种方法(900)包括:从用户设备(10)接收针对多个关键字(32)的搜索查询(20),所述多个关键字(32)出现在存储在不受信任的存储设备(150)上的一个或多个加密文档(152)中。所述方法还包括:访问加密搜索索引(160)以获得每个都表示包括所述多个关键字中的第一关键字和第二关键字的文档的文档标识符(154)的第一列表。所述方法还包括:针对每个剩余关键字,确定每个都表示包括所述第一关键字、第二关键字和相应剩余关键字的文档的文档标识符的对应列表。所述方法包括:基于所述文档标识符的第一列表和每个文档标识符的对应列表来确定每个都表示包括所述多个关键字中的每个关键字的文档的文档标识符的第二列表。文档的文档标识符的第二列表。文档的文档标识符的第二列表。

【技术实现步骤摘要】
【国外来华专利技术】减少总量泄漏的加密数据上的加密搜索


[0001]本公开涉及对加密数据执行加密搜索以减少总量泄漏。

技术介绍

[0002]随着在云中存储大量数据变得越来越普遍,可搜索加密(即,加密搜索)越来越流行。越来越多的用户或客户端拥有加密文档的大语料库,这些加密文档存储在不受客户端控制的服务器处(即,服务器不受信任的)。利用可搜索加密,客户端能够将其加密文档存储在不受信任的服务器上,但仍维持搜索文档的能力,并且例如检索包含具体关键字的所有文档的标识符。然而,这种可搜索的加密通常会带来安全和隐私方面的缺陷。

技术实现思路

[0003]本公开的一个方面提供了一种针对加密数据执行加密搜索以减少总量泄漏的方法。该方法包括:在数据处理硬件处,从与用户相关联的用户设备接收对多个关键字的搜索查询。多个关键字出现在存储在不受信任的存储设备上的加密文档语料库内的一个或多个加密文档中。该方法还包括:由数据处理硬件,访问加密搜索索引以获得文档标识符的第一列表。文档标识符的第一列表中的每个文档标识符表示包括多个关键字中的第一关键字和多个关键字中的第二关键字的文档。针对在第一关键字和第二关键字之后出现在一个或多个加密文档中的每个剩余关键字,该方法包括:由数据处理硬件,确定文档标识符的对应列表。文档标识符的对应列表中的每个文档标识符都表示包括第一关键字、第二关键字和相应的剩余关键字的文档。该方法还包括:由数据处理硬件,基于文档标识符的第一列表和每个文档标识符的对应列表来确定文档标识符的第二列表。文档标识符的第二列表中的每个文档标识符表示包括多个关键字中的每个关键字的文档。该方法还包括:由数据处理硬件,将从加密搜索索引获得的文档标识符的第二列表返回给用户设备。
[0004]本公开的实施方式可以包括以下可选特征中的一个或多个。在一些实施方式中,针对出现在一个或多个加密文档中的每个相应关键字对,加密搜索索引包括:表示文档标识符的关键字对列表的加密值,该文档标识符的关键字对列表表示包括相应关键字对中的关键字中的两个关键字的文档;以及表示加密值和相应关键字对中的关键字中的一个关键字的加密标签。每个加密值可以用基于关键字对和秘密主密钥的伪随机函数密钥来加密。
[0005]在一些示例中,伪随机函数密钥基于关键字对的级联。可选地,每个加密标签用基于关键字中的一个关键字和秘密主密钥的伪随机函数密钥来加密。针对出现在一个或多个加密文档中的每个相应关键字对,加密搜索索引还可以包括双标签列表。双标签列表中的每个双标签可以包括针对相应关键字对的对应加密标签的加密散列。
[0006]在一些实施方式中,确定文档标识符的第二列表可以包括:针对在第一关键字和第二关键字之后出现在一个或多个加密文档中的每个剩余关键字,确定与相应剩余关键字相对应的双标签是否存在于双标签列表内;以及从双标签列表中移除与相应剩余关键字不对应的每个双标签。在一些示例中,访问加密搜索索引以获得文档标识符的第一列表包括
检索与第一关键字和第二关键字相对应的文档标识符的关键字对列表。
[0007]搜索查询可以包括表示第一关键字和第二关键字的令牌,以及针对在第一关键字和第二关键字之后出现在一个或多个加密文档中的每个剩余关键字,表示第一关键字和相应剩余关键字的令牌。在一些实施方式中,将从加密搜索索引获得的文档标识符的第二列表返回到用户设备使用户设备使用秘密主密钥来解密文档标识符的第二列表。
[0008]本公开的另一方面提供了一种针对加密数据执行加密搜索以减少总量泄漏的系统。该系统包括:数据处理硬件和与数据处理硬件通信的存储器硬件。该存储器硬件存储指令,当在数据处理硬件上执行时,该指令使数据处理硬件执行操作。该操作包括从与用户相关联的用户设备接收针对多个关键字的搜索查询。多个关键字出现在存储在不受信任的存储设备上的加密文档语料库内的一个或多个加密文档中。该操作还包括访问加密搜索索引以获得文档标识符的第一列表。文档标识符的第一列表中的每个文档标识符表示包括多个关键字中的第一关键字和多个关键字中的第二关键字的文档。针对在第一关键字和第二关键字之后出现在一个或多个加密文档中的每个剩余关键字,该操作包括确定文档标识符的对应列表。文档标识符的对应列表中的每个文档标识符表示包括第一关键字、第二关键字和相应的剩余关键字的文档。该操作还包括基于文档标识符的第一列表和每个文档标识符的对应列表来确定文档标识符的第二列表。文档标识符的第二列表中的每个文档标识符表示包括多个关键字中的每个关键字的文档。该操作还包括将从加密搜索索引获得的文档标识符的第二列表返回给用户设备。
[0009]该方面可以包括以下可选特征中的一个或多个。在一些实施方式中,针对出现在一个或多个加密文档中的每个相应关键字对,加密搜索索引包括:表示文档标识符的关键字对列表的加密值,该文档标识符的关键字对列表表示包括相应关键字对中的关键字中的两个关键字的文档;以及表示加密值和相应关键字对中的关键字中的一个关键字的加密标签。每个加密值可以用基于关键字对和秘密主密钥的伪随机函数密钥来加密。
[0010]在一些示例中,伪随机函数密钥基于关键字对的级联。可选地,每个加密标签用基于关键字中的一个关键字和秘密主密钥的伪随机函数密钥来加密。针对出现在一个或多个加密文档中的每个相应关键字对,加密搜索索引还可以包括双标签列表。双标签列表中的每个双标签可以包括针对相应关键字对的对应加密标签的加密散列。
[0011]在一些实施方式中,确定文档标识符的第二列表可以包括,针对在第一关键字和第二关键字之后出现在一个或多个加密文档中的每个剩余关键字,确定与相应剩余关键字相对应的双标签是否存在于双标签列表内,以及从双标签列表中移除与相应剩余关键字不对应的每个双标签。在一些示例中,访问加密搜索索引以获得文档标识符的第一列表包括检索与第一关键字和第二关键字相对应的文档标识符的关键字对列表。
[0012]搜索查询可以包括表示第一关键字和第二关键字的令牌;以及针对在第一关键字和第二关键字之后出现在一个或多个加密文档中的每个剩余关键字,表示第一关键字和相应剩余关键字的令牌。在一些实施方式中,将从加密搜索索引获得的文档标识符的第二列表返回到用户设备使用户设备使用秘密主密钥来解密文档标识符的第二列表。
[0013]本公开的一个或多个实施方式的细节在以下附图和描述中陈述。其他方面、特征和优点将通过描述和附图并且通过权利要求书而显而易见。
附图说明
[0014]图1是在加密数据上提供加密搜索以减少总量泄漏的示例系统的示意图。
[0015]图2是加密搜索索引的示例性组件的示意图。
[0016]图3是过滤文档标识符列表的加密搜索管理器的示意图,
[0017]图4是基于图3的过滤来确定文档标识符的第二列表的加密搜索管理器的示意图。
[0018]图5是具有加密标签和值的加密搜索索引的示意图。
[0019]图6A和6B是客户端加密搜索系统的示意图。
[0020]图7A至7D是执行合取查询的系统的正式描述的示意图。<本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种方法(900),包括:在数据处理硬件(118)处,从与用户相关联的用户设备(10)接收针对多个关键字(32)的搜索查询(20),所述多个关键字(32)出现在存储在不受信任的存储设备(150)上的加密文档的语料库(152)内的一个或多个加密文档(152)中;由所述数据处理硬件(118)访问加密搜索索引(160)以获得文档标识符(154)的第一列表,所述文档标识符(154)的第一列表中的每个文档标识符(154)表示包括所述多个关键字(32)中的第一关键字(32)和所述多个关键字(32)中的第二关键字(32)的文档(152);针对在所述第一关键字(32)和所述第二关键字(32)之后出现在所述一个或多个加密文档(152)中的每个剩余关键字(32),由所述数据处理硬件(118)确定文档标识符(154)的对应列表,所述文档标识符(154)的对应列表中的每个文档标识符(154)表示包括所述第一关键字(32)、所述第二关键字(32)和相应剩余关键字(32)的文档(152);由所述数据处理硬件(118)基于所述文档标识符(154)的第一列表和文档标识符(154)的每个对应列表来确定文档标识符(154)的第二列表,所述文档标识符(154)的第二列表中的每个文档标识符(154)表示包括所述多个关键字(32)中的每个关键字的文档(152);以及由所述数据处理硬件(118)将从所述加密搜索索引(160)获得的所述文档标识符(154)的第二列表返回到所述用户设备(10)。2.根据权利要求1所述的方法(900),其中,针对出现在所述一个或多个加密文档(152)中的每个相应关键字(32)对,所述加密搜索索引(160)包括:加密值(510),所述加密值(510)表示文档标识符(154)的关键字对列表,所述文档标识符(154)表示包括相应关键字(32)对中的所述关键字(32)中的两个关键字的文档(152);以及加密标签(512),所述加密标签(512)表示所述加密值(510)和所述相应关键字(32)对中的所述关键字(32)中的一个关键字。3.根据权利要求2所述的方法(900),其中,每个加密值(510)用伪随机函数密钥(15)来加密,所述伪随机函数密钥(15)是基于所述关键字(32)对和秘密主密钥(14)。4.根据权利要求3所述的方法(900),其中,所述伪随机函数密钥(15)是基于所述关键字(32)对的级联。5.根据权利要求2至4中任一项所述的方法(900),其中,每个加密标签(512)用伪随机函数密钥(15)来加密,所述伪随机函数密钥(15)是基于所述关键字(32)中的所述一个关键字和秘密主密钥(14)。6.根据权利要求2至5中任一项所述的方法(900),其中,针对出现在所述一个或多个加密文档(152)中的每个相应关键字(32)对,所述加密搜索索引(160)还包括双标签的列表,所述双标签的列表中的每个双标签包括针对相应关键字(32)对的对应加密标签(512)的加密散列(515)。7.根据权利要求6所述的方法(900),其中,确定所述文档标识符(154)的第二列表包括:针对在所述第一关键字(32)和所述第二关键字(32)之后出现在所述一个或多个加密文档(152)中的每个剩余关键字(32):确定与相应剩余关键字(32)相对应的双标签是否存在于所述双标签的列表内;以及从所述双标签的列表中移除与所述相应剩余关键字(32)不对应的每个双标签。
8.根据权利要求2至7中任一项所述的方法(900),其中,访问所述加密搜索索引(160)以获得所述文档标识符(154)的第一列表包括:检索与所述第一关键字(32)和所述第二关键字(32)相对应的所述文档标识符(154)的关键字对列表。9.根据权利要求1至8中任一项所述的方法(900),其中,所述搜索查询(20)包括:表示所述第一关键字(32)和所述第二关键字(32)的令牌(24);以及针对在所述第一关键字(32)和所述第二关键字(32)之后出现在所述一个或多个加密文档(152)中的每个剩余关键字(32),表示所述第一关键字(32)和所述相应剩余关键字(32)的令牌(24)。10.根据权利要求1至9中任一项所述的方法(900),其中,将从所述加密搜索索引(160)获得的所述文档标识符(154)的第二列表返回到所述用户设备(10)使得所述用户设备(10)使用秘密主密钥(14)来解密所述文档标识符(154)的第二列表。11.一种系统(100),包括:数据处理硬件(118);以及与所述...

【专利技术属性】
技术研发人员:凯文
申请(专利权)人:谷歌有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1