System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 用于压缩快速加密相似性搜索和数据库分析的方法和系统技术方案_技高网

用于压缩快速加密相似性搜索和数据库分析的方法和系统技术方案

技术编号:42606590 阅读:13 留言:0更新日期:2024-09-03 18:15
一种用于数据库的加密的相似性搜索的方法(100),包括:(i)提供(120)包括多个同态加密的固定长度数据指纹的数据库;(ii)接收(130)加密的查询;(iii)生成(140)固定长度查询数据指纹;(iv)对固定长度查询数据指纹进行同态加密(150);(v)生成(160)固定大小查询数据指纹表;(vi)将同态加密的固定长度查询数据指纹与每个同态加密的固定长度数据指纹进行比较(170),其中,每个比较都会生成距离;(vii)使用同态加密的固定长度查询数据指纹与每个同态加密的固定长度数据指纹之间的生成的距离来识别(180)数据库中具有最小生成距离的一个或多个数据文件;以及(viii)报告(190)所识别的一个或多个数据文件。

【技术实现步骤摘要】
【国外来华专利技术】

本公开内容整体上涉及用于数据加密的相似性搜索的方法和系统。


技术介绍

1、许多数据应用要求相似性搜索。例如,在医学领域,找到具有相似特征的患者和/或治疗可以深入了解患者的轨迹、预测(forecast)、和/或预测、患者治疗等。因此,识别相似的患者可以对患者的医疗保健结果产生巨大的益处。与医学数据库中的医学数据的相似性搜索相关联的一个问题是,搜索相似的患者可能要求传输或传送隐私敏感的医学信息。这种敏感信息的传输可以是监管问题以及隐私和/或安全风险。

2、许多电子健康记录系统利用由医疗保健标准组织国际健康七级(health levelseven international(hl7))创建的快速医疗互操作性资源(fast healthcareinteroperability resource,fhir)格式来存储和传达医学数据。fhir是一种描述数据格式和元素(即资源)的标准,也是用于交换电子健康记录的api。然而,fhir文件可以是非常大的文件,并且因此使用fhir文件进行相似性搜索可以是一繁重的过程。

3、一种方法是使用zk-snark(zero-knowledge succinct non-interactivearguments of knowledge,零知识简洁非交互式知识论证),这是一种密码证明技术,用于以保持机密性的方式建立知识或所有权,同时最小化用于通信的带宽量。虽然这种方法使各方能够证明计算的属性,但它不会以完全加密的方式执行计算本身。

4、另一种安全进行医学数据的相似性搜索的方法是在数据仍处于加密的状态时对其进行搜索。因此,当前的方法探索使用诸如同态加密之类的方法,该方法能够在数据被加密时对其进行分析。然而,同态解决方案在它们可以处理的数据量方面受到严重限制。因此,即使是最好的解决方案对于现实世界的使用来说仍然过于有限。


技术实现思路

1、因此,本领域中持续需要能够快速并且高效地对数据库进行相似性搜索同时确保查询的隐私性和安全性的方法和系统。

2、本公开内容针对用于对数据库进行相似性搜索的专利技术方法和系统。本文中的各种实施例和实现方式针对被配置用于使用同态加密查询数据库的方法和系统。根据实施例,针对同态加密的数据库查询同态加密的固定长度查询数据指纹,以识别查询与数据库中数据之间的距离。相似性搜索系统包括数据库,该数据库包括多个同态加密的固定长度数据指纹,每个固定长度数据指纹表示数据库中的数据文件。同态加密的固定长度数据指纹在数据库中的固定大小查询数据库表中随机排序。该系统接收要在相似性搜索中针对该数据库进行查询的查询,生成固定长度的查询数据指纹,并且对固定长度的查询数据指纹进行同态加密。该系统生成与固定大小的数据库表大小相同的固定大小的查询数据指纹表,并且然后比较两个表中的指纹以生成查询与数据库中的每个指纹之间的距离。该系统识别数据库中与查询距离最小的文件,并且报告该距离和/或所识别的文件。

3、整体上,在一个方面中,提供了一种用于数据库的加密的相似性搜索的方法。该方法包括:(i)提供包括多个同态加密的固定长度数据指纹的数据库,每个固定长度数据指纹表示数据库中的数据文件,其中,多个同态加密的固定长度数据指纹在固定大小数据库表中随机排序;(ii)接收要在相似性搜索中针对所述数据库进行查询的查询;(iii)根据接收到的查询来生成固定长度查询数据指纹;(iv)同态加密固定长度查询数据指纹;(v)生成固定大小查询数据指纹表,其中,固定大小查询数据指纹表的大小与固定大小数据库表的大小相同;(vi)使用固定大小查询数据指纹表和固定大小数据库表,将同态加密的固定长度查询数据指纹与每个同态加密的固定长度数据指纹进行比较,其中,每个比较生成距离;(vii)使用同态加密的固定长度查询数据指纹与每个同态加密的固定长度数据指纹之间的生成的距离,识别数据库中具有最小生成的距离的一个或多个数据文件;以及(viii)报告数据库中的所识别的一个或多个数据文件。

4、根据实施例,该方法还包括生成多个同态加密的固定长度数据指纹的步骤。

5、根据实施例,该方法还包括生成包括多个同态加密的固定长度数据指纹的固定大小数据库表的步骤,其中,多个同态加密的固定长度数据指纹在固定大小数据库表内随机排序。

6、根据实施例,每个同态加密的固定长度数据指纹和同态加密的固定长度查询数据指纹之间的距离用于填充距离表,并且其中,距离表的大小与固定大小查询数据指纹表和固定大小数据库表的大小相同。

7、根据实施例,距离表是同态加密的。

8、根据实施例,生成的距离是同态加密的。

9、根据实施例,最小生成的距离由预先确定设置确定或由用户定义。

10、根据实施例,报告还包括查询和数据库中的所识别的一个或多个数据文件之间的生成的距离。

11、根据实施例,加密的查询是数据库的更新后的版本,并且每个固定长度数据指纹表示数据库的版本或数据库中的数据文件的版本。

12、根据实施例,加密的查询是参考基因组的更新后的版本,并且每个固定长度数据指纹表示参考基因组。

13、根据另一方面,是一种用于数据库的加密相似性搜索的系统。该系统包括:数据库,该数据库包括多个同态加密的固定长度数据指纹,每个固定长度数据指纹表示数据库中的数据文件,其中,多个同态加密的固定长度数据指纹在固定大小数据库表中随机排序;在相似性搜索中要针对数据库进行查询的查询;以及处理器,其被配置为:(i)根据查询生成固定长度查询数据指纹;(ii)同态加密固定长度查询数据指纹;(iii)生成固定大小查询数据指纹表,其中,固定大小查询数据指纹表的大小与固定大小数据库表的大小相同;(iv)使用固定大小查询数据指纹表和固定大小数据库表,将同态加密的固定长度查询数据指纹与每个同态加密的固定长度数据指纹进行比较,其中,每个比较生成距离;(v)使用同态加密的固定长度查询数据指纹与每个同态加密的固定长度数据指纹之间的生成的距离,识别数据库中具有最小生成的距离的一个或多个数据文件;以及(vi)生成包括数据库中的所识别的一个或多个数据文件的报告。

14、根据实施例,该系统还包括配置为提供所生成的报告的用户接口。

15、应当理解,前述概念和下文更详细讨论的附加概念的所有组合(前提是这些概念不相互矛盾)均被视为本文公开的专利技术主题的部分。特别是,出现在本公开内容末尾的所要求保护的主题的所有组合均被视为本文公开的专利技术主题的部分。还应当理解,本文明确使用的术语(也可能出现在通过引用并入的任何公开内容中)应当被赋予与本文公开的特定概念最一致的含义。

16、各种实施例的这些和其他方面将从下文描述的实施例中显而易见并且参考下文描述的实施例进行阐述。

本文档来自技高网...

【技术保护点】

1.一种用于数据库的加密的相似性搜索的方法(100),包括:

2.根据权利要求1所述的方法,还包括生成(115)所述多个同态加密的固定长度数据指纹的步骤。

3.根据权利要求1所述的方法,还包括生成(115)包括所述多个同态加密的固定长度数据指纹的固定大小数据库表的步骤,其中,所述多个同态加密的固定长度数据指纹在所述固定大小数据库表内随机排序。

4.根据权利要求1所述的方法,其中,每个同态加密的固定长度数据指纹与所述同态加密的固定长度查询数据指纹之间的所述距离用于填充距离表,并且其中,所述距离表与所述固定大小查询数据指纹表和所述固定大小数据库表的大小相同。

5.根据权利要求1所述的方法,其中,所述生成的距离是同态加密的。

6.根据权利要求1所述的方法,其中,报告还包括所述查询与所述数据库中的所述所识别的一个或多个数据文件之间的生成的距离。

7.根据权利要求1所述的方法,其中,所述加密的查询是数据库的更新后的版本,并且其中,每个固定长度数据指纹表示数据库的版本或所述数据库中的数据文件的版本。

8.根据权利要求1所述的方法,其中,所述加密的查询是参考基因组的更新后的版本,并且其中,每个固定长度数据指纹表示参考基因组。

9.一种用于数据库的加密的相似性搜索的系统(200),包括:

10.根据权利要求9所述的系统,还比较被配置为提供所生成的报告的用户接口(240)。

11.根据权利要求9所述的系统,其中,所述处理器还被配置为生成所述多个同态加密的固定长度数据指纹。

12.根据权利要求9所述的系统,其中,所述处理器还被配置为生成包括所述多个同态加密的固定长度数据指纹的所述固定大小数据库表,其中,所述多个同态加密的固定长度数据指纹在所述固定大小数据库表内随机排序。

13.根据权利要求9所述的系统,其中,每个同态加密的固定长度数据指纹与所述同态加密的固定长度查询数据指纹之间的距离用于填充距离表,并且其中,所述距离表与所述固定大小查询数据指纹表和所述固定大小数据库表的大小相同。

14.根据权利要求13所述的系统,其中,所述距离表是同态加密的。

15.根据权利要求9所述的系统,其中,所述最小生成的距离由预先确定的设置确定或由用户定义。

...

【技术特征摘要】
【国外来华专利技术】

1.一种用于数据库的加密的相似性搜索的方法(100),包括:

2.根据权利要求1所述的方法,还包括生成(115)所述多个同态加密的固定长度数据指纹的步骤。

3.根据权利要求1所述的方法,还包括生成(115)包括所述多个同态加密的固定长度数据指纹的固定大小数据库表的步骤,其中,所述多个同态加密的固定长度数据指纹在所述固定大小数据库表内随机排序。

4.根据权利要求1所述的方法,其中,每个同态加密的固定长度数据指纹与所述同态加密的固定长度查询数据指纹之间的所述距离用于填充距离表,并且其中,所述距离表与所述固定大小查询数据指纹表和所述固定大小数据库表的大小相同。

5.根据权利要求1所述的方法,其中,所述生成的距离是同态加密的。

6.根据权利要求1所述的方法,其中,报告还包括所述查询与所述数据库中的所述所识别的一个或多个数据文件之间的生成的距离。

7.根据权利要求1所述的方法,其中,所述加密的查询是数据库的更新后的版本,并且其中,每个固定长度数据指纹表示数据库的版本或所述数据库中的数据文件的版本。

8.根据权利要求1所述...

【专利技术属性】
技术研发人员:A·J·H·拉尔穆索
申请(专利权)人:皇家飞利浦有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1