认知存储器图形索引、存储和检索制造技术

技术编号:16934770 阅读:39 留言:0更新日期:2018-01-03 05:09
本公开提供了用于对图形或网络进行编码和索引以及用于识别图形数据内的子结构匹配或类似物的快速近似以及精确的分层网络存储和检索系统和方法。认知存储器通过广义组合地图和新的量子启发的Q‑Hashing算法对图形进行编码,以汇总图形的局部结构以及收缩和图形属性计算,以构建被称为认知签名的索引数据结构,用于基于属性的、基于模拟的、或基于结构或子结构的搜索。本发明专利技术的系统和方法理想地适用于存储和索引图形以及动态变化图形(诸如流量图或流程图和图形的运动图片序列)的全部或部分或子结构或类似物。该系统和方法具有以下优点:图形的认知签名的属性可以用于与底层数据的属性相关联,使得系统理想地用于大规模图形数据集的语义索引。

Cognitive memory graphics index, storage, and retrieval

The present disclosure provides a fast approximation and precise hierarchical network storage and retrieval system and method for coding or indexing graphs or networks, and for identifying substructure matching or analogues in graphic data. Cognitive memory encoding of Q graphics by Hashing algorithm of generalized combinatorial maps and new quantum inspired by the local structure, summary graphics and graphics properties and shrinkage calculation, in order to construct called cognitive index data structure for attribute based signature, and based on the simulation, or based on the structure or substructure search. The system and method of the invention are ideally applicable to all or part or sub structure or analogues of storing and indexing graphics and dynamically changing graphics, such as traffic picture or flowchart sequence of pictures. The system and method have the following advantages: the properties of the cognitive signature of graph can be used to relate to the attributes of the underlying data, making the system ideally applied to the semantic indexing of large-scale graph data set.

【技术实现步骤摘要】
【国外来华专利技术】认知存储器图形索引、存储和检索相关申请的交叉引用本申请基于并要求于2015年3月24日提交的临时美国申请No.62/137,598的优先权权益,该申请的全部内容通过引用被结合于此。
本公开描述了“认知存储器”模型,其使得能够对网络及其任何大小的子结构进行编码和解码以便快速存储、查询处理和检索。该模型具体而言基于称为Q-Medoids的分区算法将局部化、导向子空间的概念与使用称为Q-散列(Q-Hashing)的量子启发散列方案的子图形的局部描述在更大的图形和图形的全局空间内通过将图形映射到广义地图进行耦合。广义地图使用新的表示形式,其中节点和边采用实值和复值。这样的表示逆转了其中量子随机游标(walker)嵌入复向量空间的概念的传统概念,并且改为图形本身正在定义复空间。该模型维护了更大图形以及其包含的子图形的全局描述,这两者在重写过程中都被唯一地加以利用。重写过程涉及构建局部和全局表示,其保证方法的固定终止点以产生用于回答查询的多索引结构,查询诸如给定查询图形是确切地或近似地与存储的图形匹配,还是给定图形是其中一个存储的图形的一部分。此外,重写过程还可以提供关于图形的一部分是否介于其它图形的其它部分“中间(in-between)”的见解,即,可以实现中间性(in-betweeness)和可达性的特征。
技术介绍
本文提供的“背景”描述是为了一般地呈现本公开的上下文。当前提名的专利技术人的工作,就该工作在这个背景部分中被描述的程度而言,以及在提交时可能没有以其它方式被限定为现有技术的本描述的各方面,既没有明确地承认也没有暗示地承认作为针对本专利技术的现有技术。网络(也不同地称为图形)存储方法已经基于散列和基于内容的访问的变化,如在图像数据库、化学分子数据库、社会、财务、交通网络和互联网网络内容数据库中。世界上最流行的基于网络的索引的算法是GoogleTMPage-Rank(页面排名)算法,其在从到内容的中枢(hub)页面的互联网进入和离开链接导出的网络上操作。复杂网络中的分层子结构在生物、原子、基因组、神经和社会组织中普遍存在。复杂网络内的相关网络组(RNG)的识别通常比简单的图形同构或子同构问题更难,因为它涉及将网络划分为节点的分层子网组,由于整个网络及其建设性成分的结构、功能和演变,该分层子网组可以以多种不同的方式链接或关联。例如,社区检测使用介数(betweeness)和模块化的概念来实现除法算法,该算法逐步去除具有最大介数的链接,直到网络分解为组件:如果网络是一个具有自相似或迭代、递归、自然(例如无规模网络)的网络,那么在模块化组件内部是否可以精简更小的集群是困难的。由于每个链接都潜在地包含关于网络中的结构的信息,因此需要对不同结构级别进行群集而不会在处理的任何阶段丢弃链接的分层表示和分区策略。网络上的拓扑或几何度量(诸如分别为Hosoya的拓扑索引和Google的Page-Rank)当被单独使用甚至组合使用时,也不足以描述图像的内容描述,尤其就随时间的变化而言,并且也不能作为表达复杂的、关系型、类似类比的查询的工具,其中网络之间的脆弱匹配是非期望的。例如,在图像处理中,图形提供了良好的内容表达,但是基于图形的存储和检索是困难的,因为图像(无论是单独地还是如在视频中顺序地)的缩放、大小、分辨率、数量和保真度增加,并且这将提升基于图形的方法的复杂性。在互联网搜索中,Google的“Page-Rank”已经是主要的和最成功的网络索引算法。但是,Page-Rank无法捕获网站之间的相似性以及上下文,甚至无法用作通过内容表示来剖析网站用户的方式。在诸如PageRank的算法和其它图形算法中,主要关注点在于连接的组件和通过所谓的中枢(hub)识别重要的语义概念,这些中枢表示捕获最多导入底层概念的最大连接的组件。大多数其它基于图形的算法及其主要群集方法都建立在由传入数据形成的图形或网络的最大连接的组件的单个静态视图上:无论数据是文本(即形成文本图形)还是图像(即分割和形成用于视觉模式识别的图像图形)或者是金融网络或者分子或生化图形和网络(用于药物设计或化学物质评估)。为了检索候选图形,目前文献中有两种主要方法:基于索引的方法,诸如Levinson’sUniversalGraph[3],SUBDUE和其它[4];以及基于向量的方法,诸如Petrakis[5]的属性关系图形(AttibuteRelationalGraph)“ARG”方法。当结构的可变性、复杂性、多样性和特征差别很大或者当图形有许多动态变化时,方法(i)和(ii)失败。这些方法中没有一种方法非常适合编码和存储图形的动态变化序列。基于索引的方法维护成员图形的静态、通常预先计算的分层索引集合,其响应于查询进行遍历。在遍历期间,经由查询图形和当前索引元素之间的索引值的距离度量被计算并用于检索。基于向量的方法将成员图形视为特征向量,并将每个图形变换为特征空间。通常,对图形的属性执行向量化。在这个过程中,显示图形属性如何相互链接的结构属性被忽略。图像数据库中的网络检索与化学数据池(bank)中的图形检索不同,并且与文本数据库或超链接web中的检索非常不同,因为语义是完全不同的。某些应用领域要求图形数据库在有相似结构但主题变化(诸如CAD绘图或其它机械目录零件)时使用其中每个图形都是存储在数据库中的通用图形的变体的通用图形概念而最佳执行。这意味着成员图形相对于结构大多相似。但是每个图形的可能节点和边属性的数量将很大。事实上,每个现代OORDBMS(面向对象的关系数据库管理系统)都可以被认为是属性关系图形数据库。这是因为,关系模式具有等效的ER(实体关系)模式图形,并且因此被认为是其中成员图形是其ER模式图形的不同实例的图形数据库。但是,查询处理和高复杂度面向结构的图形存储系统的创建与OORDBMS系统几乎没有共同之处,并且因此通常没有系统可用于大规模存储和检索网络,因为在大多数情况下,图形不共享几乎相同的结构,而是可能局部不同但全局相似(例如在蛋白质结构中)或局部相似但全局非常不同(例如,在语言资源的文本图形中)。因此,需要适应这些广泛不同的视角(perspective)的方法。具体而言,需要使得能够以高效的方式捕获图形中的动态变化的框架。
技术实现思路
认知存储器适用于图形的关系查询、模拟发现、数据挖掘以及图形结构内容与语义属性的相关。具有图形结构的数据包括社交网络、生物化学网络、蛋白质和化学分子图、动态时变图,诸如交通网络图和金融交易网络以及通信系统拓扑。图形彼此的索引、存储、取回和比较的问题是本公开所解决的基本问题。附图说明由于当结合附图考虑时,通过参考以下详细描述,本公开以及其许多伴随的优点变得更好理解,因此将容易获得对本公开及其许多伴随优点更全面的了解,其中:以下各图描述了本专利技术:图1图示了认知存储器系统和过程;图2图示了将网络编码为广义(generalized)组合地图;图3绘出了Q-Medoids分区算法;图4图示了用于距离到区域NSI的分区和区域化(zoning);图5图示了量子粒子和交互的示例性球谐状约束;图6图示了示例性Q-散列函数;图7图示了示例性局部布隆过滤器索引;图8图示了示例性着色图;图9绘出了根据实施例的示例性连接矩阵;图10图本文档来自技高网
...
认知存储器图形索引、存储和检索

【技术保护点】
一种非瞬态计算机可读介质,其中包括实现量子计算元件的数据结构,包括:编码输入图形的地图,所述编码由包括所述地图的多个局部结构和所述局部结构的对应收缩级别的Q‑散列算法执行,以及与所述图形的节点的状态对应的索引,所述图形的每个节点由实数表示并且所述图形中的每条边由复数表示。

【技术特征摘要】
【国外来华专利技术】2015.03.24 US 62/137,5981.一种非瞬态计算机可读介质,其中包括实现量子计算元件的数据结构,包括:编码输入图形的地图...

【专利技术属性】
技术研发人员:A·马宗达
申请(专利权)人:凯恩迪股份有限公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1