提供用于实现基于组合超图形(CHYMAPS)和/或广义组合图形(G‑Map)的数据表示和操作的方法和装置,包括:使用快速算法将项代数映射到基于树的数,并且使用可逆数值编码和解码将映射结构的图表示为CHYMAPS;以对子图形(子图)到图形(图)同构和利用一般匹配过程的部分匹配进行优化的形式生成CHYMAPS的表示;将对CHYMAPS的操作执行为对相应数值表示的操作;使用三位自定界二进制代码执行压缩和解压缩;以及存储和检索代码。
【技术实现步骤摘要】
【国外来华专利技术】用于基于组合超图形的数据表示和操作的装置和方法对相关申请的交叉引用本申请基于并要求于2014年12月10日提交的临时美国申请No.62/090,190的优先权权益,该临时美国申请的全部内容通过引用被结合于此。
本文公开的实施例一般而言涉及用于使用唯一可逆码和基于树的编号系统来编码组合超图形(CHYMAPS)的方法和装置,该基于树的编号系统将项代数(termalgebra)嵌入到CHYMAPS中;并且更具体而言,该装置和方法提供复杂数据结构表示、模式识别、子图的快速统一、以及对项代数的操作是可逆且无损(即,双射)的对编号的算术运算。
技术介绍
本文提供的背景描述是出于一般地呈现本公开的上下文的目的。当前提名的专利技术人的工作,就该工作在这个背景部分中被描述的程度而言,以及在提交时没有以其它方式被限定为现有技术的本描述的各方面,既不是明确地承认也不是暗示地承认作为针对本公开的现有技术。搜索引擎、关系数据库系统、图表示和大多数结构化数据表示和计算系统都具有将数据存储为整数的属性。这些整数的编码、操作和解码消耗相当多的CPU时间。因此,已经付出相当大的努力来通过对数据的缩减大小或压缩和解压缩方案进行操作来降低与计算相关联的成本。
技术实现思路
提供一种方法和装置,用于实现将数据表示为组合超图形(CHYMAPS)、广义组合图形(G-Maps)和/或项代数项(term-algebraterm),并将组合超图形、广义组合图形和/或项代数项编码为自然数或基于树的数。该方法和装置还包括在数据表示的同构子图形上执行统一处理。该方法还包括操作,该操作包括:使用快速算法将项代数映射到基于树的数,并使用可逆数值编码和解码将映射结构的图表示为CHYMAPS;以对子图形(子图)到图形(图)同构和利用一般匹配过程的部分匹配进行优化的形式生成CHYMAPS的表示;将对CHYMAPS的操作执行为对相应数值表示的操作;使用三位自定界二进制码执行压缩和解压缩;以及存储和检索代码。附图说明当结合附图考虑时,通过参考以下详细描述提供对本公开的更完整的理解,其中:图1示出根据一种实现的将图或项代数项编码为可以是自然数或基于树的数的戈德尔数并且对图或项代数项的同构子图形执行统一的方法的流程图;图2示出根据一种实现的将图或项代数项编码为可以是自然数或基于树的数的戈德尔数的过程的流程图;图3A示出根据一种实现的图;图3B示出根据一种实现的图的组合图形;图3C示出根据另一种实现的图的组合图形;图3D示出根据一种实现的另一个图;图3E示出根据一种实现的另一个图的组合图形;图4A示出根据一种实现的将无不动点对合(fixedpointfreeinvolution)双射编码为自然数的方法的流程图;图4B示出根据一种实现的将自然数双射解码为无不动点对合的方法的流程图;图5示出根据一种实现的从图(输入图)到项树(termtree)(输出子图形)的变换;图6示出根据一种实现的形成基本构图模式的字典的子图的示例;图7示出根据一种实现的迭代地编码和遍历区域(locales)以对同构子图形(即,子图)执行统一的双步(dualstep)算法的示例;图8示出根据一种实现的评估子图形之间的同构的方法的流程图;图9示出根据一种实现的评估子图形之间的同构的方法的流程图;图10示出根据一种实现的标记组合超图形的箭头(dart)的方法的流程图;图11示出根据一种实现的将项代数项双射编码为自然数或基于树的数的方法的流程图;图12示出根据一种实现的将项代数项双射编码为自然数的示例;图13示出根据一种实现的使用符号序列标记组合超图形的箭头的方法的流程图;图14示出根据一种实现的对项代数项和项树进行编码的方法的流程图;图15示出根据一种实现的从项代数项生成项图的方法的流程图;图16示出根据一种实现的执行项图统一的方法的流程图;以及图17示出根据一种实现的计算设备的框图。具体实施方式在许多领域的尝试中,图可以提供知识和关系的有力的表示。图数据库存储图结构,而不是数据的表。通常,图数据库可应用于需要存储和检索复杂拓扑信息的领域,比如神经网络、语义网络、社交网络、相关故事的网络、场景、路线、路径、道路或地理信息系统(GIS)。图数据库中的主要问题之一是基于结构匹配检索成员图。图的结构匹配是已知的NP完备(NP-complete)问题。在大型图数据库中,因为必须针对数据库中的大量图执行结构匹配,所以结构匹配变得非常困难。因为不存在分解空间并且空间始终在动态变化,所以从动态拓扑图数据库的检索甚至比从预索引的基于属性的图数据库的检索更难。本文描述的方法和装置提供用于基于高速逻辑推理的匹配图结构的功能。使用知识表示模型,信息被表示为图。这些图可以被变换成广义组合图形(G-Maps,generalizedcombinatorialmaps)。使用用于图结构的广义组合映射(G-Map,generalizedcombinatorialmapping)的表示,算法使用格点(lattice)路径的属性作为G-Maps内固有的区域,以基于区域确定图结构的子图是否是同构的。假定可以由近似与超球体的质心相交的角度扫过的面积(从其量化的多面体(permutohedral)复合体的细分得到)的实数表示区域,那么可以低多项式时间或最多log(N)时间取得用于同构测试的候选子图。使用CHYMAP-NUMBER对每一个区域进行索引,该算法可以快速识别在给定图结构中同构的区域。组合图形(超图形)可以是图(超图)的拓扑表示,并且由作用于箭头的有限集的置换对定义,其中箭头表示由顶点和入射边组成的耦合,并且置换给出入射到给定顶点(边)的边(顶点)的次序。超图是其中广义边(称为超边)可以连接多于两个节点的图。在本文中,本文关于G-Maps描述的方法是通用的,并且也应用于组合超图形。类似地,除非另有明确说明,否则本文关于组合超图形描述的方法是通用的并且也应用于G-Maps。可以由用于唯一定义相应的G-maps的数列表(例如,箭头、置换和对合)表示G-maps。此外,这些数列表可以使用戈德尔编号(numbering)由单个数表示(例如,使用康托尔(cantor)编号将数对映射为单个数,这可以被重复执行以将数列表映射到单个数),其中数列表与其戈德尔数之间的变换使用双射(即,可逆变换)来执行。但是,对应于长的数列表的戈德尔数可能非常大,从而为使用常规计算机硬件存储和表示这些数带来挑战。使用基于树的整数表示来克服这个挑战,该基于树的整数表示很好地适应于紧凑地表示非常大量的数。随着使用图和/或子图的戈德尔数的基于树的整数表示来表示图和/或子图,标准数学运算可以被执行。因此,可以使用对相应的戈德尔数的基本算术运算在几个时钟周期内执行计算密集型函数(诸如,比较两个子图),否则这些计算密集型函数将需要大量的计算来遍历和比较节点。因此,本文描述的方法基于表示复杂结构数据的基于树的编号来使用向量化编码,该方法实现比先前最快方案更快几个数量级的性能,该先前最快方案能够处理用于表示对应于知识表示(例如,图)的复杂数据对象的大数。事实上,在大多数情况下,本文描述的方法相对于现有技术方法实现指数级的加速。此外,这些方法实现了存储与图对应的戈德尔数的表示所需的计算机存储本文档来自技高网...
【技术保护点】
一种实现基于组合超图形(CHYMAPS)的数据表示和操作的方法,所述方法包括:使用快速算法将项代数映射到基于树的数,并且使用可逆数值编码和解码将映射结构的图表示为CHYMAPS;以对子图形(子图)到图形(图)同构和利用一般匹配过程的部分匹配进行优化的形式生成CHYMAPS的表示;将对CHYMAPS的操作执行为对相应数值表示的操作;使用三位自定界二进制代码执行压缩和解压缩;以及存储和检索代码。
【技术特征摘要】
【国外来华专利技术】2014.12.10 US 62/090,1901.一种实现基于组合超图形(CHYMAPS)的数据表示和操作的方法,所述方法包括:使用快速算法将项代数映射到基于树的数,并且使用可逆数值编码和解码将映...
【专利技术属性】
技术研发人员:A·马宗达,
申请(专利权)人:凯恩迪股份有限公司,
类型:发明
国别省市:美国,US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。