根据一实施方式的信息处理方法,其由计算机执行,用于以虚拟表中包含的多个维度进行聚合,所述虚拟表是由自然索引格式的两个表按规定的键进行JOIN连接而成的,所述信息处理方法包括:聚合步骤,按所述键的每个值,以所述两个表中包含的所述多个维度进行聚合;以及和计算步骤,计算由所述聚合步骤进行的聚合的结果之和。和。和。
【技术实现步骤摘要】
【国外来华专利技术】信息处理方法、信息处理装置和程序
[0001]本专利技术涉及一种信息处理方法、信息处理装置和程序。
技术介绍
[0002]一直以来,已知有以关系数据库(RDB)为代表的各种数据库。RDB等数据库以表格式数据为对象,支持JOIN和检索、排序、聚合等各种运算。作为高速地对多个表格式数据进行JOIN而不利用大量的存储器的现有技术,已知专利文献1中记载的技术。
[0003]专利文献1:日本特开第2003
‑
150633号公报
技术实现思路
[0004]<本专利技术要解决的问题>
[0005]虽然在上述专利文献1所记载的技术中,利用排列或值列表实现了对多个表格式数据的JOIN的高速化,但是对JOIN后的表格式数据的各种运算也可高速化。
[0006]本专利技术的一个实施方式是鉴于上述情况而完成的,其目的是实现对JOIN后的表格式数据的运算的高速化。
[0007]<用于解决问题的手段>
[0008]为了实现上述目的,根据一实施方式的信息处理方法,其由计算机执行,用于以虚拟表中包含的多个维度进行聚合,所述虚拟表是由自然索引格式的两个表按规定的键进行JOIN连接而成的,所述信息处理方法包括:聚合步骤,按所述键的每个值,以所述两个表中包含的所述多个维度进行聚合;以及和计算步骤,计算由所述聚合步骤进行的聚合的结果之和。
[0009]<专利技术的效果>
[0010]能够实现对JOIN后的表格式数据的运算的高速化。
附图说明
[0011]图1是表示本实施方式的数据处理装置的硬件配置的一例的图。
[0012]图2是表示本实施方式的数据处理装置的功能配置的一例的图。
[0013]图3是表示表的一例的图。
[0014]图4是表示NNI格式的表的一例的图。
[0015]图5是用于说明转换排列和newSVL的准备的一例的图。
[0016]图6是用于说明newSVL的创建的一例的图。
[0017]图7是用于说明NNC的转换的一例的图。
[0018]图8是示出SVL的共用化结果的一例的图。
[0019]图9是表示InnerJOIN和OuterJOIN的一例的图。
[0020]图10是用于说明NNI格式表的表现方法的变更的一例的图。
[0021]图11是表示JOIN对象的表及其NNI格式的一例的图。
[0022]图12是用于说明SVL共用化处理后的表的一例的图。
[0023]图13是用于说明InnerJOIN中的SAcm创建处理的一例的图。
[0024]图14是用于说明InnerJOIN中的MAcm创建处理的一例的图。
[0025]图15示出了NNI格式的InnerJOIN表的一例。
[0026]图16是表示InnerJOIN表的一例的图。
[0027]图17是用于说明OuterJOIN中的SAcm创建处理的一例的图(之一)。
[0028]图18是用于说明OuterJOIN的SAcm创建处理的一例的图(之二)。
[0029]图19是用于说明OuterJOIN中的SAcm创建处理的一例的图(之三)。
[0030]图20是用于说明OuterJOIN中的MAcm创建处理的一例的图(之一)。
[0031]图21是用于说明OuterJOIN的MAcm创建处理的一例的图(之二)。
[0032]图22是示出了NNI格式的OuterJOIN表的一例的图。
[0033]图23是示出了OuterJOIN表的一例的图。
[0034]图24是用于说明RightOuterJOIN部分的读取的一例的图。
[0035]图25是用于说明LeftOuterJOIN部分的读取的一例的图。
[0036]图26是用于说明InnerJOIN部分的读取的一例的图。
[0037]图27是表示以多个列为键的JOIN对象的表及其NNI格式的一例的图。
[0038]图28是表示SVL共用化之后的以多个列为键的JOIN对象的表及其NNI格式的一例的图。
[0039]图29是表示多键字段的一例。
[0040]图30是用于说明EOrdSet的排序和转置的一例的图。
[0041]图31是用于说明创建SVL和Conv排列的一例的图(之一)。
[0042]图32是用于说明创建SVL和Conv排列的一例的图(之二)。
[0043]图33是表示以多个列为键的JOIN用的NNI格式表的一例的图。
[0044]图34是用于说明以多个列为键的JOIN中的SVL共用化处理的一例的图。
[0045]图35是表示聚合对象表的一例的图。
[0046]图36是用于说明JOIN键值的分解的一例的图。
[0047]图37是用于说明表的积的一例的图。
[0048]图38是表示聚合结果表的一例的图。
[0049]图39是用于说明排序法中的和以及积的一例的图。
[0050]图40是用于说明立方体法中的和以及积的一例的图。
[0051]图41是用于说明列传输的一例的图。
[0052]图42是表示与JOIN匹配的集合/不匹配的集合的提取对象表的一例的图。
[0053]图43是表示与JOIN匹配的集合/不匹配的集合的提取对象表的NNI格式的一例的图。
[0054]图44是用于说明提取与JOIN匹配/不匹配的集合的一例的图。
[0055]图45是用于说明提取与JOIN匹配/不匹配的集合的一例的图。
具体实施方式
[0056]在下文中,将说明本专利技术的实施例。在本实施方式中,对数据处理装置10进行说
明,该数据处理装置10能够高速执行对多个表格式数据进行JOIN之后的表格式数据的各种运算。这里,在本实施方式中,作为这些各种运算的一例,以对与JOIN后的表格式数据的排序、检索、聚合、JOIN匹配的集合和不匹配的集合的提取、列传输这5个运算为对象进行说明。注意,以下将表格式数据称为“表数据”或简称为“表”,将构成表的数据(即表的行)中的每一个数据称为“记录”。表中的列(数据项)也称为列。
[0057]<自然数索引>
[0058]首先,被称为自然数索引(NNI:Natural Number Index)的方法进行说明。自然数索引是本专利技术人设计的一种方法,它将表分割为按列的数据列,并将各数据列分割为以下两种排列。以下,这种分割也称为“成分分解”。
[0059]·
SVL(Sorted Value List:排序值列表)
[0060]·
NNC(Natural Numbered Column:自然编号列)
[0061]SVL是将列的出现值不重复且按升序排列的排列。NNC是将列的各值本文档来自技高网...
【技术保护点】
【技术特征摘要】
【国外来华专利技术】1.一种信息处理方法,其由计算机执行,用于以虚拟表中包含的多个维度进行聚合,所述虚拟表是由自然索引格式的两个表按规定的键进行JOIN连接而成的,所述信息处理方法包括:聚合步骤,按所述键的每个值,以所述两个表中包含的所述多个维度进行聚合;以及和计算步骤,计算由所述聚合步骤进行的聚合的结果之和。2.根据权利要求1所述的信息处理方法,其中,所述聚合步骤中,通过按所述键的每个值,将所述两个表分别分解为第一子表和第二子表,并计算所述第一子表与所述第二子表之间的积,来以所述多个维度进行聚合。3.根据权利要求2所述的信息处理方法,其中,所述聚合步骤中,在对所述第一子表中包含的所述维度的出现次数进行计数,并将所述计数的值添加到所述第一子表中的基础上,计算所述第一子表与所述第二子表之间的积。4.根据权利要求2或3所述的信息处理方法,其中,所述积和所述和是通过排序法或立方体法中的任一者来计算的。5.根据权利要求2至4中任一项所述的信息处理方法,其中,所述聚合的测度为最小、最大、总计或件数中的任一者,所述聚合步骤中,根据所述聚合的测度,计算所述第一子表与所述第二子表之间的积。6.根据权利要求5所述的信息处理方法,其中,所述和计算步...
【专利技术属性】
技术研发人员:古庄晋二,
申请(专利权)人:ESS控股株式会社,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。