本发明专利技术公开了度量空间划分多边界搜索性能衡量的方法及相关组件。该方法包括获取度量空间中的多个划分边界组,每个划分边界组包括第一划分边界和第二划分边界;针对每一划分边界组,计算第一划分边界和第二划分边界的法向量,分别得到第一法向量和第二法向量;针对每一划分边界组,计算第一法向量和第二法向量的夹角的余弦值,并作为对应划分边界组的余弦值;对比每个划分边界组的余弦值,根据对比结果确认各划分边界组的搜索性能。本发明专利技术比较各划分边界组的搜索性能,并选取出搜索性能最优的划分边界组,具有实验成本低、时间成本低、比较效率高的优点。较效率高的优点。较效率高的优点。
【技术实现步骤摘要】
度量空间划分多边界搜索性能衡量的方法及相关组件
[0001]本专利技术涉及数据处理
,尤其涉及一种度量空间划分多边界搜索性能衡量的方法及相关组件。
技术介绍
[0002]现有的基于划分的度量空间索引,比如以超平面为基础划分,以超平面为基础划分的结果具有良好的几何特性,其划分所得的各区域之间不相互重叠。
[0003]现有的对经典索引的优化都是从对划分后的数据进一步处理和数据的分布出发的,而少有人在划分边界的形态上着手对索引进行优化,原因是:一方面,不同索引之间的性能比较都是通过实验进行的,没有一套体系的、理论的方法可以客观地对不同方法的优劣进行评价,因此没法客观地反映潜藏在实验背后的不同划分方法的内在差异;另一方面,对不同的划分都需要编写专门的穿件索引和范围搜索的代码,存在实验成本过高的问题;再一方面,需要利用不同的索引对数据库中的所有数据进行范围搜索,并且返回索引利用不同索引时所采用的范围搜索时间或者范围搜索所需要的距离计算次数,存在时间成本高和效率低的问题。
技术实现思路
[0004]本专利技术的目的是提供一种度量空间划分多边界搜索性能衡量的方法及相关组件,旨在解决现有度量空间中,分析多组不同的多划分边界的性能时,存在实验成本高、时间成本高、效率低的问题。
[0005]为解决上述技术问题,本专利技术的目的是通过以下技术方案实现的:提供一种度量空间划分多边界搜索性能衡量的方法,其包括:
[0006]获取度量空间中的多个划分边界组,每个所述划分边界组包括第一划分边界和第二划分边界;
[0007]针对每一所述划分边界组,计算所述第一划分边界和第二划分边界的法向量,分别得到第一法向量和第二法向量;
[0008]针对每一所述划分边界组,计算所述第一法向量和第二法向量的夹角的余弦值,并作为对应所述划分边界组的余弦值;
[0009]对比每个划分边界组的余弦值,根据对比结果确认各所述划分边界组的搜索性能。
[0010]另外,本专利技术要解决的技术问题是还在于提供一种度量空间划分多边界搜索性能衡量的装置,其包括:
[0011]获取单元,用于获取度量空间中的多个划分边界组,每个所述划分边界组包括第一划分边界和第二划分边界;
[0012]第一计算单元,用于针对每一所述划分边界组,计算所述第一划分边界和第二划分边界的法向量,分别得到第一法向量和第二法向量;
[0013]第二计算单元,用于针对每一所述划分边界组,计算所述第一法向量和第二法向量的夹角的余弦值,并作为对应所述划分边界组的余弦值;
[0014]对比单元,用于对比每个划分边界组的余弦值,根据对比结果确认各所述划分边界组的搜索性能。
[0015]另外,本专利技术实施例又提供了一种计算机设备,其包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述第一方面所述的度量空间划分多边界搜索性能衡量的方法。
[0016]另外,本专利技术实施例还提供了一种计算机可读存储介质,其中所述计算机可读存储介质存储有计算机程序,所述计算机程序当被处理器执行时使所述处理器执行上述第一方面所述的度量空间划分多边界搜索性能衡量的方法。
[0017]本专利技术实施例公开了度量空间划分多边界搜索性能衡量的方法及相关组件。该方法包括获取度量空间中的多个划分边界组,每个划分边界组包括第一划分边界和第二划分边界;针对每一划分边界组,计算第一划分边界和第二划分边界的法向量,分别得到第一法向量和第二法向量;针对每一划分边界组,计算第一法向量和第二法向量的夹角的余弦值,并作为对应划分边界组的余弦值;对比每个划分边界组的余弦值,根据对比结果确认各划分边界组的搜索性能。本专利技术实施例通过计算各组的划分边界组的余弦值,可确认划分边界组中的第一划分边界和第二划分边界的划分形态,并对划分形态进行分析,从而选出搜索性能最优的划分边界组,具有实验成本低、时间成本低、比较效率高的优点。
附图说明
[0018]为了更清楚地说明本专利技术实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0019]图1为本专利技术实施例提供的度量空间划分多边界搜索性能衡量的方法的流程示意图;
[0020]图2为本专利技术实施例提供的步骤S101的子流程示意图;
[0021]图3为本专利技术实施例提供的步骤S102的子流程示意图;
[0022]图4为本专利技术实施例提供的一个划分边界组的划分性能的示意图;
[0023]图5为本专利技术实施例提供的另一个划分边界组的划分性能的示意图;
[0024]图6为本专利技术实施例提供的度量空间划分多边界搜索性能衡量的装置的示意性框图。
具体实施方式
[0025]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0026]应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整
体、步骤、操作、元素、组件和/或其集合的存在或添加。
[0027]还应当理解,在此本专利技术说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本专利技术。如在本专利技术说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
[0028]还应当进一步理解,在本专利技术说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
[0029]请参阅图1,图1为本专利技术实施例提供的度量空间划分多边界搜索性能衡量的方法方法的流程示意图;
[0030]如图1所示,该方法包括步骤S101~S104。
[0031]S101、获取度量空间中的多个划分边界组,每个所述划分边界组包括第一划分边界和第二划分边界。
[0032]具体的,如图2所示,所述步骤S101包括:
[0033]S201、选取不同的支撑点,对度量空间中的同一数据范围进行两次划分,得到包含第一划分边界和第二划分边界的一个划分边界组;
[0034]S202、根据数据到各个支撑点的不同加权距离继续对数据进行不同划分,即可得下一个划分边界组,以此类推,得到多个划分边界组。
[0035]所述度量空间为二元组(M,d),其中M是有限非空的数据集合,d是定义在M上的距离函数。
[0036]所述度量空间(M,d)满足:
[0037]数据S={s
i本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种度量空间划分多边界搜索性能衡量的方法,其特征在于,包括:获取度量空间中的多个划分边界组,每个所述划分边界组包括第一划分边界和第二划分边界;针对每一所述划分边界组,计算所述第一划分边界和第二划分边界的法向量,分别得到第一法向量和第二法向量;针对每一所述划分边界组,计算所述第一法向量和第二法向量的夹角的余弦值,并作为对应所述划分边界组的余弦值;对比每个划分边界组的余弦值,根据对比结果确认各所述划分边界组的搜索性能。2.根据权利要求1所述的度量空间划分多边界搜索性能衡量的方法,其特征在于,所述获取度量空间中的多个划分边界组,每个所述划分边界组包括第一划分边界和第二划分边界,包括:选取不同的支撑点,对度量空间中的同一数据范围进行两次划分,得到包含第一划分边界和第二划分边界的一个划分边界组;根据数据到各个支撑点的不同加权距离继续对数据进行不同划分,即可得下一个划分边界组,以此类推,得到多个划分边界组。3.根据权利要求2所述的度量空间划分多边界搜索性能衡量的方法,其特征在于,所述针对每一所述划分边界组,计算所述第一划分边界和第二划分边界的法向量,分别得到第一法向量和第二法向量,包括:将所述第一划分边界和第二划分边界映射到支撑点空间中,得到对应的第一划分超平面和第二划分超平面;分别计算所述第一划分超平面和第二划分超平面的权值,将所述第一划分超平面的权值作为第一划分边界的第一法向量,将所述第二划分超平面的权值作为第二划分边界的第二法向量。4.根据权利要求1所述的度量空间划分多边界搜索性能衡量的方法,其特征在于,所述计算所述第一法向量和第二法向量的夹角的余弦值,包括:按如下式子计算所述第一法向量和第二法向量的夹角的余弦值:其中,(a1,a2,
…
,a
n
)为所述第一法向量的坐标,(b1,b2,
…
,b
n
)为所述第二法向量的坐标。5.根据权利要求1所述的度量空间划分多边界搜索性能衡量的方法,其特征在于,所述度量空间为二元组(M,d),其中M是有限非空的数据集合,d是定义在M上的距离函数。6.根据权利要求5所述的度量空间划分多边界搜索性能衡量的方法,其特征在于,所述度量空间(M,d)满足:数据S={s
i
|s
i
∈M,i=1,2,...,m},S中存在n个支撑点P={p1,p2,...,p
n
},对于以数据到支撑点的距离d(s,p
i
)作为坐标,定义一个从M...
【专利技术属性】
技术研发人员:毛睿,赖裕雄,王毅,刘刚,陆克中,陆敏华,陈倩婷,
申请(专利权)人:深圳大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。