数据处理方法及设备技术

技术编号:33092257 阅读:14 留言:0更新日期:2022-04-16 23:21
本申请实施例公开了一种数据处理方法及设备,其中,该方法包括:基于一个轨迹的轨迹点的空间位置数据和时间位置数据,根据索引数据库中预设层级的混合编码的编码规则进行编码得到各个轨迹点的混合编码,该混合编码包括轨迹点的时间信息和空间位置信息,然后基于该各个轨迹点的混合编码在索引数据库中查询该一个轨迹的相似轨迹。该索引数据库中包括多个层级的混合编码,该索引数据库中包括具有轨迹信息的混合编码,所述轨迹信息包括轨迹标识和轨迹长度。本申请能够提高轨迹查询的准确度,同时降低轨迹相似性计算的复杂度,提高相似轨迹的查询效率。的查询效率。的查询效率。

【技术实现步骤摘要】
数据处理方法及设备


[0001]本专利技术涉及数据处理
,尤其涉及一种数据处理方法及设备。

技术介绍

[0002]移动互联技术的快速发展催生了大量反映个体、群体位置信息及行为状态的轨迹数据,因其具有丰富的时空位置及语义信息,被广泛应用于智能交通、城市计算、社会感知等各个领域。其中,轨迹相似性查询作为轨迹数据挖掘的基础之一,逐渐成为国内外的研究热点,并得到社会各界广泛关注与应用,如通勤模式识别、交通状况预测、异常行为探测、犯罪行为追踪、重大疫情防控等,对于城市交通、城市规划、公共卫生等具有重大的意义。
[0003]但是,现有的轨迹相似性查询方案中要么缺少轨迹的时间信息,要么相似性计算复杂度高,因此,如何在轨迹相似性查询中增加轨迹的时间信息以提高轨迹查询的准确度,同时降低轨迹相似性计算的复杂度是本领域技术人员急需解决的技术问题。

技术实现思路

[0004]本申请提供一种数据处理方法及设备,能够提高轨迹查询的准确度,同时降低轨迹相似性计算的复杂度,提高相似轨迹的查询效率。
[0005]第一方面,本申请提供一种数据处理方法,包括:
[0006]获取第一信息,上述第一信息包括第一轨迹的一个或多个轨迹点的空间位置数据和时间数据;
[0007]根据上述第一信息获取第一混合编码集合,上述第一混合编码集合包括上述第一信息的每个轨迹点各自的混合编码,上述混合编码为根据索引数据库中的预设层级的混合编码规则编码获得;上述混合编码包括轨迹点的时间编码和轨迹点的空间编码,上述时间编码是根据上述时间数据获得,上述空间编码是根据上述空间位置数据获得;上述索引数据库为多级索引结构,包括多个层级的混合编码,每个层级的混合编码根据其所归属的层级的混合编码进行集合划分,上述每个层级的混合编码和其所归属的层级的混合编码之间存在所索引关系,上述多个层级的混合编码中包括具有轨迹信息的混合编码,上述轨迹信息用于指示上述混合编码所属轨迹的轨迹标识和所属轨迹的轨迹长度,一个轨迹的轨迹长度为上述索引数据库中存储的轨迹标识为同一轨迹的混合编码的个数;
[0008]根据上述第一混合编码集合中的每个混合编码在上述索引数据库中按照多级索引结构的查询方法进行查询,获得第二混合编码集合,上述第二混合编码集合中的混合编码为具有轨迹信息的混合编码;上述第二混合编码集合中的混合编码映射有m个候选相似轨迹的轨迹信息,上述m为整数;
[0009]根据上述第一轨迹的轨迹长度和上述m个候选相似轨迹的轨迹信息获取N个相似轨迹,上述N为小于或等于m的整数。
[0010]本申请结合轨迹的轨迹点的时间信息和空间信息编码得到混合编码,并基于该混合编码为索引构建多层级的索引数据库,并在索引数据库的混合编码映射上述轨迹信息,
在此基础上在该索引数据库中查询到候选相似轨迹,并基于候选相似轨迹计算出目标轨迹的相似轨迹,从而能够提高轨迹查询的准确度,同时降低轨迹相似性计算的复杂度,并提高相似轨迹的查询效率。
[0011]在一种可能的实施方式中,上述根据上述第一混合编码集合中的每个混合编码在上述索引数据库中按照多级索引结构的查询方法进行查询,获得第二混合编码集合,包括:
[0012]按照多级索引结构的查询方法将上述第一混合编码集合中的每个混合编码与上述索引数据库中的混合编码比较,获取上述第二混合编码集合,上述第二混合编码集合中的混合编码为上述索引数据库中与上述第一混合编码集合中的混合编码相同的混合编码,和/或上述索引数据库中与上述第一混合编码集合中的混合编码相同的混合编码对应的低层级和/或高层级混合编码。
[0013]本申请介绍查询候选相似轨迹对应的编码集合的过程,从而可以获取到候选相似轨迹,通过筛选出候选相似轨迹,然后再进一步计算轨迹之间的相似度,从而可以减少相似度的计算次数,提高计算效率。
[0014]在一种可能的实施方式中,上述第一信息还包括上述第一轨迹的属性数据,上述轨迹信息还包括上述轨迹信息指示的轨迹的属性信息,上述属性信息根据上述轨迹信息指示的轨迹的属性数据获得;
[0015]上述根据上述第一混合编码集合中的每个混合编码在上述索引数据库中按照多级索引结构的查询方法进行查询,获得第二混合编码集合,包括:
[0016]按照多级索引结构的查询方法将上述第一混合编码集合中的每个混合编码与上述索引数据库中的混合编码比较,获取第一匹配的混合编码,上述第一匹配的混合编码为上述索引数据库中与上述第一混合编码集合中的混合编码相同的混合编码,和/或上述索引数据库中与上述第一混合编码集合中的混合编码相同的混合编码对应的低层级和/或高层级混合编码;
[0017]根据上述第一匹配的混合编码获取上述第二混合编码集合,上述第二混合编码集合中的混合编码为上述第一匹配的混合编码中属性信息包含上述第一轨迹的属性信息的混合编码。
[0018]在本申请中,除了上述混合编码作为索引之外,进一步增加属性信息作为过滤信息,属性信息可以在查询相似轨迹的时候进一步过滤不必要的轨迹,从而更高效更准确地查询到匹配的相似轨迹。
[0019]在一种可能的实施方式中,上述按照多级索引结构的查询方法将上述第一混合编码集合中的每个混合编码与上述索引数据库中的混合编码比较,包括:
[0020]根据上述第一混合编码集合中的第一混合编码确定目标层级的混合编码,上述目标层级为上述预设层级归属的层级;
[0021]根据上述目标层级的混合编码进行查找,获取第一候选混合编码集;
[0022]将上述第一混合编码与上述第一候选混合编码集比较。
[0023]在本申请中通过先获取低层级的混合编码作为索引,可以提高索引的效率。
[0024]在一种可能的实施方式中,上述根据上述第一信息获取第一混合编码集合,包括:
[0025]根据上述预设层级中混合编码的空间编码的编码规则,对上述一个或多个轨迹点的空间位置数据进行编码得到上述一个或多个轨迹点各自的空间编码;
[0026]根据上述预设层级中混合编码的时间编码的编码规则,对上述一个或多个轨迹点的时间数据进行编码得到上述一个或多个轨迹点各自的时间编码;
[0027]将上述一个或多个轨迹点中每一个轨迹点的空间编码和时间编码合并得到上述每一个轨迹点的混合编码。
[0028]本申请说明混合编码的编码过程,混合编码为轨迹点的时间编码和空间编码混合而成,因此相比于现有技术只有空间编码来表示轨迹点,本申请用该混合编码来表示轨迹点更准确。
[0029]在一种可能的实施方式中,上述第一信息还包括上述第一轨迹的属性数据,上述根据上述第一信息获取第一混合编码集合,包括:
[0030]根据上述预设层级中混合编码的空间编码的编码规则,对上述一个或多个轨迹点的空间位置数据进行编码得到上述一个或多个轨迹点各自的空间编码;
[0031]根据上述预设层级中混合编码的时间编码的编码规则,对上述一个或多个轨迹点的时间数据进行编码得到上述一个或多个轨迹点各自的时间编码;...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法,其特征在于,包括:获取第一信息,所述第一信息包括第一轨迹的一个或多个轨迹点的空间位置数据和时间数据;根据所述第一信息获取第一混合编码集合,所述第一混合编码集合包括所述第一信息的每个轨迹点各自的混合编码,所述混合编码为根据索引数据库中的预设层级的混合编码规则编码获得;所述混合编码包括轨迹点的时间编码和轨迹点的空间编码,所述时间编码是根据所述时间数据获得,所述空间编码是根据所述空间位置数据获得;所述索引数据库为多级索引结构,包括多个层级的混合编码,每个层级的混合编码根据其所归属的层级的混合编码进行集合划分,所述每个层级的混合编码和其所归属的层级的混合编码之间存在所索引关系,所述多个层级的混合编码中包括具有轨迹信息的混合编码,所述轨迹信息用于指示所述混合编码所属轨迹的轨迹标识和所属轨迹的轨迹长度,一个轨迹的轨迹长度为所述索引数据库中存储的轨迹标识为同一轨迹的混合编码的个数;根据所述第一混合编码集合中的每个混合编码在所述索引数据库中按照多级索引结构的查询方法进行查询,获得第二混合编码集合,所述第二混合编码集合中的混合编码为具有轨迹信息的混合编码;所述第二混合编码集合中的混合编码映射有m个候选相似轨迹的轨迹信息,所述m为整数;根据所述第一轨迹的轨迹长度和所述m个候选相似轨迹的轨迹信息获取N个相似轨迹,所述N为小于或等于m的整数。2.根据权利要求1所述的方法,其特征在于,所述根据所述第一混合编码集合中的每个混合编码在所述索引数据库中按照多级索引结构的查询方法进行查询,获得第二混合编码集合,包括:按照多级索引结构的查询方法将所述第一混合编码集合中的每个混合编码与所述索引数据库中的混合编码比较,获取所述第二混合编码集合,所述第二混合编码集合中的混合编码为所述索引数据库中与所述第一混合编码集合中的混合编码相同的混合编码,和/或所述索引数据库中与所述第一混合编码集合中的混合编码相同的混合编码对应的低层级和/或高层级混合编码。3.根据权利要求1所述的方法,其特征在于,所述第一信息还包括所述第一轨迹的属性数据,所述轨迹信息还包括所述轨迹信息指示的轨迹的属性信息,所述属性信息根据所述轨迹信息指示的轨迹的属性数据获得;所述根据所述第一混合编码集合中的每个混合编码在所述索引数据库中按照多级索引结构的查询方法进行查询,获得第二混合编码集合,包括:按照多级索引结构的查询方法将所述第一混合编码集合中的每个混合编码与所述索引数据库中的混合编码比较,获取第一匹配的混合编码,所述第一匹配的混合编码为所述索引数据库中与所述第一混合编码集合中的混合编码相同的混合编码,和/或所述索引数据库中与所述第一混合编码集合中的混合编码相同的混合编码对应的低层级和/或高层级混合编码;根据所述第一匹配的混合编码获取所述第二混合编码集合,所述第二混合编码集合中的混合编码为所述第一匹配的混合编码中属性信息包含所述第一轨迹的属性信息的混合编码。
4.根据权利要求2或3所述的方法,其特征在于,所述按照多级索引结构的查询方法将所述第一混合编码集合中的每个混合编码与所述索引数据库中的混合编码比较,包括:根据所述第一混合编码集合中的第一混合编码确定目标层级的混合编码,所述目标层级为所述预设层级归属的层级;根据所述目标层级的混合编码进行查找,获取第一候选混合编码集;将所述第一混合编码与所述第一候选混合编码集比较。5.根据权利要求1至4任一项所述的方法,其特征在于,所述根据所述第一信息获取第一混合编码集合,包括:根据所述预设层级中混合编码的空间编码的编码规则,对所述一个或多个轨迹点的空间位置数据进行编码得到所述一个或多个轨迹点各自的空间编码;根据所述预设层级中混合编码的时间编码的编码规则,对所述一个或多个轨迹点的时间数据进行编码得到所述一个或多个轨迹点各自的时间编码;将所述一个或多个轨迹点中每一个轨迹点的空间编码和时间编码合并得到所述每一个轨迹点的混合编码。6.根据权利要求1或2所述的方法,其特征在于,所述第一信息还包括所述第一轨迹的属性数据,所述根据所述第一信息获取第一混合编码集合,包括:根据所述预设层级中混合编码的空间编码的编码规则,对所述一个或多个轨迹点的空间位置数据进行编码得到所述一个或多个轨迹点各自的空间编码;根据所述预设层级中混合编码的时间编码的编码规则,对所述一个或多个轨迹点的时间数据进行编码得到所述一个或多个轨迹点各自的时间编码;对所述第一轨迹的属性数据进行编码得到所述第一轨迹的属性编码;将所述一个或多个轨迹点中每一个轨迹点的空间编码、时间编码和属性编码合并得到所述每一个轨迹点的混合编码。7.根据权利要求1至6任一项所述的方法,其特征在于,所述根据所述第一轨迹的轨迹长度和所述m个候选相似轨迹的轨迹信息获取N个相似轨迹,包括:计算第i编码个数,所述第i编码个数为根据所述第二混合编码集合中映射有第i标识的混合编码的个数计算得到,所述第i标识为第i个候选相似轨迹的轨迹标识,所述i的取值为从1到m;获取第i长度,所述第i长度为基于所述第一轨迹的轨迹长度,或基于所述第i个候选相似轨迹的轨迹长度与所述第一轨迹的轨迹长度计算得到;计算所述第i编码个数和所述第i长度的比值,所述比值为所述第i个候选相似轨迹与所述第一轨迹之间的相似度;根据所述计算得到的m个相似度筛选出所述N个相似轨迹。8.根据权利要求1-7任一项所述的方法,其特征在于,所述第一混合编码集合还包括插值轨迹点的混合编码,所述插值轨迹点为基于所述一个或多个轨迹点根据预设插值方法得到。9.根据权利要求8所述的方法,其特征在于,所述第一混合编码集合还包括扩展轨迹点的混合编码,所述扩展轨迹点为基于所述一个或多个轨迹点和所述插值轨迹点通过预设的扩展方法得到。
10.根据权利要求1至9任一项所述的方法,其特征在于,所述索引数据库为基于时空格网模型构建的数据库,所述时空格网模型包括多个层级的时空格网,每一个时空格网层级根据设定的空间层级和时间划分粒度来确定,每一个时空格网映射有一个混合编码;所述索引数据库的多个层级为r个层级,所述r大于1,所述索引数据库的r个层级分别对应r个时空格网层级。11.根据权利要求1至10任一项所述的方法,其特征在于,所述索引数据库与轨迹数据库映射,所述轨迹数据库用于存储所述索引数据库中包括的多个轨迹的原始数据,所述原始数据包括所述多个轨迹的时间数据、空间位置数据和属性数据中的多项数据。12.一种数据处理设备,其特征在于,包括:第一获取单元,用于获取第一信息,所述第一信息包括第一轨迹的一个或多个轨迹点的空间位置数据和时间数据;第二获取单元,用于根据所述第一信息获取第一混合编码集合,所述第一混合编...

【专利技术属性】
技术研发人员:王昊黄骞李军刘举庆
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1