【技术实现步骤摘要】
数据处理方法及设备
[0001]本专利技术涉及数据处理
,尤其涉及一种数据处理方法及设备。
技术介绍
[0002]移动互联技术的快速发展催生了大量反映个体、群体位置信息及行为状态的轨迹数据,因其具有丰富的时空位置及语义信息,被广泛应用于智能交通、城市计算、社会感知等各个领域。其中,轨迹相似性查询作为轨迹数据挖掘的基础之一,逐渐成为国内外的研究热点,并得到社会各界广泛关注与应用,如通勤模式识别、交通状况预测、异常行为探测、犯罪行为追踪、重大疫情防控等,对于城市交通、城市规划、公共卫生等具有重大的意义。
[0003]但是,现有的轨迹相似性查询方案中要么缺少轨迹的时间信息,要么相似性计算复杂度高,因此,如何在轨迹相似性查询中增加轨迹的时间信息以提高轨迹查询的准确度,同时降低轨迹相似性计算的复杂度是本领域技术人员急需解决的技术问题。
技术实现思路
[0004]本申请提供一种数据处理方法及设备,能够提高轨迹查询的准确度,同时降低轨迹相似性计算的复杂度,提高相似轨迹的查询效率。
[0005]第一方面,本申请提供一种数据处理方法,包括:
[0006]获取第一信息,上述第一信息包括第一轨迹的一个或多个轨迹点的空间位置数据和时间数据;
[0007]根据上述第一信息获取第一混合编码集合,上述第一混合编码集合包括上述第一信息的每个轨迹点各自的混合编码,上述混合编码为根据索引数据库中的预设层级的混合编码规则编码获得;上述混合编码包括轨迹点的时间编码和轨迹点的空间编码,上述时间编码是根据上
【技术保护点】
【技术特征摘要】
1.一种数据处理方法,其特征在于,包括:获取第一信息,所述第一信息包括第一轨迹的一个或多个轨迹点的空间位置数据和时间数据;根据所述第一信息获取第一混合编码集合,所述第一混合编码集合包括所述第一信息的每个轨迹点各自的混合编码,所述混合编码为根据索引数据库中的预设层级的混合编码规则编码获得;所述混合编码包括轨迹点的时间编码和轨迹点的空间编码,所述时间编码是根据所述时间数据获得,所述空间编码是根据所述空间位置数据获得;所述索引数据库为多级索引结构,包括多个层级的混合编码,每个层级的混合编码根据其所归属的层级的混合编码进行集合划分,所述每个层级的混合编码和其所归属的层级的混合编码之间存在所索引关系,所述多个层级的混合编码中包括具有轨迹信息的混合编码,所述轨迹信息用于指示所述混合编码所属轨迹的轨迹标识和所属轨迹的轨迹长度,一个轨迹的轨迹长度为所述索引数据库中存储的轨迹标识为同一轨迹的混合编码的个数;根据所述第一混合编码集合中的每个混合编码在所述索引数据库中按照多级索引结构的查询方法进行查询,获得第二混合编码集合,所述第二混合编码集合中的混合编码为具有轨迹信息的混合编码;所述第二混合编码集合中的混合编码映射有m个候选相似轨迹的轨迹信息,所述m为整数;根据所述第一轨迹的轨迹长度和所述m个候选相似轨迹的轨迹信息获取N个相似轨迹,所述N为小于或等于m的整数。2.根据权利要求1所述的方法,其特征在于,所述根据所述第一混合编码集合中的每个混合编码在所述索引数据库中按照多级索引结构的查询方法进行查询,获得第二混合编码集合,包括:按照多级索引结构的查询方法将所述第一混合编码集合中的每个混合编码与所述索引数据库中的混合编码比较,获取所述第二混合编码集合,所述第二混合编码集合中的混合编码为所述索引数据库中与所述第一混合编码集合中的混合编码相同的混合编码,和/或所述索引数据库中与所述第一混合编码集合中的混合编码相同的混合编码对应的低层级和/或高层级混合编码。3.根据权利要求1所述的方法,其特征在于,所述第一信息还包括所述第一轨迹的属性数据,所述轨迹信息还包括所述轨迹信息指示的轨迹的属性信息,所述属性信息根据所述轨迹信息指示的轨迹的属性数据获得;所述根据所述第一混合编码集合中的每个混合编码在所述索引数据库中按照多级索引结构的查询方法进行查询,获得第二混合编码集合,包括:按照多级索引结构的查询方法将所述第一混合编码集合中的每个混合编码与所述索引数据库中的混合编码比较,获取第一匹配的混合编码,所述第一匹配的混合编码为所述索引数据库中与所述第一混合编码集合中的混合编码相同的混合编码,和/或所述索引数据库中与所述第一混合编码集合中的混合编码相同的混合编码对应的低层级和/或高层级混合编码;根据所述第一匹配的混合编码获取所述第二混合编码集合,所述第二混合编码集合中的混合编码为所述第一匹配的混合编码中属性信息包含所述第一轨迹的属性信息的混合编码。
4.根据权利要求2或3所述的方法,其特征在于,所述按照多级索引结构的查询方法将所述第一混合编码集合中的每个混合编码与所述索引数据库中的混合编码比较,包括:根据所述第一混合编码集合中的第一混合编码确定目标层级的混合编码,所述目标层级为所述预设层级归属的层级;根据所述目标层级的混合编码进行查找,获取第一候选混合编码集;将所述第一混合编码与所述第一候选混合编码集比较。5.根据权利要求1至4任一项所述的方法,其特征在于,所述根据所述第一信息获取第一混合编码集合,包括:根据所述预设层级中混合编码的空间编码的编码规则,对所述一个或多个轨迹点的空间位置数据进行编码得到所述一个或多个轨迹点各自的空间编码;根据所述预设层级中混合编码的时间编码的编码规则,对所述一个或多个轨迹点的时间数据进行编码得到所述一个或多个轨迹点各自的时间编码;将所述一个或多个轨迹点中每一个轨迹点的空间编码和时间编码合并得到所述每一个轨迹点的混合编码。6.根据权利要求1或2所述的方法,其特征在于,所述第一信息还包括所述第一轨迹的属性数据,所述根据所述第一信息获取第一混合编码集合,包括:根据所述预设层级中混合编码的空间编码的编码规则,对所述一个或多个轨迹点的空间位置数据进行编码得到所述一个或多个轨迹点各自的空间编码;根据所述预设层级中混合编码的时间编码的编码规则,对所述一个或多个轨迹点的时间数据进行编码得到所述一个或多个轨迹点各自的时间编码;对所述第一轨迹的属性数据进行编码得到所述第一轨迹的属性编码;将所述一个或多个轨迹点中每一个轨迹点的空间编码、时间编码和属性编码合并得到所述每一个轨迹点的混合编码。7.根据权利要求1至6任一项所述的方法,其特征在于,所述根据所述第一轨迹的轨迹长度和所述m个候选相似轨迹的轨迹信息获取N个相似轨迹,包括:计算第i编码个数,所述第i编码个数为根据所述第二混合编码集合中映射有第i标识的混合编码的个数计算得到,所述第i标识为第i个候选相似轨迹的轨迹标识,所述i的取值为从1到m;获取第i长度,所述第i长度为基于所述第一轨迹的轨迹长度,或基于所述第i个候选相似轨迹的轨迹长度与所述第一轨迹的轨迹长度计算得到;计算所述第i编码个数和所述第i长度的比值,所述比值为所述第i个候选相似轨迹与所述第一轨迹之间的相似度;根据所述计算得到的m个相似度筛选出所述N个相似轨迹。8.根据权利要求1-7任一项所述的方法,其特征在于,所述第一混合编码集合还包括插值轨迹点的混合编码,所述插值轨迹点为基于所述一个或多个轨迹点根据预设插值方法得到。9.根据权利要求8所述的方法,其特征在于,所述第一混合编码集合还包括扩展轨迹点的混合编码,所述扩展轨迹点为基于所述一个或多个轨迹点和所述插值轨迹点通过预设的扩展方法得到。
10.根据权利要求1至9任一项所述的方法,其特征在于,所述索引数据库为基于时空格网模型构建的数据库,所述时空格网模型包括多个层级的时空格网,每一个时空格网层级根据设定的空间层级和时间划分粒度来确定,每一个时空格网映射有一个混合编码;所述索引数据库的多个层级为r个层级,所述r大于1,所述索引数据库的r个层级分别对应r个时空格网层级。11.根据权利要求1至10任一项所述的方法,其特征在于,所述索引数据库与轨迹数据库映射,所述轨迹数据库用于存储所述索引数据库中包括的多个轨迹的原始数据,所述原始数据包括所述多个轨迹的时间数据、空间位置数据和属性数据中的多项数据。12.一种数据处理设备,其特征在于,包括:第一获取单元,用于获取第一信息,所述第一信息包括第一轨迹的一个或多个轨迹点的空间位置数据和时间数据;第二获取单元,用于根据所述第一信息获取第一混合编码集合,所述第一混合编...
【专利技术属性】
技术研发人员:王昊,黄骞,李军,刘举庆,
申请(专利权)人:华为技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。