本发明专利技术提供轨迹数据隐私保护方法,包括步骤:获取数据集中包含轨迹序列和非敏感信息的轨迹集合、轨迹序列个数最大长度、非敏感信息集合、轨迹匿名个数构建隐私模型;将非敏感信息集合输入隐私模型,生成违反序列元组;将违反序列元组中轨迹序列的所有子序列与非敏感信息组合,输入隐私模型,生成最小违反序列元组;计算轨迹序列和非敏感信息关联性的缺失率,根据最小违反序列元组集合中违反序列元组个数和缺失率,计算轨迹序列的权重值,获取最大权重值对应的轨迹序列进行发布。本发明专利技术还涉及电子设备、存储介质、轨迹数据隐私保护系统;本发明专利技术能够有效解决轨迹数据和非敏感信息联合发布过程中存在的隐私泄露问题。
【技术实现步骤摘要】
轨迹数据隐私保护方法、电子设备、存储介质及系统
本专利技术涉及数据管理
,尤其涉及轨迹数据隐私保护方法、电子设备、存储介质及系统。
技术介绍
近年来,随着定位技术和智能手机等位置感知设备的广泛应用,产生了大量移动对象的轨迹数据。轨迹数据蕴含着大量的信息,发布轨迹数据供相关部门进行挖掘和研究可支持多种相关的应用。然而,由于轨迹数据与个人的信息密切相关,未对这些轨迹数据进行处理就直接发布会照成严重的隐私泄露。现有的轨迹隐私保护方法大多应用于解决轨迹数据发布过程中轨迹序列造成的位置隐私泄露和敏感信息泄露两方面问题,并不能解决轨迹数据和非敏感信息联合发布过程中存在的隐私泄露问题。
技术实现思路
为了克服现有技术的不足,本专利技术的目的之一在于提供轨迹数据隐私保护方法,解决了现有轨迹隐私保护方法无法解决轨迹数据和非敏感信息联合发布过程中存在的隐私泄露问题。本专利技术提供轨迹数据隐私保护方法,包括以下步骤:构建隐私模型,获取数据集中包含轨迹序列和非敏感信息的轨迹集合、轨迹序列个数最大长度、非敏感信息集合、轨迹匿名个数构建隐私模型;生成违反序列元组,将待分析的非敏感信息集合输入所述隐私模型,生成违反序列元组;生成最小违反序列元组,将所述违反序列元组中轨迹序列的所有子序列与所述违反序列元组中的非敏感信息组合,将所述组合输入所述隐私模型,生成最小违反序列元组,将所有所述最小违反序列元组存储至最小违反序列元组集合;轨迹数据集匿名化处理,计算所述轨迹序列和非敏感信息关联性的缺失率,根据所述最小违反序列元组集合中违反序列元组个数和所述缺失率,计算轨迹序列的权重值,获取最大权重值对应的轨迹序列进行发布。进一步地,所述步骤生成最小违反序列元组还包括将所述非敏感信息集合中非违反序列元组的轨迹序列进行序列连接,生成违反序列候选集合,对所述违反序列候选集合进行去除父序列操作。进一步地,所述隐私模型具体为:当且仅当0<|q|≤L时,|T({q,ns})|≥K,其中L为轨迹序列个数最大长度,K为轨迹匿名个数,q为轨迹序列,ns为非敏感信息集合中的非敏感信息,|T({q,ns})|为数据集同时包含q和ns的轨迹个数;还包括步骤发送虚拟轨迹,若所述待分析的非敏感信息集合中存在非敏感信息满足|T({q,ns})|≥K,则生成虚拟轨迹序列进行发布。进一步地,所述步骤生成违反序列元组具体为:若所述待分析的非敏感信息集合中存在非敏感信息满足|T({q,ns})|<K,则判定为违反序列元组。进一步地,所述计算所述轨迹序列和非敏感信息关联性的缺失率具体为:其中,count(i)为数据集同时包含q与第i个ns的轨迹个数,loss(i)为数据集同时包含q与第i个ns的轨迹减少数量,n为非敏感信息个数,infoLoss(q)为所述轨迹序列和非敏感信息关联性的缺失率。进一步地,所述计算轨迹序列的权重值具体为:w(q)=mvsDel(q)/infoLoss(q)其中,mvsDel(q)为最小违反序列元组集合中包含q的违反序列元组个数,w(q)为权重值。一种电子设备,包括:处理器;存储器;以及程序,其中所述程序被存储在所述存储器中,并且被配置成由处理器执行,所述程序包括用于执行上述轨迹数据隐私保护方法。一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行上述轨迹数据隐私保护方法。轨迹数据隐私保护系统,包括:构建隐私模型模块:用于获取数据集中包含轨迹序列和非敏感信息的轨迹集合、轨迹序列个数最大长度、非敏感信息集合、轨迹匿名个数构建隐私模型;生成违反序列元组模块:用于将待分析的非敏感信息集合输入所述隐私模型,生成违反序列元组;生成最小违反序列元组模块:用于将所述违反序列元组中轨迹序列的所有子序列与所述违反序列元组中的非敏感信息组合,将所述组合输入所述隐私模型,生成最小违反序列元组,将所有所述最小违反序列元组存储至最小违反序列元组集合;轨迹数据集匿名化处理模块:用于计算所述轨迹序列和非敏感信息关联性的缺失率,根据所述最小违反序列元组集合中违反序列元组个数和所述缺失率,计算轨迹序列的权重值,获取最大权重值对应的轨迹序列进行发布。进一步地,所述生成最小违反序列元组模块还包括将所述非敏感信息集合中非违反序列元组的轨迹序列进行序列连接,生成违反序列候选集合,对所述违反序列候选集合进行去除父序列操作。相比现有技术,本专利技术的有益效果在于:本专利技术提供轨迹数据隐私保护方法,包括以下步骤:构建隐私模型,获取数据集中包含轨迹序列和非敏感信息的轨迹集合、轨迹序列个数最大长度、非敏感信息集合、轨迹匿名个数构建隐私模型;生成违反序列元组,将待分析的非敏感信息集合输入隐私模型,生成违反序列元组;生成最小违反序列元组,将违反序列元组中轨迹序列的所有子序列与违反序列元组中的非敏感信息组合,将组合输入隐私模型,生成最小违反序列元组,将所有最小违反序列元组存储至最小违反序列元组集合;轨迹数据集匿名化处理,计算轨迹序列和非敏感信息关联性的缺失率,根据最小违反序列元组集合中违反序列元组个数和缺失率,计算轨迹序列的权重值,获取最大权重值对应的轨迹序列进行发布。本专利技术能够有效解决轨迹数据和非敏感信息联合发布过程中存在的隐私泄露问题,有效提高了推荐服务质量。上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,并可依照说明书的内容予以实施,以下以本专利技术的较佳实施例并配合附图详细说明如后。本专利技术的具体实施方式由以下实施例及其附图详细给出。附图说明此处所说明的附图用来提供对本专利技术的进一步理解,构成本申请的一部分,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:图1为本专利技术的轨迹数据隐私保护方法流程图;图2为本专利技术的轨迹数据隐私保护系统结构示意图。具体实施方式下面,结合附图以及具体实施方式,对本专利技术做进一步描述,需要说明的是,在不相冲突的前提下,以下描述的各实施例之间或各技术特征之间可以任意组合形成新的实施例。对移除用户标识符后发布的轨迹数据集进行信息挖掘时,攻击者可以获取用户的轨迹序列和非敏感信息作为背景知识来攻击用户。轨迹数据隐私保护方法,如图1所示,包括以下步骤:构建隐私模型,获取数据集中包含轨迹序列和非敏感信息的轨迹集合、轨迹序列个数最大长度、非敏感信息集合、轨迹匿名个数构建隐私模型;优选的,隐私模型具体为:当且仅当0<|q|≤L的轨迹序列q满足:对Q中各ns,|T({q,ns})|≥K,其中L为轨迹序列个数最大长度,K为轨迹匿名个数,q为轨迹序列,Q为非敏感信息集合,ns为非敏感信息集合中的非敏感信息,|T({q,ns})|为数据集同时包含q和ns的轨迹个数,要求轨迹个数至少K条。还包括步骤发送虚拟轨迹,若待分析的非敏感信息集合中存在非敏感信息满足|T({q,ns})|≥K,则生成虚拟轨迹序列进行发布。生成违反序列元组,将待分析的非敏感信息集合输入隐私模型,生成违反序列元组;优选的,步骤生成违反序列元组具体为:若待分析的非敏感信息集合中存在非敏感信息满足|T({q,ns})|<K,则判定为违反序列元组。在一实施例中,优选的,步骤生成最小违反序列元组还包括将非敏感信息集合中非违反序列元组本文档来自技高网...
【技术保护点】
1.轨迹数据隐私保护方法,其特征在于包括以下步骤:构建隐私模型,获取数据集中包含轨迹序列和非敏感信息的轨迹集合、轨迹序列个数最大长度、非敏感信息集合、轨迹匿名个数构建隐私模型;生成违反序列元组,将待分析的非敏感信息集合输入所述隐私模型,生成违反序列元组;生成最小违反序列元组,将所述违反序列元组中轨迹序列的所有子序列与所述违反序列元组中的非敏感信息组合,将所述组合输入所述隐私模型,生成最小违反序列元组,将所有所述最小违反序列元组存储至最小违反序列元组集合;轨迹数据集匿名化处理,计算所述轨迹序列和非敏感信息关联性的缺失率,根据所述最小违反序列元组集合中违反序列元组个数和所述缺失率,计算轨迹序列的权重值,获取最大权重值对应的轨迹序列进行发布。
【技术特征摘要】
1.轨迹数据隐私保护方法,其特征在于包括以下步骤:构建隐私模型,获取数据集中包含轨迹序列和非敏感信息的轨迹集合、轨迹序列个数最大长度、非敏感信息集合、轨迹匿名个数构建隐私模型;生成违反序列元组,将待分析的非敏感信息集合输入所述隐私模型,生成违反序列元组;生成最小违反序列元组,将所述违反序列元组中轨迹序列的所有子序列与所述违反序列元组中的非敏感信息组合,将所述组合输入所述隐私模型,生成最小违反序列元组,将所有所述最小违反序列元组存储至最小违反序列元组集合;轨迹数据集匿名化处理,计算所述轨迹序列和非敏感信息关联性的缺失率,根据所述最小违反序列元组集合中违反序列元组个数和所述缺失率,计算轨迹序列的权重值,获取最大权重值对应的轨迹序列进行发布。2.如权利要求1所述的轨迹数据隐私保护方法,其特征在于:所述步骤生成最小违反序列元组还包括将所述非敏感信息集合中非违反序列元组的轨迹序列进行序列连接,生成违反序列候选集合,对所述违反序列候选集合进行去除父序列操作。3.如权利要求1所述的轨迹数据隐私保护方法,其特征在于:所述隐私模型具体为:当且仅当0<|q|≤L时,|T({q,ns})|≥K,其中L为轨迹序列个数最大长度,K为轨迹匿名个数,q为轨迹序列,ns为非敏感信息集合中的非敏感信息,|T({q,ns})|为数据集同时包含q和ns的轨迹个数;还包括步骤发送虚拟轨迹,若所述待分析的非敏感信息集合中存在非敏感信息满足|T({q,ns})|≥K,则生成虚拟轨迹序列进行发布。4.如权利要求3所述的轨迹数据隐私保护方法,其特征在于:所述步骤生成违反序列元组具体为:若所述待分析的非敏感信息集合中存在非敏感信息满足|T({q,ns})|<K,则判定为违反序列元组。5.如权利要求4所述的轨迹数据隐私保护方法,其特征在于:所述计算所述轨迹序列和非敏感信息关联性的缺失率具体为:其中,cou...
【专利技术属性】
技术研发人员:尚凌辉,陈鑫,叶淑阳,
申请(专利权)人:浙江捷尚人工智能研究发展有限公司,
类型:发明
国别省市:浙江,33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。