当前位置: 首页 > 专利查询>东华大学专利>正文

车联网中基于背景信息的成员推测攻击原型系统技术方案

技术编号:22166270 阅读:157 留言:0更新日期:2019-09-21 10:18
本发明专利技术涉及一种车联网中基于背景信息的成员推测攻击原型系统,一个实施例的方法包括:成员推测攻击模型建立模块,构造车联网中基于背景信息的成员推测攻击模型;背景信息获取模块,获取车联网用户的位置数据和目标用户的朋友的位置数据;位置数据合成模块,基于特征相似性函数合成目标用户的位置数据;成员推测攻击模块,设计成员推测攻击算法,判断目标用户是否在所给集合中;算法评估模块,运用真实数据集合仿真,得到推测成功率和隐私度损失大小。本实施例方案可以借楼车联网中基于背景信息的隐私泄露问题的原因,对研究车联网中隐私保护机制促进车联网健康稳定发展具有指导作用。

Prototype System of Membership Presumption Attack Based on Background Information in Vehicle Networking

【技术实现步骤摘要】
车联网中基于背景信息的成员推测攻击原型系统
本专利技术涉及信息处理
,特别是涉及一种车联网中基于背景信息的成员推测攻击原型系统。
技术介绍
随着移动互联网的迅速发展,集成了现代信息技术的车联网在人们的生活中发挥着越来越重要的作用。在车联网用户中,用户数据被收集到中央处理器,中央处理器对用户的数据进行分析统计,并将相关统计结果用于支持改善车联网应用服务。然而,敌手可以根据统计结果推测目标用户是否是统计数据的成员,进而泄露目标车联网用户更多的个人敏感信息,即成员推测攻击。目前针对成员推测攻击问题的研究大多是在基因组研究的背景下,例如健康统计或身体特征数据这些与敏感信息相关的数据通常以集合的形式发布,某些研究通过将目标的个人资料数据与案例研究的全部数据和从公共资源获得的参考人群的数据集合进行比较,可以了解目标个体是否属于与某种疾病相关的案例研究数据集合。但是此项研究所需的背景知识相对较多。然后另一些研究对这种攻击问题进行了扩展,即利用人类基因组内的相关性特征减少对目标个体的背景信息的需求,但是这些研究都需要大量的数据进行支撑,并且计算开销非常的大。因此,还有一些研究集中在机器学习领域,使用较少的数据,关注机器学习即服务应用中生成模型的隐私泄漏问题。
技术实现思路
本专利技术的目的是:降低车联网用户隐私泄露风险。为了达到上述目的,本专利技术的技术方案是提供了一种车联网中基于背景信息的成员推测攻击原型系统,其特征在于,包括:成员推测攻击模型建立模块,构造车联网中基于背景信息的成员推测攻击模型,其中,成员推测攻击模型建立模块基于对抗性游戏定义,将问题实例化为敌手和挑战者之间进行的一个二元分类任务并用机器学习进行二元分类,成员推测攻击模型中假设敌手通过背景信息获取模块获得背景信息,敌手通过成员推测攻击模块及位置数据合成模块推断出目标用户u*是否在车联网用户集合中,其中:背景信息获取模块,用于获取已经收集的车联网用户的位置数据集合S'和目标用户u*的朋友的位置数据集合S;位置数据合成模块,基于特征相似性函数合成目标用户u*的位置数据;成员推测攻击模块,设计成员推测攻击算法,判断目标用户是否在所给集合中;所述系统还包括,算法评估模块,运用真实数据集合仿真,得到推测成功率和隐私度损失大小。优选地,所述位置数据合成模块中,基于特征相似性函数合成目标用户u*的位置数据包括以下步骤:步骤1、把目标用户u*的每个朋友的位置轨迹进行语义标记,研究时间(t,t+Δt)时间段内所有朋友的位置的语义特征,把出现次数最多的语义特征定义为目标用户在此时间段内的语义特征;步骤2、研究已经收集的位置数据集合S',选择同样的时间段内的位置数据,对这些数据进行语义特征的标记;步骤3、定义一个特征相似性函数,把位置数据集合S'中与目标用户u*的朋友的位置数据语义特征相似性最高的数据作为目标用户u*的位置数据。优选地,步骤3中,记σ为车联网用户u和v之间位置数据的相似度关系,r,r',r”为随机的位置,τ,τ'为两个时间间隙,定义用户u和用户v在时间间隔{τ,τ'}内的不同度为:其中,Mallows距离Mdist(g)是给定的时隙τ,τ'上在所有随机变量r'上计算得到的,均值E是在基于所有随机变量r上计算得到的;dist(g)表示任意两个位置之间的距离;为用户u在当前时隙τ,当前位置r的条件下,在下一时隙τ'位置处于r'的条件概率;为用户v在当前时隙τ,当前位置r的条件下,在下一时隙τ'位置处于r'的条件概率;则用户u和用户v之间相似度sims(u,v)为:其中,zs是给定dist(g)下Mallows距离最大值的归一化常数。优选地,基于游戏的定义,所述成员推测攻击算法设计过程包括观察期间TO内敌手背景信息的建立,区分函数d的实例化,最后通过隐私度量指标PL来衡量成员推测攻击的性能。优选地,所述成员推测攻击算法包括以下步骤:考虑一个敌手在观察期间To内已知发布的位置数据集合,此时,TO≠TI,TI为推测期间,敌手已知共有β组用户位置数据集合Wi,用户位置数据集合Wi的用户人数规模是m,β组用户位置数据集合Wi中可能包含也可能不包含目标用户u*,定义背景信息如下:式中,P表示背景信息,表示β组用户Wi的聚合的位置数据集合,是对目标用户与成员组Wi的成员关系的数学建模,考虑两种情况:情况一)敌手已知目标用户在过去组中的参与情况,这些组也用于计算推断期间发布的聚合,即训练数据集和测试数据集合中都包含目标用户u*;情况二)敌手已知目标用户在过去组中的参与情况,这些组不用于计算推断期间发布的聚合,即训练数据集中不包含而测试数据集中包含目标用户u*;情况一)模拟了与特定组有关的连续数据发布的情况,在这种情况下,车联网用户随着时间的推移是稳定的,即敌手已经观察到目标用户参与过过去的组;情况二)则模拟了随着时间的推移,目标用户移动到一个新的用户组,车联网用户随着时间的推移是不稳定的,敌手试图推断出目标用户是否是已发布集合中的一员;定义区分函数如下:记区分函数为d,该函数的输入变量是u*,m,TI,P,式中,表示用户组位置数据集合,使用有监督的机器学习分类器来实例化区分函数d,敌手的区分目标建模为一个二元分类任务,根据目标车联网用户是否在集合中将观察数据分为两类;根据敌手的推测成功率以及隐私损失大小来衡量成员推测攻击算法的性能,基于发布的车联网用户的位置数据集,对于一系列的游戏实例u*,计算敌手的猜测b',定义以下四种情况:TP:当b=0且b'=0,b表示随机数,b={0,1};TN:当b=1且b'=1;FP:当b=1且b'=0;FN:当b=0且b'=1;分别计算TP,FP的几率TPR,FPR:TPR=TP/(TP+FN);FPR=FP/(FP+TN);根据上式得到接收机工作特性曲线ROC,该曲线ROC表示在不同识别分类阈值下得到的TPR和FPR大小,并计算曲线下面积AUC,面积AUC表示在区分游戏中捕捉分类器的整体性能,则定义隐私损失PL如下:优选地,算法评估模块通过两个具有不同移动特性的真实的数据集作为机器学习的训练数据,从而验证所述成员推测攻击算法的有效性,得到推测成功率和隐私度损失度大小。本专利技术涉及的研究和
技术介绍
中所论及的针对成员推测攻击问题的研究不同,本专利技术研究的是车联网背景下基于背景信息的成员推测攻击问题。这将是一个更大的挑战,在本专利技术所述研究中,敌手只知道目标用户朋友的位置数据信息和他的朋友关系,相比较于以上的研究,敌手已知的背景信息更少,这使得成员推测攻击的难度进一步加大。由于采用了上述技术方案,本专利技术与现有技术相比,具有如下的创新点:本专利技术引入了一种通用的方法来研究车联网中基于背景信息的成员推测攻击问题,将成员推测攻击问题形式化为可区分的游戏,并用机器学习分类器实例化区分任务。本专利技术证明敌手可以用更少的背景信息成功地进行成员推测攻击。本专利技术还提出了一种用来合成目标车联网用户位置数据的方法,本专利技术使用两个真实的移动数据集部署此方法并且本专利技术还量化了车联网用户的隐私泄漏程度。附图说明图1是实施例工作环境的示意图;图2是实施例车联网用户端的组成结构示意图;图3是实施例中车联网中基于背景信息的成员推测攻击原型系统的方法流程图;图4是实施例中车联网中基于背本文档来自技高网
...

【技术保护点】
1.一种车联网中基于背景信息的成员推测攻击原型系统,其特征在于,包括:成员推测攻击模型建立模块,构造车联网中基于背景信息的成员推测攻击模型,其中,成员推测攻击模型建立模块基于对抗性游戏定义,将问题实例化为敌手和挑战者之间进行的一个二元分类任务并用机器学习进行二元分类,成员推测攻击模型中假设敌手通过背景信息获取模块获得背景信息,敌手通过成员推测攻击模块及位置数据合成模块推断出目标用户u

【技术特征摘要】
1.一种车联网中基于背景信息的成员推测攻击原型系统,其特征在于,包括:成员推测攻击模型建立模块,构造车联网中基于背景信息的成员推测攻击模型,其中,成员推测攻击模型建立模块基于对抗性游戏定义,将问题实例化为敌手和挑战者之间进行的一个二元分类任务并用机器学习进行二元分类,成员推测攻击模型中假设敌手通过背景信息获取模块获得背景信息,敌手通过成员推测攻击模块及位置数据合成模块推断出目标用户u*是否在车联网用户集合中,其中:背景信息获取模块,用于获取已经收集的车联网用户的位置数据集合S'和目标用户u*的朋友的位置数据集合S;位置数据合成模块,基于特征相似性函数合成目标用户u*的位置数据;成员推测攻击模块,设计成员推测攻击算法,判断目标用户是否在所给集合中;所述系统还包括,算法评估模块,运用真实数据集合仿真,得到推测成功率和隐私度损失大小。2.根据权利要求1所述的车联网中基于背景信息的成员推测攻击原型系统,其特征在于,所述位置数据合成模块中,基于特征相似性函数合成目标用户u*的位置数据包括以下步骤:步骤1、把目标用户u*的每个朋友的位置轨迹进行语义标记,研究时间(t,t+Δt)时间段内所有朋友的位置的语义特征,把出现次数最多的语义特征定义为目标用户在此时间段内的语义特征;步骤2、研究已经收集的位置数据集合S',选择同样的时间段内的位置数据,对这些数据进行语义特征的标记;步骤3、定义一个特征相似性函数,把位置数据集合S'中与目标用户u*的朋友的位置数据语义特征相似性最高的数据作为目标用户u*的位置数据。3.根据权利要求2所述的车联网中基于背景信息的成员推测攻击原型系统,其特征在于,步骤3中,记σ为车联网用户u和v之间位置数据的相似度关系,r,r',r”为随机的位置,τ,τ'为两个时间间隙,定义用户u和用户v在时间间隔{τ,τ'}内的不同度为:其中,Mallows距离Mdist(g)是给定的时隙τ,τ'上在所有随机变量r'上计算得到的,均值E是在基于所有随机变量r上计算得到的;dist(g)表示任意两个位置之间的距离;为用户u在当前时隙τ,当前位置r的条件下,在下一时隙τ'位置处于r'的条件概率;为用户v在当前时隙τ,当前位置r的条件下,在下一时隙τ'位置处于r'的条件概率;则用户u和用户v之间相似度sims(u,v)为:其中,zs是给定dist(g)下Mallows距离最大值的归一化常数。4.根据权利要求1所述的车联网中基于背景信息的成员推测攻击原型系统,其特征在于,基于游戏的定义,所述成员推测攻击算法设计过程包括观察期间TO内敌手背景...

【专利技术属性】
技术研发人员:赵萍鲁敏
申请(专利权)人:东华大学
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1