基于语义推理的用户隐私数据保护的方法、装置、电子设备及存储介质制造方法及图纸

技术编号:27878710 阅读:24 留言:0更新日期:2021-03-31 01:06
本发明专利技术公开了一种基于语义推理的用户隐私数据保护的方法、装置、电子设备及存储介质,属于信息安全技术领域,获取用户已经公开的数据;对数据进行预处理,提取关于用户的个人信息;将个人信息或隐私信息一一映射到语义网内的节点上,遍历计算目标节点到已知节点的所有路径;如果已知节点的隐私泄露值以及已知节点到目标节点路径的权重值均是已知的,则根据已知节点的隐私泄露值和已知节点到目标节点路径的权重值计算目标节点的隐私泄露值;用户根据隐私泄露值判断是否公开隐私信息;若用户选择公开,则将隐私信息添加到公开数据中。本发明专利技术提升用户对于自己隐私信息的控制权。

【技术实现步骤摘要】
基于语义推理的用户隐私数据保护的方法、装置、电子设备及存储介质
本专利技术属于信息安全
,特别涉及一种基于语义推理的用户隐私数据保护的方法、装置、电子设备及存储介质。
技术介绍
现有的隐私保护技术大都停留在理论研究层面,传统的k-匿名、l-多样性等等这些隐私保护方法,主要对用户的标识符、准标识符等进行不同程度的匿名或者泛化等预处理操作,从而当这些互联网公司在出于科学研究等目的,向外公开这些用户数据集时,可以起到一定程度的隐私保护的效果。但这都有一个重要的前提,那就是用户认为这些互联网是完全可信的,除非其主动泄漏,否则不会产生隐私泄露,这显然是不太合理的。同时,由于现阶段用户的信息散布在各个平台之上,没有一个统一的用户信息管理。因此,对于已经向互联网公布了哪些个人信息,有哪些隐私已经造成了泄漏,有哪些隐私信息正在面临着泄漏的风险,用户都没有一个直观的了解,因此无法很好进行个人隐私信息的保护。
技术实现思路
针对上述存在的问题,本专利技术提供一种基于语义推理的用户隐私数据保护的方法、装置、电子设备及存储介质。一种基于语义推理的用户隐私数据保护的方法包括:获取用户已经公开的数据;对所述数据进行预处理,提取关于所述用户的个人信息;将所述个人信息一一映射到语义网内的节点上,所述节点为已知节点;将所需判断的隐私信息映射到所述语义网内的节点上,所述节点为目标节点;遍历计算所述目标节点到所述已知节点的所有路径;如果每一条所述路径的隐私泄露权重值已知,则将所有所述路径的隐私泄露权重值相加,计算得到所述目标节点的隐私泄露值;所述用户根据所述隐私泄露值判断是否公开所述隐私信息;若所述用户选择公开所述隐私信息,则将所述隐私信息添加到所述公开的数据中。优选的是,所述对所述数据进行预处理,提取关于所述用户的个人信息的步骤包括:采用自然语言处理技术将所述数据中的个人信息提取出来;并对所述个人信息进行语义消歧。优选的是,所述语义网的构建步骤:从词典中获取符合上下位关系、实例关系、整体部分关系和属性关系的名词和形容词;利用所述名词和形容词构建所述语义网。优选的是,将所述个人信息或隐私信息一一映射到语义网内的节点上,包括:用向量空间模型VSM算法计算所述个人信息和所述隐私信息与所述每一个节点相对应的关键词的语义相似度;如果所述语义相似度不为零,则将所述个人信息和所述隐私信息与每一个节点进行映射;如果所述语义相似度为零,则使用余弦相似度算法计算待映射的所述个人信息和所述隐私信息与每一个节点相对应的关键词的词语相似度;如果所述词语相似度大于预定阈值,则将所述个人信息和所述隐私信息与每一个节点进行映射。优选的是,所述遍历计算所述目标节点到所述已知节点的所有路径,包括:采用深度优先算法,遍历所述目标节点到所述已知节点的所有路径。优选的是,所述如果每一条所述路径的隐私泄露权重值已知,则将所有所述路径的隐私泄露权重值相加,计算得到所述目标节点的隐私泄露值,包括:从所述目标节点出发,根据所述目标节点中存储的父子关系找到对应的所述已知节点以及所述目标节点到所述已知节点的路径;计算所述路径中所有的所述已知节点的所述个人信息在所述语义库中出现的概率;将位于同一条所述路径上的所述已知节点的概率归一化计算得到所述路径的隐私泄露权重值;将所有所述路径的隐私泄露权重值相加,计算得到所述目标节点的隐私泄露值。本专利技术实施例提供的一种实现上述所述方法的装置,包括:获取模块,用于获取用户已经公开的数据;预处理模块,用于对所述数据进行预处理,提取关于所述用户的个人信息;映射模块,用于将所述个人信息一一映射到语义网内的节点上,所述节点为已知节点,将所需判断的隐私信息映射到所述语义网内的节点上,所述节点为目标节点;计算模块,用于遍历计算所述目标节点到所述已知节点的所有路径;如果每一条所述路径的隐私泄露权重值已知,则将所有所述路径的隐私泄露权重值相加,计算得到所述目标节点的隐私泄露值;用户决策模块,用于所述用户根据所述隐私泄露值判断是否公开所述隐私信息;更新模块,用于若所述用户选择公开所述隐私信息,则将所述隐私信息添加到所述公开的数据中。本专利技术实施例提供的一种电子设备,包括至少一个处理单元以及至少一个存储单元,其中,所述存储单元存储有计算机程序,当所述程序被所述处理单元执行时,使得所述处理单元执行上述所述的方法。本专利技术实施例提供的一种存储介质,其存储有可由电子设备执行的计算机程序,当所述程序在所述电子设备上运行时,使得所述电子设备执行上述所述的方法。与现有技术相比,本专利技术的有益效果为:本专利技术采用源头控制方式,在用户向服务提供商提供任何个人相关信息之前,会结合之前已经公布的个人数据,计算此次个人信息的公布是否会造成其他隐私信息的泄露;然后用户可以根据自己的需求,来决定是否想服务提供商提供该个人相关信息,因此用户大幅度提升自己对于隐私信息的控制权。附图说明图1是本专利技术中基于语义推理的用户隐私数据保护装置的结构示意图;图2是本专利技术基于语义推理的用户隐私数据保护的方法的流程示意图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术的一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本专利技术保护的范围。在本专利技术的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本专利技术和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本专利技术的限制。此外,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。在本专利技术的描述中,还需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本专利技术中的具体含义。本专利技术提供一种基于语义推理的用户隐私数据保护的方法、装置、电子设备及存储介质。参照图1,是本申请实施例基于语义推理的用户隐私数据保护装置的结构示意图,其包括:获取模块1,用于获取用户已经公开的数据;具体地,根据不同的客户端,例如PC端、Android手机端、iPhone手机端、iPad端等任何可以连本文档来自技高网...

【技术保护点】
1.一种基于语义推理的用户隐私数据保护的方法,其特征在于,包括:/n获取用户已经公开的数据;/n对所述数据进行预处理,提取关于所述用户的个人信息;/n将所述个人信息一一映射到语义网内的节点上,所述节点为已知节点;/n将所需判断的隐私信息映射到所述语义网内的节点上,所述节点为目标节点;/n遍历计算所述目标节点到所述已知节点的所有路径;/n如果每一条所述路径的隐私泄露权重值已知,则将所有所述路径的隐私泄露权重值相加,计算得到所述目标节点的隐私泄露值;/n所述用户根据所述隐私泄露值判断是否公开所述隐私信息;/n若所述用户选择公开所述隐私信息,则将所述隐私信息添加到所述公开的数据中。/n

【技术特征摘要】
1.一种基于语义推理的用户隐私数据保护的方法,其特征在于,包括:
获取用户已经公开的数据;
对所述数据进行预处理,提取关于所述用户的个人信息;
将所述个人信息一一映射到语义网内的节点上,所述节点为已知节点;
将所需判断的隐私信息映射到所述语义网内的节点上,所述节点为目标节点;
遍历计算所述目标节点到所述已知节点的所有路径;
如果每一条所述路径的隐私泄露权重值已知,则将所有所述路径的隐私泄露权重值相加,计算得到所述目标节点的隐私泄露值;
所述用户根据所述隐私泄露值判断是否公开所述隐私信息;
若所述用户选择公开所述隐私信息,则将所述隐私信息添加到所述公开的数据中。


2.如权利要求1所述的基于语义推理的用户隐私数据保护的方法,其特征在于,所述对所述数据进行预处理,提取关于所述用户的个人信息的步骤包括:
采用自然语言处理技术将所述数据中的个人信息提取出来;
并对所述个人信息进行语义消歧。


3.如权利要求1所述的基于语义推理的用户隐私数据保护的方法,其特征在于,所述语义网的构建步骤:
从词典中获取符合上下位关系、实例关系、整体部分关系和属性关系的名词和形容词;
利用所述名词和形容词构建所述语义网。


4.如权利要求1所述的基于语义推理的用户隐私数据保护的方法,其特征在于,将所述个人信息或隐私信息一一映射到语义网内的节点上,包括:
用向量空间模型VSM算法计算所述个人信息和所述隐私信息与所述每一个节点相对应的关键词的语义相似度;
如果所述语义相似度不为零,则将所述个人信息和所述隐私信息与每一个节点进行映射;
如果所述语义相似度为零,则使用余弦相似度算法计算待映射的所述个人信息和所述隐私信息与每一个节点相对应的关键词的词语相似度;
如果所述词语相似度大于预定阈值,则将所述个人信息和所述隐私信息与每一个节点进行映射。


5.如权利要求1所述的基于语义推理的用户隐私数据保护的方法,其特征在于,所述遍历计算所述目标节点到...

【专利技术属性】
技术研发人员:朱娜斐陈宝存何泾沙靳姝婷潘世佳
申请(专利权)人:北京工业大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1