针对好奇推荐器的隐私保护制造技术

技术编号:12220137 阅读:112 留言:0更新日期:2015-10-21 23:20
描述一种用于在推荐器系统中保护用户隐私的方法和装置,其包括:确定针对电影将什么信息发布给用户;将信息传送给用户;接受来自用户的迷惑输入;以及估计用户的非隐私特征向量。还描述一种用于在推荐器系统中保护用户隐私的方法和装置,其包括:接收电影信息;接受用户的电影反馈;接受用户的隐私信息;计算迷惑值;以及传送迷惑值。

【技术实现步骤摘要】
【国外来华专利技术】【专利说明】 相关申请的交叉引用 本申请要求于2013年2月6日提交的、标题为"PRIVACYPROTECTIONAGAINST CURIOUSREC0MMENDERS"的美国临时申请序列号61/761,330的优先权,通过引用将其并入 本文。
本专利技术涉及在允许推荐器(recommender)提供相关个性化推荐的同时保护隐私 信息。
技术介绍
若干最近的公开研宄从用户生成的数据推断人口统计学的威胁。与本专利技术最接 近的Weinsberg等人的 "Blurme:inferringandobfuscatingusergenderbasedon ragings"(ProceedingsoftheSixthACMConferenceonRecommenderSystems,2012 年)示出可以从电影评级推断性别,并且提出减轻由此引起的隐私风险的启发法。但是, Weinsberg提出的迷惑方法明确地以推断性别的逻辑回归方法作为目标。与此相反,本专利技术 追求原则性方法,使得证明是防任意推断方法的有力的隐私保障。 本专利技术中的隐私的定义受差分隐私(differentialprivacy)的概念激发,并且作 为差分隐私的概念的限制性情况。差分隐私已经应用于诸如数据挖掘、社交推荐和推荐器 系统这样的领域。这些工作假设受信任的数据库所有者并且集中在使应用的输出是差分隐 私的。与此相反,在本专利技术中,研宄一种配置,其中推荐器是好奇的(curious),并且用户希 望防范根据他们提交给推荐器的反馈对隐私信息进行统计推断。 存在若干在准确度约束下对防统计推断的隐私进行建模的理论框架。这些方法假 设关联隐私和非隐私变量的一般概率模型,并且通过在非隐私变量的发布之前使它们失真 来确保隐私。虽然具有一般性,但是这些框架的应用需要隐私数据和将发布的数据之间的 联合分布的知识,这在实际设置中可能难以获得。被实验证据强有力地支持的本专利技术中的 线性模型的假设致使问题易于处理。更重要地,其允许本专利技术的方法表征在推荐器侧所必 需的数据公开的程度,以实现最佳的隐私准确度权衡,这是所有前述工作中没有的方面。
技术实现思路
推荐器系统可以从用户反馈推断诸如性别、年龄或政治派别这样的人口统计信 息。本专利技术提出一种推荐器与用户之间的数据交换协议(步骤、动作)的框架,捕捉推荐的 准确度、用户隐私与推荐器所公开的信息之间的权衡。 本专利技术允许用户以推荐器无法推断用户希望隐藏的一些人口统计信息的方式将 他/她的评级的失真版本传达到推荐器系统,同时允许推荐器仍然向用户提供相关的个性 化推荐。 在线服务的用户被常规地要求提供关于他们的经验和偏好的反馈。该反馈可以是 隐式的或显式的,并且可以采取许多形式,从完整评论到五星评级,到从菜单选择。这样的 信息常规地由推荐器系统使用,以提供有针对性的推荐并且个性化提供给用户的内容。用 于生成推荐的统计方法往往产生用户"简档(profile)"或特征向量。这样的简档能够暴露 用户可能视为隐私的个人信息,诸如他们的年龄、性别和政治派别。这种可能性已经被广泛 记载在公共数据集上。这种可能性要求允许具有隐私意识的用户受益于推荐器系统,同时 还确保他们希望保护的信息不会通过他们的反馈而非有意地公开或泄露,从而鼓励用户参 与到服务中的机制。 减少这样的公开或泄露的通常的方法是通过使报告给推荐器的反馈失真。在推荐 质量和用户隐私之间存在自然的权衡。更大的失真可以导致更好的迷惑但是也导致不太准 确的简档。本专利技术的贡献是标识出在该权衡中存在第三项(athirdterm),其为推荐器公 开给用户以便迷惑他们的隐私值的数据。为了例示这一点,注意到如果推荐器向用户公开 用于产生用户简档的所有数据和算法,则可以实现绝对隐私。然后,用户能够运行推荐系统 的本地拷贝,而不用总是向推荐器发送任何反馈。这显然是隐私的。但是,从推荐器的角度 来看,这仍是不能维持的,无论出于实际的原因(效率和代码维护),还是至关重要地出于 商业原因,因为推荐器可能正在收取费用、将它收集的数据以及它开发的算法这两者货币 化。向用户或可能的竞争者公开数据和算法显然是不利的。 另一方面,一些数据公开也是必要的。如果用户在发布他/她的反馈之前希望隐 藏他/她的政治派别,用户可以使用政治派别所带来的任何偏向的知识来否定该效果。从 所收集的数据中检测这样的偏向的推荐器可以将其揭示给具有隐私意识的用户。 这种情况提出若干问题。推荐器需要公开给具有隐私意识的用户以便鼓励他们参 与的信息最小量和种类(nature)是什么?该信息如何可以用于使一个人的反馈失真以保 护一个人的隐私特征(诸如性别、年龄、政治派别等)同时允许推荐器估计剩余的非隐私特 征?当被应用于失真的反馈时,什么估计方法得到最高的准确度? 本专利技术提出一种用于解决上述问题的形式化数学框架,其包括三个协议: (a)推荐器参与的数据公开, (b)被应用于用户评级的迷惑方法,以及 (c)被应用以推断非隐私用户特征的估计方法。 以上三个协议的具体实现方式提供对用户隐私信息的完美保护,同时也确保推荐 器以最佳的可能的准确度来估计非隐私信息。至关重要地,推荐器的数据公开最小。没有 更少的公开可以得到与所提出的实现方式相同或比其更好的准确度。 所提出的协议在真实的数据集上评估,证实它们在实践中确实提供出色的隐私保 障,而不显著地影响推荐准确度。 描述一种用于在推荐器系统中保护用户隐私的方法和装置,其包括:确定针对电 影将什么信息发布给用户;将信息传送给用户;接受来自用户的迷惑输入;以及估计用户 的非隐私特征向量。还描述一种用于在推荐器系统中保护用户隐私的方法和装置,其包括: 接收电影信息;接受用户的电影反馈;接受用户的隐私信息;计算迷惑值;以及传送迷惑 值。【附图说明】 根据下面的详细描述,在结合附图一起阅读的情况下,本专利技术得以最好地理解。附 图包括下面简要描述的以下图: 图1 (a)和1 (b)示出使用MovieLens数据集选择和逻辑推断的在迷惑之前、在标 准迷惑方案和选择之后的男性和女性的推断概率的分布; 图1(c)示出RMSE-AUC权衡; 图2是本专利技术的推荐器系统的流程图; 图3是本专利技术的推荐器系统的推荐器部分的放大图; 图4是本专利技术的推荐器系统的用户部分的放大图; 图5是本专利技术的推荐器系统的推荐器部分的框图;以及 图6是本专利技术的推荐器系统的用户部分的框图。【具体实施方式】 在本专利技术中所考虑的配置包含推荐器和用户。推荐器请求关于项目的用户反馈, 为了具体性,将项目称为"电影"。对每个项目的用户反馈(例如,1-5星等级)从通过两个 向量即电影简档\和用户简档x来参数化的概率分布独立地采样。用户简档x是(xMX) 的形式,其中是用户希望保留隐私(例如,他/她的性别)的可区分的二元特征,并且x 是非隐私分量。应当注意,虽然用户知道Xo,但是他/她并不知道x:在例如推荐器所使用 的特征对用户是未知的、或者甚至是通过被称为矩阵因子分解的处理来计算出并且因此是 潜在的情况下,这将是如此。 推荐器知道电影简档Vi并且希望学习用户的简档X。推荐器的目的是预测其他电 影的用户反馈并且做出推荐。用户希望受益于推荐,但是关于他/她的变量Xo是具本文档来自技高网
...

【技术保护点】
一种用于在推荐器系统中保护用户隐私的方法,所述方法包括:确定针对电影将什么信息发布给用户;将所述信息传送给所述用户;接受来自所述用户的迷惑输入;以及估计所述用户的非隐私特征向量。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:E埃奥安尼迪斯E温斯伯格S巴加特N法瓦兹AF蒙塔纳里NA塔夫特
申请(专利权)人:汤姆逊许可公司
类型:发明
国别省市:法国;FR

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1