一种基于用户分类的中毒样本构建方法技术

技术编号：37251340 阅读：14 留言：0更新日期：2023-04-20 23:29

本发明专利技术公开了一种基于用户分类的中毒样本构建方法，包括以下步骤：定义系统中的脆弱用户和鲁棒用户；定义损失函数即每个用户的动态权重，构建代理模型，模拟系统脆弱用户尽可能中毒的状态来得到假用户候选交互物品候选集合，并通过初始化假用户来降低推荐偏差以提高候选交互物品的可信性；定义每个物品的选择概率，得到所有物品的最终评分，按评分从高到低选取假用户的交互物品。本发明专利技术增强了基于深度学习推荐系统的数据中毒攻击的攻击性，同时降低了攻击成本，并为推荐系统对于数据中毒攻击的防御提供了思路。击的防御提供了思路。击的防御提供了思路。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于用户分类的中毒样本构建方法

[0001]本专利技术涉及计算机
，特别是一种基于用户分类的中毒样本构建方法。

技术介绍

[0002]随着大数据时代的来临，信息处理的方式发生了巨大的变化。推荐系统作为一种有效的信息过滤方式，有效缓解了信息爆炸的问题。推荐系统在电商、音乐等领域给用户带来了极大的便利，尤其是深度学习技术的发展以及在推荐系统领域的应用，使得深度学习技术成为推荐系统领域的一个趋势。但是推荐系统仍然面临着一些不可避免的隐私以及安全问题，包括推荐系统过度搜集用户隐私，利用成员推理攻击推理出了推荐系统的原始训练集，推荐系统的水军攻击(数据中毒攻击)等等，对推荐系统的隐私安全问题提出了新的挑战。然而随着电商等领域水军，刷好评等现象的频繁出现，尤其在推荐系统领域中，刷好评会大大降低用户对系统的信任，因此对于推荐系统的水军攻击与防御的研究意义重大。
[0003]现有的基于深度学习推荐系统的数据中毒攻击进行物品推广的攻击技术的研究中，都是对系统中的所有用户进行物品推广，推广攻击的本质是通过学习系统中的用户的特征来构建假用户，以此来推广目标物品，但是由于系统中不同的用户的特征不同，因此对于以往所有的推广攻击并未对系统用户进行分类攻击，得到的推广效果也不是非常理想。因此，基于用户分类的数据中毒攻击的研究在当下具有重要的意义，只有清楚地了解数据中毒攻击的具体攻击手段才可以更好地进行防御，为推荐系统对于数据中毒攻击的防御提供新的思路。

技术实现思路

[0004]本专利技术的目的在于，提供一种基于...

【技术保护点】

【技术特征摘要】
1.一种基于用户分类的中毒样本构建方法，其特征在于：包括以下步骤：步骤S1、对推荐系统中的用户进行分析，根据用户对目标物品的偏好和用户的历史交互记录数目将用户分类为脆弱用户和鲁棒用户；步骤S2、对步骤S1分类好的两类的用户赋予相应的权重以表示用户的脆弱程度，根据得到的用户的脆弱程度定义动态权重，脆弱程度高的用户获得更高的权重；步骤S3、基于步骤S2获得的动态权重构建一个代理模型，来模拟推荐系统中脆弱用户最大程度中毒后的状态，生成假用户的候选物品集合；步骤S4、根据中毒后的推荐系统反馈结果选择假用户的交互项目，并生成评分，生成最终的假用户；步骤S5、将步骤S4最终生成的假用户加入本地代理推荐系统的数据集，回到步骤S1，进行下一个假用户构建，直至向代理数据集内加入设定个数的假用户，完成推荐系统的投毒攻击。2.根据权利要求1所述的一种基于用户分类的中毒样本构建方法，其特征在于：所述代理模型设立在本地，能完全还原目标推荐系统，代理模型使用的数据集与目标推荐系统的数据集完全一致。3.根据权利要求2所述的一种基于用户分类的中毒样本构建方法，其特征在于：所述步骤S3具体包括以下子步骤：子步骤S3.1、在推荐系统生成第j个假用户时，向代理模型的数据集中添加一条初始假用户v
j
的数据，初始假用户v
j
的历史交互记录中包括一条对于目标物品的最高评分以及多个种子物品，多个种子物品的评分分别符合各个物品整体评分的正态分布；子步骤S3.2、根据推荐系统用户的脆弱性分类设计动态权重来定义代理模型的损失函数，以此利用训练好的代理模型来模拟脆弱用户最大程度中毒后的推荐系统状态；子步骤S3.3、训练代理模型得到对假用户v
j
的推荐结果。4.根据权利要求3所述的一种基于用户分类的中毒样本构建方法，其特征在于：所述步骤S4具体包括以下子步骤：子步骤S4.1、根据训练好的代理模型得到假用户v
j
对每个物品的预测评分子步骤S4.2、根据深度协同过滤算法的原理定义每个物品i的选择概率p
i
；子步骤S4.3、生成每个物品的最终评分rating
i
；子步骤S4.4、根据最终评分从高到低选择top
‑
r个物品作为假用户v
j
的填充物品，并根据推荐系统中所有物品评分的正态分布对假用户v
j
的填充物品进行评分，生成最终的假用户v
j
。5.根据权利要求4所述的一种基于用户分类的中毒样本构建方法，其特征在于：步骤S1中对目标物品的预测评分高于设定阈值的定义为脆弱用户，反之则为鲁棒用户。...

【专利技术属性】
技术研发人员：刘柏嵩，王志业，张雪垣，林晨楠，胡测，
申请(专利权)人：宁波大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人