恶意用户检测方法及装置制造方法及图纸

技术编号：14984277 阅读：111 留言：0更新日期：2017-04-03 15:24

本发明专利技术涉及一种恶意用户检测方法，包括:将各恶意用户注入到推荐系统中，生成正例数据集合，所述正例数据集合中的每个正例数据包括一组行为特征，一组行为特征构成一组向量；对多组向量进行离散化处理；根据离散化处理的结果，从推荐系统中的无标记用户中获取反例用户，生成反例数据集合；将正例数据集合和反例数据集合构成标记数据集，将无标记用户中获取反例用户后的剩余用户构成无标记数据集，根据标记数据集和无标记数据集，获取推荐系统中的恶意用户，从而检测到隐藏更深的恶意用户。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及数据挖掘领域，尤其涉及一种推荐系统中的恶意用户检测方法及装置。
技术介绍
推荐系统(英文：RecommenderSystems，缩写：RS)是一种为用户提供建议的智能化软件工具，目前已被应用于电子商务、电影和视频网站、社交网络、个性化阅读以及广告等诸多领域。产品的评分越来越影响用户对产品的选择，高质量的正向评分无疑会为商家带来很多的经济收益；相反的，低评分则将给商家带来经济损失。基于这一商业目的，有些商家为了促进产品的销售或打压其他商家的信誉，将会雇佣大量的用户来为自己的产品打高分，同时给其他商家的产品低评分。目前国内已出现了通过指导恶意用户以促进特定产品销售或打压其他产品信誉来获利的网站，如“刷客网”。在诸多的电子商务推荐系统中，协同过滤推荐算法是应用最为广泛的推荐系统算法。目前，国内外著名的推荐系统大多都是基于协同过滤推荐算法的，如亚马逊(英文:Amazon)网络书店、GroupLens、TiVo、Netflix、YouTube和Facebook等。基于协同过滤推荐算法的推荐方法大多基于用户-项目矩阵(英文：User-ItemMatrix)进行推荐，该算法的优点是可对多种类型的资源进行过滤，并能为用户发现新的感兴趣的信息，其核心思想是通过找到与目标用户Ut最相似的k个相似用户，根据k个相似用户对项目Ii的评分预测Ut对项目Ii的评分。但该算法给恶意用户可乘之机，这些恶意用户通过伪...

【技术保护点】
一种恶意用户检测方法，其特征在于，所述方法包括：将各恶意用户注入到推荐系统中，生成正例数据集合，所述正例数据集合中的每个正例数据包括一组行为特征，所述一组行为特征构成一组向量；对多组所述向量进行离散化处理；根据所述离散化处理的结果，从所述推荐系统中的无标记用户中获取可靠反例用户，生成反例数据集合；将所述正例数据集合和所述反例数据集合构成标记数据集，将所述无标记用户中获取反例用户后的剩余用户构成无标记数据集，根据所述标记数据集和所述无标记数据集，获取推荐系统中的恶意用户。

【技术特征摘要】
1.一种恶意用户检测方法，其特征在于，所述方法包括：
将各恶意用户注入到推荐系统中，生成正例数据集合，所述正例数据集
合中的每个正例数据包括一组行为特征，所述一组行为特征构成一组向量；
对多组所述向量进行离散化处理；
根据所述离散化处理的结果，从所述推荐系统中的无标记用户中获取可靠
反例用户，生成反例数据集合；
将所述正例数据集合和所述反例数据集合构成标记数据集，将所述无标记
用户中获取反例用户后的剩余用户构成无标记数据集，根据所述标记数据集
和所述无标记数据集，获取推荐系统中的恶意用户。
2.根据权利要求1所述的方法，其特征在于，所述恶意用户具体包括：
随机注入、平均注入、流行随机注入、流行平均注入、混合随机流行注入、
混合平均流行注入。
3.根据权利要求1所述的方法，其特征在于，所述一组行为特征具体包
括：熵、与近邻的平均相似度、长度变化、用户评过分项目与其平均值之间
的平均偏差、用户评最高分的项目集合与其他评分项目集合的偏差、用户模
型评过分项目与其平均值之间的二阶矩、用户模型对目标项目的关注度、流
行排序、所有用户的平均距离、分类熵。
4.根据权利要求2所述的方法，其特征在于，利用公式
PopRanki=ΣIj∈Ri|R·j||Ri·|]]>计算所述流行排序；
其中，PopRank为流行排序，Ij为所有为商品j打分的用户集合，Ri.
为用户ui所有评过分的商品集合，|R.j|为对项目Ij打过分的所有用户的个
数，|Ri.|为用户ui所有打过分商品的个数。
5.根据权利要求2所述的方法，其特征在于，利用计算所述所有用户的...

【专利技术属性】
技术研发人员：王有权，曹杰，潘迪，陶海成，朱桂祥，
申请(专利权)人：南京理工大学，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人