本申请提供了一种异常用户的识别方法、识别装置及可读存储介质,所述识别方法包括:获取预设统计时间段内目标用户在分享平台上的评论数据集,并检测评论数据集中的评论数据在每一个检测维度上是否为异常评论数据;当评论数据在任一检测维度上为异常评论数据时,将对应的检测维度划分至检测维度数据集;加和检测维度数据集中每一个检测维度对应的权重系数,当目标用户的权重总数大于预设阈值时,确定目标用户为异常用户。这样,根据用户的评论数据在每一个检测维度上的检测结果,确定需要加和权重系数的检测维度,不需要加和每一个检测维度的特征值,可以多维度检测并且只需加和存在异常数据的检测维度的权重系数,有助于提高检测效率和准确性。
An abnormal user identification method, identification device and readable storage medium
【技术实现步骤摘要】
一种异常用户的识别方法、识别装置及可读存储介质
本申请涉及数据处理
,尤其是涉及一种异常用户的识别方法、识别装置及可读存储介质。
技术介绍
随着计算机技术的飞速发展,用户开始越来越多的依赖终端应用进行日常生活用品的采购,有鉴于此,各大品牌也将自家的品牌产品推广到各种终端应用上,用户会参考产品下对应的评论,来确定该产品的品质,而品牌自身也会根据自己产品下的评论,分析产品的受欢迎程度,但是,在评论中会存在一些刷评论的异常用户,从而影响用户和品牌本身对产品真实效果的估算,因此,对于评论用户的鉴别十分重要。现阶段,在对于异常用户的判断,都是基于单一判断规则直接进行判断,即使在综合各检测规则判断时,也需要在每一个检测规则处通过规则进行大量的判断,判断逻辑复杂,计算量大,判断结果不准确。
技术实现思路
有鉴于此,本申请的目的在于提供一种异常用户的识别方法、识别装置及可读存储介质,可以通过目标用户的评论数据在每一个检测维度上进行检测,将检测出数据异常的检测维度的权重系数相加,若权重系数加和值大于预设阈值,确定目标用户为异常用户,这样,根据用户的评论数据在每一个检测维度上的检测结果,确定需要加和权重系数的检测维度,不需要在每一个检测维度上进行复杂的判别并加和每一个检测维度的特征值,可以多维度检测并且只需加和存在异常数据的检测维度的权重系数,有助于提高检测效率和准确性。本申请实施例提供了一种异常用户的识别方法,所述识别方法包括:获取预设统计时间段内目标用户在分享平台上的评论数据集,并检测所述评论数据集中的评论数据在每一个检测维度上是否为异常评论数据;当所述评论数据在任一检测维度上为异常评论数据时,将对应的检测维度划分至检测维度数据集;加和所述检测维度数据集中每一个检测维度对应的权重系数,确定所述目标用户的权重总数;当所述权重总数大于预设阈值时,确定所述目标用户为异常用户。进一步的,检测维度包括评论量维度、评论密度维度、评论内容重复度维度、评论原贴重复度维度、评论内容矛盾维度中的至少一种。进一步的,当检测维度包括评论量维度时,通过以下步骤确定所述评论数据在评论量维度上为异常评论数据:从所述评论数据中确定所述目标用户的评论信息总量,并计算所述目标用户在预设统计时间段内的每日平均评论量;检测所述每日平均评论量是否大于预设阈值;若所述每日平均评论量大于预设阈值,确定所述评论数据在评论量维度上为异常评论数据。进一步的,当检测维度包括评论密度维度时,通过以下步骤确定所述评论数据在评论密度维度上为异常评论数据:获取所述目标用户在预设时间间隔内的多条评论信息,以及每一条评论信息所对应的评论的评论原贴;若基于所述多条评论信息和所述评论原帖,确定出的在预设时间间隔内所述目标用户在所述评论原贴下的评论数量大于预设阈值,确定所述目标用户的评论为异常评论;检测所述异常评论在预设统计时间段内的出现次数是否大于预设阈值;若所述异常评论在预设统计时间段内的出现次数大于预设阈值,确定所述评论数据在评论密度维度上为异常评论数据。进一步的,当检测维度包括评论内容重复度维度时,通过以下步骤确定所述评论数据在评论内容重复度维度上为异常评论数据:获取预设统计时间段内,所述目标用户在不同评论原贴下的评论内容;检测所述目标用户在具有相同评论内容的评论原贴下的评论数量是否大于预设阈值;若所述目标用户在具有相同评论内容的评论原贴下的评论数量大于预设阈值,确定所述评论数据在评论内容重复度维度上为异常评论数据。进一步的,当检测维度包括评论原贴重复度维度时,通过以下步骤确定所述评论数据在评论原贴重复度维度上为异常评论数据:获取评论数据对应的多条评论原贴以及每一条评论原贴对应的原贴关键词;检测预设时间间隔内具有相同的原贴关键词的评论原贴下的评论数量是否大于预设阈值;若预设时间间隔内具有相同的原贴关键词的评论原贴下的评论数量大于预设阈值,确定所述评论数据在评论原贴重复度维度上为异常评论数据。进一步的,当检测维度包括评论内容矛盾维度时,通过以下步骤确定所述评论数据在评论内容矛盾维度上为异常评论数据:获取预设统计时间段内,所述目标用户在不同原贴下的评论内容;检测所述目标用户在不同原贴下的评论内容中针对同一关键词的评价是否不一致;若所述目标用户在不同原贴下的评论内容中针对同一关键词的评价不一致,确定所述评论数据在评论内容矛盾维度上为异常评论数据。本申请实施例还提供了一种异常用户的识别装置,所述识别装置包括:处理模块,用于获取预设统计时间段内目标用户在分享平台上的评论数据集,并检测所述评论数据集中的评论数据在每一个检测维度上是否为异常评论数据;划分模块,用于当所述评论数据在任一检测维度上为异常评论数据时,将对应的检测维度划分至检测维度数据集;第一确定模块,用于加和所述划分模块划分的检测维度数据集中每一个检测维度对应的权重系数,确定所述目标用户的权重总数;第二确定模块,用于当所述第一确定模块确定的权重总数大于预设阈值时,确定所述目标用户为异常用户。进一步的,检测维度包括评论量维度、评论密度维度、评论内容重复度维度、评论原贴重复度维度、评论内容矛盾维度中的至少一种。进一步的,当检测维度包括评论量维度时,所述处理模块在确定所述评论数据在评论量维度上为异常评论数据时,用于:从所述评论数据中确定所述目标用户的评论数据总量,并计算所述目标用户在预设统计时间段内的每日平均评论量;检测所述每日平均评论量是否大于预设阈值;若所述每日平均评论量大于预设阈值,确定所述评论数据在评论量维度上为异常评论数据。进一步的,当检测维度包括评论密度维度时,所述处理模块在确定所述评论数据在评论密度维度上为异常评论数据时,用于:获取所述目标用户在预设时间间隔内的多条评论信息,以及每一条评论信息所对应的评论的评论原贴;若基于所述多条评论信息和所述评论原帖,确定出的在预设时间间隔内所述目标用户在所述评论原贴下的评论数量大于预设阈值,确定所述目标用户的评论为异常评论;检测所述异常评论在预设统计时间段内的出现次数是否大于预设阈值;若所述异常评论在预设统计时间段内的出现次数大于预设阈值,确定所述评论数据在评论密度维度上为异常评论数据。进一步的,当检测维度包括评论内容重复度维度时,所述处理模块在确定所述评论数据在评论内容重复度维度上为异常评论数据时,用于:获取预设统计时间段内,所述目标用户在不同评论原贴下的评论内容;检测所述目标用户在具有相同评论内容的评论原贴下的评论数量是否大于预设阈值;若所述目标用户在具有相同评论内容的评论原贴下的评论数量大于预设阈值,确定所述评论数据在评论内容重复度维度上为异常评论数据。进一步的,当检测维度包括评论原贴重复度维度时,所述处理模块在通过以下步骤确本文档来自技高网...
【技术保护点】
1.一种异常用户的识别方法,其特征在于,所述识别方法包括:/n获取预设统计时间段内目标用户在分享平台上的评论数据集,并检测所述评论数据集中的评论数据在每一个检测维度上是否为异常评论数据;/n当所述评论数据在任一检测维度上为异常评论数据时,将对应的检测维度划分至检测维度数据集;/n加和所述检测维度数据集中每一个检测维度对应的权重系数,确定所述目标用户的权重总数;/n当所述权重总数大于预设阈值时,确定所述目标用户为异常用户。/n
【技术特征摘要】
1.一种异常用户的识别方法,其特征在于,所述识别方法包括:
获取预设统计时间段内目标用户在分享平台上的评论数据集,并检测所述评论数据集中的评论数据在每一个检测维度上是否为异常评论数据;
当所述评论数据在任一检测维度上为异常评论数据时,将对应的检测维度划分至检测维度数据集;
加和所述检测维度数据集中每一个检测维度对应的权重系数,确定所述目标用户的权重总数;
当所述权重总数大于预设阈值时,确定所述目标用户为异常用户。
2.根据权利要求1所述的识别方法,其特征在于,检测维度包括评论量维度、评论密度维度、评论内容重复度维度、评论原贴重复度维度、评论内容矛盾维度中的至少一种。
3.根据权利要求2所述的识别方法,其特征在于,当检测维度包括评论量维度时,通过以下步骤确定所述评论数据在评论量维度上为异常评论数据:
从所述评论数据中确定所述目标用户的评论信息总量,并计算所述目标用户在预设统计时间段内的每日平均评论量;
检测所述每日平均评论量是否大于预设阈值;
若所述每日平均评论量大于预设阈值,确定所述评论数据在评论量维度上为异常评论数据。
4.根据权利要求2所述的识别方法,其特征在于,当检测维度包括评论密度维度时,通过以下步骤确定所述评论数据在评论密度维度上为异常评论数据:
获取所述目标用户在预设时间间隔内的多条评论信息,以及每一条评论信息所对应的评论的评论原贴;
若基于所述多条评论信息和所述评论原帖,确定出的在预设时间间隔内所述目标用户在所述评论原贴下的评论数量大于预设阈值,确定所述目标用户的评论为异常评论;
检测所述异常评论在预设统计时间段内的出现次数是否大于预设阈值;
若所述异常评论在预设统计时间段内的出现次数大于预设阈值,确定所述评论数据在评论密度维度上为异常评论数据。
5.根据权利要求2所述的识别方法,其特征在于,当检测维度包括评论内容重复度维度时,通过以下步骤确定所述评论数据在评论内容重复度维度上为异常评论数据:
获取预设统计时间段内,所述目标用户在不同评论原贴下的评论内容;
检测所述目标用户在具有相同评论内容的评论原贴下的评论数量是否大于预设阈值;
若所述目标用户在具有相同评论内容的评论原贴下的评论数量大于...
【专利技术属性】
技术研发人员:许冷杉,冯允,
申请(专利权)人:精硕科技北京股份有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。