本发明专利技术提供一种僵尸账号检测方法和装置,其中,该方法包括:获取用户账号集合,并确定用户账号集合中各用户账号相互之间的关注关系;根据关注关系,确定各用户账号所归属的群体以及各用户账号之间的吸引力程度,吸引力程度用于表征各用户账号之间的关注紧密程度;若归属于同一群体的各用户账号之间的吸引力程度大于第一预设阈值,且归属于同一群体的各用户账号与归属于其他群体的各用户账号之间的吸引力程度的均值小于第二预设阈值,则确定归属于同一群体的各用户账号为僵尸账号。实现了只根据各个用户账号的关注关系去检测出僵尸账号,检测僵尸账号的时间较短,提高了检测效率,并且节约了资源。
【技术实现步骤摘要】
本专利技术涉及互联网技术,尤其涉及一种僵尸账号检测方法和装置。
技术介绍
随着社交网络不断发展,产生了各种论坛以及交友平台,例如微博、社区论坛等。在这些论坛以及平台中,会出现各种为了打广告、或者为了涨粉丝、或者为了抓取数据的僵尸账号,这些僵尸由计算机自动生成,并关注其他正常用户账号。为了甄别并清除僵尸账号,现有技术中会去获取用户账号发布的内容,采用信息检索与数据挖掘的加权(Term Frequency -1nverse Document Frequency,简称 TF-1DF)算法对用户账号发布的内容进行文本分析,得到用户账号所关注的话题,若用户账号所关注的话题都集中在某一个或某几个话题上,则确定该用户账号为僵尸账号。然而现有技术中需要对用户账号发布的内容进行文本分析,去确定用户账号是否为僵尸账号。现有技术中检测僵尸账号的时间较长,检测效率较低,并且资源消耗较大。
技术实现思路
本专利技术提供一种僵尸账号检测方法和装置,用以解决现有技术中检测僵尸账号的时间较长,检测效率较低,并且资源消耗较大的问题。本专利技术的一方面是提供一种僵尸账号检测方法,包括:获取用户账号集合,并确定所述用户账号集合中各用户账号相互之间的关注关系;根据所述关注关系,确定各用户账号所归属的群体以及各用户账号之间的吸引力程度,所述吸引力程度用于表征各用户账号之间的关注紧密程度;若归属于同一群体的各用户账号之间的吸引力程度大于第一预设阈值,且归属于同一群体的各用户账号与归属于其他群体的各用户账号之间的吸引力程度的均值小于第二预设阈值,则确定所述归属于同一群体的各用户账号为僵尸账号。如上所述的方法中,在获取用户账号集合,并确定所述用户账号集合中各用户账号相互之间的关注关系之后,还包括:根据所述关注关系,确定各用户账号的影响力值,所述影响力值用于表征各用户账号被关注的程度;相应的,在所述确定所述归属于同一群体的各用户账号为僵尸账号之前,还包括:判断所述归属于同一群体的各用户账号的影响力值是否小于第三预设阈值;若是,则执行确定所述归属于同一群体的各用户账号为僵尸账号的步骤。如上所述的方法中,所述根据所述关注关系,确定各用户账号所归属的群体以及各用户账号之间的吸引力程度,包括:采用图切分算法对所述关注关系进行运算,得到各用户账号所归属的群体;采用力导向算法对所述关注关系进行运算,得到各用户账号之间的吸引力程度。如上所述的方法中,所述根据所述关注关系,确定各用户账号的影响力值,包括:采用网页排名(Pagerank,简称PR)算法对所述关注关系进行运算,得到各用户账号的影响力值。如上所述的方法中,在所述确定所述归属于同一群体的各用户账号为僵尸账号之后,还包括:根据确定的各用户账号所归属的群体、各用户账号之间的吸引力程度以及确定的僵尸账号,确定社群关系图并显示所述社群关系图,所述社群关系图表征了各用户账号相互之间的关注紧密程度、各用户账号的群体属性以及僵尸账号,以使用户查看所述社群关系图中显示的僵尸账号所发布的内容。本专利技术的另一方面是提供一种僵尸账号检测装置,包括:获取模块,用于获取用户账号集合,并确定所述用户账号集合中各用户账号相互之间的关注关系;第一确定模块,用于根据所述关注关系,确定各用户账号所归属的群体以及各用户账号之间的吸引力程度,所述吸引力程度用于表征各用户账号之间的关注紧密程度;第二确定模块,用于若归属于同一群体的各用户账号之间的吸引力程度大于第一预设阈值,且归属于同一群体的各用户账号与归属于其他群体的各用户账号之间的吸引力程度的均值小于第二预设阈值,则确定所述归属于同一群体的各用户账号为僵尸账号。如上所述的装置中,还包括:第三确定模块,用于在所述获取模块获取用户账号集合,并确定所述用户账号集合中各用户账号相互之间的关注关系之后,根据所述关注关系,确定各用户账号的影响力值,所述影响力值用于表征各用户账号被关注的程度;相应的,还包括:判断模块,用于在所述第二确定模块确定所述归属于同一群体的各用户账号为僵尸账号之前,判断所述归属于同一群体的各用户账号的影响力值是否小于第三预设阈值;若是,则执行所述第二确定模块中的确定所述归属于同一群体的各用户账号为僵尸账号的步骤。如上所述的装置中,所述第一确定模块,具体用于:采用图切分算法对所述关注关系进行运算,得到各用户账号所归属的群体;采用力导向算法对所述关注关系进行运算,得到各用户账号之间的吸引力程度。如上所述的装置中,所述第三确定模块,具体用于:采用PR算法对所述关注关系进行运算,得到各用户账号的影响力值。如上所述的装置中,还包括:第四确定模块,用于在所述第二确定模块确定所述归属于同一群体的各用户账号为僵尸账号之后,根据确定的各用户账号所归属的群体、各用户账号之间的吸引力程度以及确定的僵尸账号,确定社群关系图并显示所述社群关系图,所述社群关系图表征了各用户账号相互之间的关注紧密程度、各用户账号的群体属性以及僵尸账号,以使用户查看所述社群关系图中显示的僵尸账号所发布的内容。本专利技术通过获取用户账号集合,并确定用户账号集合中各用户账号相互之间的关注关系;根据关注关系,确定各用户账号所归属的群体以及各用户账号之间的吸引力程度,吸引力程度用于表征各用户账号之间的关注紧密程度;若归属于同一群体的各用户账号之间的吸引力程度大于第一预设阈值,且归属于同一群体的各用户账号与归属于其他群体的各用户账号之间的吸引力程度的均值小于第二预设阈值,则确定归属于同一群体的各用户账号为僵尸账号。实现了只根据各个用户账号的关注关系去检测出僵尸账号,检测僵尸账号的时间较短,提高了检测效率,并且节约了资源。【附图说明】图1为本专利技术实施例一提供的僵尸账号检测方法的流程图;图2为本专利技术实施例二提供的僵尸账号检测方法的流程图;图3为本专利技术实施例三提供的僵尸账号检测装置的结构示意图;图4为本专利技术实施例四提供的僵尸账号检测装置的结构示意图。【具体实施方式】为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。图1为本专利技术实施例一提供的僵尸账号检测方法的流程图,如图1所示,本实施例的方法包括:步骤101、获取用户账号集合,并确定用户账号集合中各用户账号相互之间的关注关系Ο在本实施例中,具体的,首先获取用户账号集合,例如,获取某一个品牌官方微博下的全部粉丝的用户账号,组成一个用户账号集合;或者获取某一个论坛下的全部用户账号,组成一个用户账号集合。然后获取用户账号集合中各个用户账号相互之间的关注关系。步骤102、根据关注关系,确定各用户账号所归属的群体以当前第1页1 2 3 本文档来自技高网...
【技术保护点】
一种僵尸账号检测方法,其特征在于,包括:获取用户账号集合,并确定所述用户账号集合中各用户账号相互之间的关注关系;根据所述关注关系,确定各用户账号所归属的群体以及各用户账号之间的吸引力程度,所述吸引力程度用于表征各用户账号之间的关注紧密程度;若归属于同一群体的各用户账号之间的吸引力程度大于第一预设阈值,且归属于同一群体的各用户账号与归属于其他群体的各用户账号之间的吸引力程度的均值小于第二预设阈值,则确定所述归属于同一群体的各用户账号为僵尸账号。
【技术特征摘要】
【专利技术属性】
技术研发人员:秦俊辉,
申请(专利权)人:精硕世纪科技北京有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。