用户识别方法、装置、可读存储介质及电子设备制造方法及图纸

技术编号:35353947 阅读:13 留言:0更新日期:2022-10-26 12:27
本公开涉及一种用户识别方法、装置、可读存储介质及电子设备,涉及互联网技术领域。该方法包括:将第一用户的第一身份标签,以及第一用户的用户基本特征、用户发文特征与用户传播特征作为训练集,来对不同的分类器进行训练;将第二用户的用户基本特征、用户发文特征与用户传播特征作为测试集,来对该不同的分类器分别进行测试,得到该不同的分类器的测试结果;根据该测试结果与该第二用户的第二身份标签,确定该不同的分类器识别用户的精准率;从多个精准率中,筛选出目标精准率所对应的目标分类器来对不同用户的身份进行识别。使用本公开提出的方法可以识别出社媒机器人,避免设备机器人对正常人类用户的行为造成干扰。机器人对正常人类用户的行为造成干扰。机器人对正常人类用户的行为造成干扰。

【技术实现步骤摘要】
用户识别方法、装置、可读存储介质及电子设备


[0001]本公开涉及互联网
,具体地,涉及一种用户识别方法、装置、可读存储介质及电子设备。

技术介绍

[0002]在社交媒体平台中,人类用户与社媒机器人用户并存,二者组成了社交网络用户群。
[0003]相关技术中,社媒机器人与正常人类用户均会在一些社交媒体平台上产生评论、点赞、分享等行为,而社媒机器人所产生的行为会对正常人类用户的行为造成干扰。

技术实现思路

[0004]本公开的目的是提供一种用户识别方法、装置、可读存储介质及电子设备,以解决上述技术问题。
[0005]为了实现上述目的,本公开实施例的第一方面提供一种用户识别方法,所述方法包括:
[0006]将第一用户的第一身份标签,以及第一用户的用户基本特征、用户发文特征与用户传播特征作为训练集,来对不同的分类器进行训练;
[0007]将第二用户的用户基本特征、用户发文特征与用户传播特征作为测试集,来对所述不同的分类器分别进行测试,得到所述不同的分类器的测试结果;
[0008]根据所述测试结果与所述第二用户的第二身份标签,确定所述不同的分类器识别用户的精准率;
[0009]从多个精准率中,筛选出目标精准率所对应的目标分类器来对不同用户的身份进行识别;
[0010]其中,所述用户基本特征用于表示所述用户的账号信息完整度以及所述用户的账号使用频率;所述用户发文特征用户表示所述用户的发文影响力、发文内容以及发文活跃度;所述用户传播特征用于表征所述用户与其余用户的互动程度。
[0011]可选地,所述用户传播特征包括以下至少一者:
[0012]用户互动与被互动总次数、用户被互动次数、用户互动次数、用户的发文页面权重、接近中心度、介数中心度、高影响力用户标签、高活跃度用户标签。
[0013]可选地,所述用户的高影响力用户标签通过以下步骤进行添加:
[0014]在所述用户的被互动次数大于所述训练集中第一预设比例的用户的被互动次数、所述用户的介数中心度大于所述训练集中第二预设比例的用户的介数中心度以及所述用户的接近中心度大于所述训练集中第三预设比例的用户的接近中心度的情况下,为所述用户添加所述高影响力用户标签;
[0015]其中,所述第一预设比例与所述第二预设比例,大于所述第三预设比例。
[0016]可选地,所述用户的高活跃度用户标签通过以下步骤进行添加:
[0017]在所述用户的互动次数大于所述训练集中第四预设比例的用户的互动次数、所述用户的接近中心度大于所述训练集中第五预设比例的用户的接近中心度以及所述用户的介数中心度大于所述训练集中第六预设比例的用户的介数中心度的情况下,为所述用户添加所述高活跃度用户标签;
[0018]其中,所述第四预设比例与所述第五预设比例大于所述第六预设比例。
[0019]可选地,根据所述测试结果与所述第二用户的第二身份标签,确定所述不同的分类器识别用户的精准率,包括:
[0020]在所述测试结果与所述第二身份标签相同的情况下,确定所述测试结果为第一结果;
[0021]在所述测试结果与所述第二身份标签不同的情况下,确定所述测试结果为第二结果;
[0022]将所述测试集中,所述第一结果出现的次数占据所述第一结果出现的次数与所述第二结果的次数之和的比例,作为所述精准率。
[0023]可选地,所述方法还包括:
[0024]根据所述测试结果与所述第二用户的第二身份标签,确定所述不同的分类器识别用户的准确率;
[0025]从多个准确率中,筛选出目标准确率所对应的目标分类器来对不同用户的身份进行识别。
[0026]可选地,所述测试结果包括机器人与人类用户,所述第二身份标签包括社媒机器人与人类用户;根据所述测试结果与所述第二用户的第二身份标签,确定所述不同的分类器识别用户的准确率,包括:
[0027]在所述测试结果与所述第二身份标签均为社媒机器人的情况下,确定所述测试结果为第三结果;
[0028]在所述测试结果与所述第二身份标签均为人类用户的情况下,确定所述测试结果为第四结果;
[0029]将所述第三结果与所述第四结果出现的次数和占据所述测试集中测试样本的数量的比例,作为所述准确率。
[0030]根据本公开实施例的第二方面,提供一种用户识别装置,所述装置包括:
[0031]训练模块,被配置为将第一用户的第一身份标签,以及第一用户的用户基本特征、用户发文特征与用户传播特征作为训练集,来对不同的分类器进行训练;
[0032]测试模块,被配置为将第二用户的用户基本特征、用户发文特征与用户传播特征作为测试集,来对所述不同的分类器分别进行测试,得到所述不同的分类器的测试结果;
[0033]精准率确定模块,被配置为根据所述测试结果与所述第二用户的第二身份标签,确定所述不同的分类器识别用户的精准率;
[0034]第一目标分类器确定模块,被配置为从多个精准率中,筛选出目标精准率所对应的目标分类器来对不同用户的身份进行识别;
[0035]其中,所述用户基本特征用于表示所述用户的账号信息完整度以及所述用户的账号使用频率;所述用户发文特征用户表示所述用户的发文影响力、发文内容以及发文活跃度;所述用户传播特征用于表征所述用户与其余用户的互动程度。
[0036]根据本公开实施例的第三方面,提供一种非临时性计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本公开实施例第一方面所提供的用户识别方法的步骤。
[0037]根据本公开实施例的第四方面,提供一种电子设备,包括:
[0038]存储器,其上存储有计算机程序;
[0039]处理器,用于执行所述存储器中的所述计算机程序,以实现本公开实施例第一方面所提供的用户识别方法的步骤。
[0040]通过上述技术方案,第一方面由于用户基本特征、用户发文特征与用户传播特征在社媒机器人与人类用户中的表现并不相同,所以可以将这几个特征来对不同的分类器进行训练,以使得不同的分类器具有识别社媒机器人与人类用户的能力;第二方面可以将不同分类器的测试结果与测试集中的第二身份标签进行比较,来确定不同分类器的精准率,并从多个精准率中确定出目标精准率对应的目标分类器来对不同用户的身份进行识别,由于目标精准率是多个精准率中较大的精准率,所以目标精准率对应的目标分类器所识别出的用户的类别的精准率也更高,能够更好地识别出社媒机器人与人类用户;第三方面,在从多个用户中区分出社媒机器人后,可以屏蔽社媒机器人,或者提醒人类用户该用户是社媒机器人,以避免社媒机器人的行为对人类用户造成干扰。
[0041]本公开的其他特征和优点将在随后的具体实施方式部分予以详细说明。
附图说明
[0042]附图是用来提供对本公开的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本公开,但并不构成对本公开的限制。在附图中:
...

【技术保护点】

【技术特征摘要】
1.一种用户识别方法,其特征在于,所述方法包括:将第一用户的第一身份标签,以及第一用户的用户基本特征、用户发文特征与用户传播特征作为训练集,来对不同的分类器进行训练;将第二用户的用户基本特征、用户发文特征与用户传播特征作为测试集,来对所述不同的分类器分别进行测试,得到所述不同的分类器的测试结果;根据所述测试结果与所述第二用户的第二身份标签,确定所述不同的分类器识别用户的精准率;从多个精准率中,筛选出目标精准率所对应的目标分类器来对不同用户的身份进行识别;其中,所述用户基本特征用于表示所述用户的账号信息完整度以及所述用户的账号使用频率;所述用户发文特征用户表示所述用户的发文影响力、发文内容以及发文活跃度;所述用户传播特征用于表征所述用户与其余用户的互动程度。2.根据权利要求1所述的方法,其特征在于,所述用户传播特征包括以下至少一者:用户互动与被互动总次数、用户被互动次数、用户互动次数、用户的发文页面权重、接近中心度、介数中心度、高影响力用户标签、高活跃度用户标签。3.根据权利要求2所述的方法,其特征在于,所述用户的高影响力用户标签通过以下步骤进行添加:在所述用户的被互动次数大于所述训练集中第一预设比例的用户的被互动次数、所述用户的介数中心度大于所述训练集中第二预设比例的用户的介数中心度以及所述用户的接近中心度大于所述训练集中第三预设比例的用户的接近中心度的情况下,为所述用户添加所述高影响力用户标签;其中,所述第一预设比例与所述第二预设比例,大于所述第三预设比例。4.根据权利要求2所述的方法,其特征在于,所述用户的高活跃度用户标签通过以下步骤进行添加:在所述用户的互动次数大于所述训练集中第四预设比例的用户的互动次数、所述用户的接近中心度大于所述训练集中第五预设比例的用户的接近中心度以及所述用户的介数中心度大于所述训练集中第六预设比例的用户的介数中心度的情况下,为所述用户添加所述高活跃度用户标签;其中,所述第四预设比例与所述第五预设比例大于所述第六预设比例。5.根据权利要求1所述的方法,其特征在于,根据所述测试结果与所述第二用户的第二身份标签,确定所述不同的分类器识别用户的精准率,包括:在所述测试结果与所述第二身份标签相同的情况下,确定所述测试结果为第一结果;在所述测试结果与所述第二身份标签不同的情况下,确定所述测试结...

【专利技术属性】
技术研发人员:刘译璟于帮付赵丹李彦泽种一萌杜晓梦石峰
申请(专利权)人:北京百分点科技集团股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1