System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于异质模体特征的社交网络用户性别识别方法、装置及可存储介质制造方法及图纸_技高网

一种基于异质模体特征的社交网络用户性别识别方法、装置及可存储介质制造方法及图纸

技术编号:42675296 阅读:13 留言:0更新日期:2024-09-10 12:27
本发明专利技术公开了一种基于异质模体特征的社交网络用户性别识别方法、装置及可存储介质,涉及信息检测技术领域,其中方法包括以下步骤:读取用户的社交网络数据以及个人属性数据并进行预处理;根据所述社交网络数据以及所述个人属性数据提取用户的异质模体特征;构建识别模型,并利用所述异质模体特征对所述识别模型进行训练;利用经过训练的所述识别模型进行后续的社交网络用户性别识别;本发明专利技术利用简单的图结构特征进行社交网络用户的性别识别,既保证了实时性又保证了较高的准确性。

【技术实现步骤摘要】

本专利技术涉及信息检测,更具体的说是涉及一种基于异质模体特征的社交网络用户性别识别方法、装置及可存储介质


技术介绍

1、目前,随着社会的发展,社交媒体平台已经成为人们生活中不可或缺的一部分。在线互动是社交媒体平台最明显的共同点之一,在在线社区中的人们通常不会察觉到虚拟朋友和真实朋友之间的区别,更多在意的是志同道合的同伴,因此社交平台改变了人们交互沟通的方式,它对家庭、社区、职业甚至是商业都产生了巨大的影响。

2、随着社交网络的不断发展,用户可以在这些社交平台上创建自己的个人简介,并且可以选择性地隐藏某些私人信息如性别。研究表明绝大多数社交用户都会选择隐藏其兴趣爱好等用户信息,但是相关可获取的用户信息尤其是性别属性,它是用户个人画像的关键要素之一,能有助于研究者刻画经典用户类型,也能帮助企业进行个性化推荐。鉴于当下有关用户性别识别的专利专利技术中,大多都是基于图片视频或语音进行相关的特征提取进行识别,又或者是利用一些相关的软件进行一个区域内或者是根据其他软件数据信息进行推测,对数据质量要求较高,尤其是在社交网络中这样的数据过大很难保证实时性。

3、因此,如何提供一种能够解决上述问题的社交网络用户性别识别方法是本领域技术人员极需解决的问题。


技术实现思路

1、鉴于此,本专利技术提供了一种基于异质模体特征的社交网络用户性别识别方法、装置及可存储介质,利用简单的图结构特征进行社交网络用户的性别识别,既保证了实时性又保证了较高的准确性。

2、为了实现上述目的,本专利技术采用如下技术方案:

3、一种基于异质模体特征的社交网络用户性别识别方法,包括以下步骤:

4、读取用户的社交网络数据以及个人属性数据并进行预处理;

5、根据所述社交网络数据以及所述个人属性数据提取用户的异质模体特征;

6、构建识别模型,并利用所述异质模体特征对所述识别模型进行训练;

7、利用经过训练的所述识别模型进行后续的社交网络用户性别识别。

8、优选的,提取用户的异质模体特征的具体处理过程包括:

9、从所述社交网络数据中提取出用户的好友属性数据;

10、根据所述好友属性数据构建好友关系网络;

11、从所述好友关系网络提取所述异质模体特征。

12、优选的,从所述好友关系网络提取所述异质模体特征的具体处理过程包括:

13、初始化节点异质模体特征列表和节点储存列表;

14、遍历好友关系网络中的全部节点,以每个节点为父节点,计算该节点所参与的异质模体数量,即为异质模体特征。

15、优选的,利用所述异质模体特征对所述识别模型进行训练的具体处理过程包括:

16、对所述父节点的异质模体特征设置对应的性别标签,组成训练集;

17、利用所述训练集对所述识别模型进行训练,同时计算训练损失;

18、当所述训练损失最小时停止训练。

19、优选的,所述识别模型为xgboost二分类模型。

20、优选的,利用经过训练的所述识别模型进行后续的社交网络用户性别识别的具体处理过程包括:

21、获取待检测社交网络信息,并将所述待检测社交网络信息输入至所述xgboost二分类模型;

22、根据所述xgboost二分类模型的目标函数输出分类概率;

23、根据预设概率阈值对所述分类概率进行判断,实现用户性别识别。

24、本专利技术还提供一种基于异质模体特征的社交网络用户性别识别装置,包括:

25、获取模块,用于读取用户的社交网络数据以及个人属性数据并进行预处理;

26、提取模块,用于根据所述社交网络数据以及所述个人属性数据提取用户的异质模体特征;

27、构建模块,用于构建识别模型,并利用所述异质模体特征对所述识别模型进行训练;

28、识别模块,用于利用经过训练的所述识别模型进行后续的社交网络用户性别识别。

29、本专利技术还提供一种计算机可读存储介质,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如上述中任一项所述的社交网络用户性别识别方法。

30、经由上述的技术方案可知,与现有技术相比,本专利技术公开提供了一种基于异质模体特征的社交网络用户性别识别方法、装置及可存储介质,与链路预测的任务目标不同,本专利技术提供的方法是为了能够识别用户的性别而非预测用户之间是否存在关联关系;本专利技术利用社交网络用户节点的性别信息将原始模体特征细化为异质模体特征。异质模体特征通过有效融入节点性别信息,可以更精细地描述社交关系,表达更为准确的结构信息。最后,为了探究异质模体的稳定性和泛化能力,本专利技术采用不同的训练集与测试集比例,在不同数据条件下与其他算法进行比较,异质模体分类器的性能下降幅度最小且性能始终保持最高。

31、本专利技术提出的异质模体特征能够将图结构特征和节点属性特征有效融合,它通过考虑节点性别信息细化模体特征,有效增强了社交网络信息,更准确地表示社交网络关系,构建更符合实际情况的社交关系模型,从而实现更准确的识别。同时局部的拓扑结构不容易受到宏观环境的影响,所以它可以从有限的数据中准确学习到社交网络结构特征,使其模型具有较强的泛化能力。基于异质模体识别算法通过局部网络结构信息识别用户性别属性的原理,帮助社交网络管理者采用一些针对性手段增加识别难度,同时从异质模体角度出发可以更加深入的挖掘社交网络的局部结构和用户的属性特征。

本文档来自技高网...

【技术保护点】

1.一种基于异质模体特征的社交网络用户性别识别方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于异质模体特征的社交网络用户性别识别方法,其特征在于,利用所述异质模体特征对所述识别模型进行训练的具体处理过程包括:

3.根据权利要求1所述的一种基于异质模体特征的社交网络用户性别识别方法,其特征在于,利用经过训练的所述识别模型进行后续的社交网络用户性别识别的具体处理过程包括:

4.一种利用权利要求1-3任一项所述的一种基于异质模体特征的社交网络用户性别识别方法的识别装置,其特征在于,包括:

5.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如权利要求1至3中任一项所述的社交网络用户性别识别方法。

【技术特征摘要】

1.一种基于异质模体特征的社交网络用户性别识别方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于异质模体特征的社交网络用户性别识别方法,其特征在于,利用所述异质模体特征对所述识别模型进行训练的具体处理过程包括:

3.根据权利要求1所述的一种基于异质模体特征的社交网络用户性别识别方法,其特征在于,利用经过训练的所述识别模型...

【专利技术属性】
技术研发人员:冉义军向宇平许小可
申请(专利权)人:北京师范大学珠海校区
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1