一种社交群体的划分方法、划分系统及相关装置制造方法及图纸

技术编号:28980525 阅读:11 留言:0更新日期:2021-06-23 09:27
本申请提供一种社交群体的划分方法,包括:获取社交数据和聚类要求,并确定所述社交数据对应的网络结构和节点信息;根据所述网络结构和所述节点信息进行随机游走,得到社交网络图;利用预设聚类方法对社交网络图中的节点进行二分聚类,得到满足所述聚类要求的社交群体。本申请首先采用简单的随机游走机制,以所有节点作为起始节点进行随机游走,形成新的社交网络图,在一定程度上增加了社交网络可信度,同时有利于划分出影响力较强的群体。本申请简单方便,易于通过软件方式进行模拟并实现不同社交群体的划分,且符合现实生活的社交网络结构。本申请还提供一种社交群体的划分系统、计算机可读存储介质和电子设备,具有上述有益效果。

【技术实现步骤摘要】
一种社交群体的划分方法、划分系统及相关装置
本申请涉及数据处理领域,特别涉及一种社交群体的划分方法、划分系统及相关装置。
技术介绍
随着互联网技术的发展,在线社交网络呈爆炸式发展,人们的生活已经离不开在线社交网络,也时刻被它影响和改变着。深入研究影响力的传播模式有助于理解人类群体和个体的行为,从而对人们的行为做出预期,为政府、企业等各部门的决策提供可靠的依据和建议。社交群体中的聚类分析是一个将数据样本划分为由相似对象组成的分组的过程。每一个组称为一个簇,每个簇中的数据对象的相似度大,而不同簇中的对象相似度小。针对实际情况下的社交网络,社交网络聚类可以按照实际情况下网络中节点的具体位置信息将节点分到不同的簇,展现实际情况下社交网络结构中隐藏的不同组织集群,从而改进对社交网络数据的挖掘分析能力。传统的社交网络划分方法仅仅在一定程度上描述了社交网络中信息的传播和扩散过程,但由于缺乏前期预处理,对于影响力较小的传播路径仍进行了计算,影响了不同社交网络划分的精准性,导致聚类效果不显著。
技术实现思路
本申请的目的是提供一种社交群体的划分方法、划分系统、计算机可读存储介质和电子设备,通过对随机游走得到的社交网络图进行聚类,提高了社交网络可信度。为解决上述技术问题,本申请提供一种社交群体的划分方法,具体技术方案如下:获取社交数据和聚类要求,并确定所述社交数据对应的网络结构和节点信息;根据所述网络结构和所述节点信息进行随机游走,得到社交网络图;利用预设聚类方法对社交网络图中的节点进行二分聚类,得到满足所述聚类要求的社交群体。可选的,根据所述网络结构和所述节点信息进行随机游走,得到社交网络图包括:从所述网络结构中的每个节点出发,进行预设次数和预设步数的随机游走,并记录随机游走的游走路径;利用Apriori算法选取所述游走路径中的频繁项集,得到所述社交网络图。可选的,从所述网络结构中的每个节点出发,进行预设次数和预设步数的随机游走之前,还包括:利用概率转移矩阵确定节点的随机游走概率;所述概率转移矩阵为Wij为节点i和节点j之间连边的权重,Wig为网络权重矩阵的第i行总和;则从所述网络结构中的每个节点出发,进行预设次数和预设步数的随机游走包括:根据所述随机游走概率从所述网络结构中的每个节点出发,进行预设次数和预设步数的随机游走。可选的,利用概率转移矩阵确定节点的随机游走概率之前,还包括:根据所述节点信息和网络结构确定所述社交网络图对应的所述网络权重矩阵。可选的,利用预设聚类方法对社交网络图中的节点进行二分聚类包括:利用Kernighan-Lin算法或谱平分法对社交网络图中的节点进行二分聚类。可选的,若所述预设聚类方法Kernighan-Lin算法,利用预设聚类方法对社交网络图中的节点进行二分聚类,得到满足所述聚类要求的社交群体包括:将所述社交网络图随机划分为两个子图,从两个所述子图中各取一个节点进行交换,计算节点交换前后的增益函数的差值;所述增益函数为两个所述子图内的边数与两个子图之间边数的差值;将所述增益函数的差值最大时两个节点进行交换,且两个子图中的每个节点在每次迭代过程中最多交换一次;对剩余节点重复进行交换,直至所述增益函数的差值小于零或存在子图中的所有节点均被交换一次,得到第一次迭代后的两个子图;判断当前两个子图是否满足所述聚类要求;若是,将当前两个子图作为满足所述聚类要求的社交群体;若否,重复迭代,直至得到满足所述聚类要求的两个子图。本申请还提供一种社交群体的划分系统,包括:数据获取模块,用于获取社交数据和聚类要求,并确定所述社交数据对应的网络结构和节点信息;社交网络确认模块,用于根据所述网络结构和所述节点信息进行随机游走,得到社交网络图;聚类模块,用于利用预设聚类方法对社交网络图中的节点进行二分聚类,得到满足所述聚类要求的社交群体。可选的,社交网络确认模块包括:游走单元,用于从所述网络结构中的每个节点出发,进行预设次数和预设步数的随机游走,并记录随机游走的游走路径;社交网络生成单元,用于利用Apriori算法选取所述游走路径中的频繁项集,得到所述社交网络图。本申请还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的方法的步骤。本申请还提供一种电子设备,包括存储器和处理器,所述存储器中存有计算机程序,所述处理器调用所述存储器中的计算机程序时实现如上所述的方法的步骤。本申请提供一种社交群体的划分方法,包括:获取社交数据和聚类要求,并确定所述社交数据对应的网络结构和节点信息;根据所述网络结构和所述节点信息进行随机游走,得到社交网络图;利用预设聚类方法对社交网络图中的节点进行二分聚类,得到满足所述聚类要求的社交群体。本申请首先采用简单的随机游走机制,以所有节点作为起始节点进行随机游走,形成新的社交网络图,在一定程度上增加了社交网络可信度,同时有利于划分出影响力较强的群体。本申请简单方便,在当前大数据技术的支撑下,易于通过软件方式进行模拟并实现不同社交群体的划分,且符合现实生活的社交网络结构,有一定的现实意义。本申请还提供一种社交群体的划分系统、计算机可读存储介质和电子设备,具有上述有益效果,此处不再赘述。附图说明为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。图1为本申请实施例所提供的一种社交群体的划分方法的流程图;图2为本申请实施例所提供的一种社交群体的划分系统结构示意图。具体实施方式为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。请参考图1,图1为本申请实施例所提供的一种社交群体的划分方法的流程图,该方法包括:S101:获取社交数据和聚类要求,并确定所述社交数据对应的网络结构和节点信息;本步骤旨在获取社交数据和聚类要求,该社交数据指原始的社交网络数据,其可以包含用户信息,以及与用户存在关联的通信信息,其可以以通信记录的形式呈现。而通信信息通常又存在对应的通信目标,以此形成用户与用户之间的通信,在社交网络中表明用户与用户之间存在连接。需要注意的是,用户与用户之间的通信具有方向性,即用户A对用户B的通信,与用户B对用户A的通信过程为两个通信过程,各自包含通信频率等通信属性信息本文档来自技高网...

【技术保护点】
1.一种社交群体的划分方法,其特征在于,包括:/n获取社交数据和聚类要求,并确定所述社交数据对应的网络结构和节点信息;/n根据所述网络结构和所述节点信息进行随机游走,得到社交网络图;/n利用预设聚类方法对社交网络图中的节点进行二分聚类,得到满足所述聚类要求的社交群体。/n

【技术特征摘要】
1.一种社交群体的划分方法,其特征在于,包括:
获取社交数据和聚类要求,并确定所述社交数据对应的网络结构和节点信息;
根据所述网络结构和所述节点信息进行随机游走,得到社交网络图;
利用预设聚类方法对社交网络图中的节点进行二分聚类,得到满足所述聚类要求的社交群体。


2.根据权利要求1所述的社交群体的划分方法,其特征在于,根据所述网络结构和所述节点信息进行随机游走,得到社交网络图包括:
从所述网络结构中的每个节点出发,进行预设次数和预设步数的随机游走,并记录随机游走的游走路径;
利用Apriori算法选取所述游走路径中的频繁项集,得到所述社交网络图。


3.根据权利要求2所述的社交群体的划分方法,其特征在于,从所述网络结构中的每个节点出发,进行预设次数和预设步数的随机游走之前,还包括:
利用概率转移矩阵确定节点的随机游走概率;
所述概率转移矩阵为Wij为节点i和节点j之间连边的权重,Wig为网络权重矩阵的第i行总和;
则从所述网络结构中的每个节点出发,进行预设次数和预设步数的随机游走包括:
根据所述随机游走概率从所述网络结构中的每个节点出发,进行预设次数和预设步数的随机游走。


4.根据权利要求3所述的社交群体的划分方法,其特征在于,利用概率转移矩阵确定节点的随机游走概率之前,还包括:
根据所述节点信息和网络结构确定所述社交网络图对应的所述网络权重矩阵。


5.根据权利要求1所述的社交群体的划分方法,其特征在于,利用预设聚类方法对社交网络图中的节点进行二分聚类包括:
利用Kernighan-Lin算法或谱平分法对社交网络图中的节点进行二分聚类。


6.根据权利要求1所述的社交群体的划分方法,其特征在于,若所述预设聚类方法Kernighan-Lin算法,利用预设聚类方法对社交网络图中的...

【专利技术属性】
技术研发人员:张灿刘伟牟奇
申请(专利权)人:山东英信计算机技术有限公司
类型:发明
国别省市:山东;37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1