基于微博大数据的复杂网络舆情节点重要度排序方法技术

技术编号:29673919 阅读:17 留言:0更新日期:2021-08-13 21:55
本发明专利技术提供一种基于微博大数据的复杂网络舆情节点重要度排序方法,包括步骤:获取节点的邻接点个数,从而获得节点的Q值;通过每个节点的Q值得到每个节点的局部集中度,获取两个节点之间的边权重;根据边权重得到节点的权重向量,通过根据节点关联边得到拓扑结构;基于k核分解法,求出k核迭代次数,然后对节点的度和k核迭代次数进行归一化处理,创建矩阵;根据矩阵获取指标熵值,根据熵值得到度和k核迭代次数的权重;根据度和k核迭代次数的权重获得每个节点的权重因子;根据每个节点的权重因子得到综合因子,进行重要度排序。该方法能确认网络中节点的重要关系,从而提高网络的布局效率。

【技术实现步骤摘要】
基于微博大数据的复杂网络舆情节点重要度排序方法
本专利技术属于计算机
,具体涉及一种基于微博大数据的复杂网络舆情节点重要度排序方法。
技术介绍
复杂网络由大量节点组成,节点之间通过边进行交互,节点之间存在许多复杂关系,任意节点的删除和添加会影响局部甚至全局的网络连通性和节点的负载,由此,在复杂网络领域中,如何确认节点的重要关系,从而提高网络的布局效率尤为重要。
技术实现思路
有鉴于此,本专利技术的目的在于提供一种基于微博大数据的复杂网络舆情节点重要度排序方法,该方法能计算复杂网络中的节点重要度。为实现上述目的,本专利技术的技术方案为:一种基于微博大数据的复杂网络舆情节点重要度排序方法,包括以下步骤:获取复杂网络中各节点的邻接点个数,从而获得每个节点的Q值;通过每个节点的Q值得到每个节点的局部集中度,根据复杂网络中节点依靠边进行连接获取两个节点之间的边权重:其中,i、j分别为两个节点,CL为局部集中度;根据边权重得到节点的权重向量,通过根据节点关联边得到拓扑结构;基于k核分解法,求出k核迭代次数,然后对节点的度和k核迭代次数进行归一化处理,并对归一后的值创建矩阵;根据所述矩阵获取指标的熵值,然后根据熵值得到度和k核迭代次数的权重:其中,q=1、2,为熵值;定义权重因子,根据所述度和k核迭代次数的权重获得每个节点的权重因子:其中,和分别表示节点的度和k核迭代次数,、分别表示度和K核迭代次数对节点重要性的贡献权重;根据每个节点的权重因子得到综合因子;利用节点的度中心性、K-shell值、接近中心性、介数中心性、聚类系数、离心中心性、最大连通性、收缩节点加上综合因子和节点的权重向量进行高相关滤波处理后构建矩阵;通过主成分析法和灰色关联分析法对矩阵进行处理得到节点的重要度排序;其中,所述综合因子为:。为节点i的相邻节点集,为节点j的的权重因子;进一步地,所述Q值通过以下方式得到:其中,为节点u的相邻节点集,N(j)为节点j的邻接点的个数。度中心性计算方法为:为节点i的邻居节点的集合;K-shell计算方法为:其中,K为节点的K核层数。接近中心性计算方法为:j表示除节点i之外的其他节点,表示两个节点之间的距离;介数中心性计算方法为:其中,s、t表示任意的两个节点,N表示节点的总数,表示s、t两个节点之间最短路径经过节点i的数量;聚类系数公式为:其中,表示与i相邻的所有节点,为节点i,j之间的链接数,表示可能存在的最大链接数;离心中心性公式为:其中,j表示除节点i之外的所有节点表示节点i,j之间的最短距离,最短距离中的最大值。最大连通性公式为:其中,N表示节点的总数,表示删除某个节点后的所有子图中最大节点数的子图的节点个数。收缩节点公式为:其中,、分别表示节点与其邻节点收缩前后的网络凝聚度。与现有技术相比,本专利技术具有如下优点:本专利技术公开一种基于微博大数据的复杂网络舆情节点重要度排序方法,该方法利用节点的邻接点,提出了边的权重,局部集中度,节点的拓扑结构等相关概念,得到节点的权重向量。并加入了熵值,通过节点的度和K核迭代次数得到权重,通过权重公式得到权重因子,并且使用了主成分分析法来对数据进行降维处理、灰色关联分析法进行关联程度处理。最后求出衡量节点重要度的指标:关联度。关联度值越大节点越重要,最后对节点进行排序。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍。显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。图1为本专利技术中复杂网络节点结构图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。所举实施例是为了更好地对本专利技术进行说明,但并不是本专利技术的内容仅局限于所举实施例。所以熟悉本领域的技术人员根据上述
技术实现思路
对实施方案进行非本质的改进和调整,仍属于本专利技术的保护范围。本实施例中公开一种基于微博大数据的复杂网络舆情节点重要度排序方法,包括以下步骤:S1:获取复杂网络中各节点的邻接点个数,从而获得每个节点的邻接点个数之和;本实施例中,是基于微博大数据的背景,可通过新浪微博的API可以获得某个热门微博的评论情况,可以通过这个评论,将评论过的用户联系起来,形成数据集,组成复杂网络;优选地,邻接点个数之和Q值通过以下方式得到:其中,为节点u的相邻节点集,N(j)为节点j的邻接点的个数;参考图1,以图1中的1、10节点为例N(1)=1,N(10)=6,因为与节点1相邻的节点为6且只有一个邻接点,而节点10有7、8、11、12、13、14六个邻接点,通过上式可以得到节点的Q值:节点1的Q值为:Q(1)=N(6)=3,节点10的Q值为:Q(10)=N(7)+N(8)+N(11)+N(12)+N(13)+N(14)=3+3+3+4+4+1+1=19;S2:通过每个节点的Q值得到每个节点的局部集中度,根据复杂网络中节点依靠边进行连接获取两个节点之间的边权重;本实施例中,局部集中度定义为:其中,为节点i的邻接点的集合;同样的,按照节点1和节点10,得到:CL(1)=Q(6)=N(1)+N(4)+N(5)+N(7)=1+3+1+3=8CL(10)=Q(7)+Q(8)+Q(11)+Q(12)+Q(13)+Q(14)=N(6)+N(8)+N(10)+N(7)+N(9)+N(10)+N(10)+N(12)+N(13)+N(10)+N(11)+N(13)+N(15)+N(10)+N(11)+N(12)+N(15)+N(10)=4+3+6+3+1+6+6+4+4+6+3+4+3+6+3+4+3+6=75;在复杂网络中,重要节点之间依靠边进行连接,所以网络中边越重要,对应的节点也就越重要,所以得到边的权重:其中,i、j分别为两个节点,CL为局部集中度;S3:根据边权重得到节点的权重向量,通过根据节点关联边得到拓扑结构;本步骤中,连接节点的边越重要,对应的节点也就越重要,节点的权重向量就可以得:可以根据节本文档来自技高网
...

【技术保护点】
1.一种基于微博大数据的复杂网络舆情节点重要度排序方法,其特征在于,包括以下步骤:/n获取复杂网络中各节点的邻接点个数,从而获得每个节点的邻接点个数之和Q值;/n通过所述每个节点的邻接点个数之和Q值得到每个节点的局部集中度,根据复杂网络中节点依靠边进行连接获取两个节点之间的边权重;/n根据边权重得到节点的权重向量,通过根据节点关联边得到拓扑结构;基于k核分解法,求出k核迭代次数,然后对节点的度和k核迭代次数进行归一化处理,并对归一后的值创建矩阵;/n根据所述矩阵获取指标的熵值,然后根据熵值得到度和k核迭代次数的权重:/n定义权重因子,根据所述度和k核迭代次数的权重获得每个节点的权重因子;/n根据每个节点的权重因子得到综合因子;/n利用节点的度中心性、K-shell值、接近中心性、介数中心性、聚类系数、离心中心性、最大连通性、收缩节点加上综合因子和节点的权重向量进行高相关滤波处理后构建矩阵;/n通过主成分析法和灰色关联分析法对矩阵进行处理得到节点的重要度排序。/n

【技术特征摘要】
1.一种基于微博大数据的复杂网络舆情节点重要度排序方法,其特征在于,包括以下步骤:
获取复杂网络中各节点的邻接点个数,从而获得每个节点的邻接点个数之和Q值;
通过所述每个节点的邻接点个数之和Q值得到每个节点的局部集中度,根据复杂网络中节点依靠边进行连接获取两个节点之间的边权重;
根据边权重得到节点的权重向量,通过根据节点关联边得到拓扑结构;基于k核分解法,求出k核迭代次数,然后对节点的度和k核迭代次数进行归一化处理,并对归一后的值创建矩阵;
根据所述矩阵获取指标的熵值,然后根据熵值得到度和k核迭代次数的权重:
定义权重因子,根据所述度和k核迭代次数的权重获得每个节点的权重因子;
根据每个节点的权重因子得到综合因子;
利用节点的度中心性、K-shell值、接近中心性、介数中心性、聚类系数、离心中心性、最大连通性、收缩节点加上综合因子和节点的权重向量进行高相关滤波处理后构建矩阵;
通过主成分析法和灰色关联分析法对矩阵进行处理得到节点的重要度排序。


2.根据权利要求1所述的方法,其特征在于:所述每个节点的邻接点个数之和Q值计算
方法为:,其中,为所述每个节点的邻接点
个数之和Q值,为节点u的相邻节点集,为节点u的相邻节点集
中的每一个节点,为节点j的邻接点的个数。


3.根据权利要求1所述的方法,其特征在于:所述局部集中度的计算方法为:,其中,为节点i的局部集中度,为节点i的邻接点的集合,为所述每个节点的邻接点个数之和Q
值。


4.根据权利要求1所述的方法,其特征在于:所述两个节点之间的边权重计算方法为:,其中,为节点i、j之间的边权重,i、j分别
为两个节点,为所述局部集中度。


5.根据权利要求1所述的方法,其特征在于:根据边权重得到节点的权重向量,通过根据节点关联边得到拓扑结构包括步骤:从局部关系得到了权重向量W,然后做权重向量中的每一个值除以最大值的处理,最后从全局关系通过融合度与k核迭代次数综合因子。


6.根据权利要求5所述的方法,其特征在于:所述权重向量的计算方法为:,其中为节点i的权重向量,为与节点i相邻的节点
集,为节点集中的每一个节点,为节点i、j...

【专利技术属性】
技术研发人员:文立玉曾昭福罗飞舒红平郭本俊曹亮刘魁
申请(专利权)人:成都信息工程大学
类型:发明
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1