System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术属于社交网络分析领域,具体涉及一种基于话题匹配度的关键元素影响力溯源方法。
技术介绍
1、社交网络中,挖掘热点话题的多类型关键元素(用户、路径、消息)对关键元素影响力分析十分重要。话题传播具有速度快、范围广等特点,由于传播过程中的参与人数众多且各抒己见,因此产生了衍生话题的概念,即在前置话题的传播过程中,演化出的一系列与前置话题相关的话题。随着社交网络的快速发展,社交网络中话题的参与度急剧增长,衍生话题出现的频率也随之变高。衍生话题的出现极易带偏话题的主旋律,因此对衍生话题的研究变得至关重要。
2、社交网络领域中,针对衍生话题关键元素的研究,学者们从话题的相似程度、关键元素的关联性以及衍生话题的关键元素识别等方面进行研究。但是由于衍生话题的特殊性质:会受到前置话题的影响以及“前置-衍生”话题的博弈关系,因此需要使用不同的方法分析。当前学者在衍生话题关键元素影响力方向的研究仍存在一些挑战:
3、1.前置话题与衍生话题的继承关系以及话题文本数据的稀疏性。衍生话题是在前置话题的传播过程中产生的,二者之间有一定的联系。同时,在同一话题内,消息内容较短且繁多,传统的主题模型难以挖掘消息中的主题,增加了提取话题内容的难度。
4、2.衍生话题关键元素之间复杂的关联性。话题传播过程中会涉及到相互影响的消息、路径、用户这些关键元素,在前置话题影响下将衍生话题的多类型关键元素紧密结合起来,并描述它们之间的关联关系,对衍生话题的关键元素影响力分析十分有效。
5、3.多类型关键元素迭代的复杂性。
技术实现思路
1、针对现有技术存在的不足,本专利技术提出了一种基于话题匹配度的关键元素影响力溯源方法,该方法包括:
2、s1:获取社交网络传播数据;
3、s2:根据社交网络传播数据构建话题多维异质网络;根据话题多维异质网络计算用户-路径转移概率矩阵和路径-消息转移概率矩阵;
4、s3:根据社交网络传播数据计算三种关键元素的重要程度;三种关键元素分别为用户、路径和消息;
5、s4:对三种关键元素的重要程度分别进行归一化,得到三种关键元素的第一影响力;
6、s5:根据三种关键元素的重要程度计算三种关键元素的收益,根据三种关键元素的收益计算三种关键元素的第二影响力;
7、s6:根据两种转移概率矩阵、三种关键元素的第一影响力和三种关键元素的第二影响力计算三种关键元素的影响力评分。
8、优选的,构建话题多维异质网络的过程包括:从社交网络传播数据中提取出用户-路径二部图以及消息-路径二部图;根据用户-路径二部图和消息-路径二部图构建“用户-路径-消息”话题多维异质网络。
9、优选的,所述用户-路径转移概率矩阵包括用户到路径的转移概率矩阵和路径到用户的转移概率矩阵,所述路径-消息转移概率矩阵包括路径到消息的转移概率矩阵和消息到路径的转移概率矩阵。
10、优选的,步骤s3中,计算三种关键元素的重要程度的公式分别为:
11、
12、
13、
14、其中,表示在t时间段内路径i的重要程度,表示在t时间段内路径j中参与用户总数量;表示在t时间段内用户j的重要程度,表示用户j的粉丝数量,表示用户发表的消息数量,表示用户j发表的消息主题词集与用户j关注的用户发表的消息主题词集的话题匹配度;表示在t时间段内消息k的重要程度,nk表示消息k的转发量,表示消息k的主题词集zk与其前置话题的主题词集的话题匹配度;c1、c2和c3分别表示路径权重、用户权重和消息权重。
15、进一步的,计算话题匹配度的公式为:
16、
17、其中,wk1表示中词语k的权值,v1k表示中词语k对应的词向量,wk2表示中词语k的权值,v2k表示中词语k对应的词向量,n表示抽取的词数量。
18、优选的,计算三种关键元素的收益的公式分别为:
19、
20、
21、
22、其中,表示在t时间段内路径i的收益、表示在t时间段内用户j的收益,表示在t时间段内消息k的收益;表示在t时间段内路径i的重要程度,表示在t时间段内用户j的重要程度,表示在t时间段内消息k的重要程度;p1、p2和p3分别表示路径、用户和消息的比例系数。
23、优选的,计算三种关键元素的第二影响力的公式分别为:
24、
25、
26、
27、其中,表示在t时间段内用户j的第二影响力,表示在t时间段内路径i的第二影响力,表示在t时间段内消息k的第二影响力;表示在t时间段内路径i的收益、表示在t时间段内用户j的收益,表示在t时间段内消息k的收益。
28、优选的,计算三种关键元素的影响力评分的公式为:
29、计算影响力正向评分:
30、
31、
32、计算影响力反向评分:
33、
34、
35、其中,x′、y′、z′表示当前的用户、路径、消息的得分值,x、y、z表示上一次迭代得到的用户、路径、消息的得分值,在第一次正向评分时x=x0、y=y0、z=z0,x0、y0和z0分别表示用户、路径和消息的第一影响力矩阵;y″表示更新的用于下一次迭代的路径得分值;ai,j表示路径-用户转移概率矩阵,bi,k表示路径-消息转移概率矩阵,aj,i表示用户-路径转移概率矩阵,bk,i表示消息-路径转移概率矩阵;表示在t时间段内用户j的第二影响力,表示在t时间段内路径i的第二影响力,表示在t时间段内消息k的第二影响力。
36、本专利技术的有益效果为:本专利技术基于btm模型的短文本话题提取方法,针对话题中的消息内容,提取信息生成主题词向量,挖掘消息之间隐藏的语义关系。同时,引用聚类算法融合消息的主题来生成话题的主题;构建多维异质网络表示话题传播中用户、路径、消息三类关键元素之间的潜在关联关系,同时引入前置话题的影响,对关键元素影响力初始化,提高发现关键元素的准确性;借鉴演化博弈策略,利用各关键元素的初始影响力向量和概率转移矩阵,在多维异质网络上对衍生话题关键元素进行迭代打分,识别出关键元素。本专利技术不仅可以有效提取消息的主题,而且能够准确识别当前社交网络中衍生话题的关键元素,为衍生话题的研究提供了一定的参考价值,可以及早对网络中衍生话题的发展方向进行把控,具有良好的应用前景。
本文档来自技高网...【技术保护点】
1.一种基于话题匹配度的关键元素影响力溯源方法,其特征在于,包括:
2.根据权利要求1所述的一种基于话题匹配度的关键元素影响力溯源方法,其特征在于,构建话题多维异质网络的过程包括:从社交网络传播数据中提取出用户-路径二部图以及消息-路径二部图;根据用户-路径二部图和消息-路径二部图构建“用户-路径-消息”话题多维异质网络。
3.根据权利要求1所述的一种基于话题匹配度的关键元素影响力溯源方法,其特征在于,所述用户-路径转移概率矩阵包括用户到路径的转移概率矩阵和路径到用户的转移概率矩阵,所述路径-消息转移概率矩阵包括路径到消息的转移概率矩阵和消息到路径的转移概率矩阵。
4.根据权利要求1所述的一种基于话题匹配度的关键元素影响力溯源方法,其特征在于,步骤S3中,计算三种关键元素的重要程度的公式分别为:
5.根据权利要求4所述的一种基于话题匹配度的关键元素影响力溯源方法,其特征在于,计算话题匹配度的公式为:
6.根据权利要求1所述的一种基于话题匹配度的关键元素影响力溯源方法,其特征在于,计算三种关键元素的收益的公式分别为:
>7.根据权利要求1所述的一种基于话题匹配度的关键元素影响力溯源方法,其特征在于,计算三种关键元素的第二影响力的公式分别为:
8.根据权利要求1所述的一种基于话题匹配度的关键元素影响力溯源方法,其特征在于,计算三种关键元素的影响力评分的公式为:
...【技术特征摘要】
1.一种基于话题匹配度的关键元素影响力溯源方法,其特征在于,包括:
2.根据权利要求1所述的一种基于话题匹配度的关键元素影响力溯源方法,其特征在于,构建话题多维异质网络的过程包括:从社交网络传播数据中提取出用户-路径二部图以及消息-路径二部图;根据用户-路径二部图和消息-路径二部图构建“用户-路径-消息”话题多维异质网络。
3.根据权利要求1所述的一种基于话题匹配度的关键元素影响力溯源方法,其特征在于,所述用户-路径转移概率矩阵包括用户到路径的转移概率矩阵和路径到用户的转移概率矩阵,所述路径-消息转移概率矩阵包括路径到消息的转移概率矩阵和消息到路径的转移概率矩阵。
4.根据权利要求1所...
【专利技术属性】
技术研发人员:葛君伟,刘琴,肖云鹏,周旻果,李暾,王蓉,郭瑞乾,贾朝龙,
申请(专利权)人:重庆邮电大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。