一种基于社交网络用户行为的用户影响力分析方法技术

技术编号:10145783 阅读:200 留言:0更新日期:2014-06-30 15:46
本发明专利技术提出了一种基于社交网络用户行为的用户影响力分析方法,涉及信息技术领域。本发明专利技术可以通过社交网络的数据集,从用户关系和用户活动两个方法,综合分析出影响力强的用户。针对于现有的基于社交网络分析影响力的方法,与基于PageRank的模型相比,本发明专利技术涉及更多数据关系,并且在影响力的扩散与初值有关,扩散过程中受到用户评论数目和内容的影响,更为合理。与基于IDM的模型相比,本发明专利技术对于用户之间的关系利用更加充分,不存在IDM模型中的断层现象。与传统的基于用户行为模型相比,本发明专利技术类比了人与人线下关系的模式,这样更加符合社交网络中将人与人线下关系移动的线上的初衷。

【技术实现步骤摘要】
一种基于社交网络用户行为的用户影响力分析方法
本专利技术涉及信息
,特别是涉及一种基于社交网络用户行为的用户影响力分析方法。
技术介绍
随着互联网的发展,用户已经从一个被动的通过浏览器从各大网站获取信息阅读信息的浏览者,转向了可以主动参与到互联网的发展之中的编辑者,使用者和传播者。在web2.0时代,用户拥有更多的话语权和主动权,可以直接参与和发布内容,极大加强了用户间的交流性。社交网络作为这个时代一个突出的产物,其具有用户规模大,话题种类多,信息传递迅速和影响范围广等特点。社交网络的迅速发展已经成为了一个新型了信息载体和转播媒介,对于日常工作和生活产生的影响也越来越大。在信息传播的过程中,意见领袖作为一种重要力量,在社会舆论的形成过程中发挥着不可忽视的作用,局部意见在意见领袖的引导下演化为舆论,影响力直接渗透到现实社会。为了识别出社交网路中的意见领袖,需要分析社交网路中用户的影响力,找出影响力强的用户。现有的基于社交网络分析影响力的方法分为三大类。第一类是基于PageRank网页排名算法。基于PageRank的算法,多为对社交网络中的某一个因素,套用PageRank的思想,计算出用户影响力。其不足是所用的因素比较单一,没有针对内容分析。第二类基于影响力扩散模型(IDM),IDM模型主要是针对话题,根据帖子上下文词语出现的频率关系,得到话题的影响力。通过计算用户所有话题得到用户的影响力。这种方法的不足是用户之间的联系不太紧密。第三类是传统的基于用户行为模型。该模型通过统计用户的各种行为,例如跟随、转推、提及,来计算用户的影响力。这种方法比较简单,但是各种行为的归一化系数不好确定。
技术实现思路
本专利技术提供了一种基于社交网络用户行为的用户影响力分析方法。这个方法可以通过社交网络的数据集,从用户关系和用户活动两种方法,综合分析出影响力强的用户,包括如下步骤:步骤1:统计分析相关数据信息在社交网络中,数据量非常庞大,为了从庞大的数据量中分析用户影响力首先需要统计以下信息。第一,统计分析社交网络中用户之间的关注和被关注关系。第二,统计分析用户之间的评论数目和评论内容。步骤2:用户关系影响力计算用户关系影响力是实现过程借鉴了PageRank网页排名算法的思想,以用户之间的关注情况类比PageRank中的链接情况。通过公式(1)计算出用户关系影响力。由于用户关系影响力算法是一收敛算法,所以其结果只与用户之间相互关注的关系有关,与用户初始值无关。公式中R(i)表示i用户的用户关系影响力,R(j)表示j用户的影响力,L(j)表示j用户的关注数目,B(i)表示关注i用户的用户集。步骤3:用户活动影响力计算针对于社交网络,如果用户A对用户B发表了某些评论,那么说明用户B的言论影响到了用户A,从而用户A可以将B言论中影响到他的部分继续影响其他用户,所以用户B应该获得用户A的一部分影响力。具体用户B获得用户A多少的影响力取决于三点。第一点,用户A受到过多少用户言论的影响。第二点,用户A在受到所有言论的影响中B占有多大的比重。第三点,用户A受到用户B言论影响的程度。针对以上三点,用户活动影响力可以通过公式(2)表示在公式(2)中Ak+1(i)表示经过k+1次衰减传递后i用户得到的影响力。B(i)表示关注i用户的用户集。表示j用户评论i用户的数目在j用评论所有用户数目的比重。表示j用户对i用户的评论中,j用户和i用户同时出现的关键词数比i用于发表内容的关键词数。d表示一个影响力衰减因子,为了使该公式与初值有关,要保证影响力的传递是递减的,可以保证一定的递减性,但是也有可能存在为1的情况,所以加入了衰减因子d,其可以设为小于1的固定值。由于该公式的逐步递减并且趋于0,所以当Ak+1(i)的值小于首次计算活动影响力初值的百分之一时,其值可以忽略不计,所以k值有限。步骤4:用户影响力计算公式(2)中计算出的第k次用户活动影响力,是由于k-1次用户活动影响力再传递一次产生的结果。所以通过累加第3步中所有用户活动影响力的结果,计算得到用户的影响力。该过程可以通过公式(3)表示。在公式(3)中A(i)表示i用户最终的影响力。Ak(i)表示i用户经过第k次衰减传递后的影响力。本专利技术与现有技术相比,具有以下明显的优势和有益效果:针对于现有的基于社交网络分析影响力的方法,本专利技术具有一定的优势。与基于PageRank的模型相比,本专利技术涉及更多数据关系。并且在影响力的扩散与初值有关,扩散过程中受到用户评论数目和内容的影响,更为合理。与基于IDM的模型相比,本专利技术对于用户之间的关系利用更加充分,不存在IDM模型中的断层现象。与传统的基于用户行为模型相比,本专利技术类比了人与人线下关系的模式,这样更加符合社交网络中将人与人线下关系移动的线上的初衷。附图说明图1用户影响力流程图;图2用户关系影响力传递示例;图3用户活动影响力传递示例。具体实施方式以下结合说明书附图和具体实施方式对本专利技术的方法做进一步详细说明。步骤1:用户关系影响力计算如图2所示,将所有用户的关系影响力初值设置为1。用户A关注了用户C和用户D。用户A将自己的用户关系影响力平分给用户C和用户D。用户B关注了用户C和另外两个用户。用户B将自己的用户关系影响力平分给用户D和两外两个用户。用户C的用户关系影响力是0.83,分别从用户A和用户B处得来。用户D的用户关系影响力是0.5,从用户A处得来。步骤2:用户活动影响力计算如图3所示,用户A通过用户关系影响计算得来的影响力是4,他在一定时间段内评论过用户C和用户D。其中用户C评论了2条,用户D评论了6条,即用户C占用户A所有评论的四分之一,用户D站用户A所有评论的四分之三。所以用户活动影响力传递时,将用户A四分之一的影响力传递给了用户C,将用户A四分之三的影响力传递给了用户D。用户B同理,将三分之二的影响力传递给了用户C,三分之一的影响力分别传给了另外两个用户。用户C从用户A处得到了1的影响力,从用户B处得到了2的影响力。考虑到影响力的衰减效果,用户C发表的内容有6个关键词语。用户A评论用户C这条内容时,只涉及了其中的2个关键词语。用户B评论用户C这条内容时,涉及了3个关键词语。所以用户C实际得到的影响力为用户A的1*1/6加上用户B的2*3/6。为了确保递减性,此时还要乘以递减因子(此例中为0.8)。步骤3:用户影响力计算由于每次计算用户都会得到由其他用户传递过来的影响力,而这些影响力并没有参与上一次的传递运算。所以此过程需要循环算下去,直到传递的影响力小于首次计算活动影响力初值的百分之一(由于递减性趋于0的性质,可以在有限计算次数时可达到该值)。通过500次迭代用户活动影响力,最终得到用户行为影响力。最后应说明的是:以上示例仅用以说明本专利技术而并非限制本专利技术所描述的技术方案;因此,尽管本说明书参照上述的示例对本专利技术已进行了详细的说明,但是本领域的普通技术人员应当理解,仍然可以对本专利技术进行修改或等同替换;而一切不脱离专利技术的精神和范围的技术方案及其改进,其均应涵盖在本专利技术的权利要求范围当中。本文档来自技高网
...
一种基于社交网络用户行为的用户影响力分析方法

【技术保护点】
一种基于社交网络用户行为的用户影响力分析方法,其特征在于包括如下步骤:步骤1:统计分析社交网络中用户之间的关注和被关注关系及评论数目和评论内容;步骤2:设置用户关系影响力初值为1,通过计算N次用户关系影响力,直到用户关系影响力趋于平稳,两次相邻计算的结果差小于结果值的百分之一,用户关系影响力计算方法如下:R(i)=Σj∈B(i)R(j)L(j)]]>R(i)表示i用户的用户关系影响力,R(j)表示j用户的影响力,L(j)表示j用户的关注数目,B(i)表示关注i用户的用户集;步骤3:统计和分析用户之间的评论条数及内容,并设用户活动影响力初值为用户关系影响力结果,计算N次用户活动影响力,直到某次的计算结果小于首次计算活动影响力初值的百分之一,用户活动影响力计算方法如下:Ak+1(i)=Σj∈B(i)Ak(j)*L(i)ΣL*c(j)c(i)*d]]>Ak+1(i)表示经过k+1次衰减传递后i用户得到的影响力,B(i)表示关注i用户的用户集,表示j用户评论i用户的数目在j用评论所有用户数目的比重,表示j用户对i用户的评论中,j用户和i用户同时出现的关键词数比i用于发表内容的关键词数,d表示一个影响力衰减因子,为了使该公式与初值有关,要保证影响力的传递是递减的,可以保证一定的递减性,但是也有可能存在为1的情况,所以加入了衰减因子d,其可以设为小于1的固定值;步骤4:累加所有活动影响力,得到最终的用户影响力,计算方法如下:A(i)=Σk=1nAk(i)]]>A(i)表示i用户最终的影响力,Ak(i)表示i用户经过第k次衰减传递后的影响力,通过公式(2)和公式(3)可以计算出用户活动的影响力。...

【技术特征摘要】
1.一种基于社交网络用户行为的用户影响力分析方法,其特征在于包括如下步骤:步骤1:统计分析社交网络中用户之间的关注和被关注关系及评论数目和评论内容;步骤2:设置用户关系影响力初值为1,通过计算N次用户关系影响力,直到用户关系影响力趋于平稳,两次相邻计算的结果差小于结果值的百分之一,用户关系影响力计算方法如下:R(i)表示i用户的用户关系影响力,R(j)表示j用户的影响力,L(j)表示j用户的关注数目,B(i)表示关注i用户的用户集;步骤3:统计和分析用户之间的评论条数及内容,并设用户活动影响力初值为用户关系影响力结果,计算N次用户活动影响力,直到某次的计算结果小于首次计算活动影响力初值的百分之一,用户活动影响力计算方法如下:

【专利技术属性】
技术研发人员:姜伟高梦迪张建标赖英旭李健庄俊玺张世翔
申请(专利权)人:北京工业大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1