一种多源异构在线社会网络中网络主体之间社会关系的预测方法与系统技术方案

技术编号:11239201 阅读:76 留言:0更新日期:2015-04-01 12:40
本发明专利技术的主要工作是基于多源异构网络推断主体(用户)之间的社会关系(包括同类型之间或不同类型之间的主体关系,本发明专利技术中只以用户为例)的方法,异构网络是指网络中主体类型多种或者主体之间的关系类型多种,关系可以分为好友和其他两种。主要内容包括在两个(例如Twitter网络、通讯网络)异构网络中,两个网络的主体类型都包含有用户,但不同网络中主体之间的关系链接类型是不同的在Twitter网络中用户之间的关系是关注、被关注两种,在通讯网中关系类型为好友和其他两种等。要推断不同网络主体之间的社会关系必须要通过两个网络之间通过重叠用户关联起来,即部分用户同时存在于两个网络中。

【技术实现步骤摘要】

本专利技术属于网络应用
,更具体地,涉及一种多源异构网络中社会关系的预测方法与系统。
技术介绍
随着互联网的兴起,越来越多的人在使用网络。网络给人们带来了各种各样的方便,网络资源无奇不有,网络内容无所不包。研究表明,截止2011年12月31日,全球共有22.672亿网络用户,全球网络普及率为32.7%。在2011年3月,Internet WorldStats公布的全球网络用户数为20.95亿,9个月时间内全球网络用户增加了1.7222亿。按照这个速度计算,截止目前全球网民数量已超过23亿。平均每秒新增约8个网络用户,可见现在使用网络的人群数量是非常庞大的。随着互联网的普及,网民越来越多,社会网络普及程度越来越高。社会网络源自个体与个体之间的社交关系组成的网络,现有的在线社会网络如Twitter网络、Facebook网络、新浪微博、淘宝网等。对于Twitter网络如果使用Twitter的用户及用户所发布的推文Tweet视为网络中的主体,用户发表、转发推文等视为网络主体之间的关联,就可以将其抽象成为一个典型的社会网络。但社会网络并不是一层不变的,它是随着时间推移由新节点的添加或者节点间新关系的形成动态变化的,因此对社会网络结构的动态变化的研究是很有意义的。考虑将关系链接的形成过程作为网络发展和演变的基本原则,那么在给定节点的网络中,网络的成长发展是通过节点之间新关系的建立而形成。而本专利技术目的是通过研究异构网络中给定节点之间新关系的建立从而发现网络发展和演变的过程。广义来讲,社会网络可以是蛋白质相互作用网络,神经网络等生物信息网络;还可以是万维网的Web结构、Internet的拓扑结构、通讯网络等信息网络;生活中最常见的也是最直观的社会网络当属社交网络,包括学术合作、人物关系、在线交友等应用等。针对于异构网络主体相关性的研究可以应用到社交网络和电子商务的结合,如新浪微博和淘宝商品推荐等;还可以应用到决策通讯网网络主体间通讯模式(如电话、短信等);还有生物学中酵母菌蛋白质相互作用问题的研究等。目前社会网络是在其网络结构内部是相互链接的。现有的对自然科学、社会信息网络的研究都是假定网络类型结构是同构类型的,即网络节点类型相同,链接节点之间的关系类型也相同。但现实生活中大部分的网络是异构类型的,即网络节点类型多种,链接节点之间的关系类型也是多种。如DBLP网络主体节点类型有作者、论文、会议和关键词,而他们之间的多种关系如作者、论文之间撰写、引用,论文、会议之间发表、收录等;蛋白质网络主体节点类型基因、酵母等都是异构类型。传统网络中预测两个主体之间的关系方法已经存在多种,链接预测是众多方法中最常用到的。在同构网络中链接预测已经得到了广泛的应用,但是在异构网络中由于网络本身结构的特点导致常用链接预测在异构网络内不能实现。
技术实现思路
异构网络的特点主要有首先异构网络中虽然存在一些结构特征,但是没有一种特征能够很好地概括整个网络;其次异构网络的标签是复杂的,网络中标签一般都是昂贵或者难以获取的;再次网络复杂,异构网络中主体类型多种,关系类型也是多种。另外现有关系预测的研究大多针对静态无权网络,而对动态加权网络的研究相对较少;对局部因素考虑得比较具体,而对整体因素考虑得过于抽象。为了能够实现预测异构社会网络主体之间的社会关系,按照本专利技术的一个方面,提供了一种基于多源异构网络的社会关系预测方法,包括以下步骤:(1)对网络G=(V,E)按照相等的时间片长度分别进行划分,分成n个时间片快照,整个网络表示为G={T1,T2,T3,...,Tn本文档来自技高网
...
一种<a href="http://www.xjishu.com/zhuanli/55/201410734192.html" title="一种多源异构在线社会网络中网络主体之间社会关系的预测方法与系统原文来自X技术">多源异构在线社会网络中网络主体之间社会关系的预测方法与系统</a>

【技术保护点】
一种多源异构网络中社会关系的预测方法,其特征在于,所述方法包括如下步骤:(1)对网络G=(V,E)按照相等的时间片长度分别进行划分,分成n个时间片快照,整个网络表示为G=(T1,T2,T3,...,Tn);其中对于网络G=(V,E),其中V表示网络中所有主体(用户)集合,E表示所有主体间存在的链接关系集合;(2)统计两两主体的时序动作特征向量Edge_Vector(·),并对主体的时序特征向量Edge_Vector(·)内所有元素求和,从而得到主体间的链接关系的时序权重w(u,v);(3)分别对异构网络Gs=(Vs,Es)、Gt=(Vt,Et)采用步骤(1)(2)的方法获得网络主体之间的时序权重ws、wt,通过计算Gs、Gt中重叠的用户即同时存在于两个网络中的主体v,v∈Vs且v∈Vt,从而将Gs、Gt网络组合成Gnew;(4)以最小路径权重和为原则采用最短路径Dijkstra算法,计算网络Gnew中主体间的最短时序权重路径;根据最短时序权重路径所属的链接关系从而构成最短关系路径Shortest_Relation_Path;(5)预测异构网络Gnew中主体之间潜在的社会关系概率,根据已知的异构网络Gne中的主体u和主体v之间的最短关系路径Shortest_Relation_Path(u,v)=(R1,R2,...,Rl),采用HeteFlow方法计算u和v间社会关系的概率;(6)基于给定阈值δ判断异构网络主体u和v之间的社会关系,主体u和v之间的社会关系概率大于设定阈值δ,则存在关系,否则不存在关系。...

【技术特征摘要】
1.一种多源异构网络中社会关系的预测方法,其特征在于,所述方法
包括如下步骤:(1)对网络G=(V,E)按照相等的时间片长度分别进行划分,
分成n个时间片快照,整个网络表示为G=(T1,T2,T3,...,Tn);其中对于网络
G=(V,E),其中V表示网络中所有主体(用户)集合,E表示所有主体间存
在的链接关系集合;
(2)统计两两主体的时序动作特征向量Edge_Vector(·),并对主体的时
序特征向量Edge_Vector(·)内所有元素求和,从而得到主体间的链接关系的时
序权重w(u,v);
(3)分别对异构网络Gs=(Vs,Es)、Gt=(Vt,Et)采用步骤(1)(2)的方
法获得网络主体之间的时序权重ws、wt,通过计算Gs、Gt中重叠的用户即
同时存在于两个网络中的主体v,v∈Vs且v∈Vt,从而将Gs、Gt网络组合成
Gnew;
(4)以最小路径权重和为原则采用最短路径Dijkstra算法,计算网络
Gnew中主体间的最短时序权重路径;根据最短时序权重路径所属的链接关系
从而构成最短关系路径Shortest_Relation_Path;
(5)预测异构网络Gnew中主体之间潜在的社会关系概率,根据已知的
异构网络Gne中的主体u和主体v之间的最短关系路径
Shortest_Relation_Path(u,v)=(R1,R2,...,Rl),采用HeteFlow方法计算u和v间社
会关系的概率;
(6)基于给定阈值δ判断异构网络主体u和v之间的社会关系,主体
u和v之间的社会关系概率大于设定阈值δ,则存在关系,否则不存在关系。
2.如权利要求1所述的方法,其特征在于,所述步骤(1)中定义的
三种链接关系的动作特征具体为:
创建(e)、保留(c)、取消(r),并分别初始化e,c,r为-1、-0.5、2,

\t用于表示在不同时间片中网络主体之间链接关系的动作状态;
采用E(·)、C(·)、R(·)记录主体之间链接关系的动作状态结果,则E(u,v,k),
C(u,v,k),R(u,v,k)分别表示时间片k内主体(用户)之间的创建、保留、取
消链接关系的动作状态结果;其时序特征的形式化表达如下:
3.如权利要求1或2所述的方法,其特征在于,所述步骤(2)具体
包括如下子步骤:
(2-1)统计网络G中任意两主体之间的链接关系在n个时间片内所有
的动作状态集合,即时序动作特征向量Edge_Vector(·);
(2-2)将主体的时序特征向量Edge_Vector(·)中所有元素求和得到主体间
链接关系的时序权重w(u,v);对于时序特征向量Edge_Vector(u...

【专利技术属性】
技术研发人员:金海余辰李瑞丹姚德中
申请(专利权)人:华中科技大学
类型:发明
国别省市:湖北;42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1