基于图表示学习的多视角个体观点预测方法及系统技术方案

技术编号:38581332 阅读:19 留言:0更新日期:2023-08-26 23:26
本发明专利技术提出一种基于图表示学习的多视角个体观点预测方法,包括:分别构建观点持有者的背景知识图谱、交互行为网络和观点网络;以该观点持有者、目标观点对象和观点生成时刻为要素,构建观点预测任务的目标三元组;从该背景知识图谱、该交互行为网络和该观点网络,分别获取该观点持有者的知识向量、交互行为向量和观点向量;将该知识向量、该交互行为向量和该观点向量通过分类器,输出该目标三元组对应的观点预测结果。本发明专利技术还提出一种基于图表示学习的多视角个体观点预测系统,以及一种用于多视角个体观点预测的数据处理装置。多视角个体观点预测的数据处理装置。多视角个体观点预测的数据处理装置。

【技术实现步骤摘要】
基于图表示学习的多视角个体观点预测方法及系统


[0001]本专利技术涉及知识图谱领域,特别是涉及一种个体用户观点预测的方法及系统。

技术介绍

[0002]随着Web2.0技术的迅猛发展,Facebook、Twitter、微信、微博、豆瓣等社交平台的涌现,大数据时代来临,互联网成为继报纸、广播和电视之后的“第四媒体”。互联网的发展促进了大量用户数据的产生。这些海量的数据中包含用户对各个话题的直接评论,也包含用户浏览、点赞、转发等不直接表达观点倾向的行为,这些数据或直接或间接地表现了用户对不同对象的观点倾向。从这些数据中获取到用户的观点,并从这些数据中挖掘出有价值的信息,不仅可以帮助政府了解民生、制定合理的政策,也可以帮助各大公司对产品进行监控,出现问题时迅速改正,有着现实的应用价值。
[0003]现有的个体观点预测方法大体上可以分为两类,基于观点演化规则的个体观点预测方法和基于图表示学习的个体观点预测方法。基于观点演化规则的个体观点预测方法根据社会学理论,人为制定观点间的交互规则,从而预测观点的演化。基于图表示学习的个体观点预测方法使用图表示学习模型建模观点持有者和观点对象,得到观点持有者和对象的向量表示,然后使用分类器进行预测。
[0004]基于观点演化规则的个体观点预测方法根据社会学理论,人为制定观点间的交互影响及演化规则,然后基于已有个体观点数据,在给定的观点网络结构模拟观点的演化,从而预测个体观点。Sznajd等人提出Sznajd模型,这个模型的核心思想是两个人说服比一个人说服更有效果,每个个体的观点是由其周围邻居来决定的。这个模型定义个体间的简单交互规则,认为个体间的交互行为使得个体容易受他人影响,因此在交互过程中个体会完全抛弃自我观点,而选择完全采纳其他个体的观点。Ochrombel等人改进了该模型,在Sznajd模型的基础上加入意见领袖的概念,意见领袖可以完全改变其他个体的观点,并能保持自身观点不变。Toscani等人利用Sznajd模型分析了个体观点变化的因素和全局观点同化的规则。
[0005]Deffuant模型将个体观点交互设计为随机过程,即对随机抽取的两个个体的观点进行比较,若观点差值小于某一设定的阈值,则这两个个体进行交互,否则不进行交互。HK模型考虑到个体观点通常受到多个个体观点的影响,因此在遍历个体所有邻居节点的观点之后,会选择满足阈值范围的邻居观点的均值进行交互。
[0006]Bu等人提出GK

means模型,使用启发式方法识别网络中的意见领袖,然后采用动态博弈模型进行社区识别,在社区内部采用基于LHN指数的意见动态模型模拟意见矩阵的演变。He等人提出DOMF模型,该模型基于观点最大化的思想,首先使用Q

learning理论在每个阶段动态生成节点的观点,然后使用多阶段启发式模型选择种子节点,根据观点传播预测观点的演化。
[0007]基于图表示学习的个体观点预测方法将用户和观点对象看作图上的节点,观点看作图上的边,边的正负极性与观点的极性相同。这类方法根据结构平衡、社会地位等社会学
理论定义模型目标函数,在由用户观点构成的网络上使用图表示学习模型进行用户建模,最后使用分类器进行观点预测。
[0008]Cartwright等人将平衡理论由三元闭包扩展到任意环路中,只要环路中负边的个数为偶数,该环路就是平衡的,若负边个数为奇数,那么该环路是不平衡的,其中的观点会发生改变。Cygan等人对平衡理论进行了一般化,用户与积极观点的对象更相似,与消极观点的对象更有区分度。社会地位理论一般用于有向网络,网络中每个人都有相应的社会地位,每个人会向社会地位更高的人产生正向边,向社会地位低的人产生负边。
[0009]SiNE模型使用查询表编码节点的向量表示,依据扩展后的平衡理论设计目标函数,目标函数类似负采样的间隔损失函数,将正样本替换为与朋友邻居的相似度,将负样本替换为与敌人邻居的相似度。如果节点周围只有朋友节点,那么模型会生成一个虚构节点,作为目标节点的敌人邻居。SNE模型借鉴Skip

gram模型,在已知路径前置节点的情况下,使用对数双线性模型预测目标节点,来学习每个节点的向量表示。模型给正边和负边不同的权值,来捕获路径上边的符号信息。SIDE模型将随机游走算法引入有向观点网络中,生成截断随机游走路径,将图结构转化为序列结构,通过节点在随机游走中的共现频率学习观点网络中的邻域信息。同时在目标函数中,极大化正节点对的似然概率,极小化负节点对的似然概率。
[0010]SGCN模型是带符号的GCN模型。依据结构平衡理论,SGCN模型定义了平衡集和非平衡集,并使用两个独立的聚合器,分别聚合目标节点平衡集中的节点信息和非平衡集中的节点信息。在目标函数中,模型要求正节点对间的距离小于无连接节点对,无连接节点对的距离小于负节点对。在此基础上,SiGAT模型将GAT模型引入符号图。根据连边的符号和方向,模型定义了38种三角模体(Motif),对不同的模体使用独立的聚合器进行邻居节点的信息聚合,最后使用MLP聚合不同模体的信息。SHINE将人物的背景知识和交互信息引入观点预测中,使用三个独立的自编码器分别提取观点网络、关注社交网络以及人物属性网络的人物向量,然后将三个向量拼接为人物的嵌入向量,使用向量内积进行观点预测。SNEA模型将自注意力机制引入符号图,定义了节点的平衡集和非平衡集,根据结构平衡理论,重新定义了符号图中的聚合操作和目标函数,并在聚合时计算每个节点的权重。SDGNN模型考虑了观点的有向性,根据观点的方向和极性定义了四种关系,据此将每个节点的邻居分为四个集合,使用不同的聚合函数进行聚合,得到节点的向量表示,并依据社会地位理论设计了新的损失函数。
[0011]然而,已有的个体观点预测方法存在两个问题。
[0012]第一是已有方法依靠观点间的交互关系进行观点预测,预测时只使用了用户显式的观点数据,但是由于大部分用户很少直接表达自己的观点,一般只对相关其他用户发表的文章进行点赞、转发或收藏,因此显式的观点数据较少,已有方法面临数据稀疏的问题。
[0013]第二是已有方法没有考虑发表观点的时间,已有方法要么人为构造虚拟数据,模拟观点演化的过程,要么将不同时刻发表的观点看作静态的数据,没有建模观点发表的时间信息,忽视了用户的历史观点以及观点的转变。

技术实现思路

[0014]为解决上述现有技术的观点数据稀疏以及缺少时间建模的问题,本专利技术提出了一
种基于图表示学习的多视角个体观点预测方法。具体包括:分别构建观点持有者的背景知识图谱、交互行为网络和观点网络;以该观点持有者、目标观点对象和观点生成时刻为要素,构建观点预测任务的目标三元组;从该背景知识图谱、该交互行为网络和该观点网络,分别获取该观点持有者的知识向量、交互行为向量和观点向量;将该知识向量、该交互行为向量和该观点向量通过分类器,输出该目标三元组对应的观点预测结果。
[0015]本专利技术所述的多视角个体观点预测方法,其本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于图表示学习的多视角个体观点预测方法,其特征在于,包括:分别构建观点持有者的背景知识图谱、交互行为网络和观点网络;以该观点持有者、目标观点对象和观点生成时刻为要素,构建观点预测任务的目标三元组;从该背景知识图谱、该交互行为网络和该观点网络,分别获取该观点持有者的知识向量、交互行为向量和观点向量;将该知识向量、该交互行为向量和该观点向量通过分类器,输出该目标三元组对应的观点预测结果。2.如权利要求1所述的多视角个体观点预测方法,其特征在于,对于该目标三元组(u,v,t),将该知识向量Emb
KG
(u,v,t)、该交互行为向量Emb
IN
(u,v,t)和该观点向量Emb
ON
(u,v,t)进行均匀池化,得到最终三元组表示向量Emb(u,v,t),将Emb(u,v,t)输入该分类器进行观点预测,以得到的观点极性s作为该观点预测结果;其中,u表示该观点持有者,v表示该目标观点对象,t表示该观点生成时刻,当s=0时表示u对v持有负面观点,当s=1时表示u对v持有正面观点。3.如权利要求2所述的多视角个体观点预测方法,其特征在于,使用L层的图注意力网络作为知识图谱编码器Encoder
KG
,编码该背景知识图谱,编码该背景知识图谱具有知识图谱三元组(u,v,r),表示u与v之间存在关系r;获取Emb
KG
(u,v,t)的步骤包括:通过Encoder
KG
,从学习该观点持有者的背景知识信息,并获取Emb
KG
(u,v,t);其中,从中随机抽取多个知识图谱三元组作为正样本,并随机生成相同数量个不存在于中且与该知识图谱三元组具有相同结构的三元组作为负样本;以该正样本和该负样本训练Encoder
KG
,并使用交叉熵作为目标函数L
KG
。4.如权利要求2所述的多视角个体观点预测方法,其特征在于,使用拓扑时序编码模型作为交互网络编码器Encoder
IN
,编码该交互行为网络,编码该交互行为网络具有交互行为三元组(u,v,t),表示u与v在t时刻发生了交互行为;获取Emb
IN
(u,v,t)的步骤包括:通过Encoder
IN
,从学习该观点持有者的动态行为信息,并获取Emb
IN
(u,v,t);其中,从中随机抽取多个交互行为三元组作为正样本,并随机生成相同数量个不存在于中且与该交互行为三元组具有相同结构的三元组作为负样本;以该正样本和该负样本训练Encoder
IN
,并使用交叉熵作为目标函数L
IN
。5.如权利要求2所述的多视角个体观点预测方法,其特征在于,使用拓扑时序编码模型作为观点网络编码...

【专利技术属性】
技术研发人员:王元卓李子健沈英汉江旭晖尹芷仪沈华伟
申请(专利权)人:中国科学院计算技术研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1