当前位置: 首页 > 专利查询>复旦大学专利>正文

预测议员投票倾向的方法及其装置制造方法及图纸

技术编号:30436161 阅读:19 留言:0更新日期:2021-10-24 17:37
本发明专利技术公开了一种预测议员投票倾向的方法及其装置,其涉及政治投票技术领域,方法包括:根据议员的基本信息建立议员节点,根据议员在推特发布的言论信息建立言论节点;建立节点之间的关系;获取节点的初始化表示;基于关键词的言论网络的异质图卷积;基于话题标签的言论网络的异质图卷积;基于长短期记忆网络的议题的文本信息初始化;使用异质图卷积神经网络来更新议员和言论节点的表示,并通过三元组损失函数进行联合训练,学习异质图中的节点表示和议题表示,通过议员和议题之间的距离来衡量议员对议题的投票偏好,以预测议员对议题的投票倾向。本申请提高了点名趋势预测的性能,并且适用于没有投票记录的新加入议员的预测。并且适用于没有投票记录的新加入议员的预测。并且适用于没有投票记录的新加入议员的预测。

【技术实现步骤摘要】
预测议员投票倾向的方法及其装置


[0001]本专利技术涉及政治投票
,特别涉及一种预测议员投票倾向的方法及其装置。

技术介绍

[0002]点名投票预测的目的是利用议员投票的历史记录来估计他们对新兴问题的可能态度。由于议员的政治偏好和文化背景对他们的立场和诉求有很大影响,因此,从点名投票数据中学习议员的表示已成为预测其投票倾向的有效工具。
[0003]以往的研究主要从两个方面促进议员唱名投票的预测。一方面,丰富议题的文本信息被应用来增加分类的特征,另一方面,在具有相同投票、发起和捐赠行为的议员之间建立关系,通过整合具有类似政治背景的议员,极大地提高了点名预测的性能。
[0004]但是,对于第一次参加议题投票的议员,可参照议员的不足使得获得具有上下文信息的、体现交互关系的议员表示变得困难,从而导致了所谓的冷启动问题。特别是在政治领域,任期终止通常意味着参议院或议会的更新。例如,在给定是数据集上有10%以上的议员是新选出的。此外,投票行为仅表明议员的结果行动,而在社交平台上向公众展示的内容包含了他们的最终选择的线索。因此,探讨他们的意见和最后决定背后的原因是有价值的,有利于解释议题过程。

技术实现思路

[0005]为了克服现有技术的上述缺陷,本专利技术实施例所要解决的技术问题是提供了一种预测议员投票倾向的方法及其装置,其能够提高点名投票预测的性能,而且适用于那些新参选的议员。
[0006]本专利技术实施例的具体技术方案是:
[0007]一种预测议员投票倾向的方法,所述预测议员投票倾向的方法包括:
[0008]根据议员的基本信息建立议员节点,根据议员发布的言论的语义信息建立言论节点;
[0009]建立节点之间的关系;
[0010]获取节点的初始化表示;
[0011]基于关键词的言论网络异质图卷积;
[0012]基于话题标签的言论网络异质图卷积;
[0013]基于长短期记忆网络的议题的文本信息初始化;
[0014]使用异质图卷积神经网络来更新议员和言论节点的表示,并通过三元组损失函数进行联合训练,学习异质图中的节点表示和议题表示,通过议员和议题之间的距离来衡量议员对议题的投票偏好,以预测议员对议题的投票倾向。
[0015]优选地,所述议员的基本信息包括成员ID、所属州和政党;所述议员发布的言论包括议员在推特上的发言文本;所述言论节点至少包括关键词和话题标签之一。
[0016]优选地,构造异质图模型,异质图中包括节点、节点之间的关系的建立、节点的初始化;在基于关键词言论网络的异质图中有R1,R2和R3三种关系,而在基于标签言论网络的图中有R1,R2,R3和R4四种关系;其中,R1表示议员节点之间共同发起议题,其权重是预设时间内两个议员共同发起的议题数量;R2表示言论节点的共现关系,权重为两个关键词或话题标签共现的次数;R3表示议员节点和言论节点之间的关系,其权重为议员提及该关键词或者话题标签的次数;R4表示议员在某个话题下的推文情感。
[0017]优选地,在步骤获取节点的初始化表示中,具体为:议员的基本信息用于获得其初始表示,通过以下公式将其ID,所属州和政党信息拼接起来获得议员的初始表示:
[0018][0019]X
ID
(i)表示议员i的ID,X
Party
(i)表示议员i所属州,X
state
(i)表示议员i所属政党;
[0020]对于关键词的初始表示,使用GloVe词向量;
[0021]对于话题标签节点,使用带有该话题标签的推文中预设数量个高频词的GloVe词向量的均值。
[0022]优选地,在步骤基于关键词的言论网络异质图卷积中,采用如下公式将议员和关键词的表示更新:
[0023][0024][0025]其中,σ表示激活函数Sigmoid函数;W
1(l)
和是第l层隐藏层的权重矩阵;X
(l)
和Y
(l)
是第l层的节点表示;λ1和λ2是加权超参数;和分别是议员网络和言论网络的标准化邻接矩阵;和分别是从关键词到议员以及从议员到关键词的边的归一化相邻矩阵;X
(l+1)
和Y
(l+1)
是第l+1层的节点表示。
[0026]优选地,在步骤基于话题标签的言论网络异质图卷积中,对图卷积神经网络进行一般化,以处理任何一对节点之间的不同关系,并对每种关系类型使用不同的权重矩阵和归一化因子,具体过程如下:
[0027][0028]其中,为与节点i关系类型为r的邻居集合,c
i,r
是归一化因子,通常设置为R表示关系类型的集合,hi表示节点i的隐藏状态,hj是节点j的隐藏状态,hi
(l)
表示节点i在第l层的隐藏状态。
[0029]优选地,表示基于话题标签的图卷积操作,具体如下:
[0030][0031][0032]其中,和表示权重矩阵;和表示归一化因子,N
i
表示节点i的邻居集合,为与节点i关系类型为r的邻居集合,x
i
、x
j
、x
k
分别表示议员节点i、j、k的隐藏状态,y
i
、y
j
、y
k
分别表示言论节点i、j、k的隐藏状态,l表示第l层。
[0033]优选地,在步骤基于长短期记忆网络的议题的文本信息初始化中,对于议题,标题、说明和摘要是能够获得的直接文本信息,使用长短期记忆网络编译议题的文本信息以得到其初始表示形式:
[0034]X
lgn
(i)=LSTM(t
i
)
[0035]其中,t
i
表示议题i的文本信息,LSTM表示长短期记忆网络。
[0036]优选地,在步骤使用异质图卷积神经网络来更新议员和言论节点的表示,并通过三元组损失函数进行联合训练,学习异质图中的节点表示和议题表示,通过议员和议题之间的距离来衡量议员对议题的投票偏好,以预测议员对议题的投票倾向中,具体包括:
[0037]获得初始化表示后,首先通过异质图卷积神经网络更新议员和关键词或话题标签的表示;然后,通过三元组损失函数联合学习议员和议题的表示,具体而言,抽样一批三元组,每个三元组均由目标议题a和一对议员p和n组成,其表决结果满足表决(n,a)<表决(p,a),且表决结果的衡量标准为NO<NOT VOTE<YES,损失函数表示为:
[0038]L=max(d(a,p)

d(a,n)+margin,0);
[0039]根据议员与议题之间的距离对议员进行排序,并根据议题的不同票的比例预测他们的选择。
[0040]一种预测议员投票倾向的装置,它包括:存储器和处理器,存储器中存储计算机程序,所述计算机程序在被所述处理器执行时,实现以下本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种预测议员投票倾向的方法,其特征在于,所述预测议员投票倾向的方法包括:根据议员的基本信息建立议员节点,根据议员发布的言论的语义信息建立言论节点;建立节点之间的关系;获取节点的初始化表示;基于关键词的言论网络异质图卷积;基于话题标签的言论网络异质图卷积;基于长短期记忆网络的议题的文本信息初始化;使用异质图卷积神经网络来更新议员和言论节点的表示,并通过三元组损失函数进行联合训练,学习异质图中的节点表示和议题表示,通过议员和议题之间的距离来衡量议员对议题的投票偏好,以预测议员对议题的投票倾向。2.根据权利要求1所述的预测议员投票倾向的方法,其特征在于,所述议员的基本信息包括成员ID、所属州和政党;所述议员发布的言论包括议员在推特上的发言文本;所述言论节点至少包括发言文本中的关键词和话题标签之一。3.根据权利要求2所述的预测议员投票倾向的方法,其特征在于,构造异质图模型,异质图中包括节点、节点之间的关系的建立、节点的初始化;在基于关键词言论网络的异质图中有R1,R2和R3三种关系,而在基于标签言论网络的图中有R1,R2,R3和R4四种关系;其中,R1表示议员节点之间共同发起议题,其权重是预设时间内两个议员共同发起的议题数量;R2表示言论节点的共现关系,权重为两个关键词或话题标签共现的次数;R3表示议员节点和言论节点之间的关系,其权重为议员提及该关键词或者话题标签的次数;R4表示议员在某个话题下的推文情感。4.根据权利要求2所述的预测议员投票倾向的方法,其特征在于,在步骤获取节点的初始化表示中,具体为:将议员的基本信息编码,通过以下公式将其ID,所属州和政党信息拼接起来获得议员的初始表示:X
ID
(i)表示议员i的ID,X
Party
(i)表示议员i所属州,X
State
(i)表示议员i所属政党;对于关键词的初始表示,使用GloVe词向量;对于话题标签节点,使用带有该话题标签的推文中预设数量个高频词的GloVe词向量的均值。5.根据权利要求2所述的预测议员投票倾向的方法,其特征在于,在步骤基于关键词的言论网络异质图卷积中,采用如下公式将议员和关键词的表示更新:言论网络异质图卷积中,采用如下公式将议员和关键词的表示更新:其中,σ表示激活函数Sigmoid函数;W
1(l)
和W
2(l)
是第l层隐藏层的权重矩阵;X
(l)
和Y
(l)
是第l层的节点表示;λ1和λ2是加权超参数;和分别是议员网络和言论网络的标准化邻接矩阵;和分别是从关键词到议员以及从议员到关键词的边的归一化相邻矩阵;X
(l+1)
和Y
(l+1)
是第l+1层的节点表示。
6.根据...

【专利技术属性】
技术研发人员:魏忠钰牟馨忆
申请(专利权)人:复旦大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1