System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术属于新闻事件预测,具体涉及一种基于时间平滑约束深度演化聚类的新闻事件预测方法。
技术介绍
1、新闻事件库,如全球新闻事件库(global database of events,language,andtone,gdelt)和综合危机预警事件库(integrated crisis early warning system,icews),包含大量具有时间标记的新闻事件。新闻事件通常以四元组的形式表示,即(头实体、关系、尾实体、时间戳),这种表示方法不仅直观且富有表现力,且能够精确地捕捉到事件的核心要素及其发生的时间点。其中,实体包括国家、地区、公民和公司等,作为事件的参与者或受影响的对象,关系包括开展合作、访问、发表声明、谴责和拒绝等,揭示了这些实体之间的行为或状态变化。
2、新闻事件预测任务基于历史发生的新闻事件,将实体和关系映射为低维、稠密的实值向量表示,进而通过向量运算预测实体之间未来可能发生的关系。这一任务不仅在国际事件预测、社会风险评估、以及公共安全管理等领域展现出巨大的应用潜力,也是人工智能与大数据技术深度融合的重要体现。然而,新闻事件预测面临着诸多挑战,包括但不限于数据的海量性、异质性、以及时序依赖性等。特别是如何有效地捕捉实体之间的高阶相关性及其随时间的演化规律,成为当前研究的热点与难点。
3、为了应对这些挑战,研究者们纷纷将目光投向深度神经网络,特别是图神经网络(gnns)与循环神经网络(rnns)及其变体。图神经网络擅长处理图结构数据,能够自然地捕捉实体之间的成对相关性,通过节点
技术实现思路
1、鉴于上述,本专利技术的目的是提供一种基于时间平滑约束深度演化聚类的新闻事件预测方法,根据每个时间戳发生的新闻事件构建实体图,利用深度演化聚类模块构建簇,对相邻时间戳的簇进行对齐和融合以构建簇图,进而构建时间平滑约束,并引入簇图信息传递模块进行表示学习,从而有效建模实体之间高阶相关性的时序演化,在国际事件预测、社会治理等领域具有广阔的应用前景。
2、为实现上述专利技术目的,本专利技术提供的技术方案如下:
3、本专利技术实施例提供的一种基于时间平滑约束深度演化聚类的新闻事件预测方法,包括以下步骤:
4、在构建的训练数据集中根据每个时间戳发生的新闻事件构建以实体为节点并以实体之间的关系为边的实体图;
5、使用关系感知的图卷积神经网络在实体图上进行信息聚合得到初步更新的实体表示和关系表示;
6、在深度演化聚类模块中基于初步更新的实体表示利用模糊聚类得到实体对于簇的软隶属矩阵和不同时间戳的簇,将相邻时间戳的簇进行对齐融合后构建以簇为节点并以簇之间的隐式相关性为边的簇图,并根据相邻时间戳的簇之间的余弦距离构建时间平滑损失;
7、在簇图信息传递模块中利用隐式相关性编码器捕获簇图中簇对之间的隐式相关性后在簇图上进行信息聚合以更新簇的表示,进而根据实体对于簇的软隶属矩阵对初步更新的实体表示和关系表示进行再次更新;
8、利用时间残差门将当前时间戳再次更新的实体表示和关系表示与当前时间戳初始的实体表示和关系表示相结合,作为下一个时间戳的输入;
9、将不同时间戳再次更新后的实体表示和关系表示输入到基于注意力机制的时间依赖编码器中,得到综合的实体表示和关系表示;
10、基于综合的实体表示和关系表示,通过基于卷积的新闻事件模型预测实体之间未来可能发生的所有关系,构建包括预测损失和时间平滑损失的总预测损失,基于训练数据集和总预测损失对整个网络进行训练,利用训练好的新闻事件模型进行新闻事件预测。
11、具体地,所述在构建的训练数据集中根据每个时间戳发生的新闻事件构建以实体为节点并以实体之间的关系为边的实体图,包括:
12、对新闻事件数据进行预处理,提取得到的新闻事件以四元组(s,r,o,t)的形式表示,其中,s代表头实体,r代表关系,o代表尾实体,t代表时间戳;
13、利用大小为t的滑动时间窗口对预处理后的新闻事件数据划分得到训练数据集,其中每个样本包含新闻事件数据中t个时间戳发生的新闻事件;
14、将训练数据集中所有新闻事件构建为全局静态图,其中,节点表示实体,边表示实体之间的关系,并基于全局静态图利用谱聚类获得全局簇;
15、将训练数据集分为n个批次用于进行分批训练,随机初始化可学习的实体表示ei和可学习的关系表示ri,i表示实体表示或关系表示的索引;
16、选取一批训练样本,根据每个时间戳发生的新闻事件构建实体图其中,表示t时间戳的节点集,代表实体;表示t时间戳的边集,代表实体之间的关系。
17、具体地,所述使用关系感知的图卷积神经网络在实体图上进行信息聚合得到初步更新的实体表示和关系表示,包括:
18、利用关系感知的图卷积神经网络在实体图上进行信息聚合的计算公式如下:
19、
20、其中,表示初步更新的尾实体表示,由于新闻事件中尾实体也能作为另一事件的头实体,则此处也视为同步初步更新了头实体表示,和rt,l分别表示t时间戳的头实体s、尾实体o和关系r在第l层的表示,表示t时间戳的新闻事件集合,w1和w2表示可学习的参数,do表示尾实体的入度,rrelu(·)表示激活函数;
21、t时间戳的初步更新的关系表示rt由与r相关的实体表示以及r在上一个时间戳的表示rt-1得到,计算公式如下:
22、
23、其中,[;]表示串接操作,pooling(·)表示平均池化操作,表示在t时间戳与r相关的初步更新的实体表示,其中头实体或尾实体的实体集合x在(x,r,o,t)中代表头实体,x在(s,r,x,t)中代表尾实体。
24、具体地,所述在深度演化聚类模块中基于初步更新的实体表示利用模糊聚类得到实体对于簇的软隶属矩阵和不同时间戳的簇,包括:
25、在深度演化聚类模块中,首先通过优化以下目标函数j,得到实体对于簇的软隶属矩阵u,计算公式如下:
26、
27、其中,ne和nc分别表示实体和本文档来自技高网...
【技术保护点】
1.一种基于时间平滑约束深度演化聚类的新闻事件预测方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于时间平滑约束深度演化聚类的新闻事件预测方法,其特征在于,所述在构建的训练数据集中根据每个时间戳发生的新闻事件构建以实体为节点并以实体之间的关系为边的实体图,包括:
3.根据权利要求1所述的基于时间平滑约束深度演化聚类的新闻事件预测方法,其特征在于,所述使用关系感知的图卷积神经网络在实体图上进行信息聚合得到初步更新的实体表示和关系表示,包括:
4.根据权利要求1所述的基于时间平滑约束深度演化聚类的新闻事件预测方法,其特征在于,所述在深度演化聚类模块中基于初步更新的实体表示利用模糊聚类得到实体对于簇的软隶属矩阵和不同时间戳的簇,包括:
5.根据权利要求1所述的基于时间平滑约束深度演化聚类的新闻事件预测方法,其特征在于,所述将相邻时间戳的簇进行对齐融合后构建以簇为节点并以簇之间的隐式相关性为边的簇图,包括:
6.根据权利要求5所述的基于时间平滑约束深度演化聚类的新闻事件预测方法,其特征在于,时间平滑损失的计算公式如下
7.根据权利要求2所述的基于时间平滑约束深度演化聚类的新闻事件预测方法,其特征在于,所述在簇图信息传递模块中利用隐式相关性编码器捕获簇图中簇对之间的隐式相关性后在簇图上进行信息聚合以更新簇的表示,进而根据实体对于簇的软隶属矩阵对初步更新的实体表示和关系表示进行再次更新,包括:
8.根据权利要求1所述的基于时间平滑约束深度演化聚类的新闻事件预测方法,其特征在于,基于卷积的新闻事件模型采用ConvTransE模型。
9.根据权利要求1所述的基于时间平滑约束深度演化聚类的新闻事件预测方法,其特征在于,预测损失的计算公式如下:
10.根据权利要求1所述的基于时间平滑约束深度演化聚类的新闻事件预测方法,其特征在于,所述基于训练数据集和总预测损失对整个网络进行训练,包括:
...【技术特征摘要】
1.一种基于时间平滑约束深度演化聚类的新闻事件预测方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于时间平滑约束深度演化聚类的新闻事件预测方法,其特征在于,所述在构建的训练数据集中根据每个时间戳发生的新闻事件构建以实体为节点并以实体之间的关系为边的实体图,包括:
3.根据权利要求1所述的基于时间平滑约束深度演化聚类的新闻事件预测方法,其特征在于,所述使用关系感知的图卷积神经网络在实体图上进行信息聚合得到初步更新的实体表示和关系表示,包括:
4.根据权利要求1所述的基于时间平滑约束深度演化聚类的新闻事件预测方法,其特征在于,所述在深度演化聚类模块中基于初步更新的实体表示利用模糊聚类得到实体对于簇的软隶属矩阵和不同时间戳的簇,包括:
5.根据权利要求1所述的基于时间平滑约束深度演化聚类的新闻事件预测方法,其特征在于,所述将相邻时间戳的簇进行对齐融合后构建以簇为节点并以簇之间的隐式相关性为边的...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。