System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 利用双曲图网络的时序观点挖掘方法技术_技高网

利用双曲图网络的时序观点挖掘方法技术

技术编号:40558366 阅读:10 留言:0更新日期:2024-03-05 19:20
本发明专利技术涉及利用双曲图网络的时序观点挖掘方法,属于自然语言处理与机器学习领域。本发明专利技术首先基于推文数据集生成社交关系图,利用指数映射将社交关系图嵌入双曲空间,通过双曲图卷积提取其结构特征;然后利用交叉注意力机制计算推文内容与推文时间的相关性,再结合时间注意力机制拟合早期推文对当前观点的影响权重,得到推文时序特征;最后拼接结构特征与时序特征得到推文的最终表示,输入分类器预测观点类别。本发明专利技术针对现有社交网络的观点挖掘方法未充分利用热门推文与相关推文间关系、难以准确建模早期推文对当前观点影响的问题,提出利用双曲图网络的时序观点挖掘方法,提升观点挖掘的准确率。

【技术实现步骤摘要】

本专利技术涉及利用利用双曲图网络的时序观点挖掘方法,属于自然语言处理与机器学习领域。


技术介绍

1、观点挖掘是利用多元数据构建个体特征,研究影响观点形成和演变的核心要素及其关联关系,从而预测观点倾向的理论和方法。观点挖掘任务一方面为舆情控制、政策制定提供可靠依据,具有重要社会价值;另一方面有利于电子商务、金融服务等领域制定合适的市场策略,具有重要市场价值。当前主流的基于深度学习的观点挖掘方法大致分为基于图神经网络的方法和基于序列建模的方法。

2、基于图神经网络的方法主要是通过个体的关注网络、转推网络等拟合个体的社会关系,并使用图神经网络构建节点的拓扑特征以及邻居节点的影响关系。然而社交网络图中的热门推文具有很高的连接数,这类方法难以建模这些推文的特征以及热门推文与其相关推文关系之间的关系,导致社交网络图结构特征建模不准确。

3、基于序列建模的方法主要是依据历史事件的特征,建模当前观点的形成过程,以便挖掘分析历史事件与当前观点的关联关系。然而现有方法难以准确建模早期推文对当前观点影响,导致时间特征构建不准确。

4、综上所述,针对现有社交网络的观点挖掘方法未充分利用热门推文与相关推文间关系、难以准确建模早期推文对当前观点影响的问题,提出利用双曲图网络的时序观点挖掘方法。


技术实现思路

1、本专利技术的目的是针对现有社交网络的观点挖掘方法难以建模热门推文的特征以及热门推文与相关推文关系之间的关系,难以准确建模早期推文对当前观点影响的问题,提出利用双曲图网络的时序观点挖掘方法。

2、本专利技术的设计原理为:首先基于推文数据集生成社交关系图,利用指数映射将社交关系图嵌入双曲空间,在双曲空间中提取并聚合社交关系异质图节点嵌入特征,生成节点的结构特征;然后利用预训练语言模型bert提取推文文本表示、推文发布时间序列的嵌入特征以及代表个体特征的总体表示,并利用文本表示和时间嵌入计算交叉注意力,之后计算时间序列嵌入特征与总体表示的相关性得到时间注意力,融合交叉注意力和时间注意力得到节点的时间特征;最后拼接节点的结构特征和时间特征,并映射到新的向量空间,训练分类器进行预测分类,输出节点的观点类别。

3、本专利技术的技术方案是通过如下步骤实现的:

4、步骤1,利用双曲图对社交网络图节点进行嵌入来学习拓扑依赖关系,提取个体的结构特征。

5、步骤1.1,首先基于推文数据集生成社交关系图,利用指数映射将社交关系图嵌入双曲空间。

6、步骤1.2,使用双曲图卷积特征变换方法将初始节点特征映射到新的空间,然后使用双曲图聚合捕获邻居节点特征。

7、步骤1.3,使用图注意力机制对多个图上节点的特征进行融合,得到结构特征矩阵。

8、步骤2,利用交叉注意力机制和时序注意力机制建模当前观点受历史推文的影响权重。

9、步骤2.1,将个体的历史推文集经过bert编码器提取推文的文本特征和时间特征并建模个体特征的总体特征表示。

10、步骤2.2,通过文本特征和时间特征计算交叉注意力权重,通过时间特征和总体特征计算时序注意力权重。

11、步骤2.3,融合交叉注意力和时序注意力,并结合个体特征的总体特征计算最终的注意力权重,进而生成节点的时间特征矩阵。

12、步骤3,将双曲图嵌入获取到的结构特征以及融合注意力嵌入得到的时间特征进行拼接,作为节点的最终特征。

13、步骤4,将节点的最终特征经过softmax层分类得到观点预测的类别。

14、有益效果

15、相比于欧式空间图嵌入的图神经网络方法,本专利技术利用双曲空间建模社交网络图中热门推文特征,并利用注意力机制融合相关推文特征,构建更准确的推文结构特征。

16、相比于序列建模方法,本专利技术利用两种注意力机制,从内容、时间等多个角度衡量早期推文与当前观点的相关性,构建更准确的推文时间特征。

本文档来自技高网...

【技术保护点】

1.利用双曲图网络的时序观点挖掘方法,其特征在于所述方法包括如下步骤:

2.根据权利要求1所述的利用双曲图网络的时序观点挖掘方法,其特征在于:步骤1中基于推文数据集生成社交关系图,利用指数映射将社交关系图嵌入双曲空间,使用双曲图卷积特征变换方法将初始节点特征映射到新的空间,然后使用双曲图聚合捕获邻居节点特征,使用图注意力机制对多个图上节点的特征进行融合,得到结构特征矩阵。

3.根据权利要求1所述的结合图嵌入知识建模的网络入侵检测方法,其特征在于:步骤2中将个体的历史推文集经过BERT编码器提取推文的文本特征和时间特征并建模个体特征的总体特征表示,通过文本特征和时间特征计算交叉注意力权重,通过时间特征和总体特征计算时序注意力权重,融合交叉注意力和时序注意力,并结合个体特征的总体特征计算最终的注意力权重,进而生成节点的时间特征矩阵。

【技术特征摘要】

1.利用双曲图网络的时序观点挖掘方法,其特征在于所述方法包括如下步骤:

2.根据权利要求1所述的利用双曲图网络的时序观点挖掘方法,其特征在于:步骤1中基于推文数据集生成社交关系图,利用指数映射将社交关系图嵌入双曲空间,使用双曲图卷积特征变换方法将初始节点特征映射到新的空间,然后使用双曲图聚合捕获邻居节点特征,使用图注意力机制对多个图上节点的特征进行融合,得到结构特征矩...

【专利技术属性】
技术研发人员:罗森林马西洋潘丽敏郜森吴舟婷
申请(专利权)人:北京理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1