基于双滑动窗口的图神经网络文本情感分类方法技术

技术编号：29584578 阅读：22 留言：0更新日期：2021-08-06 19:43

本发明专利技术涉及文本情感分类技术领域，且公开了基于双滑动窗口的图神经网络文本情感分类方法，采用全局滑动窗口获取单词对之间的权重,采用PMI互信息计算权重。该基于双滑动窗口的图神经网络文本情感分类方法，引入全局滑动窗口和局部滑动窗口来构建文本级图，全局窗口在文本之间滑动用来确定单词连边权重，局部滑动窗口在文本内滑动用来确定单词之间连边情况；采用门控图神经网络更新节点，综合考虑邻居节点信息和边的权重更新当前节点；引入注意力机制学习单词节点权重，采用最大池化和平均池化结合的方式学习图表示进行分类。本发明专利技术采用全局窗口局部窗口来获取全局信息和局部信息，并且能获取多样性的全局信息，高效融合全局信息和局部信息。

全部详细技术资料下载

【技术实现步骤摘要】
基于双滑动窗口的图神经网络文本情感分类方法
本专利技术涉及人工智能与文本分类
，具体为基于双滑动窗口的图神经网络文本情感分类方法。
技术介绍
随着社交媒体的快速发展，互联网(例如：微博、淘宝、twitter)上涌现了大量用户参与的文本信息，这些文本信息中蕴含了丰富的用户观点和情绪。这不仅为消费者提供了产品使用体验交流平台，另一方面也为商家提供了信息展示和产品改进的平台。从海量文本中提取这一类带有情感的文本，并对其进行文本情感的分析和研究，具有很强的应用价值。情感分析使用自然语言处理(NLP)、文本分析和计算技术自动从情感评论中提取或分类情感。对这些情感和观点的分析已经应用到许多领域，如消费者信息、市场营销、书籍、应用程序、网站和社交媒体等。例如，在美国2016年总统竞选中，有研究针对Twitter用户发布的相关帖子进行观点及情绪分析，最终成功预测出竞选的候选人；在2011年日本大地震期间，有研究对社交媒体上地震相关的帖子进行情感分析，提出了一种大数据驱动的灾害响应方法。该模型通过机器学习方法对分类后的灾难数据进行分类，分析人们的情绪，有助于应急响应人员和救援人员制定更好的策略，以有效地管理快速变化的灾害环境。通过对2014年加州南纳帕地震期间的相关推特的帖子进行分析，以分析人们在2014年加州南纳帕6.0级地震之前、期间和之后的情绪和流动性；在金融市场领域，金融文本数据分析平台利用情感分析技术，分析挖掘各大财经网站、股票论坛中不同的立场不同的思维方式的人群的不同观点与情绪，分析挖掘反应投资者情绪的网络舆...

【技术保护点】
1.基于双滑动窗口的图神经网络文本情感分类方法，其特征在于，包括以下步骤：/nS1：采用全局滑动窗口获取单词对之间的权重,采用PMI互信息计算权重：/n

【技术特征摘要】
1.基于双滑动窗口的图神经网络文本情感分类方法，其特征在于，包括以下步骤：
S1：采用全局滑动窗口获取单词对之间的权重,采用PMI互信息计算权重：

S2：构建文本级图G＝(E,N)，每个文本有其特殊图结构。其中，E为边集合，N为单词节点集合。单词之间的连边由局部滑动窗口确定，出现在同一窗口内的单词之间相互连接，边的权重从S1计算的全局共享矩阵中获取。
S3：初始化节点表示。节点表示从Glove词向量获取。
S4：更新节点表示。采用GG-NN(门控图神经网络)的方式更新节点表示：
Ht＝GRU(Ht-1,at)
S5：引入注意力机制，为每个节点学习一个权重：

S6：学习文本级图表示。全局池化和平均池化结合的方式：

S7：预测文本标签。对当前文本进行分类：
Y＝softmax(WYHG+b)
S8：计算真实标签和预测标签之间的损失，采用交叉熵损失计算公式：

2.根据权利要求1所述的基于双滑动窗口的图神经网络文本情感分类方法，其特征在于，所述步骤1中W(wi，wj)是当前窗口中同时包含单词wi和单词wj的文本数量,W(wi)是当前窗口中包含单词wi的文本数量，W是全局窗口的大小。这样，同一滑动全局窗口内的文本计算的权重可以形成一个全局共享矩阵。采用滑动全局窗口的方式计算单词对之间的权重，相同窗口内的文本中的单词对共享权重，不同窗口内的文本中的单词对权重可能不同。因此，采用全局滑动窗口的方式计算...

【专利技术属性】
技术研发人员：李向华，吴欣俣，高超，王震，朱培灿，李学龙，
申请(专利权)人：西北工业大学，
类型：发明
国别省市：陕西;61

全部详细技术资料下载我是这个专利的主人