一种文本情绪分类方法及系统技术方案

技术编号：21629148 阅读：28 留言：0更新日期：2019-07-17 11:09

本发明专利技术提供一种文本情绪分类方法，包括：S1、基于限制递归神经张量网络模型中预设的权重矩阵集，在文本中提取权重大于预设阈值的词项作为语义实词；S2、基于训练后的限制递归神经张量网络模型，提取所述语义实词的情绪特征；S3、基于所述语义实词的情绪特征，对所述文本进行情绪分类。本发明专利技术提供的文本情绪分类方法及系统，通过在递归神经张量网络模型的基础上，添加权重矩阵集使得模型训练对于虚词权重降低，使得文本情绪特征检测能更专注于实词，减少信息冗余干扰，提高文本情绪分类准确率。

A Text Emotion Classification Method and System

全部详细技术资料下载

【技术实现步骤摘要】
一种文本情绪分类方法及系统
本专利技术涉及文本信息处理领域，更具体地，涉及一种文本情绪分类方法及系统。
技术介绍
据《中国互联网络发展状况统计报告》调查结果显示，截至2016年12月，中国网民规模达7.31亿，相当于欧洲人口总量，互联网普及率达到53.2％。互联网在整体环境、应用普及和热点行业发展等领域都取得了令人瞩目的成绩。随着网络技术的发展和普及，网络不仅给网民提供了信息传播的新途径，并且为用户提供了快捷、方便的交互方式，作为读者与作者，读者与读者之间架起了沟通的桥梁。互联网在信息传播领域越来越突出的作用不仅引起了学术界对网络舆情的关注，许多对信息敏感的行业如证券、金融以及政府机构也逐渐将目光投向这一研究领域。在网上，越来越多的用户利用互联网来发表自己的观点，由此产生了大量数文本数据。这些数据不仅包含权威的官方信息，也包含可信度较差的非官方信息，甚至是虚假信息。并且由于网络的开放性和共享性，用户参与进来发表自己的观点，免不了会产生“情绪化”的内容。其中的一些信息广泛传播必然会在社会上造成舆论效应，或积极或消极。因此，把握互联网用户的“情绪化”信息逐渐成为大众舆情监测的重要组成部分。而目前对情绪倾向性分析缺乏有效的分析工具，很难捕捉相关文章的主流情绪。目前，现有的文本情绪分类方法一般采用传统的词袋模型和人工标注法和回溯神经网络(RNN)模型分类法。传统的词袋模型和人工标注法首先人工构建情绪匹配知识库，将待分类文本与情绪匹配知识库进行匹配，得到待分类文本的情绪特征，将所述待分类文本的情绪特征进行分类，得到文本的情绪分类结果。RNN模型可用来预测句子级的情绪...

【技术保护点】
1.一种文本情绪分类方法，其特征在于，包括：S1、基于限制递归神经张量网络模型中预设的权重矩阵集，在文本中提取权重大于预设阈值的词项作为语义实词；S2、基于训练后的限制递归神经张量网络模型，提取所述语义实词的情绪特征；S3、基于所述语义实词的情绪特征，对所述文本进行情绪分类。

【技术特征摘要】
1.一种文本情绪分类方法，其特征在于，包括：S1、基于限制递归神经张量网络模型中预设的权重矩阵集，在文本中提取权重大于预设阈值的词项作为语义实词；S2、基于训练后的限制递归神经张量网络模型，提取所述语义实词的情绪特征；S3、基于所述语义实词的情绪特征，对所述文本进行情绪分类。2.根据权利要求1所述的方法，其特征在于，步骤S1之前所述方法还包括：在递归神经张量网络模型中添加权重矩阵集，并基于预设的限制函数，缩小所述递归神经张量网络模型中的循环检测器大小，从而构建所述限制递归神经张量网络模型。3.根据权利要求2所述的方法，其特征在于，所述限制递归神经张量网络模型为：其中，h为情绪特征，σ为激活函数，x为词项，f(i(xt))为限制函数，b为偏置量，t为状态量，w为矩阵，ht为当前状态的情绪特征，为权重矩阵，为循环检测器。4.根据权利要求2所述的方法，其特征在于，步骤S1包括：获取所述文本中的所有词项；基于所述限制递归神经张量网络模型中预设的权重矩阵集，对所述所有词项中的每一个词项分配一个预设的权重矩阵，得到各个词项的权重表达式；对所述各个词项的权重表达式训练后，提取权重大于预设阈值的词项作为语义实词。5.根据权利要求2所述的方法，其特征在于，步骤S1之后，步骤S2之前，所述方法还包括：构建斯坦福情绪树；将所述斯坦福情绪树...

【专利技术属性】
技术研发人员：王宁君，张春荣，赵琦，
申请(专利权)人：普天信息技术有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人