基于时间特征的弹幕情感分析方法技术

技术编号：34321500 阅读：62 留言：0更新日期：2022-07-31 00:17

本发明专利技术提供了一种基于时间特征的弹幕情感分析方法，首先对原始弹幕数据进行了分词、去除停用词等文本预处理，来提高嵌入的准确度。然后使用弹幕情感分析模型中的嵌入模块将文本从词换成字并输出具有时间特征的融合向量，从而解决弹幕结构复杂的问题，减少网络词汇对语义的影响，使得模型能够更好地学习弹幕地隐含语义，优化了模型进行弹幕分析地性能。其次，通过双向长短期记忆模型BiLSTM和注意力机制进一步获取弹幕数据的深层特征，充分考虑了文本和时间两种因素。最后通过分类器对弹幕的情感类型进行精确分类。相较于现有弹幕分析方法，本发明专利技术的弹幕情感分析方法有效提升了弹幕情感分析的准确率，具有较强的应用性。具有较强的应用性。具有较强的应用性。

Emotional analysis method of barrage based on time characteristics

全部详细技术资料下载

【技术实现步骤摘要】
基于时间特征的弹幕情感分析方法

[0001]本专利技术属于文本分类领域，具体涉及一种基于时间特征的弹幕情感分析方法。

技术介绍

[0002]文本情感分析是文本分类的一种，是指利用自然语言处理和文本挖掘技术，对带有情感色彩的主观性文本进行分析、处理和抽取的过程，其已经构成一个具有影响力的研究领域，并在工业界得到了广泛的应用。情感分析的需求来源于个人、企业和政府对产品、营销和政策的兴趣。近年来，创新和商业的需求不断推动着情感分析的研究发展。
[0003]随着互联网和社交媒体的发展，人们对娱乐消费的需求越来越高。根据中国互联网络发展状况统计报告，网络视频和衍生产品已经成为网络娱乐消费领域的支柱产业。弹幕作为一种视频评论手段，由最初的亚文化小团体逐渐进入了大众的视野，为视频用户提供了一种新的在线交流的方法。目前，包括Bilibili、腾讯、虎牙、爱奇艺、斗鱼和央视影音等都在视频中加入了弹幕。对弹幕进行情感分析可以帮助平台了解用户的心理和特征，得到更多有效的信息反馈，协助后台进行相关视频和广告的推荐，也可以帮助创作者改进发布的视频。然而，弹幕与一般的微博、商品评论和影评等不同，结构多样，构成复杂，省略的信息较多，是一种特殊的短文本，目前的方法对弹幕进行情感分析效果有限，准确率较低。因此，有必要提供一种新的方法来对弹幕的情感分析进行改进。

技术实现思路

[0004]为解决上述问题，提供一种准确率高的弹幕情感分析方法，本专利技术采用了如下技术方案：
[0005]本专利技术提供了一种基于时间特征的弹幕

【技术保护点】

【技术特征摘要】
1.一种基于时间特征的弹幕情感分析方法，其特征在于，包括以下步骤：步骤S1，对待分析的原始弹幕数据进行文本预处理，并提取弹幕文本和弹幕发送时间；步骤S2，基于输入层、嵌入模块、神经网络模块和分类模块构建并训练得到弹幕情感分析模型；步骤S3，将所述弹幕文本和所述弹幕发送时间输入至所述弹幕情感分析模型中，由所述嵌入模块进行向量化处理分别得到文本向量和时间向量，并拼接得到具有时间特征的融合向量；步骤S4，将所述融合向量作为所述神经网络模块的输入，获取弹幕句子表达式；步骤S5，由所述分类模块中的softmax分类器计算弹幕句子表达式的文本标签的类别概率，得到所述待分析的原始弹幕数据的情感分类的分析结果。2.根据权利要求1所述的基于时间特征的弹幕情感分析方法，其特征在于：其中，所述文本预处理包括分词、去除停用词、以及清除特殊字符和标点符号。3.根据权利要求1所述的基于时间特征的弹幕情感分析方法，其特征在于：其中，所述嵌入模块具有文本信息处理子模块、时间信息处理子模块以及融合子模块，所述文本向量为所述文本信息处理子模块基于word2vec模型对所述弹幕文本进行向量化处理得到，该处理过程为：设定每一条弹幕含有n个词，将每个词都转换成其one
‑
hot向量的形式x
i
＝(x1,x2…
x
n
)，然后通过嵌入矩阵W
e
得到x
i
的嵌入向量表达形式，通过将每个词的嵌入向量进行拼接得到所述文本向量。4.根据权利要求3所述的基于时间特征的弹幕情感分析方法，其特征在于：其中，所述时间向量为所述时间信息处理子模块基于所述word2vec模型对所述弹幕发送时间进行向量化处理得到，该处理过程为：设定每一条弹幕所处的时间长度有n秒，将每一秒都转化成其one
‑
hot向量的形式x
i
＝(x1,x2…
x
n
)，然后通过嵌入矩阵W
e
得到x
i
的嵌入向量表达形式，通过...

【专利技术属性】
技术研发人员：牟雪峰，李海明，
申请(专利权)人：上海电力大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人