文本分析模型的训练方法、文本分析方法、设备及介质技术

技术编号：37819825 阅读：12 留言：0更新日期：2023-06-09 09:53

本申请实施例涉及文本分析领域，公开了一种文本分析模型的训练方法、文本分析方法、设备及介质。训练方法包括：在原始文本的指定位置添加标志字得到文本信息，并对文本信息中各字进行编码得到的字向量进行拼接得到文本向量；将文本向量输入到特征提取模型中，并将多个提取网络输出的、与指定位置对应的多个输出向量输入到权重提取模型中，得到多个输出权重；通过多个输出权重对多个输出向量进行加权处理，得到文本信息的语义表征向量；将语义表征向量输入到与多个主题类别一一对应的多个分类模型中，得到文本信息所属主题类别和所属情感类别的预测标签；利用预设的分类损失函数对特征提取模型、权重提取模型和多个分类模型进行训练。进行训练。进行训练。

全部详细技术资料下载

【技术实现步骤摘要】
文本分析模型的训练方法、文本分析方法、设备及介质

[0001]本申请实施例涉及文本分析
，特别涉及一种文本分析模型的训练方法、文本分析方法、设备及介质。

技术介绍

[0002]目前，越来越多的民众通过社交媒体了解社会热点新闻，并以评论的形式表达态度和意见，而对各种信息进行文本分析，如：对热点新闻进行主题类别和情感极性分析、对评论进行情感倾向分析等等，有助于了解热点事件的舆论情况，从而进行舆情管控。
[0003]目前常用的文本分析方法是采用一种串形的方式先抽取出文本中包含的主题类别的类别词，再针对抽取出的每个类别进行文本的情感分类。然而这种方法由于是先抽取出文本中包含的类别词，再做基于类别词的情感分类，这很容易导致错误从上游任务传递到下游任务，影响整个文本分析的准确率。

技术实现思路

[0004]本申请实施方式的目的在于提供一种模型训练方法、文本分析方法、电子设备及存储介质，利用特征提取模型中各层提取网络输出的、与指定位置对应的输出向量，并对输出向量在训练过程中动态地赋予对应的输出权重，以此得到更为准确且完整的语义表征向量，大大提高了文本分析的准确率。
[0005]为解决上述技术问题，本申请的实施方式提供了一种文本分析模型的训练方法，包括：在原始文本的指定位置添加标志字，得到文本信息，并对所述文本信息中各字进行编码得到的字向量进行拼接得到文本向量；将所述文本向量输入到由多个提取网络级联组成的特征提取模型中，并将多个提取网络输出的、与所述指定位置对应的多个输出向量输入到权重提取模型中...

【技术保护点】

【技术特征摘要】
1.一种文本分析模型的训练方法，其特征在于，包括：在原始文本的指定位置添加标志字，得到文本信息，并对所述文本信息中各字进行编码得到的字向量进行拼接得到文本向量；将所述文本向量输入到由多个提取网络级联组成的特征提取模型中，并将多个提取网络输出的、与所述指定位置对应的多个输出向量输入到权重提取模型中，得到与所述多个输出向量一一对应的多个输出权重；通过所述多个输出权重对所述多个输出向量进行加权处理，得到所述文本信息的语义表征向量；将所述语义表征向量输入到与多个主题类别一一对应的多个分类模型中，得到所述文本信息所属主题类别和所属情感类别的预测标签；利用预设的分类损失函数对所述特征提取模型、所述权重提取模型和所述多个分类模型进行训练。2.根据权利要求1所述的文本分析模型的训练方法，其特征在于，每个所述字向量由表示字语义信息的字义向量、表示字所属语句信息的段向量、表示字位置信息的位置向量相加得到。3.根据权利要求1所述的文本分析模型的训练方法，其特征在于，所述权重提取模型包括：双向长短期记忆网络和第一全连接网络；所述将多个提取网络输出的、与所述指定位置对应的多个输出向量输入到权重提取模型中，得到与所述多个输出向量一一对应的多个输出权重，包括：将所述多个输出向量输入到所述双向长短期记忆网络中，得到与多个输出向量对应的多个第一向量；将所述多个第一向量输入到所述第一全连接网络，得到多个输出权重。4.根据权利要求1所述的文本分析模型的训练方法，其特征在于，所述通过所述多个输出权重对所述多个输出向量进行加权处理，得到所述文本信息的语义表征向量，包括：将所述多个输出权重与所述多个输出向量进行加权求和或加权平均，得到第二向量；将所述第二向量输入到第二全连接网络，得到所述语义表征向量。5.根据权利要求1所述的文本分析模型的训练方法，其特征在于，每个所述分类模型包括：注意力网络和第三全连接网络；所述将所述语义表征向量输入到与多个主题类别一一对应的多个分类模型中，得到所述文本信息所属主题类别和所属情感类别的预测标签，包括：针对每个分类模型，将与所述分类模型对应的主题类别的类别词向量和所述语义表征向量...

【专利技术属性】
技术研发人员：过弋，胡益峰，
申请(专利权)人：华东理工大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人