一种基于综合表示嵌入的文本分类方法技术

技术编号：33307819 阅读：51 留言：0更新日期：2022-05-06 12:18

本发明专利技术公开了一种基于综合表示嵌入的文本分类方法，包括以下步骤：将句子进行文本分词；获得文本分词的综合表示嵌入；训练基于综合表示嵌入的文本句子分类模型；使用训练好的文本分类模型对待分类文本句子进行分类；所述的综合表示嵌入包括文本的词表达嵌入、词性表达嵌入和上下文表达嵌入；所述的文本分类模型包括输入层，处理层和输出层，所述的输入层接收输入，输入为文本句子的综合表示嵌入，处理层依序为卷积层、最大池化层、第一全连接层、LSTM层、第二全连接层和softmax分类层，输出层输出分类结果。本发明专利技术方法充分利用文本分词的多种属性嵌入，使得分类效果更好，简单的分类步骤，使得分类速度更快。使得分类速度更快。使得分类速度更快。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于综合表示嵌入的文本分类方法

[0001]本专利技术属于文本分类
，尤其涉及一种基于综合表示的文本分类方法。

技术介绍

[0002]随着技术的发展，将自然语言文档自动分类成若干主题的类别这一项工作作为新兴的学科发展了起来，称为自动文本分类(Automatic Text Classification)，为简洁起见，本文将自动文本分类简称为文本分类(Text Classification)。文本分类的主要任务是在给定的分类体系下，根据文本的内容自动地确定与文本关联的类别。文本分类技术不仅仅解决了用户准确查找数据的需求，也在很大程度上降低了网络信息的杂乱特征。所以，文本分类技术的出现受到了计算机和自动化领域内专家、学者和工程师们的广泛重视。
[0003]文本分类被认识为许多技术的基础，如搜索引擎、信息过滤、情报分析、情感分析，等等。因此，文本分类技术有着广泛的应用前景，是一项具有较大研究价值的关键性技术。
[0004]事实上，文本分类一直被作为一个基本科学问题，被人工智能和语言学学者研究，如何提高文本分类的准确性和文本分类的速度，一直是作为研究的评价指标，这也指导着相关的学术界和工程界不停地寻找新的分类方法。

技术实现思路

[0005]有鉴于此，提供一种高效且准确的文本分类方法，是解决现有技术问题的关切点。本专利技术的目的在于提供一种基于综合表示的文本分类方法，所述方法充分利用文本分词的多种属性嵌入，使得分类效果更好，简单的分类步骤，使得分类速度更快。
[0006]本专利...

【技术保护点】

【技术特征摘要】
1.一种基于综合表示嵌入的文本分类方法，其特征在于，包括以下步骤：将句子进行文本分词；获得文本分词的综合表示嵌入；训练基于综合表示嵌入的文本句子分类模型；使用训练好的文本分类模型对待分类文本句子进行分类；所述的综合表示嵌入包括文本的词表达嵌入、词性表达嵌入和上下文表达嵌入；所述的文本分类模型包括输入层，处理层和输出层，所述的输入层接收输入，输入为文本句子的综合表示嵌入，处理层依序为卷积层、最大池化层、第一全连接层、LSTM层、第二全连接层和softmax分类层，输出层输出分类结果。2.根据权利要求1所述的一种基于综合表示嵌入的文本分类方法，其特征在于，所述的获得文本分词的综合表示嵌入，包括以下步骤：获取文本分词基于词典索引的词嵌入向量Embed1(IndexD(C
i
))，其中C
i
为文本分词，IndexD为文本分词的词典索引，Embed1表示基于词典索引的词嵌入；获取文本分词基于词性索引的词嵌入向量Embed2(IndexP(P(C
i
)))，P为获取文本分词的词性，IndexP为文本分词的词性索引，Embed2表示基于...

【专利技术属性】
技术研发人员：刘聆，彭波，曹丹，
申请(专利权)人：长沙一扬电子科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人