文本处理方法、装置、存储介质及电子设备制造方法及图纸

技术编号：35700383 阅读：17 留言：0更新日期：2022-11-23 14:53

本申请属于人工智能技术领域，涉及文本处理方法、装置、存储介质及电子设备。该方法包括：获取待处理文本，对所述待处理文本进行预处理和分词处理，以获取与所述待处理文本对应的分词向量序列；将所述分词向量序列输入至融合语言模型，通过所述融合语言模型对所述分词向量序列进行语义特征提取，以获取与所述待处理文本对应的目标词向量；其中，所述融合语言模型是基于Nezha模型、Bert模型和Roformer模型构建的。本申请能够通过融合语言模型充分挖掘待处理文本中隐藏的信息，提高语义特征提取和词向量的精准度。和词向量的精准度。和词向量的精准度。

全部详细技术资料下载

【技术实现步骤摘要】
文本处理方法、装置、存储介质及电子设备

[0001]本申请涉及人工智能
，特别涉及一种文本处理方法、文本处理系统、计算机存储介质及电子设备。

技术介绍

[0002]随着各行业的发展以及人工智能的发展，每个行业出现了多种不同的业务类型，为了对各个业务类型的文本进行信息提取，并减少人力支出，人们开始采用各种语言模型对业务文本进行处理。
[0003]目前在对业务文本进行处理时，通常无法针对某一特定行业中各个业务类型对应的文本进行区分，并充分挖掘其中隐藏的信息，进而无法为满足用户相应地业务需求。另外在对模型进行训练时，通常需要大量标注的训练文本，但是标注需要耗费大量的人力物力，因此导致相应行业领域的文本数据太少，所训练的模型的性能较差。
[0004]需要说明的是，上述
技术介绍
部分公开的信息仅用于加强对本申请的背景的理解。

技术实现思路

[0005]本申请的目的在于提供一种文本处理方法、文本处理系统、计算机存储介质及电子设备，进而至少在一定程度上提高对各领域文本的识别精度和处理效率。
[0006]本申请的其他特性和优点将通过下面的详细描述变得显然，或部分地通过本申请的实践而习得。
[0007]根据本申请的第一方面，提供一种文本处理方法，包括：
[0008]获取待处理文本，对所述待处理文本进行预处理和分词处理，以获取与所述待处理文本对应的分词向量序列；
[0009]将所述分词向量序列输入至融合语言模型，通过所述融合语言模型对所述分词向量序列进行语义特征提取，以...

【技术保护点】

【技术特征摘要】
1.一种文本处理方法，其特征在于，包括：获取待处理文本，对所述待处理文本进行预处理和分词处理，以获取与所述待处理文本对应的分词向量序列；将所述分词向量序列输入至融合语言模型，通过所述融合语言模型对所述分词向量序列进行语义特征提取，以获取与所述待处理文本对应的目标词向量；其中，所述融合语言模型是基于Nezha模型、Bert模型和Roformer模型构建的。2.根据权利要求1所述的方法，其特征在于，所述对所述待处理文本进行预处理和分词处理，以获取分词向量序列，包括：将预处理后的所述待处理文本输入至分词模型，通过所述分词模型对所述预处理后的待处理文本进行分词和向量化处理，以获取与所述预处理后的待处理文本中各分词对应的分词向量；根据各所述分词的顺序和各所述分词对应的分词向量构建所述分词向量序列。3.根据权利要求1所述的方法，其特征在于，所述融合语言模型包括输入层、第一语义解析单元、第二语义解析单元、模型融合层、词向量转换层和输出层；所述将所述分词向量序列输入至融合语言模型，通过所述融合语言模型对所述分词向量序列进行语义特征提取，以获取与所述待处理文本对应的目标词向量，包括：通过所述输入层将所述分词向量序列分别输入至所述第一语义解析单元和所述第二语义解析单元，通过所述第一语义解析单元和所述第二语义解析单元分别对所述分词向量序列进行语义特征提取，以获取第一词向量和第二词向量；通过所述模型融合层对所述第一词向量和所述第二词向量进行融合，以获取融合词向量；通过所述词向量转换层基于注意力机制对所述融合词向量进行处理，以获取所述目标词向量。4.根据权利要求3所述的方法，其特征在于，所述第一语义解析单元包括依次连接的Roformer模型层和第一Bert模型层；所述通过所述第一语义解析单元对所述分词向量序列进行语义特征提取，以获取第一词向量，包括：通过所述Roformer模型层根据所述分词向量序列中各分词向量所对应的位置构建旋转位置编码；将所述分词向量序列和所述旋转位置编码输入至所述第一Bert模型层，通过所述第一Bert模型层根据所述旋转位置编码对所述分词向量序列进行语义特征提取，以获取所述第一词向量。5.根据权利要求3中所述的方法，其特征在于，所述第二语义解析单元包括依次连接的第二Bert模型层和Nezha模型层；所述通过所述第二语义解析单元对所述分词向量序列进行语义特征提取，以获取第二词向量，包括：将所述分词向量序列输入至所述第二Bert模型层，通过所述第二Bert模型层对所述分词向量序列进行语义特征提取，以获取初始词向量；将所述初始词向量输入至所述Nezha模型层，通过所述Nezha模型层对所述初始词向量
进行处理，以获取相对位置编码，并基于所述相对位置编码对所述初始词向量进行语义特征提取，以获取所述第二词向量。6.根据权利要求3所述的方法，其特征在于，所述通过所述模型融合层对所述第一词向量和所述第二词向量进行融合，以获取融合词向量，包括：将所述第一词向量和所述第二词向量中对应同一分词的词向量相加或拼接，以获取所述融合词向量。7.根据权利要求3所述的方法，其特征在于，所述融合词向量包括与各所述分词对应的嵌入词向量，所述词向量转换层包括注意力层和转换层；所述通过所述词向量转换层基于注意力机制对所述融合词向量进行处理，以获取所述目标词向量，包括：通过所述注意力层基于注意力机制确定与各所述嵌入词向量对应的注意力权重；通过所述转换层根据各所述嵌入词向量和与各所述...

【专利技术属性】
技术研发人员：刘康，李鉴学，范潇，杨明川，
申请(专利权)人：中国电信股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人