一种训练自然语言处理模型的方法和系统技术方案

技术编号：26377660 阅读：19 留言：0更新日期：2020-11-19 23:46

本申请实施例公开了一种训练自然语言处理模型方法及系统。所述方法包括：获取语言训练样本以及初始模型，所述初始模型包括第一模型以及第二模型，所述第一模型至少包含编码器，所述第二模型至少包含所述第一模型的编码器；以及利用所述语言训练样本，经过迭代训练过程训练所述初始模型以生成自然语言处理模型，其中，所述迭代训练过程包括一次或以上的迭代，所述编码器在每一次迭代中被更新两次。本申请在训练执行具体自然语言处理任务的第二模型时，先通过训练编码器的方式对语言训练样本进行预处理，可以解决自然语言处理过程中数据集较大的问题，提高训练效率以及准确率。

全部详细技术资料下载

【技术实现步骤摘要】
一种训练自然语言处理模型的方法和系统
本申请涉及自然语言处理领域，特别涉及一种训练自然语言处理模型的方法和系统。
技术介绍
近年来，自然语言处理(NLP，NaturalLanguageProcessing)作为研究人与计算机交互的语言问题的基础，其融合了语言学、计算机科学、数学科学等，也是人工智能的核心课题之一。目前，在例如语义分析、情感分类等具体的自然语言处理任务中，通常需要将海量的输入文本或语音转换文本数据，影响自然语言处理系统的效率及性能。
技术实现思路
本申请实施例之一提供一种训练自然语言处理模型的方法，以提高自然语言处理模型的训练效果和/或训练效率。本申请实施例之一提供一种训练自然语言处理模型的方法。该方法包括获取语言训练样本以及初始模型，所述初始模型包括第一模型以及第二模型，所述第一模型至少包含编码器，所述第二模型至少包括所述第一模型的编码器。该方法进一步包括利用所述语言训练样本，经过迭代训练过程训练所述初始模型以生成自然语言处理模型。其中，所述迭代训练过程包括一次或以上的迭代，所述编码器在第一次迭代中被更新两次。本申请实施例之一提供一种训练自然语言处理模型的系统。所述系统包括获取模块和训练模块。所述获取模块用于获取语言训练样本以及初始模型，所述初始模型包括第一模型以及第二模型，所述第一模型至少包含编码器，所述第二模型至少包括所述第一模型的编码器。所述训练模块用于利用所述语言训练样本，经过迭代训练过程训练所述初始模型以生成自然语言处理模型。其中，所述迭代训练过程...

【技术保护点】
1.一种训练自然语言处理模型的方法，其特征在于，所述方法包括：/n获取语言训练样本以及初始模型，所述初始模型包括第一模型以及第二模型，所述第一模型至少包含编码器，所述第二模型至少包括所述第一模型的编码器；以及/n利用所述语言训练样本，经过迭代训练过程训练所述初始模型以生成自然语言处理模型，/n其中，所述迭代训练过程包括一次或以上的迭代，所述编码器在每一次迭代中被更新两次。/n

【技术特征摘要】
1.一种训练自然语言处理模型的方法，其特征在于，所述方法包括：
获取语言训练样本以及初始模型，所述初始模型包括第一模型以及第二模型，所述第一模型至少包含编码器，所述第二模型至少包括所述第一模型的编码器；以及
利用所述语言训练样本，经过迭代训练过程训练所述初始模型以生成自然语言处理模型，
其中，所述迭代训练过程包括一次或以上的迭代，所述编码器在每一次迭代中被更新两次。

2.根据权利要求1所述的方法，其特征在于，所述一次或以上的迭代中的至少一次当前迭代包括：
基于所述语言训练样本更新当前迭代中的第一模型以得到第一被更新的第一模型，所述第一被更新的第一模型包括第一被更新的编码器；
基于所述第一被更新的编码器构建当前迭代中的第二模型；
基于所述语言训练样本更新当前迭代中的第二模型以得到被更新的第二模型，所述被更新的第二模型包括第二被更新的编码器；
基于所述第一被更新的第一模型和第二被更新的编码器生成第二被更新的第一模型，以用于下一次迭代。

3.根据权利要求2所述的方法，其特征在于，所述语言训练样本包括一个或多个第一语言序列，所述基于所述语言训练样本更新当前迭代中的第一模型以得到第一被更新的第一模型包括：
对每个第一语言序列，将其输入所述当前迭代中的第一模型，以得到预测语言序列；
基于所述一个或多个第一语言序列和所述一个或多个预测语言序列，确定第一损失函数的值；以及
基于所述第一损失函数的值，更新所述当前迭代中的第一模型以得到第一被更新的第一模型。

4.根据权利要求3所述的方法，其特征在于，对所述每个第一语言序列，当前迭代中的第一模型的编码器被用于：
将所述第一语言序列转化成语义向量；以及
对所述语义向量进行编码，以生成编码后的语义向量。

5.根据权利要求4所述的方法，其特征在于，所述第一模型进一步包括解码器，
当前迭代中的第一模型的解码器被用于对所述编码后的语义向量进行解码，以生成所述第一语言序列对应的预测语言序列。

6.根据权利要求2所述的方法，其特征在于，所述语...

【专利技术属性】
技术研发人员：程浩，杨晓庆，李奘，
申请(专利权)人：北京嘀嘀无限科技发展有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人