文本生成方法及装置、语言模型的训练方法及装置制造方法及图纸

技术编号：41726219 阅读：15 留言：0更新日期：2024-06-19 12:49

本发明专利技术公开了一种文本生成方法及装置、语言模型的训练方法及装置。其中，该方法包括：获取文本数据；利用语言模型对文本数据进行生成，得到生成文本，其中，语言模型通过第一训练数据和评分模型对初始语言模型进行训练得到，第一训练数据为根据多个领域的初始权重从多个领域对应的训练数据集中抽取得到的训练数据，多个领域的初始权重通过初始语言模型的第一评分结果进行动态调整得到，第一评分结果用于通过评分模型对初始语言模型的目标训练结果进行评分得到。本发明专利技术解决了文本生成准确度低的技术问题。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及人工智能领域，具体而言，涉及一种文本生成方法及装置、语言模型的训练方法及装置。

技术介绍

1、在人工智能领域，一些语言模型在经过大量的文本数据训练后，可以对人类语言进行理解和生成，也即可以对文本进行生成。在现有的语言模型训练方法中，将整个模型训练分为预训练、指令微调、强化学习三个阶段，其中，预训练往往是根据无监督语料构建而成的弱监督训练，指令微调训练是使用含有指令的问答对数据进行有监督训练，强化学习阶段则使用一问多答的数据进行强化学习，得到训练后的语言模型。

2、但是上述的语言模型训练方法存在影响模型准确度的问题。首先，训练过程中多领域混合数据配比不变，无法保证多领域混合数据配比的合理性，出现领域偏好的可能性较大；其次，各个阶段的切换是人工评测决定的，因此切换时的训练目标不连续，导致模型训练不平滑，损失函数陡增；然后，多个阶段中均需要进行多次不同的人工评测，在增加人工成本同时对训练没有起到改进作用。以上问题均会导致模型训练效果不佳、训练后模型准确度低的问题，使用低准确度的模型进行文本生成，会导致文本生成的准确度也随之降低。

3、针对上述的问题，目前尚未提出有效的解决方案。

技术实现思路

1、本专利技术实施例提供了一种文本生成方法及装置、语言模型的训练方法及装置，以至少解决文本生成准确度低的技术问题。

2、根据本专利技术实施例的一个方面，提供了一种文本生成方法，包括：获取文本数据；利用语言模型对文本数据进行生成，得到生成文本，其中，语

3、可选地，该方法还包括获取多个领域对应的训练数据集；基于多个领域的初始权重从多个领域对应的训练数据集中抽取第一训练数据；基于第一训练数据和评分模型对初始语言模型进行训练，得到语言模型。

4、可选地，基于第一训练数据和评分模型对初始语言模型进行训练，得到语言模型，包括：基于第一训练数据对初始语言模型进行训练，得到目标训练结果；利用评分模型对目标训练结果进行评分，得到第一评分结果，其中，第一评分结果用于通过评分分值确定目标训练结果是否满足预设标准；若第一评分结果为目标训练结果满足预设标准，基于目标训练结果对初始语言模型的模型参数进行调整，得到语言模型；若第一评分结果为目标训练结果不满足预设标准，基于第一评分结果对多个领域的初始权重进行调整，得到多个领域的目标权重，并基于多个领域的目标权重和多个领域的训练数据对初始语言模型的模型参数进行调整，得到语言模型。

5、可选地，基于目标训练结果对初始语言模型的模型参数进行调整，得到语言模型，包括：获取初始语言模型的训练阶段，并基于目标训练结果和标注训练结果构建损失函数；基于训练阶段对应的训练权重对损失函数进行调整，得到目标损失函数；基于目标损失函数对初始语言模型的模型参数进行调整，得到语言模型。

6、可选地，利用评分模型对目标训练结果进行评分，得到第一评分结果，包括：利用评分模型对目标训练结果进行评分，得到第二评分结果；输出第二评分结果；响应于接收到对第二评分结果的调整指令，对第二评分结果进行调整，得到第一评分结果。

7、可选地，基于多个领域的目标权重和多个领域的训练数据对初始语言模型的模型参数进行调整，得到语言模型，包括：基于多个领域的目标权重从多个领域对应的训练数据集中抽取第二训练数据；基于第二训练数据和评分模型对初始语言模型的模型参数进行调整，得到语言模型。

8、可选地，基于第一评分结果对多个领域的初始权重进行调整，得到多个领域的目标权重，包括：确定第一评分结果的评分分值对应的目标倒数；对目标倒数进行归一化处理，得到归一化数据；基于归一化数据对多个领域的初始权重进行调整，得到多个领域的目标权重。

9、可选地，该方法还包括：获取样本文本数据、样本文本数据对应的多个样本生成文本以及样本生成文本对应的样本评分分值；基于样本文本数据、样本生成文本和样本评分分值构建评测训练数据；基于评测训练数据对初始评分模型进行训练，得到评分模型。

10、根据本专利技术实施例的另一个方面，提供了一种语言模型的训练方法，包括：获取多个领域对应的训练数据集；基于多个领域的初始权重从多个领域对应的训练数据集中抽取第一训练数据；基于第一训练数据和评分模型对初始语言模型进行训练，得到语言模型，评分模型用于评测初始语言模型的生成准确度，其中，多个领域的初始权重用于通过初始语言模型的第一评分结果进行动态调整得到，第一评分结果用于通过评分模型对初始语言模型的目标训练结果进行评分得到。

11、根据本专利技术实施例的第三方面，提供了一种文本生成装置，包括：获取模块，用于获取文本数据；生成模块，用于利用语言模型对文本数据进行生成，得到生成文本，其中，语言模型通过第一训练数据和评分模型对初始语言模型进行训练得到，第一训练数据为根据多个领域的初始权重从多个领域对应的训练数据集中抽取得到的训练数据，评分模型用于评测初始语言模型的生成准确度，多个领域的初始权重用于通过初始语言模型的第一评分结果进行动态调整得到，第一评分结果用于通过评分模型对初始语言模型的目标训练结果进行评分得到。

12、根据本专利技术实施例的第四方面，提供了一种语言模型的训练装置，包括：获取模块，用于获取多个领域对应的训练数据集；抽取模块，用于基于多个领域的初始权重从多个领域对应的训练数据集中抽取第一训练数据；训练模块，用于基于第一训练数据和评分模型对初始语言模型进行训练，得到语言模型，评分模型用于评测初始语言模型的生成准确度，其中，多个领域的初始权重用于通过初始语言模型的第一评分结果进行动态调整得到，第一评分结果用于通过评分模型对初始语言模型的目标训练结果进行评分得到。

13、根据本专利技术实施例的第五方面，提供了一种计算机可读存储介质，计算机可读存储介质包括存储的程序，其中，在程序运行时控制所在设备的处理器中执行上述的文本生成方法，或，执行上述的语言模型的训练方法。

14、根据本专利技术实施例的第六方面，提供了一种电子设备，其特征在于，包括：一个或多个处理器；存储装置，用于存储一个或多个程序；当一个或多个程序被一个或多个处理器执行，使得一个或多个处理器中执行上述的文本生成方法，或，执行上述的语言模型的训练方法。

15、在本专利技术实施例中，首先获取文本数据；利用语言模型对文本数据进行生成，得到生成文本，其中，语言模型通过第一训练数据和评分模型对初始语言模型进行训练得到，第一训练数据为根据多个领域的初始权重从多个领域对应的训练数据集中抽取得到的训练数据，多个领域的初始权重通过初始语言模型的第一评分结果进行动态调整得到，第一评分结果用于通过评分模型对初始语言模型的目标训练结果进行评分本文档来自技高网...

【技术保护点】

1.一种文本生成方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述方法还包括：

3.根据权利要求2所述的方法，其特征在于，基于所述第一训练数据和所述评分模型对初始语言模型进行训练，得到所述语言模型，包括：

4.根据权利要求3所述的方法，其特征在于，基于所述目标训练结果对所述初始语言模型的模型参数进行调整，得到所述语言模型，包括：

5.根据权利要求3所述的方法，其特征在于，利用所述评分模型对所述目标训练结果进行评分，得到第一评分结果，包括：

6.根据权利要求3所述的方法，其特征在于，基于所述多个领域的目标权重和所述多个领域的训练数据对所述初始语言模型的模型参数进行调整，得到所述语言模型，包括：

7.根据权利要求5所述的方法，其特征在于，所述方法还包括：

8.一种语言模型的训练方法，其特征在于，包括：

9.一种文本生成装置，其特征在于，包括：

10.一种语言模型的训练装置，其特征在于，包括：

11.一种计算机可读存储介质，其特征在于，所述计算机

12.一种电子设备，其特征在于，包括：

...

【技术特征摘要】

1.一种文本生成方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述方法还包括：

3.根据权利要求2所述的方法，其特征在于，基于所述第一训练数据和所述评分模型对初始语言模型进行训练，得到所述语言模型，包括：

4.根据权利要求3所述的方法，其特征在于，基于所述目标训练结果对所述初始语言模型的模型参数进行调整，得到所述语言模型，包括：

5.根据权利要求3所述的方法，其特征在于，利用所述评分模型对所述目标训练结果进行评分，得到第一评分结果，包括：

6.根据权利要求3所述的方法，其特征在于，基于所述多个领域的目标权重和所述多个领...

【专利技术属性】
技术研发人员：刘欣璋，王子涵，王超，宋双永，
申请(专利权)人：中电信人工智能科技北京有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人