模型训练方法、装置及存储介质制造方法及图纸

技术编号：30448062 阅读：19 留言：0更新日期：2021-10-24 18:41

本申请实施例提供一种模型训练方法、装置及存储介质，其中，模型训练方法包括：获得多个对话样本的困难度；根据每个对话样本的困难度对多个对话样本进行分组，得到至少一个对话样本组；按照预设的困难度顺序，将至少一个对话样本组加入训练集合中，并利用训练集合中的对话样本对对话模型进行训练。通过将对话样本根据困难度进行分组，按照预设的困难度顺序，加入训练集合中进行训练，提高了对话模型训练的效果，进而提高了对话模型的准确率。进而提高了对话模型的准确率。进而提高了对话模型的准确率。

全部详细技术资料下载

【技术实现步骤摘要】
模型训练方法、装置及存储介质

[0001]本申请实施例涉及人工智能
，尤其涉及一种模型训练方法、装置及存储介质。

技术介绍

[0002]随着人工智能的发展，许多设备都可以通过神经网络模型实现和用户进行问答对话。对话状态跟踪（Dialog State Tracking，DST）模型是任务导向型对话中的重要模型，它可以根据对话历史，输出表示对话状态的槽值对，也可以说是将对话进行分类。在模型应用之前，需要利用样本数据对模型进行训练，训练效果的好坏也决定了模型分类的准确性。相关技术中，对DST模型进行训练时，利用对话数据进行随机训练，影响训练效果，进而影响模型的准确率。

技术实现思路

[0003]有鉴于此，本申请实施例提供一种模型训练方法、装置及存储介质，以至少部分解决上述问题。
[0004]根据本申请实施例的第一方面，提供了一种模型训练方法，包括：获得多个对话样本的困难度；根据每个对话样本的困难度对多个对话样本进行分组，得到至少一个对话样本组；按照预设的困难度顺序，将至少一个对话样本组加入训练集合中，并利用训练集合中的对话样本对对话模型进行训练。
[0005]根据本申请实施例的第二方面，提供了一种模型训练装置，包括：困难度模块，用于获得多个对话样本的困难度；分组模块，用于根据每个对话样本的困难度对多个对话样本进行分组，得到至少一个对话样本组；训练模块，用于按照预设的困难度顺序，将至少一个对话样本组加入训练集合中，并利用训练集合中的对话样本对对话模型进行训练。
[0006]根据本...

【技术保护点】

【技术特征摘要】
1.一种模型训练方法，其中，包括：获得多个对话样本的困难度；根据每个对话样本的困难度对所述多个对话样本进行分组，得到至少一个对话样本组；按照预设的困难度顺序，将所述至少一个对话样本组加入训练集合中，并利用所述训练集合中的对话样本对对话模型进行训练。2.根据权利要求1所述的方法，其中，所述对话模型至少包括编码器，所述方法还包括：利用预训练样本对所述编码器进行预训练；具体的，所述利用预训练样本对所述编码器进行预训练，包括：将所述预训练样本输入所述对话模型的编码器中得到编码数据；将所述编码数据输入预设的预训练分类模型，并计算损失函数值，根据计算得到的损失函数值调整所述编码器，以减少所述损失函数值。3.根据权利要求2所述的方法，其中，所述预训练样本包括预训练槽样本和预训练对话样本，所述编码器包括槽编码器和对话编码器，所述将所述预训练样本输入所述对话模型的编码器中得到编码数据，包括：将所述预训练槽样本输入所述槽编码器得到槽编码数据，将预训练对话样本输入所述对话编码器得到对话编码数据，所述编码数据包括所述槽编码数据和所述对话编码数据。4.根据权利要求3所述的方法，其中，所述预训练分类模型包括序列二分类模型、槽分类模型以及掩码语言模型，所述将所述编码数据输入预设的预训练分类模型，并计算损失函数值，根据计算得到的损失函数值调整所述编码器，以减少所述损失函数值，包括：将所述槽编码数据和所述对话编码数据输入所述序列二分类模型，并计算第一损失函数值；将所述槽编码数据和所述对话编码数据输入所述槽分类模型，并计算第二损失函数值；将所述槽编码数据和所述对话编码数据输入所述掩码语言模型，并计算第三损失函数值；将所述第一损失函数值、所述第二损失函数值以及所述第三损失函数值进行加权求和得到所述损失函数值，根据所述损失函数值调整所述编码器，以减少所述损失函数值。5.根据权利要求1所述的方法，其中，所述获得多个对话样本的困难度，包括：根据所述对话模型的准确率，和/或，困难度打分策略，分别对每个对话样本进行困难度打分，得到所述对话样本的困难度。6.根据权利要求1所述的方法，其中，所述获得多个对话样本的困难度，包括：将对话样...

【专利技术属性】
技术研发人员：戴音培，李永彬，孙健，
申请(专利权)人：阿里巴巴达摩院杭州科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人