一种模型训练方法、装置、设备及介质制造方法及图纸

技术编号：38543372 阅读：11 留言：0更新日期：2023-08-22 20:54

本申请实施例提供一种模型训练方法、装置、设备及介质，该方法可以由计算机设备执行，该方法包括：将第一数据集输入训练好的召回模型，基于所述训练好的召回模型得到第一顺序集合；接收第一指令，根据所述第一指令和所述第一顺序集合确定第二顺序集合；将所述第一数据集输入所述排序模型，并基于所述第二顺序集合监督所述排序模型进行训练，得到训练好的排序模型，所述训练好的排序模型用于输入待识别的无标签数据和输出所述待识别的无标签数据对应的M个预设标签的排序，所述M个预设标签的排序用于实现应用的功能。序用于实现应用的功能。序用于实现应用的功能。

全部详细技术资料下载

【技术实现步骤摘要】
一种模型训练方法、装置、设备及介质

[0001]本申请涉及计算机
，具体涉及到一种模型训练方法、装置、设备及介质。

技术介绍

[0002]在诸如搜索引擎、文字检索等应用中，需要用到排序模型来实现应用的功能。排序模型越精准，应用的功能的性能越好。
[0003]在具体实现时，需要大量标签数据对排序模型进行训练，这些标签数据具有多个标签且该多个标签的顺序确定，因此选择高质量的标签数据对排序模型的训练效果为重要。现有技术中，主要通过人工对数据打标签，由于排序模型需要通过大量的标签数据进行训练，人为打标工作量大，效率低，训练排序模型的成本高；并且在打标过程中，容易引起人为失误，导致排序的标签不符合实际需要，即排序的标签准确率低。

技术实现思路

[0004]本申请实施例提供一种模型训练方法、装置、设备及介质，用于解决现有技术中获得排序的标签的效率低、成本高以及排序的标签准确率低的技术问题。
[0005]第一方面，本申请实施例提供一种模型训练方法，该方法可以由计算机设备执行，该方法包括：将第一数据集输入训练好的召回模型，基于所述训练好的召回模型得到第一顺序集合；其中，所述第一数据集中包括多条无标签数据，所述训练好的召回模型用于针对输入的每条无标签数据输出N个预设标签的排序，所述第一顺序集合包括所述多条无标签数据中各条无标签数据对应的N个预设标签的排序，所述N为正整数；接收第一指令，根据所述第一指令和所述第一顺序集合确定第二顺序集合；将所述第一数据集输入所述排序模型，并基于所述第二顺序集合监督所...

【技术保护点】

【技术特征摘要】
1.一种模型训练方法，其特征在于，包括：将第一数据集输入训练好的召回模型，基于所述训练好的召回模型得到第一顺序集合；其中，所述第一数据集中包括多条无标签数据，所述训练好的召回模型用于针对输入的每条无标签数据输出N个预设标签的排序，所述第一顺序集合包括所述多条无标签数据中各条无标签数据对应的N个预设标签的排序，所述N为正整数；接收第一指令，根据所述第一指令和所述第一顺序集合确定第二顺序集合；将所述第一数据集输入所述排序模型，并基于所述第二顺序集合监督所述排序模型进行训练，得到训练好的排序模型，所述训练好的排序模型用于输入待识别的无标签数据和输出所述待识别的无标签数据对应的M个预设标签的排序，所述M个预设标签的排序用于实现应用的功能，所述M为小于或等于N的正整数。2.如权利要求1所述的方法，其特征在于，在所述将第一数据集输入训练好的召回模型之前，还包括：获得第二数据集，所述第二数据集中包括至少一条标签数据；基于所述第二数据集训练召回模型，得到所述训练好的召回模型。3.如权利要求1所述的方法，其特征在于，所述接收第一指令，根据所述第一指令和所述第一顺序集合确定第二顺序集合，包括：根据所述第一指令更改所述第一顺序集合中至少一条无标签数据对应的N个预设标签的排序。4.如权利要求3所述的方法，其特征在于，所述第一指令中包含针对至少一条无标签数据中第一无标签数据对应的第一标签的指示信息；所述接收第一指令，根据所述第一指令和所述第一顺序集合确定第二顺序集合，包括：将所述第一标签置于所述第一无标签数据对应的N个预设标签的排序的首位。5.如权利要求1所述的方法，其特征在于，所述应用包括搜索引擎；所述功能包括对搜索的结果进行排序。6.一种模型训练装置，其特征在于，包括：处理模块，用于将第一数据集输入训练好的召回模型，基于所述训练好的召...

【专利技术属性】
技术研发人员：朱明浩，倪志恒，王龙，陈立力，周明伟，
申请(专利权)人：浙江大华技术股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人