一种模型训练的方法及装置制造方法及图纸

技术编号:29935574 阅读:10 留言:0更新日期:2021-09-04 19:11
本说明书公开了一种模型训练的方法及装置,可以获取训练样本,该训练样本中包含搜索语句,相应的搜索结果、该搜索语句对应的第一标注信息以及该搜索结果对应的第二标注信息。而后,将该搜索结果以及该搜索语句输入到待训练的业务模型中,得到该搜索结果在各业务下的排序评分,以及该搜索语句与各业务之间的匹配度,针对每个业务,根据该搜索语句与该业务之间匹配度,补偿该搜索结果在该业务下的排序评分,得到该搜索结果在该业务下的补偿后排序评分,根据该搜索结果在各业务下的补偿后排序评分、该搜索语句与各业务之间的匹配度、第一标注信息以及第二标注信息,训练业务模型,在降低成本的同时提高了排序的准确性。低成本的同时提高了排序的准确性。低成本的同时提高了排序的准确性。

【技术实现步骤摘要】
一种模型训练的方法及装置


[0001]本说明书涉及计算机
,尤其涉及一种模型训练的方法及装置。

技术介绍

[0002]随着信息技术的不断发展,一个业务平台可以为用户提供各种各样的业务,而为了便于用户快速找到所需执行的业务,业务平台可以为用户提供搜索的功能,用户输入一定的搜索语句,业务平台可以为用户查询到相应的结果展示给用户。
[0003]在实际应用中,业务平台可以提供给用户一个统一的搜索入口,用户可以通过该搜索入口搜索到业务平台中任意一项业务中的搜索结果,例如,在业务平台中,存在订酒店、预约餐厅、点外卖等业务,用户可以在统一搜索入口中搜索某个酒店、某个餐厅等。
[0004]在现有技术中,业务平台可以针对每种业务构建一种排序模型,该排序模型负责对在这一业务中与用户的搜索语句相关的搜索结果进行排序,但是这种方式业务平台需要维护多个模型,成本较高。
[0005]所以,如何在保证对搜索结果排序的准确性的条件下降低维护排序模型的成本,则是一个亟待解决的问题。

技术实现思路

[0006]本说明书提供一种模型训练的方法及装置,以部分的解决现有技术存在的上述问题。
[0007]本说明书采用下述技术方案:
[0008]本说明书提供了一种模型训练的方法,包括:
[0009]获取训练样本,所述训练样本中包含搜索语句,所述搜索语句对应的搜索结果、所述搜索语句对应的第一标注信息以及所述搜索结果对应的第二标注信息,所述第一标注信息用于表示与所述搜索语句相关的业务,所述第二标注信息用于表示用户针对所述搜索结果的实际操作结果;
[0010]将所述搜索结果以及所述搜索语句输入到待训练的业务模型中,得到所述搜索结果在各业务下的排序评分,以及所述搜索语句与各业务之间的匹配度;
[0011]针对每个业务,根据所述搜索语句与该业务之间匹配度,补偿所述搜索结果在该业务下的排序评分,得到所述搜索结果在该业务下的补偿后排序评分;
[0012]根据所述搜索结果在各业务下的补偿后排序评分、所述搜索语句与各业务之间的匹配度、所述第一标注信息以及所述第二标注信息,训练所述业务模型。
[0013]可选地,所述业务模型中包含排序模型以及业务匹配模型;
[0014]将所述搜索结果以及所述搜索语句输入到待训练的业务模型中,得到所述搜索结果在各业务下的排序评分,以及所述搜索语句与各业务之间的匹配度,具体包括:
[0015]将所述搜索结果输入到所述排序模型中,得到所述搜索结果在各业务下的排序评分,以及将所述搜索语句输入到所述业务匹配模型中,得到所述搜索语句与各业务之间的
匹配度。
[0016]可选地,所述排序模型中包含特征提取层以及各业务对应的业务层;
[0017]将所述搜索结果输入到所述排序模型中,得到所述搜索结果在各业务下的排序评分,具体包括:
[0018]将所述搜索结果输入到所述特征提取层中,得到所述搜索结果对应的特征向量;
[0019]针对每个业务,将所述特征向量输入到该业务对应的业务层中,得到所述搜索结果在该业务下的排序评分。
[0020]可选地,所述特征提取层中包含基础特征提取层以及业务特征提取层;
[0021]将所述搜索结果输入到特征提取层中,得到所述搜索结果对应的特征向量,具体包括:
[0022]将所述搜索结果输入到所述基础特征提取层中,得到基础特征向量;
[0023]将所述基础特征向量输入到所述业务特征提取层中,得到所述搜索结果在各业务下的特征向量;
[0024]将所述特征向量输入到该业务对应的业务层中,得到所述搜索结果在该业务下的排序评分,具体包括:
[0025]将所述搜索结果在该业务下的特征向量输入到该业务对应的业务层中,得到所述搜索结果在该业务下的排序评分。
[0026]可选地,将所述基础特征向量输入到所述业务特征提取层中,得到所述搜索结果在各业务下的特征向量,具体包括:
[0027]将所述基础特征向量输入到所述业务特征提取层中,确定所述基础特征向量在各业务下的注意力权重;
[0028]针对每个业务,根据所述基础特征向量以及所述基础特征向量在该业务下的注意力权重,确定所述搜索结果在该业务下的特征向量。
[0029]可选地,将所述基础特征向量输入到所述业务特征提取层中,确定所述基础特征向量在各业务下的注意力权重,具体包括:
[0030]将所述基础特征向量输入到所述业务特征提取层中,对所述基础特征向量进行向量拆分,得到所述基础特征向量对应的各子向量,以及确定所述基础特征向量对应的各子向量在各业务下的注意力权重;
[0031]针对每个业务,根据所述基础特征向量以及所述基础特征向量在该业务下的注意力权重,确定所述搜索结果在该业务下的特征向量,具体包括:
[0032]针对每个业务,根据所述基础特征向量对应的各子向量,以及所述基础特征向量对应的各子向量在该业务下的注意力权重,确定所述搜索结果在该业务下的特征向量。
[0033]可选地,根据所述搜索结果在各业务下的补偿后排序评分、所述搜索语句与各业务之间的匹配度、所述第一标注信息以及所述第二标注信息,训练所述业务模型,具体包括:
[0034]根据所述搜索结果在各业务下的补偿后排序评分,确定所述搜索结果对应的整体排序评分;
[0035]根据所述整体排序评分、所述搜索语句与各业务之间的匹配度、所述第一标注信息以及所述第二标注信息,训练所述业务模型。
[0036]可选地,根据所述整体排序评分、所述搜索语句与各业务之间的匹配度、所述第一标注信息以及所述第二标注信息,训练所述业务模型,具体包括:
[0037]以最小化所述整体排序评分与所述第二标注信息之间的偏差,以及最小化所述搜索语句与各业务之间的匹配度和所述第一标注信息之间的偏差,对所述排序模型以及所述业务匹配模型进行联合训练。
[0038]可选地,所述方法还包括:
[0039]接收目标用户的搜索请求;
[0040]根据所述搜索请求,确定所述目标用户输入的搜索语句,作为目标搜索语句;
[0041]根据所述目标搜索语句,确定各候选搜索结果;
[0042]针对每个候选搜索结果,将该候选搜索结果以及所述目标搜索语句输入到训练后的业务模型中,得到该候选搜索结果在各业务下对应的排序评分以及所述目标搜索语句与各业务之间的匹配度;
[0043]针对每个业务,根据所述目标搜索语句与该业务之间的匹配度,补偿该候选搜索结果在该业务下的排序评分,得到该候选搜索结果在该业务下的补偿后排序评分;
[0044]根据各候选搜索结果在各业务下的补偿后排序评分,对所述各候选搜索结果进行排序,得到排序结果;
[0045]根据所述排序结果,将所述各候选搜索结果展示给所述目标用户。
[0046]本说明书提供了一种模型训练的装置,包括:
[0047]获取模块,用于获取训练样本,所述本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种模型训练的方法,其特征在于,包括:获取训练样本,所述训练样本中包含搜索语句,所述搜索语句对应的搜索结果、所述搜索语句对应的第一标注信息以及所述搜索结果对应的第二标注信息,所述第一标注信息用于表示与所述搜索语句相关的业务,所述第二标注信息用于表示用户针对所述搜索结果的实际操作结果;将所述搜索结果以及所述搜索语句输入到待训练的业务模型中,得到所述搜索结果在各业务下的排序评分,以及所述搜索语句与各业务之间的匹配度;针对每个业务,根据所述搜索语句与该业务之间匹配度,补偿所述搜索结果在该业务下的排序评分,得到所述搜索结果在该业务下的补偿后排序评分;根据所述搜索结果在各业务下的补偿后排序评分、所述搜索语句与各业务之间的匹配度、所述第一标注信息以及所述第二标注信息,训练所述业务模型。2.如权利要求1所述的方法,其特征在于,所述业务模型中包含排序模型以及业务匹配模型;将所述搜索结果以及所述搜索语句输入到待训练的业务模型中,得到所述搜索结果在各业务下的排序评分,以及所述搜索语句与各业务之间的匹配度,具体包括:将所述搜索结果输入到所述排序模型中,得到所述搜索结果在各业务下的排序评分,以及将所述搜索语句输入到所述业务匹配模型中,得到所述搜索语句与各业务之间的匹配度。3.如权利要求2所述的方法,其特征在于,所述排序模型中包含特征提取层以及各业务对应的业务层;将所述搜索结果输入到所述排序模型中,得到所述搜索结果在各业务下的排序评分,具体包括:将所述搜索结果输入到所述特征提取层中,得到所述搜索结果对应的特征向量;针对每个业务,将所述特征向量输入到该业务对应的业务层中,得到所述搜索结果在该业务下的排序评分。4.如权利要求3所述的方法,其特征在于,所述特征提取层中包含基础特征提取层以及业务特征提取层;将所述搜索结果输入到特征提取层中,得到所述搜索结果对应的特征向量,具体包括:将所述搜索结果输入到所述基础特征提取层中,得到基础特征向量;将所述基础特征向量输入到所述业务特征提取层中,得到所述搜索结果在各业务下的特征向量;将所述特征向量输入到该业务对应的业务层中,得到所述搜索结果在该业务下的排序评分,具体包括:将所述搜索结果在该业务下的特征向量输入到该业务对应的业务层中,得到所述搜索结果在该业务下的排序评分。5.如权利要求4所述的方法,其特征在于,将所述基础特征向量输入到所述业务特征提取层中,得到所述搜索结果在各业务下的特征向量,具体包括:将所述基础特征向量输入到所述业务特征提取层中,确定所述基础特征向量在各业务下的注意力权重;
针对每个业务,根据所述基础特征向量以及所述基础特征向量在该业务下的注意力权重,确定所述搜索结果在该业务下的特征向量。6.如权利要求5所述的方法,其特征在于,将所述基础特征向量输入到所述业务特征提取层中,确定所述基础特征向量在各业务下的注意力权重,具体包括:将所述基础特征向量输入到所述业务特征提取层中,对所述基础特征向量进行向量拆分,得到所述基础特征向量对应的各子向量,以及确定所述基础特征向量对应的各子向量在各业务下的注意力权重;针对每个业务,根据所述基础特征向量以及所述基础特征向量在该业务...

【专利技术属性】
技术研发人员:冯家琪肖垚黄培浩周翔陈胜
申请(专利权)人:北京三快在线科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1