搜索召回方法、召回模型训练方法、装置和计算机设备制造方法及图纸

技术编号:36229061 阅读:12 留言:0更新日期:2023-01-04 12:28
本申请涉及一种搜索召回方法、召回模型训练方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括:分别对当前搜索对象对应的历史搜索语句序列和历史正向召回信息序列进行特征转换,得到对应的历史搜索语句特征序列、正向召回信息特征序列;基于历史搜索语句特征序列,对正向召回信息特征序列进行解调处理,得到当前搜索对象对应的搜索对象特征初始序列;对当前搜索对象的当前搜索语句进行特征提取,得到当前搜索语句特征,融合当前搜索语句特征和搜索对象特征初始序列,得到搜索融合特征;基于搜索融合特征,从候选召回资源库中获取对应的匹配召回资源作为当前搜索对象对应的当前召回结果。采用本方法能够召回准确性。性。性。

【技术实现步骤摘要】
搜索召回方法、召回模型训练方法、装置和计算机设备


[0001]本申请涉及计算机
,特别是涉及一种搜索召回方法、召回模型训练方法、装置、计算机设备、存储介质和计算机程序产品。

技术介绍

[0002]随着计算机技术的发展,搜索引擎的功能日趋强大。召回是搜索中的重要环节,根据用户输入的搜索语句可以从海量信息资源中召回与搜索语句相关的信息资源。
[0003]传统技术中,通常是提取搜索语句对应的搜索语句特征,提取待召回资源对应的资源特征,基于搜索语句特征和资源特征从待召回资源中确定目标召回资源。然而,从搜索语句中提取到的搜索语句特征包含的信息量有限,容易导致召回准确性较低。

技术实现思路

[0004]基于此,有必要针对上述技术问题,提供一种能够提高召回准确性的搜索召回方法、召回模型训练方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
[0005]本申请提供了一种搜索召回方法。所述方法包括:获取当前搜索语句,获取当前搜索对象对应的历史搜索语句序列和历史正向召回信息序列;所述当前搜索对象为所述当前搜索语句对应的搜索对象,所述历史正向召回信息序列中的历史正向召回信息是历史正向召回资源对应的资源信息;分别对所述历史搜索语句序列和所述历史正向召回信息序列进行特征转换,得到对应的历史搜索语句特征序列、正向召回信息特征序列;基于所述历史搜索语句特征序列,对所述正向召回信息特征序列进行解调处理,得到所述当前搜索对象对应的搜索对象特征初始序列;对所述当前搜索语句进行特征提取,得到当前搜索语句特征,融合所述当前搜索语句特征和所述搜索对象特征初始序列,得到搜索融合特征;基于所述搜索融合特征,从候选召回资源库中获取对应的匹配召回资源作为所述当前搜索对象对应的当前召回结果。
[0006]本申请还提供了一种搜索召回装置。所述装置包括:数据获取模块,用于获取当前搜索语句,获取当前搜索对象对应的历史搜索语句序列和历史正向召回信息序列;所述当前搜索对象为所述当前搜索语句对应的搜索对象,所述历史正向召回信息序列中的历史正向召回信息是历史正向召回资源对应的资源信息;特征转换模块,用于分别对所述历史搜索语句序列和所述历史正向召回信息序列进行特征转换,得到对应的历史搜索语句特征序列、正向召回信息特征序列;特征解调模块,用于基于所述历史搜索语句特征序列,对所述正向召回信息特征序列进行解调处理,得到所述当前搜索对象对应的搜索对象特征初始序列;特征融合模块,用于对所述当前搜索语句进行特征提取,得到当前搜索语句特征,融合所述当前搜索语句特征和所述搜索对象特征初始序列,得到搜索融合特征;
资源召回模块,用于基于所述搜索融合特征,从候选召回资源库中获取对应的匹配召回资源作为所述当前搜索对象对应的当前召回结果。
[0007]一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述搜索召回方法所述的步骤。
[0008]一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述搜索召回方法所述的步骤。
[0009]一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现上述搜索召回方法所述的步骤。
[0010]上述搜索召回方法、装置、计算机设备、存储介质和计算机程序产品,通过获取当前搜索语句,获取当前搜索对象对应的历史搜索语句序列和历史正向召回信息序列;当前搜索对象为当前搜索语句对应的搜索对象,历史正向召回信息序列中的历史正向召回信息是历史正向召回资源对应的资源信息;分别对历史搜索语句序列和历史正向召回信息序列进行特征转换,得到对应的历史搜索语句特征序列、正向召回信息特征序列;基于历史搜索语句特征序列,对正向召回信息特征序列进行解调处理,得到当前搜索对象对应的搜索对象特征初始序列;对当前搜索语句进行特征提取,得到当前搜索语句特征,融合当前搜索语句特征和搜索对象特征初始序列,得到搜索融合特征;基于搜索融合特征,从候选召回资源库中获取对应的匹配召回资源作为当前搜索对象对应的当前召回结果。这样,历史正向召回信息序列隐含了当前搜索对象的对象属性,基于历史搜索语句特征序列对正向召回信息特征序列进行解调处理,可以从正向召回信息特征序列中解调出用于表征当前搜索对象的对象属性的搜索对象特征,搜索对象特征初始序列为搜索对象特征对应的序列。融合当前搜索语句对应的当前搜索语句特征和当前搜索对象对应的搜索对象特征得到的搜索融合特征,既包含当前搜索语句对应的语义信息,又包含当前搜索对象对应的属性信息,基于这样的搜索融合特征从候选召回资源库中获取到的匹配召回资源不仅与当前搜索语句匹配,而且还与当前搜索对象匹配,具有更高的准确性,可以有效提高搜索召回的准确性,实现针对当前搜索对象的个性化召回。
[0011]本申请提供了一种召回模型训练方法。所述方法包括:获取训练搜索语句和所述训练搜索语句对应的正向召回信息、反向召回信息,获取训练搜索对象对应的历史搜索语句序列和历史正向召回信息序列,将所述训练搜索语句、所述正向召回信息、所述反向召回信息、所述历史搜索语句序列和所述历史正向召回信息序列输入初始召回模型;所述训练搜索对象为所述训练搜索语句对应的搜索对象,召回信息是召回资源对应的资源信息;分别对所述历史搜索语句序列和所述历史正向召回信息序列进行特征转换,得到对应的历史搜索语句特征序列、正向召回信息特征序列;基于所述历史搜索语句特征序列,对所述正向召回信息特征序列进行解调处理,得到所述训练搜索对象对应的搜索对象特征初始序列;分别对所述训练搜索语句、所述正向召回信息、所述反向召回信息进行特征提取,得到训练搜索语句特征、目标正向召回信息特征、目标反向召回信息特征;融合所述训练搜索语句特征和所述搜索对象特征初始序列,得到搜索融合特征;基于所述搜索融合特征分别和所述目标正向召回信息特征、所述目标反向召回信
息特征之间的特征相似度,调整所述初始召回模型的模型参数,直至满足收敛条件,得到目标召回模型。
[0012]本申请还提供了一种召回模型训练装置。所述装置包括:训练数据获取模块,用于获取训练搜索语句和所述训练搜索语句对应的正向召回信息、反向召回信息,获取训练搜索对象对应的历史搜索语句序列和历史正向召回信息序列,将所述训练搜索语句、所述正向召回信息、所述反向召回信息、所述历史搜索语句序列和所述历史正向召回信息序列输入初始召回模型;所述训练搜索对象为所述训练搜索语句对应的搜索对象,召回信息是召回资源对应的资源信息;特征转换模块,用于分别对所述历史搜索语句序列和所述历史正向召回信息序列进行特征转换,得到对应的历史搜索语句特征序列、正向召回信息特征序列;特征解调模块,用于基于所述历史搜索语句特征序列,对所述正向召回信息特征序列进行解调处理,得到所述训练搜索对象对应的搜索对象特征初始序列;特征提取模块,用于分别对所述训练搜索语句、所述正向召回信息、所述反向召回信息进行特征提取,得到训练搜索语句特征、目标正向召回信息特征、目标反向召回信息特征;特征融合模块,用于融合所述训练搜索本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种搜索召回方法,其特征在于,所述方法包括:获取当前搜索语句,获取当前搜索对象对应的历史搜索语句序列和历史正向召回信息序列;所述当前搜索对象为所述当前搜索语句对应的搜索对象,所述历史正向召回信息序列中的历史正向召回信息是历史正向召回资源对应的资源信息;分别对所述历史搜索语句序列和所述历史正向召回信息序列进行特征转换,得到对应的历史搜索语句特征序列、正向召回信息特征序列;基于所述历史搜索语句特征序列,对所述正向召回信息特征序列进行解调处理,得到所述当前搜索对象对应的搜索对象特征初始序列;对所述当前搜索语句进行特征提取,得到当前搜索语句特征,融合所述当前搜索语句特征和所述搜索对象特征初始序列,得到搜索融合特征;基于所述搜索融合特征,从候选召回资源库中获取对应的匹配召回资源作为所述当前搜索对象对应的当前召回结果。2.根据权利要求1所述的方法,其特征在于,所述基于所述历史搜索语句特征序列,对所述正向召回信息特征序列进行解调处理,得到所述当前搜索对象对应的搜索对象特征初始序列,包括:基于所述历史搜索语句特征序列和所述正向召回信息特征序列进行搜索语句和召回信息的对齐,得到所述历史正向召回信息序列对应的搜索语句特征对齐序列;基于所述搜索语句特征对齐序列,对所述正向召回信息特征序列进行解调处理,得到所述当前搜索对象对应的搜索对象特征初始序列。3.根据权利要求2所述的方法,其特征在于,所述基于所述历史搜索语句特征序列和所述正向召回信息特征序列进行搜索语句和召回信息的对齐,得到所述历史正向召回信息序列对应的搜索语句特征对齐序列,包括:基于所述历史搜索语句特征序列中的历史搜索语句特征和所述正向召回信息特征序列中的历史正向召回信息特征之间的特征相似度,得到历史正向召回信息和历史搜索语句之间的关联权重;基于同一历史正向召回信息对应的各个关联权重,对所述历史搜索语句特征序列中对应的各个历史搜索语句特征进行融合,得到各个历史正向召回信息分别对应的搜索语句对齐特征;基于各个搜索语句对齐特征得到所述搜索语句特征对齐序列。4.根据权利要求2所述的方法,其特征在于,所述基于所述搜索语句特征对齐序列,对所述正向召回信息特征序列进行解调处理,得到所述当前搜索对象对应的搜索对象特征初始序列,包括:在所述搜索语句特征对齐序列和所述正向召回信息特征序列中,将同一历史正向召回信息对应的搜索语句对齐特征和历史正向召回信息特征进行融合,得到语句融合特征序列;基于解调权重,对所述语句融合特征序列进行调整,得到所述搜索对象特征初始序列。5.根据权利要求1所述的方法,其特征在于,所述融合所述当前搜索语句特征和所述搜索对象特征初始序列,得到搜索融合特征,包括:对所述搜索对象特征初始序列进行小波变换,得到至少两个搜索对象特征目标序列;
融合所述当前搜索语句特征和各个搜索对象特征目标序列,得到所述搜索融合特征。6.根据权利要求5所述的方法,其特征在于,所述对所述搜索对象特征初始序列进行小波变换,得到至少两个搜索对象特征目标序列,包括:将所述搜索对象特征初始序列作为当前处理序列;获取当前处理序列对应的滤波频率,将当前处理序列中低于滤波频率的数据滤除,得到第一特征滤波序列,将当前处理序列中高于或等于滤波频率的数据滤除,得到第二特征滤波序列;对第一特征滤波序列进行下采样处理,得到第一特征下采样序列,对第二特征滤波序列进行下采样处理,得到第二特征下采样序列;将第二特征下采样序列作为当前处理序列,返回所述获取当前处理序列对应的滤波频率,将当前处理序列中低于滤波频率的数据滤除,得到第一特征滤波序列,将当前处理序列中高于或等于滤波频率的数据滤除,得到第二特征滤波序列的步骤执行,直至满足结束条件,得到各个第一特征下采样序列和各个第二特征下采样序列;基于所述各个第一特征下采样序列和所述各个第二特征下采样序列,得到所述至少两个搜索对象特征目标序列。7.根据权利要求5所述的方法,其特征在于,所述对所述搜索对象特征初始序列进行小波变换,得到至少两个搜索对象特征目标序列,包括:对所述搜索对象特征初始序列进行滤波处理,得到搜索对象特征中间序列;对所述搜索对象特征中间序列进行小波变换,得到所述至少两个搜索对象特征目标序列。8.根据权利要求7所述的方法,其特征在于,所述对所述搜索对象特征初始序列进行滤波处理,得到搜索对象特征中间序列,包括:对所述搜索对象特征初始序列进行频域变换,得到初始频域信息;基于滤波权重,对所述初始频域信息进行调整,得到目标频域信息;对所述目标频域信息进行时域变换,得到所述搜索对象特征中间序列。9.根据权利要求5所述的方法,其特征在于,所述融合所述当前搜索语句特征和各个搜索对象特征目标序列,得到所述搜索融合特征,包括:分别对各个搜索对象特征目标序列进行池化处理,得到对应的各个搜索对象目标特征;获取所述当前搜索语句特征和所述各个搜索对象目标特征分别对应的特征权重;基于特征权重,融合所述各个搜索对象目标特征和所述当前搜索语句特征,得到所述搜索融合特征。10.根据权利要求1所述的方法,其特征在于,所述候选召回资源库包括多个候选召回资源;所述基于所述搜索融合特征,从候选召回资源库中获取对应的匹配召回资源作为所述当前搜索对象对应的当前召回结果,包括:计算各个候选召回资源对应的候选召回信息的候选召回信息特征分别和所述搜索融合特征之间的特征相似度;基于所述特征相似度,从各个候选召回信息中确定匹配召回信息;
从所述候选召回数据库中,将所述匹配召回信息对应的候选召回资源作为所述匹配召回资源,得到所述当前召回结果。11.根据权利要求1至10中任一项所述的方法,其特征在于,所述方法还包括:对所述候选召回资源库中的候选召回资源所对应的候选召回信息进行特征转换,得到对...

【专利技术属性】
技术研发人员:李作潮马建强亓超
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1