一种词条推荐方法、装置和用于推荐词条的装置制造方法及图纸

技术编号:33641351 阅读:14 留言:0更新日期:2022-06-02 20:16
本申请实施例公开了一种词条推荐方法、装置和用于推荐词条的装置。该方法的实施例包括:基于多路召回策略召回多个词表,各词表中的词条具有原始得分;分别针对各词表对原始得分进行归一化处理,得到各词表中的词条的目标得分,并分别确定各词表中的词条的权重;基于目标得分和权重,从多个词表中选取目标词条,并将目标词条推送至目标客户端。该实施方式所推荐给用户的词条可更高程度覆盖用户的输入需求,并提高了推荐给用户的词条的准确性。并提高了推荐给用户的词条的准确性。并提高了推荐给用户的词条的准确性。

【技术实现步骤摘要】
一种词条推荐方法、装置和用于推荐词条的装置


[0001]本申请实施例涉及计算机
,具体涉及一种词条推荐方法、装置和用于推荐词条的装置。

技术介绍

[0002]输入法客户端通常配置有系统词库,该词库中包含全量用户的高频词以及一些权威词、热点词等。在用户输入过程中,可从系统词库中选取若干词作为候选项推荐给用户。但随着新词条、新表达方式不断涌现,用户输入需求的差异化越来越大,导致用户的一些个性化的高频词条往往无法入选系统词库,因而系统词库无法满足用户的输入需求。
[0003]现有技术中,通常通过单一或是多路召回策略召回针对某个用户的词表,以满足该用户的输入偏好。然而,采用单一的召回策略召回的词表通常无法准确覆盖用户的输入需求,采用多路召回策略召回的词表之间不存在可比性,因而无法从中筛选出准确的词条为用户推荐。

技术实现思路

[0004]本申请实施例提出了一种词条推荐方法、装置和用于推荐词条的装置,以解决现有技术中推荐给用户的词条无法覆盖用户的输入需求以及准确性较低的技术问题。
[0005]第一方面,本申请实施例提供了一种词条推荐方法,该方法包括:基于多路召回策略召回多个词表,各词表中的词条具有原始得分;分别针对所述各词表对所述原始得分进行归一化处理,得到所述各词表中的词条的目标得分,并分别确定所述各词表中的词条的权重;基于所述目标得分和所述权重,从所述多个词表中选取目标词条,并将所述目标词条推送至目标客户端。
[0006]在一些实施例中,所述分别确定所述各词表中的词条的权重,包括:基于所述原始得分,对所述各词表中的词条进行分组;确定各组词条的权重,其中,同组词条具有相同的权重。
[0007]在一些实施例中,所述基于所述目标得分和所述权重,从所述多个词表中选取目标词条,包括:基于所述权重,对所召回的每个词条的目标得分进行加权求和,得到所召回的每个词条的加权得分;按照加权得分由大到小的次序,对所召回的词条进行排序;基于排序结果,选取预设数量的词条作为目标词条。
[0008]在一些实施例中,将所述目标词条推送至目标客户端,包括:将所述目标词条进行汇总,得到目标词表;将所述多路召回策略所针对的用户作为目标用户,将所述目标词条推送至所述目标用户所使用的目标客户端。
[0009]在一些实施例中,所述分别针对所述各词表对所述原始得分进行归一化处理,得到所述各词表中的词条的目标得分,包括:对于所召回的每个词表,基于该词表中的词条的原始得分中的最小值和最大值,对该词表中的词条的原始得分进行归一化处理,得到该词表中的词条的目标得分。
[0010]在一些实施例中,所述对于所召回的每个词表,基于该词表中的词条的原始得分中的最小值和最大值,对该词表中的词条的原始得分进行归一化处理,得到该词表中的词条的目标得分,包括:对于所召回的每个词表,确定该词表中的词条的原始得分中的最小值和最大值;对于该词表中的每个词条,确定该词条的原始得分与所述最小值的第一差值,确定所述最大值与所述最小值的第二差值,将所述第一差值与所述第二差值的比值确定为该词条的目标得分。
[0011]在一些实施例中,所述对于所召回的每个词表,基于该词表中的词条的原始得分中的最小值和最大值,对该词表中的词条的原始得分进行归一化处理,得到该词表中的词条的目标得分,包括:对于所召回的每个词表,确定该词表中的词条的原始得分中的最小值和最大值,将所述最小值与预设偏差值之和作为第一目标值,将所述最大值与所述预设偏差值之差作为第二目标值;对于该词表中的每个词条,确定该词条的原始得分与所述第一目标值的第一差值,确定所述第二目标值与所述第一目标值的第二差值,将所述第一差值与所述第二差值的比值确定为该词条的目标得分。
[0012]第二方面,本申请实施例提供了一种词条推荐装置,该装置包括:召回单元,被配置成基于多路召回策略召回多个词表,各词表中的词条具有原始得分;处理单元,被配置成分别针对所述各词表对所述原始得分进行归一化处理,得到所述各词表中的词条的目标得分,并分别确定所述各词表中的词条的权重;推送单元,被配置成基于所述目标得分和所述权重,从所述多个词表中选取目标词条,并将所述目标词条推送至目标客户端。
[0013]在一些实施例中,所述处理单元,进一步被配置成:基于所述原始得分,对所述各词表中的词条进行分组;确定各组词条的权重,其中,同组词条具有相同的权重。
[0014]在一些实施例中,所述推送单元,进一步被配置成:基于所述权重,对所召回的每个词条的目标得分进行加权求和,得到所召回的每个词条的加权得分;按照加权得分由大到小的次序,对所召回的词条进行排序;基于排序结果,选取预设数量的词条作为目标词条。
[0015]在一些实施例中,所述推送单元,进一步被配置成:将所述目标词条进行汇总,得到目标词表;将所述多路召回策略所针对的用户作为目标用户,将所述目标词条推送至所述目标用户所使用的目标客户端。
[0016]在一些实施例中,所述处理单元,进一步被配置成:对于所召回的每个词表,基于该词表中的词条的原始得分中的最小值和最大值,对该词表中的词条的原始得分进行归一化处理,得到该词表中的词条的目标得分。
[0017]在一些实施例中,所述处理单元,进一步被配置成:对于所召回的每个词表,确定该词表中的词条的原始得分中的最小值和最大值;对于该词表中的每个词条,确定该词条的原始得分与所述最小值的第一差值,确定所述最大值与所述最小值的第二差值,将所述第一差值与所述第二差值的比值确定为该词条的目标得分。
[0018]在一些实施例中,所述处理单元,进一步被配置成:对于所召回的每个词表,确定该词表中的词条的原始得分中的最小值和最大值,将所述最小值与预设偏差值之和作为第一目标值,将所述最大值与所述预设偏差值之差作为第二目标值;对于该词表中的每个词条,确定该词条的原始得分与所述第一目标值的第一差值,确定所述第二目标值与所述第一目标值的第二差值,将所述第一差值与所述第二差值的比值确定为该词条的目标得分。
[0019]第三方面,本申请实施例提供了一种用于推荐词条的装置,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行一个或者一个以上程序包含用于进行以下操作的指令::基于多路召回策略召回多个词表,各词表中的词条具有原始得分;分别针对所述各词表对所述原始得分进行归一化处理,得到所述各词表中的词条的目标得分,并分别确定所述各词表中的词条的权重;基于所述目标得分和所述权重,从所述多个词表中选取目标词条,并将所述目标词条推送至目标客户端。
[0020]在一些实施例中,所述分别确定所述各词表中的词条的权重,包括:基于所述原始得分,对所述各词表中的词条进行分组;确定各组词条的权重,其中,同组词条具有相同的权重。
[0021]在一些实施例中,所述基于所述目标得分和所述权重,从所述多个词表中选取目标词条,包括:基于所述权重,对所召回的每个词条的目标得分进行加权求和本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种词条推荐方法,其特征在于,所述方法包括:基于多路召回策略召回多个词表,各词表中的词条具有原始得分;分别针对所述各词表对所述原始得分进行归一化处理,得到所述各词表中的词条的目标得分,并分别确定所述各词表中的词条的权重;基于所述目标得分和所述权重,从所述多个词表中选取目标词条,并将所述目标词条推送至目标客户端。2.根据权利要求1所述的方法,其特征在于,所述分别确定所述各词表中的词条的权重,包括:基于所述原始得分,对所述各词表中的词条进行分组;确定各组词条的权重,其中,同组词条具有相同的权重。3.根据权利要求1所述的方法,其特征在于,所述基于所述目标得分和所述权重,从所述多个词表中选取目标词条,包括:基于所述权重,对所召回的每个词条的目标得分进行加权求和,得到所召回的每个词条的加权得分;按照加权得分由大到小的次序,对所召回的词条进行排序;基于排序结果,选取预设数量的词条作为目标词条。4.根据权利要求1所述的方法,其特征在于,所述将所述目标词条推送至目标客户端,包括:将所述目标词条进行汇总,得到目标词表;将所述多路召回策略所针对的用户作为目标用户,将所述目标词条推送至所述目标用户所使用的目标客户端。5.根据权利要求1所述的方法,其特征在于,所述分别针对所述各词表对所述原始得分进行归一化处理,得到所述各词表中的词条的目标得分,包括:对于所召回的每个词表,基于该词表中的词条的原始得分中的最小值和最大值,对该词表中的词条的原始得分进行归一化处理,得到该词表中的词条的目标得分。6.根据权利要求5所述的方法,其特征在于,所述对于所召回的每个词表,基于该词表中的词条的原始得分中的最小值和最大值,对该词表中的词条的原始得分进行归一化处理,得到该词表中的词条的目标得分,包括:对于所召回的每个词表,确定该词表中的词条的原始得分中的最小值和最大值;对于该词表中的每个词条,确定该词条的原始得分与所述最小值的第一差值,...

【专利技术属性】
技术研发人员:李鑫
申请(专利权)人:北京搜狗科技发展有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1