文本对应类目的预测方法、装置以及电子设备制造方法及图纸

技术编号:37465442 阅读:16 留言:0更新日期:2023-05-06 09:39
本发明专利技术提供了一种文本对应类目的预测方法、装置以及电子设备,涉及数据处理技术领域,缓解了对用户输入的文本对应商品类目的预测精准度较低的技术问题。该方法包括:获取用户在搜索界面所输入的待搜索的目标文本;利用多个不同种类的类目预测模型分别对目标文本进行预测,得到若干预测类目;基于若干预测类目确定一目标类目,并将目标类目确定为目标文本对应的参考类目;利用参考类目生成用于向用户进行推送的目标商品。进行推送的目标商品。进行推送的目标商品。

【技术实现步骤摘要】
文本对应类目的预测方法、装置以及电子设备


[0001]本专利技术涉及数据处理
,尤其是涉及一种文本对应类目的预测方法、装置以及电子设备。

技术介绍

[0002]目前,在用户进行商品搜索时,系统需要根据用户输入的文本,预测用户意图。例如,对于电商搜索,用户输入待搜索商品的文本后,系统需要对输入的文本进行分词,基于意图解析进行商品的召回,而待搜索商品的商品类目的预测是这个过程中必不可少的环节。所以在向用户推送所搜索的商品之前,需要预测用户输入的文本所对应的商品类目,预测的结果将作用于后续待搜索商品的确定和推送等过程,对用户的整个商品搜索结果影响较大。
[0003]现有的文本对应类目的预测方法,主要是统计文本和商品类目的相关性,即统计待搜索的目标文本的分词和商品类目的相互信息,以确定待搜索的目标文本所属商品类目。但是,目前的方法对用户输入的待搜索文本所对应商品类目的预测精准度较低。

技术实现思路

[0004]本申请的目的在于提供一种文本对应类目的预测方法、装置以及电子设备,以缓解目前对用户输入的文本对应商品类目的预测精准度较低的技术问题。
[0005]第一方面,本申请实施例提供了一种文本对应类目的预测方法,所述方法包括:
[0006]获取用户在搜索界面所输入的待搜索的目标文本;其中,所述目标文本用于表征待搜索商品的商品描述信息;
[0007]利用多个不同种类的类目预测模型分别对所述目标文本进行预测,得到若干预测类目;其中,所述预测类目用于表征所述商品描述信息对应的商品类别;所述多个不同种类的类目预测模型是利用相同的训练样本集分别对多个不同种类的初始预测模型进行训练后得到的模型训练结果,所述训练样本集中的每个训练样本均包含训练文本以及所述训练文本对应的训练类目;
[0008]基于所述若干预测类目确定一目标类目,并将所述目标类目确定为所述目标文本对应的参考类目;
[0009]利用所述参考类目生成用于向用户进行推送的目标商品。
[0010]在一个可能的实现中,利用相同的训练样本集分别对多个不同种类的初始预测模型进行训练的过程包括:
[0011]将相同的所述训练样本集分别转换为多种不同格式的训练样本集;其中,每种所述格式对应多个不同种类的初始预测模型中的一种所述初始预测模型的训练样本格式;
[0012]将每种所述格式的训练样本集输入至训练样本格式对应的所述初始预测模型中,通过训练得到多个不同种类的训练后的类目预测模型。
[0013]在一个可能的实现中,所述基于所述若干预测类目确定一目标类目的步骤,包括:
[0014]通过分类投票算法从所述若干预测类目中确定数量最多的一个目标类目;和/或,
[0015]针对所述若干预测类目中的每个相同的所述预测类目,通过加权算法得到相同的所述预测类目的总概率,并从所述若干预测类目中将所述总概率最大的一预测类目确定为目标类目。
[0016]在一个可能的实现中,所述若干预测类目的类目数量为多个;所述基于所述若干预测类目确定一目标类目的步骤,包括:
[0017]通过分类投票算法从多个所述预测类目中确定数量最多的多个初始类目;其中,所述初始类目的数量小于或等于所述预测类目的数量;
[0018]针对每个相同的所述初始类目,通过加权算法得到相同的所述初始类目的总概率,并从多个所述初始类目中将所述总概率最大的一初始类目确定为目标类目。
[0019]在一个可能的实现中,所述将所述目标类目确定为所述目标文本对应的参考类目的步骤之后,还包括:
[0020]将所述参考类目与预设正确类目进行对比,得到第一对比结果;
[0021]根据所述第一对比结果确定所述参考类目的类目结果准确度。
[0022]在一个可能的实现中,还包括:
[0023]将所述预测类目与预设正确类目进行对比,得到第二对比结果;
[0024]根据所述第二对比结果确定所述预测类目对应的所述类目预测模型的类目预测准确度。
[0025]在一个可能的实现中,所述目标类目的确定过程包括基于所述若干预测类目进行加权算法的过程;
[0026]所述根据所述第二对比结果确定所述预测类目对应的所述类目预测模型的类目预测准确度的步骤之后,还包括:
[0027]根据所述类目预测准确度,调整对应的所述预测类目的各自分概率在所述加权算法中的权重值;其中,所述类目预测准确度越高,对应的所述权重值越高。
[0028]在一个可能的实现中,所述训练样本集的获取过程包括:
[0029]获取训练文本以及用户对所述训练文本的类目确定结果;其中,所述训练文本用于表征商品的历史描述信息;
[0030]基于所述类目确定结果确定所述训练文本对应的训练类目;其中,所述训练类目用于表征所述历史描述信息对应的商品类别;
[0031]基于多个所述训练文本和对应的所述训练类目,得到所述训练样本集。
[0032]在一个可能的实现中,所述基于多个所述训练文本和对应的所述训练类目,得到所述训练样本集的步骤,包括:
[0033]获取多个所述训练文本和对应的所述训练类目;
[0034]如果在多个所述训练类目中第一训练类目对应的第一训练文本的数量小于或等于预设文本数量,则从所述第一训练类目对应包含的预设商品中确定第一预设商品;
[0035]将所述第一预设商品确定为所述第一训练类目对应的所述第一训练文本,以增加所述第一训练文本的数量。
[0036]在一个可能的实现中,所述训练样本中包含所述训练文本、所述训练文本对应的正样本类目和所述训练文本对应的负样本类目;所述基于多个所述训练文本、对应的所述
正样本类目和对应的所述负样本类目,得到所述训练样本集的步骤,包括:
[0037]针对同一所述训练文本,确定对应的所述正样本类目的指定同含义类目;
[0038]将所述指定同含义类目确定为所述训练文本对应的所述正样本类目,得到第一正样本类目;
[0039]在对应的所述负样本类目中删除所述指定同含义类目,得到第一负样本类目;
[0040]基于多个所述训练文本、对应的所述第一正样本类目和对应的所述第一负样本类目,得到所述训练样本集。
[0041]在一个可能的实现中,所述训练样本中包含所述训练文本、所述训练文本对应的正样本类目和所述训练文本对应的负样本类目;所述基于多个所述训练文本、对应的所述正样本类目和对应的所述负样本类目,得到所述训练样本集的步骤,包括:
[0042]针对同一所述训练文本,从对应的所述负样本类目中确定对应的所述正样本类目的指定相似类目;
[0043]在对应的所述负样本类目中删除所述指定相似类目,得到第二负样本类目;
[0044]基于多个所述训练文本、对应的所述正样本类目和对应的所述第二负样本类目,得到所述训练样本集。
[0045]第二方面,提供了一种文本对应类目的预测装置,所述装置包括:
[0046]本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文本对应类目的预测方法,其特征在于,所述方法包括:获取用户在搜索界面所输入的待搜索的目标文本;其中,所述目标文本用于表征待搜索商品的商品描述信息;利用多个不同种类的类目预测模型分别对所述目标文本进行预测,得到若干预测类目;其中,所述预测类目用于表征所述商品描述信息对应的商品类别;所述多个不同种类的类目预测模型是利用相同的训练样本集分别对多个不同种类的初始预测模型进行训练后得到的模型训练结果,所述训练样本集中的每个训练样本均包含训练文本以及所述训练文本对应的训练类目;基于所述若干预测类目确定一目标类目,并将所述目标类目确定为所述目标文本对应的参考类目;利用所述参考类目生成用于向用户进行推送的目标商品。2.根据权利要求1所述的方法,其特征在于,利用相同的训练样本集分别对多个不同种类的初始预测模型进行训练的过程包括:将相同的所述训练样本集分别转换为多种不同格式的训练样本集;其中,每种所述格式对应多个不同种类的初始预测模型中的一种所述初始预测模型的训练样本格式;将每种所述格式的训练样本集输入至训练样本格式对应的所述初始预测模型中,通过训练得到多个不同种类的训练后的类目预测模型。3.根据权利要求1所述的方法,其特征在于,所述基于所述若干预测类目确定一目标类目的步骤,包括:通过分类投票算法从所述若干预测类目中确定数量最多的一个目标类目;和/或,针对所述若干预测类目中的每个相同的所述预测类目,通过加权算法得到相同的所述预测类目的总概率,并从所述若干预测类目中将所述总概率最大的一预测类目确定为目标类目。4.根据权利要求1所述的方法,其特征在于,所述若干预测类目的类目数量为多个;所述基于所述若干预测类目确定一目标类目的步骤,包括:通过分类投票算法从多个所述预测类目中确定数量最多的多个初始类目;其中,所述初始类目的数量小于或等于所述预测类目的数量;针对每个相同的所述初始类目,通过加权算法得到相同的所述初始类目的总概率,并从多个所述初始类目中将所述总概率最大的一初始类目确定为目标类目。5.根据权利要求1所述的方法,其特征在于,所述将所述目标类目确定为所述目标文本对应的参考类目的步骤之后,还包括:将所述参考类目与预设正确类目进行对比,得到第一对比结果;根据所述第一对比结果确定所述参考类目的类目结果准确度。6.根据权利要求1所述的方法,其特征在于,还包括:将所述预测类目与预设正确类目进行对比,得到第二对比结果;根据所述第二对比结果确定所述预测类目对应的所述类目预测模型的类目预测准确度。7.根据权利要求6所述的方法,其特征在于,所述目标类目的确定过程包括基于所述若干预测类目进行加权算法的过程;
所述根据所述第二对比结果确定所述预测类目对应的所述类目预测模型的类目预测准确度的步骤之后,还包括:根据所述类目预测准确度,调整对应的所述预测类目的各自分概率在所述加权算法中的权重值;其中,所述类目预测准确度越高,对应的所述权重值越高。8.根据权利要求1所述的方法,其特征在于,所述训练样本集的获取过程包括:获取训练文本以及用户对所述训练文本的类目确定结果;其中,所述训练文本用于表征商品的历史描述信息;基于所述类目确定结果确定...

【专利技术属性】
技术研发人员:韩强
申请(专利权)人:北京橙心无限科技发展有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1