推荐模型的训练方法以及物品推荐方法、系统和相关设备技术方案

技术编号:33713043 阅读:22 留言:0更新日期:2022-06-06 08:50
本公开涉及一种推荐模型的训练方法以及物品推荐方法、系统和相关设备。推荐模型的训练方法包括:利用推荐模型,对包括用户的特征和物品的特征的、用于训练的数据进行处理,获得类别无关表征和类别相关表征,用于训练的数据预先标记有推荐信息、以及物品的类别;利用判别器,分别对类别无关表征和类别相关表征进行处理,以获得相应的判别结果,其中,判别结果表示判别器所处理的表征与多个类别的相关性;根据类别无关表征或类别相关表征中的至少一个,确定预测结果;以类别无关表征不对应多个类别中的任意一个、类别相关表征对应预先标记的类别、以及预测结果与预先标记的推荐信息匹配为训练目标,对推荐模型和判别器进行训练。对推荐模型和判别器进行训练。对推荐模型和判别器进行训练。

【技术实现步骤摘要】
推荐模型的训练方法以及物品推荐方法、系统和相关设备


[0001]本公开涉及机数据处理领域,特别涉及一种推荐模型的训练方法以及物品推荐方法、系统和相关设备。

技术介绍

[0002]在信息推荐技术中,推荐准确性(recommendation accuracy)和推荐多样性(recommendation diversity)是两种不同的目标。以推荐准确性为主要优化目标的推荐算法倾向推荐比较热门的商品(popular item)或者热门类别中的商品(item in popular category)。以推荐多样性为主要优化目标的推荐算法倾向要求推荐结果覆盖越多类越好(diversifying accross all item categories)。
[0003]目前,解决推荐多样性的方法主要以下三类。
[0004]第一类是以行列式点过程方法(Determinantal Point Process,简称:DPP)、最大边际相关性方法(Maximal Marginal Relevance,简称:MMR)为代表的排列(post

ranking)算法,其以多样性为目标,对推荐算法产出的前K个商品重新排序。
[0005]第二类是排序学习(Learning to Rank,简称:LTR)推荐算法,其直接推荐一个商品列表给用户。
[0006]第三类是纠偏推荐算法,其主要通过去除类别特征(Unawareness)、逆概率加权法(IPS)或者去除混淆因素(DecRS)来避免推荐算法推荐更多热门商品或者热门类别中的商品。

技术实现思路

[0007]根据本公开一些实施例的第一个方面,提供一种推荐模型的训练方法,包括:利用推荐模型,对包括用户的特征和物品的特征的、用于训练的数据进行处理,获得类别无关表征和类别相关表征,用于训练的数据预先标记有推荐信息、以及物品的类别;利用判别器,分别对类别无关表征和类别相关表征进行处理,以获得相应的判别结果,其中,判别结果表示判别器所处理的表征与多个类别的相关性;根据类别无关表征或类别相关表征中的至少一个,确定预测结果;以类别无关表征不对应多个类别中的任意一个、类别相关表征对应预先标记的类别、以及预测结果与预先标记的推荐信息匹配为训练目标,对推荐模型和判别器进行训练。
[0008]在一些实施例中,判别器的判别结果具有与多个类别一一对应的多个维度,每个维度的值表示判别器所处理的表征与相应类别相关的概率。
[0009]在一些实施例中,对推荐模型和判别器进行训练包括:根据利用判别器对类别无关表征的判别结果、与类别无关目标结果,确定第一损失值,其中,在类别无关目标结果中,每个维度的值低于预设低门限;利用第一损失值,对推荐模型和判别器的参数进行调整。
[0010]在一些实施例中,确定预测结果包括:利用第一映射模型对类别无关表征进行处理,获得第一预测结果;对推荐模型和判别器进行训练还包括:根据第一预测结果和预先标
记的推荐信息,确定第二损失值,以便利用第一损失值和第二损失值,对推荐模型、判别器和第一映射模型的参数进行调整。
[0011]在一些实施例中,对推荐模型和判别器进行训练包括:根据利用判别器对类别相关表征的判别结果、与类别相关目标结果,确定第三损失值,其中,在类别相关目标结果中,预先标记的类别对应的维度的值高于预设高门限、其他维度的值低于预设低门限;利用第三损失值,对推荐模型和判别器的参数进行调整。
[0012]在一些实施例中,确定预测结果包括:利用第二映射模型对类别无关表征和类别相关表征进行处理,获得第二预测结果;对推荐模型和判别器进行训练还包括:根据第二预测结果和预先标记的推荐信息,确定第四损失值,以便利用第三损失值和第四损失值,对推荐模型、判别器和第二映射模型的参数进行调整。
[0013]在一些实施例中,在对推荐模型、判别器和第二映射模型的参数进行调整的过程中,保持类别无关表征的值不变。
[0014]在一些实施例中,推荐信息表示用户是否对物品进行反馈。
[0015]根据本公开一些实施例的第二个方面,提供一种物品推荐方法,包括:利用推荐模型,对包括目标用户的特征和备选物品的特征的、待测的数据进行处理,获得类别无关表征和类别相关表征;根据待测的数据,确定待测的数据的预测结果;根据待测的数据的预测结果,确定是否为目标用户推荐备选物品。
[0016]在一些实施例中,备选物品位于备选物品集合,并且确定是否为目标用户推荐备选物品包括:确定待测的数据的预测结果在备选物品集合中所有物品对应的预测结果中的排名;在排名高于预设排名的情况下,为目标用户推荐备选物品。
[0017]在一些实施例中,推荐模型是通过前述任意一种推荐模型的训练方法训练的。
[0018]根据本公开一些实施例的第三个方面,提供一种推荐模型的训练装置,包括:第一表征获得模块,被配置为利用推荐模型,对包括用户的特征和物品的特征的、用于训练的数据进行处理,获得类别无关表征和类别相关表征,用于训练的数据预先标记有推荐信息、以及物品的类别;判别模块,被配置为利用判别器,分别对类别无关表征和类别相关表征进行处理,以获得相应的判别结果,其中,判别结果表示判别器所处理的表征与多个类别的相关性;第一预测模块,被配置为根据类别无关表征或类别相关表征中的至少一个,确定预测结果;训练模块,被配置为以类别无关表征不对应多个类别中的任意一个、类别相关表征对应预先标记的类别、以及预测结果与预先标记的推荐信息匹配为训练目标,对推荐模型和判别器进行训练。
[0019]根据本公开一些实施例的第四个方面,提供一种物品推荐装置,包括:第二表征获得模块,被配置为利用推荐模型,对包括目标用户的特征和备选物品的特征的、待测的数据进行处理,获得类别无关表征和类别相关表征;第二预测模块,被配置为根据待测的数据中的类别无关表征和类别相关表征,确定待测的数据的预测结果;推荐模块,被配置为根据待测的数据的预测结果,确定是否为目标用户推荐备选物品。
[0020]根据本公开一些实施例的第五个方面,提供种物品推荐系统,包括:前述推荐模型的训练装置;以及,前述物品推荐装置。
[0021]根据本公开一些实施例的第六个方面,提供一种电子设备,包括:存储器;以及耦接至存储器的处理器,处理器被配置为基于存储在存储器中的指令,执行前述任意一种方
法。
[0022]根据本公开一些实施例的第七个方面,提供一种计算机可读存储介质,其上存储有计算机程序,其中,该程序被处理器执行时实现前述任意一种方法。
[0023]上述专利技术中的一些实施例具有如下优点或有益效果。本公开的推荐模型在输出表征时,基于将类别无关表征和类别相关表征进行分离的目标进行训练,可以同时提升推荐模型的推荐多样性和准确性。该过程没有额外增加复杂度、也没有引入与用户和物品无关的噪声,并且充分利用了物品类别这一重要的信息,从而具备较好的训练效果。
[0024]通过以下参照附图对本公开的示例性实施例的详本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种推荐模型的训练方法,包括:利用推荐模型,对包括用户的特征和物品的特征的、用于训练的数据进行处理,获得类别无关表征和类别相关表征,所述用于训练的数据预先标记有推荐信息、以及所述物品的类别;利用判别器,分别对所述类别无关表征和所述类别相关表征进行处理,以获得相应的判别结果,其中,所述判别结果表示所述判别器所处理的表征与多个类别的相关性;根据所述类别无关表征或所述类别相关表征中的至少一个,确定预测结果;以所述类别无关表征不对应所述多个类别中的任意一个、类别相关表征对应预先标记的类别、以及所述预测结果与预先标记的推荐信息匹配为训练目标,对所述推荐模型和所述判别器进行训练。2.根据权利要求1所述的训练方法,其中,所述判别器的判别结果具有与所述多个类别一一对应的多个维度,每个维度的值表示所述判别器所处理的表征与相应类别相关的概率。3.根据权利要求2所述的训练方法,其中,所述对所述推荐模型和所述判别器进行训练包括:根据利用判别器对所述类别无关表征的判别结果、与类别无关目标结果,确定第一损失值,其中,在所述类别无关目标结果中,每个维度的值低于预设低门限;利用所述第一损失值,对所述推荐模型和所述判别器的参数进行调整。4.根据权利要求3所述的训练方法,其中:所述确定预测结果包括:利用第一映射模型对所述类别无关表征进行处理,获得第一预测结果;所述对所述推荐模型和所述判别器进行训练还包括:根据所述第一预测结果和预先标记的推荐信息,确定第二损失值,以便利用所述第一损失值和所述第二损失值,对所述推荐模型、所述判别器和所述第一映射模型的参数进行调整。5.根据权利要求2所述的训练方法,其中,所述对所述推荐模型和所述判别器进行训练包括:根据利用判别器对所述类别相关表征的判别结果、与类别相关目标结果,确定第三损失值,其中,在所述类别相关目标结果中,预先标记的类别对应的维度的值高于预设高门限、其他维度的值低于预设低门限;利用所述第三损失值,对所述推荐模型和所述判别器的参数进行调整。6.根据权利要求5所述的训练方法,其中:所述确定预测结果包括:利用第二映射模型对所述类别无关表征和所述类别相关表征进行处理,获得第二预测结果;所述对所述推荐模型和所述判别器进行训练还包括:根据所述第二预测结果和预先标记的推荐信息,确定第四损失值,以便利用所述第三损失值和所述第四损失值,对所述推荐模型、所述判别器和所述第二映射模型的参数进行调整。
7.根据权利要求6所述的训练方法,其中,在对所述推荐模型、所述判别器和所述第二映射模型的参数进行调整的过程中,保持所述类别无关表征的值不变。8.根据权利要求1

7中...

【专利技术属性】
技术研发人员:张晓颖李航
申请(专利权)人:北京有竹居网络技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1