内容推荐控制及召回模型的训练方法、装置、设备和介质制造方法及图纸

技术编号：33841722 阅读：16 留言：0更新日期：2022-06-18 10:24

本申请涉及计算机技术领域，尤其涉及内容推荐控制及召回模型的训练方法、装置、设备和介质，用以提升推荐系统的定向推荐能力，提高召回率。其中，方法包括：获取训练样本数据集，并下采样得到子样本数据集；基于各子样本数据集对召回模型进行超参数优化，获得各子样本数据集对应的中间超参数组；根据各中间超参数组在召回模型上的准确度，预测各备选超参数组在召回模型上的准确度；基于准确度从各备选超参数组中选择超参数组对召回模型进行超参数配置并进行超参数调整，获得目标召回模型；基于目标召回模型向目标对象进行多媒体内容推荐。本申请基于元学习提高了超参数选择效率，得到的目标召回模型更加准确，可有效提升推荐系统的定向推荐能力。的定向推荐能力。的定向推荐能力。

全部详细技术资料下载

【技术实现步骤摘要】
内容推荐控制及召回模型的训练方法、装置、设备和介质

[0001]本申请涉及计算机
，尤其涉及内容推荐控制及召回模型的训练方法、装置、设备和介质。

技术介绍

[0002]推荐系统广泛应用于在电商、搜索、广告等领域，用于为用户推荐个性化的物品。例如在广告场景下，个性化的推荐系统可以通过用户的特征和“偏好”，为用户推送广告，如果用户最终产生了点击转化行为，可以认为广告推送成果，否则推送失败，这些都可以基于推荐系统中的召回模型来实现。
[0003]在实际应用场景中，用户和物品的数据量非常大，且具有随时间分布不一致的特点，需要人为地调整召回模型的超参数，如属性特征的维度，神经网络中神经元的数目，模型训练的学习率等。该方法主要是在训练模型时由操作人员根据经验进行人为配置，但采用这种方法很可能会导致超参数配置不准确，且需要耗费人力资源，最终使得推荐系统的召回模型不够精确，导致多媒体内容推荐的准确性较低。

技术实现思路

[0004]本申请实施例提供内容推荐控制及召回模型的训练方法、装置、设备和介质，用以提升推荐系统的定向推荐能力，提高召回率。
[0005]本申请实施例提供的一种内容推荐控制方法，包括：
[0006]对训练样本数据集进行下采样得到多个子样本数据集，所述训练样本数据集用于训练目标推荐系统的第一召回模型；
[0007]分别基于各个子样本数据集，对所述第一召回模型进行超参数优化，获得各个子样本数据集分别对应的中间超参数组；
[0008]分别根据各个子样本数据集对应...

【技术保护点】

【技术特征摘要】
1.一种内容推荐控制方法，其特征在于，该方法包括：对训练样本数据集进行下采样得到多个子样本数据集，所述训练样本数据集用于训练目标推荐系统的第一召回模型；分别基于各个子样本数据集，对所述第一召回模型进行超参数优化，获得各个子样本数据集分别对应的中间超参数组；分别根据各个子样本数据集对应的中间超参数组在所述第一召回模型上的准确度，预测各个备选超参数组在所述第一召回模型上的准确度，每个备选超参数组是基于所述训练样本数据集进行初始化获得的；根据各个备选超参数组在所述第一召回模型上的准确度，从各个备选超参数组中选择超参数组对所述第一召回模型进行超参数配置并进行超参数调整，获得目标召回模型；基于所述目标召回模型向目标对象进行多媒体内容推荐。2.如权利要求1所述的方法，其特征在于，每个子样本数据集中的训练样本是基于对抗扰动，从所述训练样本数据集中采样出的抗干扰能力低于目标条件的训练样本。3.如权利要求2所述的方法，其特征在于，所述从所述训练样本数据集中采样出的抗干扰能力低于目标条件的训练样本，具体包括：从所述训练样本数据集中，筛选满足如下抗干扰条件的训练样本作为子样本数据集中的训练样本：为训练样本所增加的对抗扰动的大小小于预设阈值，并基于所述第一召回模型对增加对抗扰动后的训练样本进行重新分类时，分类结果错误的训练样本；或者从所述训练样本数据集中，筛选满足如下数量条件的训练样本作为子样本数据集中的训练样本：为各个训练样本增加一定的对抗扰动，并基于所述第一召回模型对增加对抗扰动后的训练样本进行重新分类时，分类结果错误的训练样本的数量达到各个子样本数据集的训练样本总和。4.如权利要求1所述的方法，其特征在于，所述分别根据各个子样本数据集对应的中间超参数组在所述第一召回模型上的准确度，预测各个备选超参数组在所述第一召回模型上的准确度，具体包括：分别根据各个子样本数据集中的训练样本，提取各个子样本数据集的元特征；分别将各个子样本数据集对应的元特征，中间超参数组输入第一准确度预测模型，基于所述第一准确度预测模型输出的第一预测准确度与相应的真实准确度之间的差异，对所述第一准确度预测模型执行多轮迭代训练，以获得第二准确度预测模型，其中所述真实准确度指所述中间超参数组在所述第一召回模型上的准确度；将所述训练样本数据集对应的元特征以及备选超参数组分别输入所述第二准确度预测模型，预测得到各个备选超参数组对应的第二预测准确度，其中所述第二预测准确度指预测得到的所述备选超参数组在所述第一召回模型上的准确度。5.如权利要求4所述的方法，其特征在于，每个子样本数据集都包括训练子集和验证子集两大类；所述分别基于各个子样本数据集，对所述第一召回模型进行超参数优化，获得各个子样本数据集分别对应的中间超参数组时，对于任意一个子样本数据集，具体包括：初始化所述第一召回模型对应的超参数；基于获得的超参数配置所述第一召回模型，并基于所述子样本数据集中的训练子集对所述第一召回模型进行训练，得到第二召回模型；
将所述子样本数据集中的验证子集输入所述第二召回模型，基于所述第二召回模型的输出结果得到当前的超参数对应的准确度，将当前的超参数作为所述子样本数据集对应的一组中间超参数组，其中，基于所述第二召回模型的输出结果得到的准确度为所述中间超参数组对应的真实准确度；通过贝叶斯优化对当前的超参数进行调整，重新得到一组超参数，返回基于获得的超参数配置所述第一召回模型，并基于所述子样本数据集中的训练子集对所述第一召回模型进行训练，得到第二召回模型的步骤。6.如权利要求5所述的方法，其特征在于，所述训练样本数据集中的训练样本包括样本对象特征，样本多媒体内容特征，以及所述样本对象与所述样本多媒体内容的操作标签，所述操作标签表示将所述样本多媒体内容推荐给所述样本对象时，所述样本对象对所述样本多媒体内容是否发生目标操作行为；所述分别根据各个子样本数据集中的训练样本，提取各个子样本数据集的元特征时，对于任意一个子样本数据集，具体包括：将所述子样本数据集中的各个训练样本输入所述第二召回模型，基于所述第二召回模型，提取各个训练样本对应的预期分数，所述预期分数表示将样本多媒体内容推荐给所述样本对象时，所述样本对象对所述样本多媒体内容发生目标操作行为的分数；获得各个训练样本对应的预期分数的特征均值，以及，根据每个训练样本包含的样本对象特征，样本多媒体内容特征以及操作标签，确定操作标签的分布特征；将所述特征均值以及所述分布特征组合作为所述子样本数据集的元特征。7.如权利要求4所述的方法，其特征在于，每一轮迭代训练都执行下列过程：从未选择的子样本数据集中选取一定数量的目标子样本数据集；分别将各个目标子样本数据集对应的元特征和中间超参数组输入第一准确度预测模型，预测得到各个目标子样本数据集对应的第一预测准确度；根据所述第一预测准确度与相应的真实准确度之间的差异，对所述第一准确度预测模型的网络参数进行调整。8.如权利要求7所述...

【专利技术属性】
技术研发人员：刘月，王鑫，朱文武，周江，
申请(专利权)人：清华大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人