信息推荐及其模型训练方法、装置、设备及存储介质制造方法及图纸

技术编号：44422426 阅读：0 留言：0更新日期：2025-02-28 18:37

本申请提出一种信息推荐及其模型训练方法、装置、设备及存储介质，该推荐模型训练方法，包括：基于预设曝光增长率对全域样本进行抽样，得到训练数据集；全域样本包括各内容推荐场景下的样本；采用训练数据集训练推荐模型，得到适用各内容推荐场景的基础推荐模型；推荐模型中的召回层模型和排序层模型均包括主网络和偏置网络；基于各内容推荐场景下的个性化数据集，分别调整基础推荐模型，得到各内容推荐场景各自的个性化推荐模型。本申请能够得到一个包括通用的无偏基础模型及多个个性化推荐模型的推荐系统模型。

全部详细技术资料下载

【技术实现步骤摘要】

本申请属于模型训练，具体涉及一种信息推荐及其模型训练方法、装置、设备及存储介质。

技术介绍

1、信息流应用中通常包含不同类型的内容，包括新闻、图片、图书、音频、短视频或长视频等，并且不同类型的内容通常在不同频道和不同位置进行显示。

2、当新场景进行冷启动综合内容推荐时，由于没有针对性的训练数据导致无法训练个性化的推荐模型。而使用全域样本作为训练数据时，各个频道的内容差异和消费不同导致推荐模型训练时有偏差，因此在新场景进行冷启动时，模型的个性化推荐效果不是很好。

技术实现思路

1、本申请提出一种信息推荐及其模型训练方法、装置、设备及存储介质，能够得到一个包括通用的无偏基础模型及多个个性化推荐模型的推荐系统模型。

2、本申请第一方面实施例提出了一种推荐模型训练方法，包括：

3、基于预设曝光增长率对全域样本进行抽样，得到训练数据集；所述全域样本包括各内容推荐场景下的样本；

4、采用所述训练数据集训练推荐模型，得到适用所述各内容推荐场景的基础推荐模型；所述推荐模型中的召回层模型和排序层模型均包括主网络和偏置网络；

5、基于所述各内容推荐场景下的个性化数据集，分别调整所述基础推荐模型，得到所述各内容推荐场景各自的个性化推荐模型。

6、在本申请一些实施例中，所述基于预设曝光增长率对全域样本进行抽样，包括：

7、分别确定全域样本中各样本的曝光数；

8、基于预设曝光增长率和各样本的曝光数，从所述全域样本

9、在本申请一些实施例中，所述基于预设曝光增长率和各样本的曝光数，从所述全域样本中选取多个样本，包括：

10、基于各样本的曝光数，将曝光数相同的样本组成集合，得到多个样本集合；

11、基于各样本集合对应的曝光数对所述多个样本集合进行排序，从排序后的各样本集合中选取曝光数最高的预设数目个样本集合；

12、从所述预设数目个样本集合中选取曝光数按照所述预设曝光增长率递增的多个目标样本集合；

13、基于各目标样本集合对应的曝光数，分别从各目标样本集合中选取样本。

14、在本申请一些实施例中，召回层模型包括第一主网络和第一偏置网络；所述采用所述训练数据集训练推荐模型，包括：

15、将所述训练数据集中各样本包括的用户特征数据和推荐内容分别输入所述第一主网络，得到推荐内容与用户特征之间的关系；

16、将所述各样本中的偏置特征分别输入所述第一偏置网络，得到各样本数据的偏置参数；

17、基于所述推荐内容与用户特征之间的关系，以及所述各样本数据的偏置参数，确定预测输出值；所述预测输出值用于指示所述偏置特征对样本是否被点击的影响程度。

18、在本申请一些实施例中，所述排序层模型包括第二主网络和第二偏置网络；所述采用所述训练数据集训练推荐模型，还包括：

19、基于所述预测输出值，确定新训练数据集；

20、将所述新训练数据集各样本包括的新用户特征数据和新推荐内容分别输入所述第二主网络，得到新推荐内容与新用户特征之间的关系；

21、将所述新训练数据集中各样本中的偏置特征分别输入所述第二偏置网络，得到各新样本数据的偏置参数；

22、基于所述新推荐内容与新用户特征之间的关系，以及所述各新样本数据的偏置参数，确定新预测输出值；所述新预测输出值用于指示所述偏置特征对样本是否被点击的影响程度。

23、在本申请一些实施例中，所述基于所述各内容推荐场景下的个性化数据集，分别调整所述基础推荐模型，得到所述各内容推荐场景各自的个性化推荐模型，包括：

24、删除所述基础推荐模型中的偏置网络，得到新基础推荐模型；

25、基于各场景下的个性化数据集，对所述新基础推荐模型进行微调，分别得到各场景对应的个性化推荐模型。

26、本申请第二方面实施例提出了一种信息推荐方法，所述方法包括：

27、获取目标内容推荐场景下目标用户的用户特征数据；

28、将所述用户特征数据输入所述目标内容推荐场景对应的个性化推荐模型，输出待推荐内容；所述个性化推荐模型是通过第一方面所述的推荐模型训练方法训练得到的；

29、将所述待推荐内容发送给所述目标用户。

30、在本申请一些实施例中，所述将所述用户特征数据输入所述目标内容推荐场景对应的个性化推荐模型，输出待推荐内容，包括：

31、若当前已训练得到所述目标内容推荐场景的目标个性化推荐模型，则将所述用户特征数据输入所述目标个性化推荐模型，输出待推荐内容。

32、在本申请一些实施例中，所述将所述用户特征数据输入所述目标内容推荐场景对应的个性化推荐模型，输出待推荐内容，包括：

33、若当前未训练得到所述目标内容推荐场景的目标个性化推荐模型，则将所述用户特征数据分别输入当前已训练的各内容推荐场景的个性化推荐模型中，得到各内容推荐场景的个性化推荐模型输出的多组候选内容；

34、从所述多组候选内容中筛选出待推荐内容。

35、在本申请一些实施例中，所述方法还包括：

36、在获得所述目标内容推荐场景的目标个性化数据集的情况下，基于所述目标个性化数据集对所述基础推荐模型进行调整，得到所述目标内容推荐场景的目标个性化推荐模型。

37、本申请第三方面的实施例提供了一种推荐模型训练装置，包括：

38、训练数据获取模块，用于基于预设曝光增长率对全域样本进行抽样，得到训练数据集；所述全域样本包括各内容推荐场景下的样本；

39、基础模型训练模块，用于采用所述训练数据集训练推荐模型，得到适用所述各内容推荐场景的基础推荐模型；所述推荐模型中的召回层模型和排序层模型均包括主网络和偏置网络；

40、个性化模型训练模块，用于基于所述各内容推荐场景下的个性化数据集，分别调整所述基础推荐模型，得到所述各内容推荐场景各自的个性化推荐模型。

41、本申请第四方面的实施例提供了一种信息推荐装置，所述装置包括：

42、数据获取模块，用于获取目标内容推荐场景下目标用户的用户特征数据；

43、内容确定模块，用于将所述用户特征数据输入所述目标内容推荐场景对应的个性化推荐模型，输出待推荐内容；所述个性化推荐模型通过第一方面所述的推荐模型训练方法训练得到；

44、内容发送模块，用于将所述待推荐内容发送给所述目标用户。

45、本申请第五方面的实施例提供了一种电子设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器运行所述计算机程序以实现上述第一方面或第二方面所述的方法。

46、本申请第六方面的实施例提供了一种计算机可读存储介质，其上存储有计算机程序，所述程序被处理器执行实现上述本文档来自技高网...

【技术保护点】

1.一种推荐模型训练方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述基于预设曝光增长率对全域样本进行抽样，包括：

3.根据权利要求2所述的方法，其特征在于，所述基于预设曝光增长率和各样本的曝光数，从所述全域样本中选取多个样本，包括：

4.根据权利要求1所述的方法，其特征在于，召回层模型包括第一主网络和第一偏置网络；所述采用所述训练数据集训练推荐模型，包括：

5.根据权利要求4所述的方法，其特征在于，所述排序层模型包括第二主网络和第二偏置网络；所述采用所述训练数据集训练推荐模型，还包括：

6.根据权利要求1所述的方法，其特征在于，所述基于所述各内容推荐场景下的个性化数据集，分别调整所述基础推荐模型，得到所述各内容推荐场景各自的个性化推荐模型，包括：

7.一种信息推荐方法，其特征在于，所述方法包括：

8.根据权利要求7所述的方法，其特征在于，所述将所述用户特征数据输入所述目标内容推荐场景对应的个性化推荐模型，输出待推荐内容，包括：

9.根据权利要求7或8所述的方法，

10.根据权利要求9所述的方法，其特征在于，所述方法还包括：

11.一种推荐模型训练装置，其特征在于，包括：

12.一种信息推荐装置，其特征在于，所述装置包括：

13.一种电子设备，其特征在于，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述程序，以实现如权利要求1-10中任一项所述的方法。

14.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行，以实现如权利要求1-10中任一项所述的方法。

...

【技术特征摘要】