用于帖子推荐的方法、电子设备和存储介质技术

技术编号:31575477 阅读:25 留言:0更新日期:2021-12-25 11:16
本公开的实施例涉及用于帖子推荐的方法、电子设备和计算机存储介质,涉及信息处理领域。根据该方法,获取与多个神经网络模型相关联的多个第一模型参数集;基于多个第一模型参数集,经由随机丢弃层,生成多个第二模型参数集;基于多个第二模型参数集,经由混合专家层,生成目标模型参数集;基于目标模型参数集以及与目标场景中的多个用户相关联的用户属性数据和帖子点击数据,训练目标神经网络模型,以生成经训练的目标神经网络模型和多个用户特征表示;以及基于多个用户特征表示,经由经训练的目标神经网络模型,预测关于用户针对帖子的点击概率,以用于推荐帖子。由此,能够实现多个场景的模型参数迁移到目标场景,提高了模型训练速度。训练速度。训练速度。

【技术实现步骤摘要】
用于帖子推荐的方法、电子设备和存储介质


[0001]本公开的实施例总体涉及信息处理领域,具体涉及用于帖子推荐的方法、电子设备和计算机存储介质。

技术介绍

[0002]随着技术的发展,利用大量数据来训练模型,以进行诸如个性化推荐,也变得比较流行。但是对于某些场景,其数据量可能并不多,基于这些场景下的少量数据训练的模型的使用效果不佳。

技术实现思路

[0003]提供了一种用于帖子推荐的方法、电子设备以及计算机存储介质,能够实现多个场景的模型参数迁移到目标场景,提高了目标场景中的模型训练速度和帖子推荐准确度。
[0004]根据本公开的第一方面,提供了一种用于数据项推荐的方法。该方法包括:获取与多个神经网络模型相关联的多个第一模型参数集,多个神经网络模型应用于多个场景;基于多个第一模型参数集,经由随机丢弃层,生成多个第二模型参数集;基于多个第二模型参数集,经由混合专家层,生成目标模型参数集;基于目标模型参数集以及与目标场景中的多个用户相关联的用户属性数据和帖子点击数据,训练目标神经网络模型,以生成经训练的目标神经网络模型和与多个用户相关联的多个用户特征表示;以及基于多个用户特征表示,经由经训练的目标神经网络模型,预测关于目标场景中用户针对帖子的点击概率,以用于在目标场景中基于所述点击概率向用户推荐帖子。
[0005]根据本公开的第二方面,提供了一种电子设备。该电子设备包括:至少一个处理器,以及与至少一个处理器通信连接的存储器,其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行根据第一方面所述的方法。
[0006]在本公开的第三方面中,提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现根据本公开的第一方面的方法。
[0007]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0008]结合附图并参考以下详细说明,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。在附图中,相同或相似的附图标注表示相同或相似的元素。
[0009]图1是根据本公开的实施例的信息处理环境100的示意图。
[0010]图2是根据本公开的实施例的用于帖子推荐的方法200的示意图。
[0011]图3是根据本公开的实施例的用于获取与多个神经网络模型相关联的多个第一模型参数集的方法300的示意图。
[0012]图4是根据本公开的实施例的用于生成目标模型参数集的方法400的示意图。
[0013]图5是根据本公开的实施例的用于生成多个门控值的方法500的示意图。
[0014]图6是根据本公开的实施例的循环神经网络单元600的示意框图。
[0015]图7是根据本公开的实施例的混合专家层700的示意框图。
[0016]图8是用来实现本公开实施例的用于帖子推荐的方法的电子设备的框图。
具体实施方式
[0017]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0018]在本文中使用的术语“包括”及其变形表示开放性包括,即“包括但不限于”。除非特别申明,术语“或”表示“和/或”。术语“基于”表示“至少部分地基于”。术语“一个示例实施例”和“一个实施例”表示“至少一个示例实施例”。术语“另一实施例”表示“至少一个另外的实施例”。术语“第一”、“第二”等等可以指代不同的或相同的对象。下文还可能包括其他明确的和隐含的定义。
[0019]如上所述,传统方案对于少量数据的场景训练的模型效果不佳。如何利用应用于具有大量数据的多个场景的多个神经网络模型的参数来训练具有少量数据的目标场景的目标神经网络模型是需要解决的问题,从而提高目标神经网络模型的训练速度和效果。
[0020]为了至少部分地解决上述问题以及其他潜在问题中的一个或者多个,本公开的示例实施例提出了一种用于帖子推荐的方案。在该方案中,计算设备获取与多个神经网络模型相关联的多个第一模型参数集,多个神经网络模型应用于多个场景。计算设备基于多个第一模型参数集,经由随机丢弃层,生成多个第二模型参数集,以及基于多个第二模型参数集,经由混合专家层,生成目标模型参数集。计算设备基于目标模型参数集以及与目标场景中的多个用户相关联的用户属性数据和帖子点击数据,训练目标神经网络模型,以生成经训练的目标神经网络模型和与多个用户相关联的多个用户特征表示。随后计算设备基于多个用户特征表示,经由经训练的目标神经网络模型,预测关于目标场景中用户针对帖子的点击概率,以用于在目标场景中基于所述点击概率向用户推荐帖子。以此方式,能够实现多个场景的模型参数迁移到目标场景,提高了目标场景中的模型训练速度和帖子推荐准确度。
[0021]在下文中,将结合附图更详细地描述本方案的具体示例。
[0022]图1示出了根据本公开的实施例的信息处理环境100的示例的示意图。信息处理环境100可以包括计算设备110、多个场景120120

1至120

3(统称为120)、应用与多个场景120的多个神经网络模型130

1至130

3(统称为130)、目标场景140和目标神经网络模型150。应当理解,虽然图1中示出了3个场景和3个神经网络模型,但这只是举例说明,也可以包括更多或更少场景和神经网络模型,本公开的范围在此不受限制。
[0023]计算设备110例如包括但不限于服务器计算机、多处理器系统、大型计算机、包括上述系统或设备中的任意一个的分布式计算环境等。在一些实施例中,计算设备110可以具有一个或多个处理单元,包括诸如图像处理单元GPU、现场可编程门阵列FPGA和专用集成电
路ASIC等的专用处理单元以及诸如中央处理单元CPU的通用处理单元。
[0024]计算设备110用于获取与多个神经网络模型130相关联的多个第一模型参数集,多个神经网络模型130应用于多个场景120;基于多个第一模型参数集,经由随机丢弃层,生成多个第二模型参数集;基于多个第二模型参数集,经由混合专家层,生成目标模型参数集;基于目标模型参数集以及与目标场景150中的多个用户相关联的用户属性数据和帖子点击数据,训练目标神经网络模型140,以生成经训练的目标神经网络模型140和与多个用户相关联的多个用户特征表示;以及基于多个用户特征表示,经由经训练的目标神经网络模型140,预测关于目标场景150中用户针对帖子的点击概率,以用于在目标场景150中基于所述点击概率向用户推荐帖子。
[0025]由此,能够实现多个场景的模型参数迁移到目标本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于帖子推荐的方法,包括:获取与多个神经网络模型相关联的多个第一模型参数集,所述多个神经网络模型应用于多个场景;基于所述多个第一模型参数集,经由随机丢弃层,生成多个第二模型参数集;基于多个第二模型参数集,经由混合专家层,生成目标模型参数集;基于所述目标模型参数集以及与目标场景中的多个用户相关联的用户属性数据和帖子点击数据,训练目标神经网络模型,以生成经训练的目标神经网络模型和与所述多个用户相关联的多个用户特征表示;以及基于所述多个用户特征表示,经由经训练的目标神经网络模型,预测关于所述目标场景中用户针对帖子的点击概率,以用于在所述目标场景中基于所述点击概率向用户推荐帖子。2.根据权利要求1所述的方法,其中获取与多个神经网络模型相关联的多个第一模型参数集包括:对于与所述多个神经网络模型中的每个神经网络模型,执行以下步骤:获取所述神经网络模型在多个时刻的多个第三模型参数集;对于所述多个时刻中的每个时刻,按照时间先后顺序,迭代执行以下步骤:基于与所述时刻的前一时刻相关联的先前隐含状态和与所述时刻相关联的第三模型参数集,经由两个门控层,生成第一门控状态和第二门控状态;基于所述第一门控状态和所述先前隐含状态,生成经更新的先前隐含状态;基于经更新的先前隐含状态和所述当前第三模型参数集,生成候选隐含状态;以及基于所述先前隐含状态、所述候选隐含状态和所述第二门控状态,生成与所述时刻相关联的隐含状态;以及基于与所述多个时刻中的最后时刻相关联的隐含状态,经由输出层,生成与所述神经网络模型相关联的第一模型参数集。3.根据权利要求1所述的方法,其中生成所述目标模型参数集包括:基于所述多个第二模型参数集,经由门控网络,生成多个门控值,所述多个门控值中包括预定数量个非零门控值;基于所述多个第二模型参数集中与所述预定数量个非零门控值相对应的预定数量个第二模型参数集,经由所述预定数量个专家层,生成预定数量个预测模型参数集;以及基于所述预定数量个非零门控值和所述预定数量个预测模型参数集,生成所述目标模型参数集。4.根据权利要求3所述的方法,其中生成所述多个门控值包括:基于所述多个第二模型参数集和门控权重矩阵,生成多个第...

【专利技术属性】
技术研发人员:顾茂杰彭飞唐文斌
申请(专利权)人:上海任意门科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1