模型训练方法、数据推荐方法、装置、电子设备及存储介质制造方法及图纸

技术编号:33706776 阅读:18 留言:0更新日期:2022-06-06 08:30
本公开提供了一种模型训练方法、数据推荐方法、装置、电子设备及存储介质,涉及人工智能技术领域,尤其涉及深度学习、自然语言处理、数据推荐等领域。具体实现方案为:从第一feed信息流及所述第一feed信息流中的第一频道获取目标行为数据;从所述第一feed信息流及所述第一feed信息流中的第一频道获取目标资源数据;根据所述目标行为数据和所述目标资源数据得到样本数据;根据所述样本数据进行跨领域多视角的模型训练,得到训练后的第一目标模型。采用本公开,提高了模型训练的精度。提高了模型训练的精度。提高了模型训练的精度。

【技术实现步骤摘要】
模型训练方法、数据推荐方法、装置、电子设备及存储介质


[0001]本公开涉及人工智能
,尤其涉及深度学习、自然语言处理、数据推荐等领域。

技术介绍

[0002]数据推荐领域中,通过客户端可以为用户推荐各类感兴趣的数据,比如,为用户推荐感兴趣的一篇文章、感兴趣的歌单等等,客户端可以采用feed信息流的形式向用户推送各类感兴趣的数据。
[0003]随着技术的发展,可以通过人工智能加速数据的处理,所适用的应用场景多种多样,比如涉及数据推荐中的图片处理、图文处理、视频处理等硬件设计或软件设计中都可以采用人工智能技术,以提高数据的处理速度及精度。对于数据推荐领域,需要一种在数据推荐上精度高的模型。

技术实现思路

[0004]本公开提供了一种模型训练方法、装置、电子设备以及存储介质。
[0005]根据本公开的一方面,提供了一种模型训练方法,包括:
[0006]从第一feed信息流及所述第一feed信息流中的第一频道获取目标行为数据;
[0007]从所述第一feed信息流及所述第一feed信息流中的第一频道获取目标资源数据;
[0008]根据所述目标行为数据和所述目标资源数据得到样本数据;
[0009]根据所述样本数据进行跨领域多视角的模型训练,得到训练后的第一目标模型。
[0010]根据本公开的另一方面,提供了一种数据推荐方法,包括:
[0011]获取在第一feed信息流中第一频道上的触控操作;
[0012]响应所述触控操作,根据上述模型训练方法得到的第一目标模型得到与所述触控操作匹配的资源数据。
[0013]根据本公开的另一方面,提供了一种模型训练装置,包括:
[0014]第一数据获取单元,用于从第一feed信息流及所述第一feed信息流中的第一频道获取目标行为数据;
[0015]第二数据获取单元,用于从所述第一feed信息流及所述第一feed信息流中的第一频道获取目标资源数据;
[0016]样本数据确定单元,用于根据所述目标行为数据和所述目标资源数据得到样本数据;
[0017]模型训练单元,用于根据所述样本数据进行跨领域多视角的模型训练,得到训练后的第一目标模型。
[0018]根据本公开的另一方面,提供了一种数据推荐装置,包括:
[0019]操作获取单元,用于获取在第一feed信息流中第一频道上的触控操作;
[0020]操作响应单元,用于响应所述触控操作,根据上述模型训练方法得到的第一目标
模型得到与所述触控操作匹配的资源数据。
[0021]根据本公开的另一方面,提供了一种电子设备,包括:
[0022]至少一个处理器;以及
[0023]与该至少一个处理器通信连接的存储器;其中,
[0024]该存储器存储有可被该至少一个处理器执行的指令,该指令被该至少一个处理器执行,以使该至少一个处理器能够执行本公开任意一实施例所提供的方法。
[0025]根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,该计算机指令用于使该计算机执行本公开任意一项实施例所提供的方法。
[0026]根据本公开的另一方面,提供了一种计算机程序产品,包括计算机指令,该计算机指令被处理器执行时实现本公开任意一项实施例所提供的方法。
[0027]采用本公开,可以从第一feed信息流及第一feed信息流中的第一频道获取目标行为数据,从第一feed信息流及第一feed信息流中的第一频道获取目标资源数据。根据目标行为数据和目标资源数据得到样本数据,以根据样本数据进行跨领域多视角的模型训练,得到训练后的第一目标模型,从而,提高了模型训练的精度。
[0028]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0029]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0030]图1是根据本公开实施例的一分布式集群处理场景的示意图;
[0031]图2是根据本公开实施例的模型训练方法的流程示意图;
[0032]图3是根据本公开实施例的一示例中feed流的示意图;
[0033]图4是根据本公开实施例的另一示例中feed流的示意图;
[0034]图5是根据本公开实施例的一示例中双塔模型的结构示意图;
[0035]图6是根据本公开实施例的数据推荐方法的流程示意图;
[0036]图7是根据本公开实施例的模型训练装置的组成结构示意图;
[0037]图8是根据本公开实施例的数据推荐装置的组成结构示意图
[0038]图9是用来实现本公开实施例的模型训练方法或数据推荐方法的电子设备的框图。
具体实施方式
[0039]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0040]本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。本文中术语“至少一种”表示多种中的任意一种或多种中的至少两种的任意组合,例如,包括A、B、C中的至少一种,可以表示包括从A、B和C构成的集合中选择的任意一个或多个元素。本文中术
语“第一”、“第二”表示指代多个类似的技术用语并对其进行区分,并不是限定顺序的意思,或者限定只有两个的意思,例如,第一特征和第二特征,是指代有两类/两个特征,第一特征可以为一个或多个,第二特征也可以为一个或多个。
[0041]另外,为了更好的说明本公开,在下文的具体实施方式中给出了众多的具体细节。本领域技术人员应当理解,没有某些具体细节,本公开同样可以实施。在一些实例中,对于本领域技术人员熟知的方法、手段、元件和电路未作详细描述,以便于凸显本公开的主旨。
[0042]feed信息流是一种给用户持续提供内容的数据形式,是由多个内容提供源组成的资源聚合器,可以由用户主动订阅消息源,并且向用户推送数据内容。
[0043]feed信息流可以是客户端的主feed界面中的feed信息流,也可以是该客户端的主feed界面中某一个或某几个具体频道下的feed信息流。对于新上线投入使用的某一个或某几个具体频道,比如,女性专栏、体育等,大多使用主feed界面中的feed信息流作为样本数据来进行模型训练,比如,可以直接主feed界面中加载的基于活跃用户的大量行为数据作为该样本数据,这与针对某一个或某几个具体频道的用户分布有所不同,资源分布也有所不同,导致基于该样本数据训练得到的模型精度低,以数据推荐领域为本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种模型训练方法,包括:从第一feed信息流及所述第一feed信息流中的第一频道获取目标行为数据;从所述第一feed信息流及所述第一feed信息流中的第一频道获取目标资源数据;根据所述目标行为数据和所述目标资源数据得到样本数据;根据所述样本数据进行跨领域多视角的模型训练,得到训练后的第一目标模型。2.根据权利要求1所述的方法,其中,所述从第一feed信息流及所述第一feed信息流中的第一频道获取目标行为数据,包括:获取第一feed信息流中与目标用户匹配的第一行为数据;将所述第一feed信息流中与第一频道匹配的所有用户行为数据,确定为第二行为数据;根据所述第一行为数据和所述第二行为数据得到所述目标行为数据。3.根据权利要求1所述的方法,其中,所述从所述第一feed信息流及所述第一feed信息流中的第一频道获取目标资源数据,包括:获取第一feed信息流中与目标资源数据匹配的第一资源数据;将所述第一feed信息流中与第一频道匹配的所有用户行为数据相关联的资源数据,确定为第二资源数据;根据所述第一资源数据和所述第二资源数据得到所述目标资源数据。4.根据权利要求2所述的方法,其中,所述获取第一feed信息流中与目标用户匹配的第一行为数据,包括:根据用户特征,获取第一feed信息流中与目标用户匹配的第一行为数据;其中,所述用户特征包括:用户ID、用户性别、用户年龄、用户所在城市、用户历史行为、用户所处场景中的至少一种。5.根据权利要求2所述的方法,其中,所述将所述第一feed信息流中与第一频道匹配的所有用户行为数据,确定为第二行为数据,包括:响应在所述第一频道上的触控操作,从所述第一feed信息流所隶属的第一feed流界面切换到所述第一频道所隶属的第二feed流界面;将基于所述第二feed流界面收集的与所述第一频道匹配的所有用户行为数据,确定为所述第二行为数据。6.根据权利要求3所述的方法,其中,所述获取第一feed信息流中与目标资源数据匹配的第一资源数据,包括:根据资源特征,获取第一feed信息流中与目标资源数据匹配的第一资源数据;其中,所述资源特征包括:用户ID、资源类型、生产所述资源的内容提供方类型中的至少一种。7.根据权利要求3所述的方法,其中,所述将所述第一feed信息流中与第一频道匹配的所有用户行为相关联的资源数据,确定为第二资源数据,包括:响应在所述第一频道上的触控操作,从所述第一feed信息流所隶属的第一feed流界面切换到所述第一频道所隶属的第二feed流界面;获取基于所述第二feed流界面收集的与所述第一频道匹配的所有用户行为数据;将与所述第一频道匹配的所有用户行为数据相关联的资源数据,确定为所述第二资源
数据。8.根据权利要求1

7中任一项所述的方法,其中,所述根据所述样本数据进行跨领域多视角的模型训练,得到训练后的第一目标模型,包括:将所述样本数据输入双塔模型,以二分类交叉熵作为损失函数进行所述跨领域多视角的模型训练,得到所述训练后的第一目标模型。9.根据权利要求8所述的方法,其中,所述将所述样本数据输入双塔模型,以二分类交叉熵作为损失函数进行所述跨领域多视角的模型训练,得到所述训练后的第一目标模型,包括:在所述双塔模型中,将所述样本数据中的目标行为数据作为用户塔,将所述样本数据中的目标资源数据作为资源塔;根据所述用户塔和所述资源塔计算所述二分类交叉熵,得到交叉熵损失函数;根据所述交叉熵损失函数进行模型训练,得到所述训练后的第一目标模型。10.一种数据推荐方法,包括:获取在第一feed信息流中第一频道上的触控操作;响应所述触控操作,根据上述权利要求1

9任一项得到的第一目标模型得到与所述触控操作匹配的资源数据。11.根据权利要求10所述的方法,其中,所述资源数据包括:图文信息、动态视频信息、短视频信息、小视频信息中的至少一种。12.一种模型训练装置,包括:第一数据获取单元,用于从第一feed信息流及所述第一feed信息流中的第一频道获取目标行为数据;第...

【专利技术属性】
技术研发人员:戴文恺沈椿壮姚传宇鲁巧芸杨钊马丽芬白云龙韩艳吴宗刚
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1