对象推荐方法和对象推荐模型的训练方法技术

技术编号:36431539 阅读:25 留言:0更新日期:2023-01-20 22:43
本公开提供了一种对象推荐方法和对象推荐模型的训练方法,涉及计算机技术领域,尤其涉及基于人工智能的推荐技术领域。实现方案为:获得目标用户的用户特征、要向目标用户推荐的目标对象的对象特征,以及目标用户所对应的目标场景的场景特征,其中,目标场景指示目标用户获取对象的方式;基于用户特征、对象特征获得初始预测结果,初始预测结果指示是否向目标用户推荐目标对象;以及基于场景特征和初始预测结果,确定是否向目标用户推荐目标对象。象。象。

【技术实现步骤摘要】
对象推荐方法和对象推荐模型的训练方法


[0001]本公开涉及计算机
,尤其涉及基于人工智能的推荐
,具体涉及一种对象推荐方法、对象推荐模型的训练方法、装置、电子设备、计算机可读存储介质和计算机程序产品。

技术介绍

[0002]人工智能是研究使计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科,既有硬件层面的技术也有软件层面的技术。人工智能硬件技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理等技术;人工智能软件技术主要包括计算机视觉技术、语音识别技术、自然语言处理技术以及机器学习/深度学习、大数据处理技术、知识图谱技术等几大方向。
[0003]基于人工智能的推荐技术,已经渗透到各个领域。其中,基于人工智能的对象推荐,通过预测用户对对象的偏好,向用户推荐符合其偏好的对象。
[0004]在此部分中描述的方法不一定是之前已经设想到或采用的方法。除非另有指明,否则不应假定此部分中描述的任何方法仅因其包括在此部分中就被认为是现有技术。类似地,除非另有指明,否则此部分中提及的问题不应认为在任何现有技术中已被公认。

技术实现思路

[0005]本公开提供了一种对象推荐方法、对象推荐模型的训练方法、装置、电子设备、计算机可读存储介质和计算机程序产品。
[0006]根据本公开的一方面,提供了一种对象推荐方法,包括:获得目标用户的用户特征、要向所述目标用户推荐的目标对象的对象特征,以及所述目标用户所对应的目标场景的场景特征,其中,所述目标场景指示所述目标用户获取对象的方式;基于所述用户特征、所述对象特征获得初始预测结果,所述初始预测结果指示是否向所述目标用户推荐所述目标对象;以及基于所述场景特征和所述初始预测结果,确定是否向所述目标用户推荐所述目标对象。
[0007]根据本公开的另一方面,提供了一种对象推荐模型的训练方法,所述对象推荐模型包括用户网络、对象网络和场景网络,所述方法包括:获得训练样本和所述训练样本对应的标注标签,所述训练样本包括训练用户、向所述训练用户推荐的训练对象和向所述训练用户推荐所述训练对象时所述训练用户所对应的训练场景,所述标注标签至少指示所述训练样本是否偏好所述训练该对象;将所述训练用户的用户特征输入所述用户网络以获得第一预测结果,将所述训练对象的对象特征输入所述对象网络以获得第二预测结果,并且将所述场景特征输入到所述场景网络以获得第三预测结果,所述第一预测结果、所述第二预测结果、所述第三预测结果分别至少指示所述训练用户是否偏好所述训练该对象;基于所述标注标签、所述第一预测结果、所述第二预测结果和所述第三预测结果,调整所述用户网络、所述对象网络和所述场景网络的参数。
[0008]根据本公开的另一方面,提供了一种对象推荐装置,包括:第一获取单元,被配置用于获得目标用户的用户特征、要向所述目标用户推荐的目标对象的对象特征,以及所述目标用户所对应的目标场景的场景特征,其中,所述目标场景指示所述目标用户获取对象的方式;初始预测单元,被配置用于基于所述用户特征、所述对象特征获得初始预测结果,所述初始预测结果指示是否向所述目标用户推荐所述目标对象;以及确定单元,被配置用于基于所述场景特征和所述初始预测结果,确定是否向所述目标用户推荐所述目标对象。
[0009]根据本公开的另一方面,提供了一种对象推荐模型的训练装置,所述对象推荐模型包括用户网络、对象网络和场景网络,所述装置包括:训练样本获取单元,被配置用于获得训练样本和所述训练样本对应的标注标签,所述训练样本包括训练用户、向所述训练用户推荐的训练对象和向所述训练用户推荐所述训练对象时所述训练用户所对应的训练场景,所述标注标签至少指示所述训练样本是否偏好所述训练该对象;预测结果获取单元,被配置用于将所述训练用户的用户特征输入所述用户网络以获得第一预测结果,将所述训练对象的对象特征输入所述对象网络以获得第二预测结果,并且将所述场景特征输入到所述场景网络以获得第三预测结果,所述第一预测结果、所述第二预测结果、所述第三预测结果分别至少指示所述训练用户是否偏好所述训练该对象;参数调整单元,被配置用于基于所述标注标签、所述第一预测结果、所述第二预测结果和所述第三预测结果,调整所述用户网络、所述对象网络和所述场景网络的参数。
[0010]根据本公开的另一方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行根据本公开的实施例所述的方法。
[0011]根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据本公开的实施例所述的方法。
[0012]根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,其中,所述计算机程序在被处理器执行时实现根据本公开的实施例所述的方法。
[0013]根据本公开的一个或多个实施例,针对不同场景,提升给用户推荐的对象的准确性。
[0014]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0015]附图示例性地示出了实施例并且构成说明书的一部分,与说明书的文字描述一起用于讲解实施例的示例性实施方式。所示出的实施例仅出于例示的目的,并不限制权利要求的范围。在所有附图中,相同的附图标记指代类似但不一定相同的要素。
[0016]图1示出了根据本公开的实施例的可以在其中实施本文描述的各种方法的示例性系统的示意图;
[0017]图2示出了根据本公开的实施例的对象推荐方法的流程图;
[0018]图3示出了根据本公开的实施例的对象推荐方法中基于所述用户特征、所述对象特征获得初始预测结果的过程的流程图;
[0019]图4示出了根据本公开的实施例的对象推荐方法中基于所述第一结果和所述第二结果,确定所述初始预测结果的过程的流程图;
[0020]图5示出了根据本公开的实施例的对象推荐方法中基于所述场景特征和所述初始预测结果,确定是否向所述目标用户推荐所述目标对象的过程的流程图;
[0021]图6示出了根据本公开的实施例的对象推荐方法中基于所述初始预测结果和所述第三结果,确定是否向所述目标用户推荐所述目标对象的过程的流程图;
[0022]图7示出了根据本公开的实施例的对象推荐方法中对象推荐模型的结构示意图;
[0023]图8示出了根据本公开的实施例的对象推荐模型的训练方法的流程图;
[0024]图9示出了根据本公开的实施例的对象推荐模型的训练方法中基于所述标注标签、所述第一预测结果、所述第二预测结果和所述第三预测结果,调整所述用户网络、所述对象网络和所述场景网络的参数的过程的流程图;
[0025]图10示出了根据本公开的实施例的对象推荐本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种对象推荐方法,包括:获得目标用户的用户特征、要向所述目标用户推荐的目标对象的对象特征,以及所述目标用户所对应的目标场景的场景特征,其中,所述目标场景指示所述目标用户获取对象的方式;基于所述用户特征、所述对象特征获得初始预测结果,所述初始预测结果指示是否向所述目标用户推荐所述目标对象;以及基于所述场景特征和所述初始预测结果,确定是否向所述目标用户推荐所述目标对象。2.根据权利要求1所述的方法,其中,所述基于所述用户特征、所述对象特征获得初始预测结果包括:基于所述用户特征,获得第一结果;基于所述对象特征,获得第二结果,其中,所述第一结果和所述第二结果分别至少指示所述目标用户是否偏好所述目标对象;以及基于所述第一结果和所述第二结果,确定所述初始预测结果。3.根据权利要求2所述的方法,其中,所述第一结果和所述第二结果分别包括指示所述目标用户偏好所述目标对象的概率的第一向量;并且其中,所述基于所述第一结果和所述第二结果,确定所述初始预测结果包括:基于所述第一结果中的第一向量和所述第二结果中的第一向量,获得第一预测向量,所述第一预测向量指示所述目标用户偏好所述目标对象的概率;以及基于所述第一预测向量,获得所述初始预测结果。4.根据权利要求3所述的方法,其中,所述第一结果和所述第二结果还分别包括指示所述目标用户偏好所述目标对象的程度的第二向量,所述基于所述第一结果、所述基于所述第一结果和所述第二结果,确定所述初始预测结果还包括:基于所述第一结果中的第二向量和所述第二结果中的第二向量,获得第二预测向量;以及其中,基于所述第一预测向量,获得所述初始预测结果包括:基于所述第一预测向量和所述第二预测向量,获得所述初始预测结果。5.根据权利要求4所述的方法,其中,所述基于所述场景特征和所述初始预测结果,确定是否向所述目标用户推荐所述目标对象包括:基于所述场景特征,获得第三结果,所述第三结果至少指示所述目标用户是否偏好所述目标对象;以及基于所述初始预测结果和所述第三结果,确定是否向所述目标用户推荐所述目标对象。6.根据权利要求5所述的方法,其中,所述初始预测结果包括:所述第一预测向量和所述第二预测向量,所述第三结果包括指示所述目标用户偏好所述目标对象的概率的第一向量和指示所述目标用户偏好所述目标对象的程度的第二向量,所述基于所述初始预测结果和所述第三结果,确定是否向所述目标用户推荐所述目标对象包括:基于所述第一预测向量与所述第三结果,获得第三预测向量,所述第三预测向量指示所述目标用户偏好所述目标对象的概率;基于所述第二预测向量与所述第三结果,获得第四预测向量,所述第四预测向量指示
所述目标用户偏好所述目标对象的程度;以及基于所述第三预测向量和所述第四预测向量,确定是否向所述目标用户推荐所述目标对象。7.根据权利要求5所述的方法,其中,所述第一向量指示所述目标用户对所述目标对象具有第一操作的概率,所述第二向量指示所述目标用户对所述目标对象具有至少一种第二操作的概率或者所述目标用户对所述目标对象进行第三操作的时长。8.根据权利要求7所述的方法,其中,所述第一操作包括点击操作,所述至少一种第二操作包括:关注、收藏、点赞或分享,所述第三操作包括观看或者播放。9.根据权利要求5所述的方法,其中,所述基于所述用户特征,获得第一结果,所述基于所述对象特征,获得第二结果,以及所述基于所述场景特征,获得第三结果包括:将所述用户特征输入到用户网络,以获得所述第一结果,将所述对象特征输入到对象网络,以获得所述第二结果,以及将所述场景特征输入到场景网络,以获得所述第三结果,其中,所述用户网络、所述对象网络和所述场景网络是采用训练样本联合训练而来的,所述训练样本包括训练用户、向所述训练用户推荐的训练对象和向所述训练用户推荐所述训练对象时所述训练用户所对应的训练场景并且具有标注标签,所述标注标签至少指示所述训练样本是否偏好所述训练该对象,并且其中,在联合训练所述用户网络、所述对象网络和所述场景网络的过程中,将所述训练用户的用户特征输入所述用户网络以获得第一预测结果,将所述训练对象的对象特征输入所述对象网络以获得第二预测结果,并且将所述场景特征输入到所述场景网络以获得第三预测结果,所述第一预测结果、所述第二预测结果、所述第三预测结果分别至少指示所述训练用户是否偏好所述训练该对象,基于所述第一预测结果、所述第二预测结果、所述第三预测结果和所述标注标签调整所述用户网络、所述对象网络和所述场景网络的参数。10.一种对象推荐模型的训练方法,所述对象推荐模型包括用户网络、对象网络和场景网络,所述方法包括:获得训练样本和所述训练样本对应的标注标签,所述训练样本包括训练用户、向所述训练用户推荐的训练对象和向所述训练用户推荐所述训练对象时所述训练用户所对应的训练场景,所述标注标签至少指示所述训练样本是否偏好所述训练该对象;将所述训练用户的用户特征输入所述用户网络以获得第一预测结果,将所述训练对象的对象特征输入所述对象网络以获得第二预测结果,并且将所述场景特征输入到所述场景网络以获得第三预测结果,所述第一预测结果、所述第二预测结果、所述第三预测结果分别至少指示所述训练用户是否偏好所述训练该对象;以及基于所述标注标签、所述第一预测结果、所述第二预测结果和所述第三预测结果,调整所述用户网络、所述对象网络和所述场景网络的参数。11.根据权利要求10所述的方法,其中,基于所述标注标签、所述第一预测结果、所述第二预测结果和所述第三预测结果,调整所述用户网络、所述对象网络和所述场景网络的参数包括:基于所述第一预测结果、所述第二预测结果和所述第三预测结果,获得总预测结果,所述总预测结果至少指示所述训练用户是否偏好所述训练对象;以及
基于所述总预测结果和所述标注标签,调整所述用户网络、所述对象网络和所述场景网络的参数。12.根据权利要求11所述的方法,其中,所述标注标签包括指示所述训练用户偏好所述训练对象的第一标签和指示所述训练用户是否偏好所述训练对象的程度的第二标签,所述第一预测结果、所述第二预测结果和所述第三预测结果分别包括指示所述训练用户偏好所述训练对象的概率的第一向量和指示所述训练用户偏好所述训练对象的程度的第二向量,所述基于所述第一预测结果、所述第二预测结果和所述第三预测结果,获得总预测结果包括:基于所述第一预测结果中的第一向量、所述第二预测结果中的第一向量和所述第三预测结果中的第一向量,获得第一向量结果,所述第一向量结果指示所述训练用户偏好所述训练对象的概率;基于所述第一预测结果中的第二向量、所述第二预测结果中的第二向量和所述第三预测结果中的第二向量,获得第二向量结果,所述第二向量结果指示所述训练用户偏好所述训练对象的程度;以及基于所述第一向量结果和所述第二向量结果,获得所述总预测结果。13.根据权利要求12所述的方法,其中,所述总预测结果包括所述第一向量结果和所述第二向量结果,所述基于所述总预测结果和所述标注标签,调整所述用户网络、所述对象网络和所述场景网络的参数包括:基于所述第一向量结果和所述第一标签,获得第一损失;基于所述第二向量结果和所述第二标签,获得第一损失;基于所述第一损失和所述第二损失,获得总损失,其中,在所述总损失中,所述第二损失所占据的权重大于所述第一损失所占据的权重;以及基于所述总损失,调整所述用户网络、所述对象网络和所述场景网络的参数。14.根据权利要求13所述的方法,其中,所述基于所述总损失,调整所述用户网络、所述对象网络和所述场景网络的参数包括:基于所述总损失,分别获得对应于所述用户网络的第一分损失、对应于所述对象网络的第二分损失和对应于所述场景网络的第三分损失;以及基于所述第一分损失,调整所述用户网络的参数,基于所述第二分损失调整所述对象网络的参数和基于所述第三分损失调整所述场景网络的参数。15.一种对象推荐装置,包括:第一获取单元,被配置用于获得目标用户的用户特征、要向所述目标用户推荐的目标对象的对象特征,以及所述目标用户所对应的目标场景的场景特征,其中,所述目标场景指示所述目标用户获取对象的方式;初始预测单元,被配置用于基于所述用户特征、所述对象特征获得初始预测结果,所述初始预测结果指示是否向所述目标用户推荐所述目标对象;以及确定单元,被配置用于基于所述场景特征和所述初始预测结果,确定是否向所述目标用户推荐所述目标对象。16...

【专利技术属性】
技术研发人员:吴学超刘星王爽旭祝帅
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1