用于训练长尾数据表征模型的方法和装置制造方法及图纸

技术编号：38159588 阅读：7 留言：0更新日期：2023-07-13 09:30

本说明书的实施例提供了一种用于训练长尾数据表征模型的方法和装置。在该用于训练长尾数据表征模型的方法中，循环执行下述模型训练过程：将当前训练样本集的头部子图数据和尾部子图数据分别提供给当前长尾数据表征模型的第一图神经网络和第二图神经网络，得到当前训练样本集的头部历史查询数据节点和尾部历史查询数据节点分别对应的特征表征；针对各个尾部历史查询数据节点，在当前训练样本集中确定该尾部历史查询数据节点的匹配头部历史查询数据节点；根据由尾部历史查询数据节点和对应的匹配头部历史查询数据节点组成的正样本对，确定知识迁移对比损失值；响应于不满足训练结束条件，基于知识迁移对比损失值调整当前长尾数据表征模型的参数。长尾数据表征模型的参数。长尾数据表征模型的参数。

全部详细技术资料下载

【技术实现步骤摘要】
用于训练长尾数据表征模型的方法和装置

[0001]本说明书实施例通常涉及计算机
，尤其涉及用于训练长尾数据表征模型的方法和装置。

技术介绍

[0002]随着人工智能技术的飞速发展，在诸如服务搜索等领域常常需要根据搜索词(query)和待匹配项对应的表征来计算两者的相似度。现有的搜索场景中，往往存在长尾偏置(Long
‑
Tail Bias)问题，即热门的搜索词通常占据了绝大多数曝光，而长尾搜索词却无法获得充足的训练数据，在该情况下，当用户输入一条长尾搜索词时，模型很难为该搜索词产出高质量的排序结果。因此，如何训练模型以提升长尾数据的表征能力成为亟需解决的问题。

技术实现思路

[0003]鉴于上述，本说明书实施例提供了一种用于训练长尾数据表征模型的方法和装置。利用该方法、装置，可以实现对长尾数据的有效表征，进而提高相应的搜索效果。
[0004]根据本说明书的实施例的一个方面，提供一种用于训练长尾数据表征模型的方法，其中，所述长尾数据表征模型包括第一图神经网络和第二图神经网络，所述方法包括：利用训练样本集循环执行下述模型训练过程，直到满足训练结束条件，所述训练样本集包括由头部历史查询数据节点和对应的历史关联数据节点构成的头部子图数据和由尾部历史查询数据节点和对应的历史关联数据节点构成的尾部子图数据：将当前训练样本集的头部子图数据和尾部子图数据分别提供给当前长尾数据表征模型的第一图神经网络和第二图神经网络，得到所述当前训练样本集的头部历史查询数据节点和尾部历史查询数据节点分别对...

【技术保护点】

【技术特征摘要】
1.一种用于训练长尾数据表征模型的方法，其中，所述长尾数据表征模型包括第一图神经网络和第二图神经网络，所述方法包括：利用训练样本集循环执行下述模型训练过程，直到满足训练结束条件，所述训练样本集包括由头部历史查询数据节点和对应的历史关联数据节点构成的头部子图数据和由尾部历史查询数据节点和对应的历史关联数据节点构成的尾部子图数据：将当前训练样本集的头部子图数据和尾部子图数据分别提供给当前长尾数据表征模型的第一图神经网络和第二图神经网络，得到所述当前训练样本集的头部历史查询数据节点和尾部历史查询数据节点分别对应的特征表征；针对各个尾部历史查询数据节点，在所述当前训练样本集中确定该尾部历史查询数据节点的匹配头部历史查询数据节点；根据由尾部历史查询数据节点和对应的匹配头部历史查询数据节点组成的正样本对，确定知识迁移对比损失值；响应于不满足训练结束条件，基于所述知识迁移对比损失值调整当前长尾数据表征模型的模型参数，其中，经过模型参数调整后的长尾数据表征模型充当下一模型训练过程的当前长尾数据表征模型。2.如权利要求1所述的方法，其中，所述将当前训练样本集的头部子图数据和尾部子图数据分别提供给当前长尾数据表征模型的第一图神经网络和第二图神经网络，得到所述当前训练样本集的头部历史查询数据节点和尾部历史查询数据节点分别对应的特征表征包括：将当前训练样本集的头部子图数据提供给当前长尾数据表征模型的第一图神经网络，得到所述当前训练样本集的头部历史查询数据节点和对应的历史关联数据节点对应于头部历史查询数据节点的特征表征；以及将当前训练样本集的尾部子图数据提供给当前长尾数据表征模型的第二图神经网络，得到所述当前训练样本集的尾部历史查询数据节点和对应的历史关联数据节点对应于尾部历史查询数据节点的特征表征，所述根据由尾部历史查询数据节点和对应的匹配头部历史查询数据节点组成的正样本对，确定知识迁移对比损失值包括：根据由尾部历史查询数据节点和对应的匹配头部历史查询数据节点组成的正样本对，确定第一知识迁移对比损失值；根据由同一历史关联数据节点分别对应于头部历史查询数据节点和尾部历史查询数据节点的特征表征组成的正样本对，确定第二知识迁移对比损失值；根据所述第一知识迁移对比损失值和所述第二知识迁移对比损失值确定所述知识迁移对比损失值。3.如权利要求1所述的方法，其中，所述第一图神经网络和第二图神经网络为多层图神经网络，在所述响应于不满足训练结束条件，基于所述知识迁移对比损失值调整当前长尾数据表征模型的模型参数之前，所述模型训练过程还包括：针对所述当前训练样本集中的目标节点，根据由该目标节点对应于多层图神经网络的节点初始表征和其他层输出的节点特征表征组成的正样本对，确定结构增强对比损失值，
其中，所述目标节点包括以下至少一项：头部历史查询数据节点，尾部历史查询数据节点，头部子图数据的历史关联数据节点，尾部子图数据的历史关联数据节点，所述响应于不满足训练结束条件，基于所述知识迁移对比损失值调整当前长尾数据表征模型的模型参数包括：响应于不满足训练结束条件，基于所述知识迁移对比损失值和所述结构增强对比损失值得到的总损失值调整当前长尾数据表征模型的模型参数。4.如权利要求3所述的方法，其中，所述其他层输出的节点特征包括多层图神经网络的偶数层输出的节点特征。5.如权利要求1到4中任一所述的方法，其中，所述训练样本集还包括与所述头部子图数据和所述尾部子图数据对应的层次化意图数据，所述层次化意图数据包括由意图节点构成的图数据，在所述响应于不满足训练结束条件，基于所述知识迁移对比损失值调整当前长尾数据表征模型的模型参数之前，所述模型训练过程还包括：针对所述当前训练样本集中的目标节点，根据由该目标节点对应的特征表征和该目标节点的匹配意图节点对应的特征表征组成的正样本对，确定层次化意图对比损失值，其中，所述目标节点包括以下至少一项：头部历史查询数据节点，尾部历史查询数据节点，头部子图数据的历史关联数据节点，尾部子图数据的历史关联数据节点，所述匹配意图节点包括同级匹配意图节点和所述同级匹配意图节点的父节点，所述同级匹配意图节点为所述层次化意图数据中与该目标节点相匹配的意图节点；所述响应于不满足训练结束条件，基于所述知识迁移对比损失值调整当前长尾数据表征模型的模型参数包括：响应于不满足训练结束条件，基于所述知识迁移对比损失值和所述层次化意图对比损失值得到的总损失值调整当前长尾数据表征模型的模型参数。6.如权利要求5所述的方法，其中，所述层次化意图数据包括由多个意图树构成的图数据，所述针对所述当前训练样本集中的目标节点，根据由该目标节点对应的特征表征和该目标节点的匹配意图节点对应的特征表征组成的正样本对，确定层次化意图对比损失值包括：针对所述当前训练样本集中的目标节点，根据由该目标节点对应的特征表征和该目标节点的匹配意图节点对应的特征表征组成的正样本对以及由该目标节点对应的特征表征和与该目标节点的同级匹配意图节点属于同一意图树的其他同级意图节点对应的特征表征组成的负样本对，确定层次化意图对比损失值。7.如权利要求5所述的方法，其中，所述层次化意图数据包括由多个意图树构成的图数据，所述针对所述当前训练样本集中的目标节点，根据由该目标节点对应的特征表征和该目标节点的匹配意图节点对应的特征表征组成的正样本对，确定层次化意图对比损失值包括：针对所述当前训练样本集中的目标节点，根据由该目标节点对应的特征表征和该目标节点的匹配意图节点对应的特征表征组成的正样本对以及由该目标节点对应的特征表征
和与该目标节点的同级匹配意图节点属于不同意图树的同级意图节点对应的特征表征组成的负样本对，确定层次化意图对比损失值。8.如权利要求5所述的方法，其中，所述层次化意图数据包括由多个意图树构成的图数据，所述匹配意图节点对应的特征表征通过聚合所述匹配意图节点的子节点的特征表征而得到。9.如权利要求1所述的方法，其中，匹配头部历史查询数据节点根据以下至少一项确定：语义相关度，节点对应的属性匹配度，历史热度。10.如权利要求9所述的方法，其中，匹配头部历史查询数据节点通过以下步骤确定：针对各个尾部历史查询数据节点，从所述当前训练样本集中选取与该尾部历史查询数据节点语义相关度最高的第一数目个初始候选头部历史查询数据节点，从第一数目个初始候选头部历史查询数据节点中选取与该尾部历史查询数据节点的目标属性相...

【专利技术属性】
技术研发人员：王伟帆，胡斌斌，张志强，周俊，彭志成，钟明洁，刘忠义，
申请(专利权)人：支付宝杭州信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人