用户标签的处理方法、装置、云服务器和可读存储介质制造方法及图纸

技术编号:37844793 阅读:20 留言:0更新日期:2023-06-14 22:28
本申请提供一种用户标签的处理方法、装置、云服务器和可读存储介质。本申请的方法,预先构建包含标签值和用户特征数据的知识图谱,对知识图谱及统一的标签预测模型进行训练,得到训练好的知识图谱和标签预测模型。基于统一的知识图谱和标签预测模型,响应于用户标签预测请求,获取待预测标签的目标用户的信息,确定知识图谱中的目标用户节点,预测知识图谱中的多个标签值节点与目标用户节点之间具有边的概率信息,根据概率信息确定与目标用户节点之间具有边的目标标签值节点,从而确定目标用户具有的目标标签值,实现用户多标签值的预测,无需为每种标签构建单独的预测模型,减少了用户标签预测的工作量,提升了用户标签预测的效率。的效率。的效率。

【技术实现步骤摘要】
用户标签的处理方法、装置、云服务器和可读存储介质


[0001]本申请涉及计算机技术,尤其涉及一种用户标签的处理方法、装置、云服务器和可读存储介质。

技术介绍

[0002]在个性化推荐、标签圈人、精准问答等多个互联网应用领域中,人群画像起着举足轻重的作用。构建人群画像旨在根据用户的反馈对用户做深层次的理解,精准预测用户偏好信息,通过构建一个标签体系,将人群画像的构建过程标准化为对用户预测标签的过程。精准的人群画像(用户标签预测)能够辅助提高下游应用的性能。例如,依据用户标签为其推荐感兴趣的商品、店铺活动等信息。因此,探索准确、快速、高效的用户标签预测方法有着重要的价值。
[0003]目前的用户标签预测方法中,对于每一种标签都需要数据预处理获取对应用户特征、训练单独的预测模型,随着标签数量的增加,特征处理、模型搭建和训练、模型调优和维护的工作量迅速增加,耗时长,导致用户标签预测的工作量大、效率低。

技术实现思路

[0004]本申请提供一种用户标签的处理方法、装置、云服务器和可读存储介质,用以解决用户标签预测的工作量大、效率低的问题。
[0005]一方面,本申请提供一种用户标签的处理方法,包括:
[0006]响应于用户标签预测请求,获取待预测标签的目标用户的信息;
[0007]根据所述目标用户的信息,确定训练好的知识图谱中的目标用户节点,所述知识图谱至少包括用户节点、标签值节点、以及用户节点与标签值节点间的边,用户节点与标签值节点间的边表示该用户节点对应的用户具有该标签值节点对应的标签值;
[0008]通过训练好的标签预测模型,预测所述知识图谱中的多个标签值节点与所述目标用户节点之间具有边的概率信息;
[0009]根据所述概率信息,确定所述目标用户对应的目标标签值。
[0010]另一方面,本申请提供一种用户标签的处理装置,包括:
[0011]用户信息获取模块,用于响应于用户标签预测请求,获取待预测标签的目标用户的信息;
[0012]用户节点确定模块,用于根据所述目标用户的信息,确定训练好的知识图谱中的目标用户节点,所述知识图谱至少包括用户节点、标签值节点、以及用户节点与标签值节点间的边,用户节点与标签值节点间的边表示该用户节点对应的用户具有该标签值节点对应的标签值;
[0013]标签预测模块,用于通过训练好的标签预测模型,预测所述知识图谱中的多个标签值5节点与所述目标用户节点之间具有边的概率信息;
[0014]标签确定模块,用于根据所述概率信息,确定所述目标用户对应的目标标签值。
[0015]另一方面,本申请提供一种云服务器,包括:处理器,以及与所述处理器通信连接的存储器;
[0016]所述存储器存储计算机执行指令;
[0017]0所述处理器执行所述存储器存储的计算机执行指令,以实现上述所述的用户标签的处
[0018]理方法。
[0019]另一方面,本申请提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现上述所述的用户标签的处理方法。
[0020]5本申请提供的用户标签的处理方法、装置、云服务器和可读存储介质,通过预先构建
[0021]包含标签值信息和用户特征数据的知识图谱,对知识图谱中节点的特征向量及统一的标签预测模型进行训练,得到训练好的知识图谱和标签预测模型。通过统一的知识图谱和标签预测模型,可以预测得到知识图谱中的多个标签值节点与所述目标用户节点之间具有边的概率信息,基于该概率信息可以进一步确定与目标用户节点之间具有边的目标标签值节点,0从而确定目标用户具有的目标标签值,实现用户标签值的预测,无需为每种标签构建单独的预测模型,有效减少了用户标签预测的工作量,提升了用户标签预测的效率。
附图说明
[0022]此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,5并与说明书一起用于解释本申请的原理。
[0023]图1为本申请所适用的一种示例性的用户标签预测的系统架构图;
[0024]图2为本申请实施例提供的知识图谱和标签预测模型训练的系统架构示意图;
[0025]图3为本申请一示例性实施例提供的用户标签的处理方法流程图;
[0026]图4为本申请一示例性实施例提供的一种知识图谱包含的节点的示意图;
[0027]图5为本申请另一示例性实施例提供的用户标签预测的方法流程图;
[0028]图6为本申请一示例性实施例提供的用户标签预测模型的框架图;
[0029]图7为本申请一示例性实施例提供的知识图谱和标签预测模型训练的方法流程图;
[0030]图8为本申请一示例性实施例提供的用户标签的处理装置的结构示意图;
[0031]图9为本申请实施例提供的一种云服务器的结构示意图。
[0032]5通过上述附图,已示出本申请明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本申请构思的范围,而是通过参考特定实施例为本领域技术人员说明本申请的概念。
具体实施方式
[0033]这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附
权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
[0034]首先对本申请所涉及的名词进行解释:
[0035]标注信息(label):机器学习的分类问题中,每一条训练数据中训练样本的真实类别,二分类问题的label取值为0或1。
[0036]GraphSAGE:一种图神经网络算法。GraphSAGE包含采样(Sample)和聚合(aggregate),首先使用图中节点之间连接信息,对邻居节点进行采样,然后通过多层聚合函数不断地将相邻节点的信息融合在一起。用融合后的信息预测节点的分类信息。
[0037]图卷积神经网络(Graph Convolutional Network,简称GCN):将卷积操作应用到图数据。关键是学习一个函数,通过聚合节点自身的特征和邻居的特征来生成该节点的特征表示。
[0038]针对现有的用户标签预测方法,需要针对每种标签训练单独的预测模型,导致用户标签预测的工作量大、效率低的文图,本申请提供一种用户标签的处理方法,通过构建包含多个标签值对应的标签值节点、用户节点及与用户标签值预测相关的实体信息节点的知识图谱,该知识图谱包含用户、标签值及与用户标签值预测相关的用户特征信息(实体信息);通过对知识图谱中节点的特征向量及统一的标签预测模型进行训练,得到训练好的知识图谱和标签预测模型,训练好的知识图谱和标签预测模型作为用于预测用户是否具有知识图谱中包含的各种标签值的所使用的统一的知识图谱和标签预测模型。进一步地,通过本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用户标签的处理方法,其特征在于,包括:响应于用户标签预测请求,获取待预测标签的目标用户的信息;根据所述目标用户的信息,确定训练好的知识图谱中的目标用户节点,所述知识图谱至少包括用户节点、标签值节点、以及用户节点与标签值节点间的边,用户节点与标签值节点间的边表示该用户节点对应的用户具有该标签值节点对应的标签值;通过训练好的标签预测模型,预测所述知识图谱中的多个标签值节点与所述目标用户节点之间具有边的概率信息;根据所述概率信息,确定所述目标用户对应的目标标签值。2.根据权利要求1所述的方法,其特征在于,所述标签预测模型包括图卷积神经网络和分类预测模块,所述知识图谱中的节点具有特征向量;所述通过训练好的标签预测模型,预测所述知识图谱中的标签值节点与所述目标用户节点之间具有边的概率信息,包括:通过所述标签预测模型中的图卷积神经网络,将所述目标用户节点的特征向量与邻居节点的特征向量聚合,得到所述目标用户节点的表示向量,并将所述知识图谱中的标签值节点的特征向量与邻居节点的特征向量聚合,得到所述标签值节点的向量表示;通过所述标签预测模型中的分类预测模块,根据所述目标用户节点的表示向量与所述标签值节点的向量表示,预测标签值节点与所述目标用户节点之间具有边的概率信息。3.根据权利要求1所述的方法,其特征在于,还包括:根据预先设置的标签值集合和用户的历史行为数据,构建知识图谱,所述知识图谱包括标签值节点、所述历史行为数据所涉及的实体对象的节点、以及实体对象节点之间的边,所述实体对象至少包括用户;对所述知识图谱中各节点的初始化的特征向量进行预训练,更新所述知识图谱中各节点的特征向量;获取包括用户节点信息、标签值节点信息及标注信息的训练样本,并根据所述训练样本中的标注信息,建立所述知识图谱中用户节点与标签值节点之间的边,所述标注信息用于指示训练样本中的用户节点信息与标签值节点信息对应节点之间是否有边;使用所述训练样本,对所述知识图谱中节点的特征向量和标签预测模型进行训练,得到训练好的知识图谱和标签预测模型。4.根据权利要求3所述的方法,其特征在于,所述根据预先设置的标签值集合和用户的历史行为数据,构建知识图谱,包括:根据预先设置的标签值集合,构建标签值节点;根据用户的历史行为数据,抽取实体对象信息及实体对象间的关系,根据所述实体对象信息构建实体对象节点,并根据所述实体对象间的关系构建实体对象节点之间的边;所述标签值节点、所述实体对象节点和所述实体对象节点之间的边构成了知识图谱。5.根据权利要求4所述的方法,其特征在于,所述根据用户的历史行为数据,抽取实体对象信息及实体对象间的关系,包括:根据用户的历史行为数据,抽取用户、商品、商家、商品类目、对话场景中至少一种实体对象的信息,用户与商品、商家、对话场景间的关系,商品与商家和商品类目间的关系。6.根据权利要求3所述的方法,其特征在于,所述对所述知识图谱中各节点的初始化的
特征向量进行预训练,更新所述知识图谱中各节点的特征向量,包括:随机初始化所述知识图谱中各节点的特征向量;对于随机初始化后所述知识图谱中的任意的第一节点,将所述第一节点的邻居节点的特征向量聚合到所述第一节点的特征向量上,得到所述第一节点更新后的特征向量。7.根据权利要求3所述的方法,其特征在于,所述标签预测模型包括图卷积神经网络和分类预测模块,所述使用所述训练样本,对所述知识图谱中...

【专利技术属性】
技术研发人员:孙冉
申请(专利权)人:阿里巴巴中国有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1