用户标签的处理方法、装置、云服务器和可读存储介质制造方法及图纸

技术编号：37844793 阅读：26 留言：0更新日期：2023-06-14 22:28

本申请提供一种用户标签的处理方法、装置、云服务器和可读存储介质。本申请的方法，预先构建包含标签值和用户特征数据的知识图谱，对知识图谱及统一的标签预测模型进行训练，得到训练好的知识图谱和标签预测模型。基于统一的知识图谱和标签预测模型，响应于用户标签预测请求，获取待预测标签的目标用户的信息，确定知识图谱中的目标用户节点，预测知识图谱中的多个标签值节点与目标用户节点之间具有边的概率信息，根据概率信息确定与目标用户节点之间具有边的目标标签值节点，从而确定目标用户具有的目标标签值，实现用户多标签值的预测，无需为每种标签构建单独的预测模型，减少了用户标签预测的工作量，提升了用户标签预测的效率。的效率。的效率。

全部详细技术资料下载

【技术实现步骤摘要】
用户标签的处理方法、装置、云服务器和可读存储介质

[0001]本申请涉及计算机技术，尤其涉及一种用户标签的处理方法、装置、云服务器和可读存储介质。

技术介绍

[0002]在个性化推荐、标签圈人、精准问答等多个互联网应用领域中，人群画像起着举足轻重的作用。构建人群画像旨在根据用户的反馈对用户做深层次的理解，精准预测用户偏好信息，通过构建一个标签体系，将人群画像的构建过程标准化为对用户预测标签的过程。精准的人群画像(用户标签预测)能够辅助提高下游应用的性能。例如，依据用户标签为其推荐感兴趣的商品、店铺活动等信息。因此，探索准确、快速、高效的用户标签预测方法有着重要的价值。
[0003]目前的用户标签预测方法中，对于每一种标签都需要数据预处理获取对应用户特征、训练单独的预测模型，随着标签数量的增加，特征处理、模型搭建和训练、模型调优和维护的工作量迅速增加，耗时长，导致用户标签预测的工作量大、效率低。

技术实现思路

[0004]本申请提供一种用户标签的处理方法、装置、云服务器和可读存储介质，用以解决用户标签预测的工作量大、效率低的问题。
[0005]一方面，本申请提供一种用户标签的处理方法，包括：
[0006]响应于用户标签预测请求，获取待预测标签的目标用户的信息；
[0007]根据所述目标用户的信息，确定训练好的知识图谱中的目标用户节点，所述知识图谱至少包括用户节点、标签值节点、以及用户节点与标签值节点间的边，用户节点与标签值节点间的边表示该用户节点对应的用户具有该标签值节点...

【技术保护点】

【技术特征摘要】
1.一种用户标签的处理方法，其特征在于，包括：响应于用户标签预测请求，获取待预测标签的目标用户的信息；根据所述目标用户的信息，确定训练好的知识图谱中的目标用户节点，所述知识图谱至少包括用户节点、标签值节点、以及用户节点与标签值节点间的边，用户节点与标签值节点间的边表示该用户节点对应的用户具有该标签值节点对应的标签值；通过训练好的标签预测模型，预测所述知识图谱中的多个标签值节点与所述目标用户节点之间具有边的概率信息；根据所述概率信息，确定所述目标用户对应的目标标签值。2.根据权利要求1所述的方法，其特征在于，所述标签预测模型包括图卷积神经网络和分类预测模块，所述知识图谱中的节点具有特征向量；所述通过训练好的标签预测模型，预测所述知识图谱中的标签值节点与所述目标用户节点之间具有边的概率信息，包括：通过所述标签预测模型中的图卷积神经网络，将所述目标用户节点的特征向量与邻居节点的特征向量聚合，得到所述目标用户节点的表示向量，并将所述知识图谱中的标签值节点的特征向量与邻居节点的特征向量聚合，得到所述标签值节点的向量表示；通过所述标签预测模型中的分类预测模块，根据所述目标用户节点的表示向量与所述标签值节点的向量表示，预测标签值节点与所述目标用户节点之间具有边的概率信息。3.根据权利要求1所述的方法，其特征在于，还包括：根据预先设置的标签值集合和用户的历史行为数据，构建知识图谱，所述知识图谱包括标签值节点、所述历史行为数据所涉及的实体对象的节点、以及实体对象节点之间的边，所述实体对象至少包括用户；对所述知识图谱中各节点的初始化的特征向量进行预训练，更新所述知识图谱中各节点的特征向量；获取包括用户节点信息、标签值节点信息及标注信息的训练样本，并根据所述训练样本中的标注信息，建立所述知识图谱中用户节点与标签值节点之间的边，所述标注信息用于指示训练样本中的用户节点信息与标签值节点信息对应节点之间是否有边；使用所述训练样本，对所述知识图谱中节点的特征向量和标签预测模型进行训练，得到训练好的知识图谱和标签预测模型。4.根据权利要求3所述的方法，其特征在于，所述根据预先设置的标签值集合和用户的历史行为数据，构建知识图谱，包括：根据预先设置的标签值集合，构建标签值节点；根据用户的历史行为数据，抽取实体对象信息及实体对象间的关系，根据所述实体对象信息构建实体对象节点，并根据所述实体对象间的关系构建实体对象节点之间的边；所述标签值节点、所述实体对象节点和所述实体对象节点之间的边构成了知识图谱。5.根据权利要求4所述的方法，其特征在于，所述根据用户的历史行为数据，抽取实体对象信息及实体对象间的关系，包括：根据用户的历史行为数据，抽取用户、商品、商家、商品类目、对话场景中至少一种实体对象的信息，用户与商品、商家、对话场景间的关系，商品与商家和商品类目间的关系。6.根据权利要求3所述的方法，其特征在于，所述对所述知识图谱中各节点的初始化的
特征向量进行预训练，更新所述知识图谱中各节点的特征向量，包括：随机初始化所述知识图谱中各节点的特征向量；对于随机初始化后所述知识图谱中的任意的第一节点，将所述第一节点的邻居节点的特征向量聚合到所述第一节点的特征向量上，得到所述第一节点更新后的特征向量。7.根据权利要求3所述的方法，其特征在于，所述标签预测模型包括图卷积神经网络和分类预测模块，所述使用所述训练样本，对所述知识图谱中...

【专利技术属性】
技术研发人员：孙冉，
申请(专利权)人：阿里巴巴中国有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人