预测模型训练方法以及装置制造方法及图纸

技术编号：37861477 阅读：11 留言：0更新日期：2023-06-15 20:51

本说明书实施例提供预测模型训练方法以及装置，预测模型训练方法包括：从样本异构图中确定第一样本、第二样本以及第二样本对应的样本标签，其中，样本异构图包括至少两个不同类型的节点、和至少两个不同类型的边，第一样本和第二样本为目标异构图中的节点；对第一样本的样本特征进行聚合处理，得到第一聚合样本，以及对第二样本的样本特征进行聚合处理，得到第二聚合样本；根据第一样本、与第一样本关联的第一关联样本以及第一关联样本相对于第一样本的相关度，对第一样本的样本特征进行增强处理，获得增强样本；根据第二聚合样本以及第二样本对应的样本标签、第一聚合样本和增强样本，对预测模型进行训练，直至获得满足训练停止条件的预测模型。练停止条件的预测模型。练停止条件的预测模型。

全部详细技术资料下载

【技术实现步骤摘要】
预测模型训练方法以及装置

[0001]本说明书实施例涉及模型训练
，特别涉及预测模型训练方法。

技术介绍

[0002]图数据结构是一种抽象程度高，表达能力强的数据结构，图数据结构包括节点和节点之间的边，节点可用于表示现实世界的实体，而实体之间的关系则通过节点之间的边来体现。随着机器学习技术的发展，通常使用图神经网络对图数据结构进行学习，以实现对实体的行为预测。
[0003]然而，在对图数据结构进行学习时，通常会存在只有少量数据样本是有标签的，而大量数据样本都是没有标签的数据，在根据少量有标签的数据样本训练模型时，由于数据样本较少可能导致训练出来的模型预测准确率较差。通常情况下会依赖人工经验对没有标签的数据样本打标，会导致花费较高的人工成本，效率较差，因此，亟需一种有效的技术方案解决上述问题。

技术实现思路

[0004]有鉴于此，本说明书实施例提供了一种预测模型训练方法。本说明书一个或者多个实施例同时涉及一种预测模型训练装置，一种预测方法，一种预测装置，一种计算设备，一种计算机可读存储介质以及一种计算机程序，以解决现有技术中存在的技术缺陷。
[0005]根据本说明书实施例的第一方面，提供了一种预测模型训练方法，包括：
[0006]从样本异构图中确定第一样本、第二样本以及所述第二样本对应的样本标签，其中，所述样本异构图包括至少两个不同类型的节点、和至少两个不同类型的边，所述第一样本和所述第二样本为所述目标异构图中的节点；
[0007]对所述第一样本的样本特征进行聚合处...

【技术保护点】

【技术特征摘要】
1.一种预测模型训练方法，包括：从样本异构图中确定第一样本、第二样本以及所述第二样本对应的样本标签，其中，所述样本异构图包括至少两个不同类型的节点、和至少两个不同类型的边，所述第一样本和所述第二样本为所述目标异构图中的节点；对所述第一样本的样本特征进行聚合处理，得到第一聚合样本，以及对所述第二样本的样本特征进行聚合处理，得到第二聚合样本；根据所述第一样本、与所述第一样本关联的第一关联样本以及所述第一关联样本相对于所述第一样本的相关度，对所述第一样本的样本特征进行增强处理，获得增强样本；根据所述第二聚合样本以及所述第二样本对应的样本标签、所述第一聚合样本和所述增强样本，对预测模型进行训练，直至获得满足训练停止条件的所述预测模型。2.根据权利要求1所述的方法，所述第一关联样本与所述第一样本直接关联；相应的，所述根据所述第一样本、与所述第一样本关联的第一关联样本以及所述第一关联样本相对于所述第一样本的相关度，对所述第一样本的样本特征进行增强处理，获得增强样本，包括：确定与所述第一样本直接关联的第一关联样本相对于所述第一样本的相关度；在所述第一关联样本相对于所述第一样本的相关度大于相关度阈值的情况下，对所述第一样本的样本特征和所述第一关联样本的样本特征进行交换，获得增强样本。3.根据权利要求2所述的方法，所述确定与所述第一样本直接关联的第一关联样本相对于所述第一样本的相关度，包括：根据所述第一样本、与所述第一样本直接关联的第一关联样本以及所述第一样本和所述第一关联样本之间的关联关系，计算所述第一关联样本相对于所述第一样本的特征权重；根据所述第一样本的向量特征和所述第一关联样本的向量特征，计算所述第一样本和所述第一关联样本的特征相似度；根据所述特征权重和所述特征相似度，确定第一关联样本相对于第一样本的相关度。4.根据权利要求2所述的方法，所述第一关联样本为至少两个；相应的，所述根据所述第一样本、与所述第一样本关联的第一关联样本以及所述第一关联样本相对于所述第一样本的相关度，对所述第一样本的样本特征进行增强处理，获得增强样本，包括：确定每个第一关联样本相对于所述第一样本的相关度；对所述每个第一关联样本相对于所述第一样本的相关度进行比较，根据比较结果确定目标关联样本；对所述第一样本的样本特征和所述目标关联样本的样本特征进行交换，获得增强样本。5.根据权利要求1所述的方法，所述第一关联样本与所述第一样本间接关联；相应的，所述根据所述第一样本、与所述第一样本关联的第一关联样本以及所述第一关联样本相对于所述第一样本的相关度，对所述第一样本的样本特征进行增强处理，获得增强样本，包括：确定与所述第一样本间接关联的第一关联样本相对于所述第一样本的相关度；
在所述第一关联样本相对于所述第一样本的相关度大于相关度阈值的情况下，在所述第一样本和所述第一关联样本之间添加直接关联关系，根据添加结果对所述第一样本的样本特征进行聚合处理，得到增强样本。6.根据权利要求5所述的方法，所述确定与所述第一样本间接关联的第一关联样本相对于所述第一样本的相关度，包括：根据所述第一样本、与所述第一样本间接关联的第一关联样本，确定与所述第一样本和所述第一关联样本共同关联的共同关联样本；对所述共同关联样本进行加权...

【专利技术属性】
技术研发人员：陈颖，强思维，元凌峰，佟家弼，张珺，李鹏宇，李少帅，刘小雷，郭乃诚，高源，
申请(专利权)人：浙江网商银行股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人