【技术实现步骤摘要】
一种实体分类方法、装置、电子设备及存储介质
[0001]本公开涉及计算机应用
,具体而言,涉及一种实体分类方法、装置、电子设备及存储介质。
技术介绍
[0002]随着信息技术的发展,人们已经进入到一个“大数据”的时代,每天都有海量多元的数据喷涌而出,一方面这大大丰富了用户、文章、商品等实体对象的语义信息,但另一方面也使人们难以从庞大的数据中发掘出所需的模式特征。
[0003]为了系统化、规范化、精细化的描述分析实体特点,人们通常会建立一套标准化的标签集,并用以对实体进行标注。但是,鉴于数据规模的巨大,仅靠人工完成数据标注显然是一件不可能完成的任务。于是,标签分类预测技术应运而生,并在计算机视觉、自然语言处理、生物信息、信息检索等多个领域得到了广泛的应用。
[0004]标签分类预测技术是一种通过总结已知实体标签出现的规律,对新的数据进行标签判别预测的技术。传统的分类问题假设实例仅与一个标签相关,即单视图分类预测。然而,在实践中一个样本通常会具有多个标签,传统分类技术不再适用。
技术实现思路
[0005]本公开实施例至少提供一种实体分类方法、装置、电子设备及存储介质,以实现多视图分类预测,预测的准确度较高。
[0006]第一方面,本公开实施例提供了一种实体分类方法,包括:
[0007]获取多个实体节点对应的多个实体关系网络;同一实体节点在不同实体关系网络中对应不同的实体关系;
[0008]基于训练好的多个基学习器对所述多个实体关系网络进行多标签预测,得到每个实 ...
【技术保护点】
【技术特征摘要】
1.一种实体分类方法,其特征在于,包括:获取多个实体节点对应的多个实体关系网络;同一实体节点在不同实体关系网络中对应不同的实体关系;基于训练好的多个基学习器对所述多个实体关系网络进行多标签预测,得到每个实体节点在每个实体关系网络中的多标签预测结果;基于每个实体节点在每个实体关系网络中的多标签预测结果,确定每个实体节点对应的最终多标签预测结果。2.根据权利要求1所述的方法,其特征在于,在所述多标签预测结果包括多个候选标签的预测分值的情况下;所述基于每个实体节点在每个实体关系网络中的多标签预测结果,确定每个实体节点对应的最终多标签预测结果,包括:针对所述多个候选标签中的目标候选标签,基于每个实体节点在每个实体关系网络中的多标签预测结果,确定每个实体节点针对所述目标候选标签的标签特征向量;基于训练好的元学习器对多个实体节点针对所述目标候选标签的标签特征向量进行排序学习,确定每个实体节点对应的最终多标签预测结果。3.根据权利要求2所述的方法,其特征在于,所述基于每个实体节点在每个实体关系网络中的多标签预测结果,确定每个实体节点针对所述目标候选标签的标签特征向量,包括:针对所述多个实体关系网络中的目标实体关系网络,从所述实体节点在所述目标实体关系网络中针对多个候选标签的预测分值中,选取出与所述目标候选标签匹配的目标预测分值;将从所述多个实体关系网络中分别选取出的目标预测分值进行组合,得到所述实体节点针对所述目标候选标签的标签特征向量。4.根据权利要求2所述的方法,其特征在于,所述基于训练好的元学习器对多个实体节点针对所述目标候选标签的标签特征向量进行排序学习,确定每个实体节点对应的最终多标签预测结果,包括:针对所述多个实体节点中的目标实体节点,将所述目标实体节点针对所述目标候选标签的标签特征向量输入到训练好的元学习器,确定所述目标实体节点对应多个候选标签的排序后预测分值;基于所述排序后预测分值,确定所述目标实体节点对应的多标签预测结果。5.根据权利要求4所述的方法,其特征在于,所述基于所述排序后预测分值,确定所述目标实体节点对应的多标签预测结果,包括:在所述排序后预测分值大于预设阈值的情况下,将排序后预测分值对应的候选标签确定为所述目标实体节点对应的多标签预测结果。6.根据权利要求2至5任一项所述的方法,其特征在于,按照如下步骤训练所述元学习器:获取包括有多个样本特征向量的样本训练集,所述样本特征向量的每一个维度值指向一个实体节点标签对;遍历所述样本训练集中的每个样本特征向量,并确定每个样本特征向量的λ
‑
梯度;基于所述多个样本特征向量以及所述每个样本特征向量的λ
‑
梯度构建回归树;基于所述回归树的各个叶子结点与所述各个实体节点之间的对应关系,对所述待训练
的元学习器中每个实体节点的排序得分进行更新,得到训练好的元学习器。7.根据权利要求1至5任一项所述的方法,其特征在于,所述基于训练好的多个基学习器对所述多个实体关系网络进行多标签预测,得到每个实体节点在每个实体关系网络中的多标签预测结果,包括:针对所述多个实体关系网络中的目标实体关系网络,利用与所述目标实体关系网络对应的目标基学习器对所述目标实体关系网络进行多标签预测,得到每个实体节点在所述目标实体关系网络中的多标签预测结果。8.根据权利要求7所述的方法,其特征在于,在所述目标基学习器包括全连接输入层、表示学习模块及全连接输出层的情况下,所述利用与所述目标实体关系网络对应的目标基学习器对所述目标实体关系网络进行多标签预测,得到每个实体节点在所述目标实体关系网络中的多标签预测结果,包括:将所述目标实体网络中每个实体节点的原始特征向量输入到所述目标基学习器包括的全连接输入层,确定所述全连接输入层输出的针对每个实体节点的降维特征向量;以及,将所述降维特征向量输入到所述目标基学习器包括的表示学习模块,确定蕴含有低阶信号及相似节点信息的隐藏特征向量;以及,将所述隐藏特征向量输入到所述目标基学习器包括的全连接输出层,确定每个实体节点在所述目标实体关系网络中的多标签预测结果。9.根据权利要求8所述的方法,其特征在于,按照如下步骤训练包括全连接输入层、表示学习模块及全连接输出层的目标基学习器:获取样本实体关系网络,所述样本实体关系网络中的部分实体节点具有多标签标注结果;利用所述全连接输入层对所述样本实体关系网络中的每个实体节点进行降维表示,确定进行降维转换后每个实体节点的节点降维隐含表示;利用所述表示学习模块包括的图卷积层对所述节点降维隐含表示进行低阶信号的注意力学习,得到进行注意力学习后每个实体节点的节点注意力隐含表...
【专利技术属性】
技术研发人员:刘砺志,王钰,蒋海俭,闵青,
申请(专利权)人:中国银联股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。