【技术实现步骤摘要】
识别模型的训练方法、识别方法和装置
[0001]本申请涉及人工智能
,尤其涉及一种识别模型的训练方法、识别方法和装置。
技术介绍
[0002]在深度学习领域,文本表达的语义多种类多样。在部分应用场景中,需要识别出文本表达的实体以及实体之间的关系。由于一个实体可能与多个实体之间存在不同的关系、实体A相对于实体B的关系并不一定等于实体B相对于实体A的关系等原因,导致实体间关系的识别模型训练复杂度高,识别准确性差。
[0003]如何准确识别文本的实体间关系,是本申请所要解决的技术问题。
技术实现思路
[0004]本申请实施例的目的是提供一种识别模型的训练方法、识别方法和装置,用以解决文本的实体间关系识别不准确的问题。
[0005]第一方面,提供了一种识别模型的训练方法,包括:
[0006]获取多组样本数据,所述样本数据包括文本、所述文本的标注关系标签、所述文本对应的特征向量和所述特征向量的标注分类标签,所述标注分类标签用于表征所述文本中是否包含实体,所述标注关系标签用于表征所述文本中的实体之间的关系;
[0007]根据所述标注关系标签、所述特征向量和所述标注分类标签对初始识别模型进行训练,得到识别模型。
[0008]第二方面,提供了一种识别方法,包括:
[0009]获取待识别文本对应的特征向量;
[0010]将所述特征向量输入识别模型,得到所述待识别文本的识别结果,所述识别结果包括所述待识别文本中目标实体和所述目标实体之间的关系,其中,所述识别模 ...
【技术保护点】
【技术特征摘要】
1.一种识别模型的训练方法,其特征在于,包括:获取多组样本数据,所述样本数据包括文本、所述文本的标注关系标签、所述文本对应的特征向量和所述特征向量的标注分类标签,所述标注分类标签用于表征所述文本中是否包含实体,所述标注关系标签用于表征所述文本中的实体之间的关系;根据所述标注关系标签、所述特征向量和所述标注分类标签对初始识别模型进行训练,得到识别模型。2.如权利要求1所述的方法,其特征在于,所述初始识别模型包括:线性分类层和关系匹配层,所述根据所述标注关系标签、所述特征向量和所述标注分类标签对初始识别模型进行训练,得到识别模型,包括:通过所述线性分类层对输入的所述特征向量和所述标注分类标签进行分类,得到所述特征向量对应的预测分类标签;通过所述关系匹配层对输入的所述预测分类标签、所述特征向量和所述标注关系标签进行关系匹配,得到所述特征向量的预测关系标签;根据所述标注分类标签和所述预测分类标签构建第一损失;根据所述标注关系标签和所述预测关系标签构建第二损失;根据所述第一损失和所述第二损失调整所述初始识别模型,得到识别模型。3.如权利要求2所述的方法,其特征在于,所述初始识别模型包括:池化层,所述通过所述关系匹配层对输入的所述预测分类标签、所述特征向量和所述标注关系标签进行关系匹配之前,还包括:通过所述池化层对目标特征向量的预测分类标签进行降维,得到降维后的预测分类标签,所述目标特征向量为多个连续字词对应的特征向量,以及所述目标特征向量的预测分类标签相同。4.如权利要求3所述的方法,其特征在于,所述文本中包括基于预设顺序排列的至少一个目标关系词构成的集合,所述标注关系标签包括三维标签矩阵,其中,所述三维标签矩阵的第一维度用于表示作为头实体的字词在所述文本中的次序,所述三维标签矩阵的第二维度用于表示头实体与尾实体之间的关系对应的目标关系词在所述集合中的次序,所述三维标签矩阵的第三维度用于表示作为尾实体的字词在所述文本中的次序,所述三维标签矩阵中的数值用于表示所在维度对应的头实体与尾实体之间存在实体关系的概率。5.如权利要求4所述的方法,其特征在于,所述通过所述关系匹配层对输入的所述预测分类标签、所述特征向量和所述标注关系标签进行关系匹配,得到所述特征向量的预测关系标签,包括:通过所述关系匹配层对输入的所述文本中表示实体的字词对应的特征向量和所述预测分类标签生成实体特征矩阵;通过所述关系匹配层对输入的所述文本中表示关系的字词对应的特征向量和所述至少一个目标关系词生成关系特征矩阵;根据所述实体特征矩阵和所述关系特征矩阵生成三维实体关系矩阵;
通过所述关系匹配层对所述三维实体关系矩阵和所述三维标签矩阵进行关系匹配,得到所述特征向量的预测关系标签。6.如权利要求5所述的方法,其特征在于,根据所述实体特征矩阵和所述关系特征矩阵生成三维实体关系矩阵,包括:将所述关系特征矩阵的转置矩阵与所述实体特征矩阵的乘积确定为头实体矩阵,其中,所述实体特征矩阵的元素包括表示实体的字词的预测分...
【专利技术属性】
技术研发人员:邓泽贵,蒋宁,吴海英,
申请(专利权)人:马上消费金融股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。