识别模型的训练方法、识别方法和装置制造方法及图纸

技术编号:37664057 阅读:21 留言:0更新日期:2023-05-26 04:21
本发明专利技术本申请公开了一种识别模型的训练方法、识别方法和装置,用以解决文本的实体间关系识别不准确的问题。本方案包括:获取多组样本数据,样本数据包括文本、文本的标注关系标签、文本对应的特征向量和特征向量的标注分类标签,标注分类标签用于表征文本中是否包含实体,标注关系标签用于表征文本中的实体之间的关系;根据标注关系标签、特征向量和标注分类标签对初始识别模型进行训练,得到识别模型。本申请实施例的方案能降低模型训练复杂度,通过标注分类标签训练模型对文本字词的分类能力,通过标注关系标签训练模型对实体之间关系的识别能力,使训练得到的模型能准确识别文本的实体间关系。文本的实体间关系。文本的实体间关系。

【技术实现步骤摘要】
识别模型的训练方法、识别方法和装置


[0001]本申请涉及人工智能
,尤其涉及一种识别模型的训练方法、识别方法和装置。

技术介绍

[0002]在深度学习领域,文本表达的语义多种类多样。在部分应用场景中,需要识别出文本表达的实体以及实体之间的关系。由于一个实体可能与多个实体之间存在不同的关系、实体A相对于实体B的关系并不一定等于实体B相对于实体A的关系等原因,导致实体间关系的识别模型训练复杂度高,识别准确性差。
[0003]如何准确识别文本的实体间关系,是本申请所要解决的技术问题。

技术实现思路

[0004]本申请实施例的目的是提供一种识别模型的训练方法、识别方法和装置,用以解决文本的实体间关系识别不准确的问题。
[0005]第一方面,提供了一种识别模型的训练方法,包括:
[0006]获取多组样本数据,所述样本数据包括文本、所述文本的标注关系标签、所述文本对应的特征向量和所述特征向量的标注分类标签,所述标注分类标签用于表征所述文本中是否包含实体,所述标注关系标签用于表征所述文本中的实体之间的关系;
[0007]根据所述标注关系标签、所述特征向量和所述标注分类标签对初始识别模型进行训练,得到识别模型。
[0008]第二方面,提供了一种识别方法,包括:
[0009]获取待识别文本对应的特征向量;
[0010]将所述特征向量输入识别模型,得到所述待识别文本的识别结果,所述识别结果包括所述待识别文本中目标实体和所述目标实体之间的关系,其中,所述识别模型根据多组样本数据中包括的文本、所述文本的标注关系标签、所述文本的特征向量和所述文本的标注分类标签对初始识别模型进行训练得到,所述标注关系标签用于表征所述文本中的实体之间的关系,所述标注分类标签用于表征所述文本中是否包含实体。
[0011]第三方面,提供了一种识别模型的训练装置,包括:
[0012]获取模块,获取多组样本数据,所述样本数据包括文本、所述文本的标注关系标签、所述文本对应的特征向量和所述特征向量的标注分类标签,所述标注分类标签用于表征所述文本中是否包含实体,所述标注关系标签用于表征所述文本中的实体之间的关系;
[0013]训练模块,根据所述标注关系标签、所述特征向量和所述标注分类标签对初始识别模型进行训练,得到识别模型。
[0014]第四方面,提供了一种识别装置,包括:
[0015]向量获取模块,获取待识别文本对应的特征向量;
[0016]识别模块,将所述特征向量输入识别模型,得到所述待识别文本的识别结果,所述
识别结果包括所述待识别文本中目标实体和所述目标实体之间的关系,其中,所述识别模型根据多组样本数据中包括的文本、所述文本的标注关系标签、所述文本的特征向量和所述文本的标注分类标签对初始识别模型进行训练得到,所述标注关系标签用于表征所述文本中的实体之间的关系,所述标注分类标签用于表征所述文本中是否包含实体。
[0017]第五方面,提供了一种电子设备,该电子设备包括处理器、存储器及存储在该存储器上并可在该处理器上运行的计算机程序,该计算机程序被该处理器执行时实现如第一方面或第二方面的方法的步骤。
[0018]第六方面,提供了一种计算机可读存储介质,该计算机可读存储介质上存储计算机程序,该计算机程序被处理器执行时实现如第一方面或第二方面的方法的步骤。
[0019]在本申请实施例中,首先获取多组样本数据,样本数据包括文本、文本的标注关系标签、文本对应的特征向量和特征向量的标注分类标签。其中,标注分类标签用于表征文本中是否包含实体,标注关系标签用于表征文本中的实体之间的关系。上述标注分类标签对文本中的字词分类进行标记,能在随后的步骤中训练模型对文本中字词的分类能力。上述标注关系标签对文本中的实体之间的关系进行标记,能在随后的步骤中训练模型对实体之间的关系的识别能力。随后,根据标注关系标签、特征向量和标注分类标签对初始识别模型进行训练,得到识别模型。本申请训练模型的过程中使用了标注关系标签和标注分类标签,能从文本字词分类以及关系识别这两方面对模型进行有效训练。另外,本方案中能对文本中表达实体的字词与表达实体间关系的字词共同处理,避免了先识别实体再识别实体间关系导致的模型训练复杂度高的问题。在降低模型训练复杂度的基础上,本方案有效提高模型识别文本的实体间关系的准确性。
附图说明
[0020]此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
[0021]图1是本申请的一个实施例一种识别模型的训练方法的流程示意图之一;
[0022]图2是本申请的一个实施例一种识别模型的训练方法的流程示意图之二;
[0023]图3是本申请的一个实施例一种识别模型的训练方法的流程示意图之三;
[0024]图4是本申请的一个实施例一种识别模型的训练方法的流程示意图之四;
[0025]图5a是本申请的一个实施例一种识别模型的训练方法的流程示意图之五;
[0026]图5b是本申请的一个实施例一种识别模型的结构示意图;
[0027]图6是本申请的一个实施例一种识别方法的流程示意图之一;
[0028]图7是本申请的一个实施例一种识别方法的流程示意图之二;
[0029]图8是本申请的一个实施例一种识别模型的训练装置的结构示意图;
[0030]图9是本申请的一个实施例一种识别装置的结构示意图。
具体实施方式
[0031]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施
例,都属于本申请保护的范围。本申请中附图编号仅用于区分方案中的各个步骤,不用于限定各个步骤的执行顺序,具体执行顺序以说明书中描述为准。
[0032]目前世界正处于信息爆炸的时代,特别是互联网中存在无穷无尽的信息,但这些信息大多都是非结构化的信息。如何利用这些信息提升公司生产效率是一个重大的问题。
[0033]对于大量的非结构化文本,往往需要应用自动化的知识抽取工具来实现信息的提取与归纳。知识抽取工具多种多样,至少可以分为pipline和joint范式(联合抽取)两种。其中,基于pipline的抽取方式各组件可以自由的选择,但也存在一定的误差积累。联合抽取则可以在一定程度上避免这种误差,但同时也存在着训练困难、难以定位出错位置的问题。
[0034]在实际应用中,如要通过模型进行实体和关系的抽取,往往采用以实体辅助关系的抽取的方案。其中,在联合模型内部往往是先抽取实体再抽取实体间关系。
[0035]另外,如果通过改变标注方式来实现实体和关系的同时抽取,虽然能一定程度上实现实体和关系的同时抽取,但这种标注方式本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种识别模型的训练方法,其特征在于,包括:获取多组样本数据,所述样本数据包括文本、所述文本的标注关系标签、所述文本对应的特征向量和所述特征向量的标注分类标签,所述标注分类标签用于表征所述文本中是否包含实体,所述标注关系标签用于表征所述文本中的实体之间的关系;根据所述标注关系标签、所述特征向量和所述标注分类标签对初始识别模型进行训练,得到识别模型。2.如权利要求1所述的方法,其特征在于,所述初始识别模型包括:线性分类层和关系匹配层,所述根据所述标注关系标签、所述特征向量和所述标注分类标签对初始识别模型进行训练,得到识别模型,包括:通过所述线性分类层对输入的所述特征向量和所述标注分类标签进行分类,得到所述特征向量对应的预测分类标签;通过所述关系匹配层对输入的所述预测分类标签、所述特征向量和所述标注关系标签进行关系匹配,得到所述特征向量的预测关系标签;根据所述标注分类标签和所述预测分类标签构建第一损失;根据所述标注关系标签和所述预测关系标签构建第二损失;根据所述第一损失和所述第二损失调整所述初始识别模型,得到识别模型。3.如权利要求2所述的方法,其特征在于,所述初始识别模型包括:池化层,所述通过所述关系匹配层对输入的所述预测分类标签、所述特征向量和所述标注关系标签进行关系匹配之前,还包括:通过所述池化层对目标特征向量的预测分类标签进行降维,得到降维后的预测分类标签,所述目标特征向量为多个连续字词对应的特征向量,以及所述目标特征向量的预测分类标签相同。4.如权利要求3所述的方法,其特征在于,所述文本中包括基于预设顺序排列的至少一个目标关系词构成的集合,所述标注关系标签包括三维标签矩阵,其中,所述三维标签矩阵的第一维度用于表示作为头实体的字词在所述文本中的次序,所述三维标签矩阵的第二维度用于表示头实体与尾实体之间的关系对应的目标关系词在所述集合中的次序,所述三维标签矩阵的第三维度用于表示作为尾实体的字词在所述文本中的次序,所述三维标签矩阵中的数值用于表示所在维度对应的头实体与尾实体之间存在实体关系的概率。5.如权利要求4所述的方法,其特征在于,所述通过所述关系匹配层对输入的所述预测分类标签、所述特征向量和所述标注关系标签进行关系匹配,得到所述特征向量的预测关系标签,包括:通过所述关系匹配层对输入的所述文本中表示实体的字词对应的特征向量和所述预测分类标签生成实体特征矩阵;通过所述关系匹配层对输入的所述文本中表示关系的字词对应的特征向量和所述至少一个目标关系词生成关系特征矩阵;根据所述实体特征矩阵和所述关系特征矩阵生成三维实体关系矩阵;
通过所述关系匹配层对所述三维实体关系矩阵和所述三维标签矩阵进行关系匹配,得到所述特征向量的预测关系标签。6.如权利要求5所述的方法,其特征在于,根据所述实体特征矩阵和所述关系特征矩阵生成三维实体关系矩阵,包括:将所述关系特征矩阵的转置矩阵与所述实体特征矩阵的乘积确定为头实体矩阵,其中,所述实体特征矩阵的元素包括表示实体的字词的预测分...

【专利技术属性】
技术研发人员:邓泽贵蒋宁吴海英
申请(专利权)人:马上消费金融股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1