一种基于句法指导的文本命名实体信息识别方法技术

技术编号：28942850 阅读：25 留言：0更新日期：2021-06-18 21:50

本发明专利技术公布了一种基于句法指导的文本命名实体信息识别方法，构建基于句法指导的文本命名实体信息识别模型，模型包括基于Transformer模型的编码层、句法指导自注意力层、表示融合层、条件随机场CRF解码层；仅需建模依存句法树结构而无需引入依存关系类型，通过采用注意力机制，采用抽取准确率高、易于获取词级别的词性信息弥补不引入依存关系类型带来的信息缺失。采用本发明专利技术方法能够避免自然语言处理中信息抽取中抽取出的依存关系类型的错误传递问题。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于句法指导的文本命名实体信息识别方法
本专利技术提供一种文本命名实体的识别技术，具体涉及一种基于句法指导的文本命名实体信息的识别方法，属于自然语言处理中的信息抽取

技术介绍
近年来，在自然语言处理
中，神经网络模型凭借其强大的上下文编码能力以及无需人工构建特征的优势，在文本命名实体的识别任务中起着重要作用。然而，为了提高现有神经网络模型的表现，除了建模上下文之外，一个直接的方法就是引入更多的知识，这些知识包括了外部知识，例如知识库；还有文本内部的语言学知识，例如句法信息。现有的命名实体识别模型中，Jieetal.(ZhanmingJieandWeiLu.2019.Dependency-GuidedLSTM-CRFforNamedEntityRecognition.InProceedingsofthe2019ConferenceonEmpiricalMethodsinNaturalLanguageProcessingandthe9thInternationalJointConferenceonNaturalLanguageProcessing,EMNLP-IJCNLP2019,HongKong,China,November3-7,2019,pages3860–3870.)提出了依存句法指导的命名实体识别模型DGLSTM-CRF，该模型将从文本中抽取出来的句法信息当作正确知识并将它们直接拼接到词向量上(依存关系类型)或通过交互函数建模进模型(依存句法树结构)。然而，这种做法忽视了这些抽取出来...

【技术保护点】
1.一种基于句法指导的文本命名实体信息识别方法，构建基于句法指导的文本命名实体信息识别模型，模型包括基于Transformer模型的编码层、句法指导自注意力层、表示融合层、条件随机场CRF解码层；仅需建模依存句法树结构而无需引入依存关系类型，通过采用注意力机制，采用抽取准确率高、易于获取词级别的词性信息弥补不引入依存关系类型带来的信息缺失；包括如下步骤：/n1)构建句法指导自注意力层，得到每个文本句子的句法指导的表示；/n基于Transformer模型的编码层用于将输入的句子文本编码为词向量作为词表示；构建的句法指导自注意力层对上一层得到的原词表示进行加权求和，得到句法指导的词表示；构建句法指导自注意力层包括步骤A～G：/nA.获取每个文本句子的依存句法树；/n给定一个文本句子S，S＝{s

【技术特征摘要】
1.一种基于句法指导的文本命名实体信息识别方法，构建基于句法指导的文本命名实体信息识别模型，模型包括基于Transformer模型的编码层、句法指导自注意力层、表示融合层、条件随机场CRF解码层；仅需建模依存句法树结构而无需引入依存关系类型，通过采用注意力机制，采用抽取准确率高、易于获取词级别的词性信息弥补不引入依存关系类型带来的信息缺失；包括如下步骤：
1)构建句法指导自注意力层，得到每个文本句子的句法指导的表示；
基于Transformer模型的编码层用于将输入的句子文本编码为词向量作为词表示；构建的句法指导自注意力层对上一层得到的原词表示进行加权求和，得到句法指导的词表示；构建句法指导自注意力层包括步骤A～G：
A.获取每个文本句子的依存句法树；
给定一个文本句子S，S＝{s1,s2,...,si,...,sn}，si为文本句子S中的每个词，n为S包含的词的个数；通过预训练好的依存句法解析器得到每个句子的依存句法树，依存句法树中的每个节点即句子中的每个词si；
B.根据依存句法树结构对树中每个节点，计算其祖先节点集合Pi；
C.对于每个词si和它的祖先节点集合Pi，根据如下公式计算遮盖矩阵M：

其中，i和j为句子中第i和第j个词的下标；遮盖矩阵M的含义为：如果M[i,j]＝1则表示si是sj的祖先节点；
D.对于Transformer模型中的最后一层编码器中的第i个头，将其输出Zi映射成三个矩阵K′i,Q′i,V′i；
E.将矩阵K′i,Q′i和遮盖矩阵M点乘，得到注意力权重A′i；
F.将矩阵V′i与注意力权重A′i相乘，得到每个头的句法指导的词表示W′i；
G.将每个头的词表示W′i拼接起来，通过一个全连接层并通过GeLU激活函数得到句法指导的表示H′＝{h′1,h′2,...,h′i,...,h′n},
2)构建表示融合层，根据每个文本句子的句法指导的表示和原词表示，得到文本句子最终句法指导的表示；包括步骤：
H.对句法指导的表示H′＝{h′1,h′2,...,h′n}和通过基于Transformer模型的编码层得到的原词表示H＝{h1,h2,...,hn}加权，得到最终句法指导的表示G＝(g1,g2,…,gn)；其中，gi＝αhi+(1-α)h′i；
3)构建条件随机场解码层，对最终的词表示进行解码，得到输入句子中每个词对应的实体类型标签，即模型的输出结果；包括如下步骤：
I.将最终句法指导的表示输入条件随机场CRF中，得到每个词对应的实体标签；
对于H步骤得到的最终句法指导的表示通过接一个全连接层获取每个词对应的实体标签得分
S＝softmax(WG+b)
其中，Sij为第j个字符为第i个标签的分数，其中n为输入序列长度，k为标签集合的大小；
将Sij作为条件随机场模型中的发射分数矩阵，对于一条可能的预测标签序列y＝(y1,y2,…,yn)，通过如下公式计算得到序列的得分：

其中，A为通过梯度...

【专利技术属性】
技术研发人员：夏宇，李素建，
申请(专利权)人：北京大学，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人