本发明专利技术涉及一种实体关系抽取方法、系统、设备及可读存储介质,包括:将待进行实体关系抽取的句子输入至word2vec网络中得到句子的特征输入向量,将所述特征输入向量输入至BiGRU网络中进行前向后向学习得到目标特征向量,利用多分支注意力机制计算目标特征向量权重值,采用softmax函数根据所述目标特征向量权重值计算句子中每个词被选作实体关系的概率,本发明专利技术提供的实体关系抽取方法将可以更好地处理实体特征表达,使句子特征信息在传递过程中保留句子前后的依赖信息,减少句子特征值在传递过程中的退化问题,更好地解决长期依赖和反向特征依赖传递问题,更好地识别实体与关系。系。系。
【技术实现步骤摘要】
一种实体关系抽取方法、系统、设备及可读存储介质
[0001]本专利技术涉及自然语言处理
,尤其是指一种实体关系抽取方法、系统、设备及可读存储介质。
技术介绍
[0002]随着现代互联网的高速发展和人工智能及大数据在工业界的应用,随之产生了指数级的数据和海量信息,这些数据蕴含了许多有价值的信息,由于其中信息冗余多,信息量大,信息来源广泛以及信息结构多样性的原因,在这些无序的信息中如何挖掘这些高价值的信息变得越来越迫切,而信息抽取在挖掘信息方面变得越来越重要,它是从非结构化文本中提取结构化信息,而信息抽取中的关系抽取任务最为关键,因为它可以抽取出两个实体之间的关系。
[0003]关系抽取在自然语言处理中构建知识图谱等方面有着广泛的应用,知识图谱的初衷是让机器具备识别能力,推理能力,让它保存实体和实体相互连接的关系,构建其实体与关系的依赖路径。在工业界、学术界和日常生活中知识图谱被广泛应用,如在信息化推荐,问答系统,智能化搜索等方面。在智能化搜索方面通过输入文本即可得到相关问题的答案,例如现在的语音助手和聊天机器人;其次,在医学相关领域已经得到广泛的应用,例如根据症状智能寻找相似病例诊疗,可以做出更精确的治疗。关系抽取任务在生活中拥有重大的研究意义,可以极大的方便人们生活,减少生活中的繁琐事项,为生活提供智能与边界,因此对关系抽取在自然语言处理等方面被越来越多的研究者所研究,研究者通过对关系抽取性能的提升来提高关系抽取在信息化领域与工业界的医学界等应用范围。
[0004]现有的关系抽取方法通过卷积神经网络自动提取特征减少了大量的特征标记工作,节省了大量人力资源,但是由于卷积神经网络无法细化池化特征造成了语义信息的丢失;除此之外,还有人提出了递归神经网络模型在实体关系抽取中的应用,但其存在梯度消失和梯度爆炸的问题,且容易丢失长距离关系,难以处理长距离依赖问题。
[0005]综上所述,现有的关系抽取技术中存在语义信息丢失和长距离关系提取困难的问题。
技术实现思路
[0006]为此,本专利技术所要解决的技术问题在于克服现有技术中关系抽取时语义信息丢失以及长距离关系难以提取的问题。
[0007]为解决上述技术问题,本专利技术提供了一种实体关系抽取方法,包括:
[0008]将待进行实体关系抽取的句子输入训练好的实体关系抽取模型中,利用所述实体关系抽取模型中的word2vec网络提取句子的特征输入向量;
[0009]将所述句子的特征输入向量输入到所述实体关系抽取模型中的PCNN特征提取网络中提取句子的局部特征向量;
[0010]将所述句子的局部特征向量输入到所述实体关系抽取模型中的BiGRU神经网络中
进行双向学习得到句子的目标特征向量;
[0011]将所述句子的目标特征向量输入所述实体关系抽取模型中的多分支注意力机制计算句子的目标特征向量权重值;
[0012]使用所述实体关系抽取模型中的softmax函数根据所述句子的目标特征向量权重值对句子的实体关系进行分类,得到句子中每个词被选作实体关系的概率。
[0013]在本专利技术的一个实施例中,所述利用所述实体关系抽取模型中的 word2vec网络提取句子的特征输入向量包括:
[0014]获取待进行实体关系抽取的句子的输入文本序列S={w1,w2,...,w
l
},其中, w
i
表示句子中第i个单词的编码,l表示句子的长度;
[0015]将所述输入文本序列输入到word2vec网络中,输出维度为d
p
的词向量,并根据所述词向量得到句子中第一实体到句子中每个词距离的文本序列 M={p1,p2,......,p
m
}和句子中第二实体到句子中每个词距离的文本序列 N={p1,p2,......,p
n
};
[0016]将所述文本序列M和文本序列N分别输入到word2vec网络中,输出两个维度为d
t
的词向量;
[0017]将维度为d
p
的词向量和两个维度为d
t
的词向量拼接得到维度为d
p
+2d
t
的特征输入向量。
[0018]在本专利技术的一个实施例中,所述将所述句子的局部特征向量输入到所述实体关系抽取模型中的BiGRU神经网络中进行双向学习得到句子的目标特征向量的计算公式为:
[0019]z
t
=σ(W
z
*[h
t
‑1,x
t
]),
[0020]r
t
=σ(W
r
*[h
t
‑1,x
t
]),
[0021][0022][0023][0024][0025][0026]其中,r
t
是复位门,z
t
是更新门,x
t
是输入数据,W
z
、W
r
、W分别是重置门、更新门、候选隐藏状态的权重矩阵,σ是一个sigmoid函数,为候选隐藏状态的输出,h
t
是当前时刻的输出,h
t
‑1是上一时刻的输出,为后向学习得到的特征向量,为前向学习得到的特征向量,为目标特征向量。
[0027]在本专利技术的一个实施例中,所述将所述句子的目标特征向量输入所述实体关系抽取模型中的多分支注意力机制计算句子的目标特征向量权重值包括:
[0028]计算句子的目标特征向量在t时刻的权重,其计算公式为:
[0029][0030]其中,β
i
为初始化特征参数,为目标特征向量,Z
t
为句子的目标特征向量在t时刻的权重;
[0031]对句子的目标特征向量1至t时刻的权重求和得到句子的目标特征向量权重值,其
计算公式为:
[0032][0033]其中,j={1,2,3,......,t},Z为句子的目标特征向量权重值。
[0034]在本专利技术的一个实施例中,所述句子中每个词被选作实体关系的概率的计算公式为:
[0035][0036]其中,P(k)为句子中第k个词被选作实体关系的概率。
[0037]在本专利技术的一个实施例中,所述实体关系抽取模型的训练过程为:
[0038]采集包含不同实体与关系的句子作为训练样本,将训练样本输入 word2vec网络中得到样本的特征输入向量;
[0039]将所述样本的特征输入向量输入到PCNN特征提取网络中提取样本的局部特征向量;
[0040]将所述样本的局部特征向量输入到BiGRU神经网络中进行双向学习得到样本的目标特征向量;
[0041]将所述样本的目标特征向量输入多分支注意力机制中计算样本的目标特征向量权重值;
[0042]使用softmax函数根据所述样本的目标特征向量权重值对样本的实体关系进行分类,得到本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种实体关系抽取方法,其特征在于,包括:将待进行实体关系抽取的句子输入训练好的实体关系抽取模型中,利用所述实体关系抽取模型中的word2vec网络提取句子的特征输入向量;将所述句子的特征输入向量输入到所述实体关系抽取模型中的PCNN特征提取网络中提取句子的局部特征向量;将所述句子的局部特征向量输入到所述实体关系抽取模型中的BiGRU神经网络中进行双向学习得到句子的目标特征向量;将所述句子的目标特征向量输入所述实体关系抽取模型中的多分支注意力机制计算句子的目标特征向量权重值;使用所述实体关系抽取模型中的softmax函数根据所述句子的目标特征向量权重值对句子的实体关系进行分类,得到句子中每个词被选作实体关系的概率。2.根据权利要求1所述的实体关系抽取方法,其特征在于,所述利用所述实体关系抽取模型中的word2vec网络提取句子的特征输入向量包括:获取待进行实体关系抽取的句子的输入文本序列S={w1,w2,...,w
l
},其中,w
i
表示句子中第i个单词的编码,l表示句子的长度;将所述输入文本序列输入到word2vec网络中,输出维度为d
p
的词向量,并根据所述词向量得到句子中第一实体到句子中每个词距离的文本序列M={p1,p2,......,p
m
}和句子中第二实体到句子中每个词距离的文本序列N={p1,p2,......,p
n
};将所述文本序列M和文本序列N分别输入到word2vec网络中,输出两个维度为d
t
的词向量;将维度为d
p
的词向量和两个维度为d
t
的词向量拼接得到维度为d
p
+2d
t
的特征输入向量。3.根据权利要求1所述的实体关系抽取方法,其特征在于,所述将所述句子的局部特征向量输入到所述实体关系抽取模型中的BiGRU神经网络中进行双向学习得到句子的目标特征向量的计算公式为:z
t
=σ(W
z
*[h
t
‑1,x
t
]),r
t
=σ(W
r
*[h
t
‑1,x
t
]),]),]),]),]),其中,r
t
是复位门,z
t
是更新门,x
t
是输入数据,W
z
、W
r
、W分别是重置门、更新门、候选隐藏状态的权重矩阵,σ是一个sigmoid函数,为候选隐藏状态的输出,h
t
是当前时刻的输出,h
t
‑1是上一时刻的输出,为后向学习得到的特征向量,为前...
【专利技术属性】
技术研发人员:钱雪忠,江旭,
申请(专利权)人:江南大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。