一种实体关系抽取方法、系统、设备及可读存储介质技术方案

技术编号：36335682 阅读：55 留言：0更新日期：2023-01-14 17:47

本发明专利技术涉及一种实体关系抽取方法、系统、设备及可读存储介质，包括：将待进行实体关系抽取的句子输入至word2vec网络中得到句子的特征输入向量，将所述特征输入向量输入至BiGRU网络中进行前向后向学习得到目标特征向量，利用多分支注意力机制计算目标特征向量权重值，采用softmax函数根据所述目标特征向量权重值计算句子中每个词被选作实体关系的概率，本发明专利技术提供的实体关系抽取方法将可以更好地处理实体特征表达，使句子特征信息在传递过程中保留句子前后的依赖信息，减少句子特征值在传递过程中的退化问题，更好地解决长期依赖和反向特征依赖传递问题，更好地识别实体与关系。系。系。

全部详细技术资料下载

【技术实现步骤摘要】
一种实体关系抽取方法、系统、设备及可读存储介质

[0001]本专利技术涉及自然语言处理
，尤其是指一种实体关系抽取方法、系统、设备及可读存储介质。

技术介绍

[0002]随着现代互联网的高速发展和人工智能及大数据在工业界的应用，随之产生了指数级的数据和海量信息，这些数据蕴含了许多有价值的信息，由于其中信息冗余多，信息量大，信息来源广泛以及信息结构多样性的原因，在这些无序的信息中如何挖掘这些高价值的信息变得越来越迫切，而信息抽取在挖掘信息方面变得越来越重要，它是从非结构化文本中提取结构化信息，而信息抽取中的关系抽取任务最为关键，因为它可以抽取出两个实体之间的关系。
[0003]关系抽取在自然语言处理中构建知识图谱等方面有着广泛的应用，知识图谱的初衷是让机器具备识别能力，推理能力，让它保存实体和实体相互连接的关系，构建其实体与关系的依赖路径。在工业界、学术界和日常生活中知识图谱被广泛应用，如在信息化推荐，问答系统，智能化搜索等方面。在智能化搜索方面通过输入文本即可得到相关问题的答案，例如现在的语音助手和聊天机器人；其次，在医学相关领域已经得到广泛的应用，例如根据症状智能寻找相似病例诊疗，可以做出更精确的治疗。关系抽取任务在生活中拥有重大的研究意义，可以极大的方便人们生活，减少生活中的繁琐事项，为生活提供智能与边界，因此对关系抽取在自然语言处理等方面被越来越多的研究者所研究，研究者通过对关系抽取性能的提升来提高关系抽取在信息化领域与工业界的医学界等应用范围。
[0004]现有的关系抽取方法通过卷积神经...

【技术保护点】

【技术特征摘要】
1.一种实体关系抽取方法，其特征在于，包括：将待进行实体关系抽取的句子输入训练好的实体关系抽取模型中，利用所述实体关系抽取模型中的word2vec网络提取句子的特征输入向量；将所述句子的特征输入向量输入到所述实体关系抽取模型中的PCNN特征提取网络中提取句子的局部特征向量；将所述句子的局部特征向量输入到所述实体关系抽取模型中的BiGRU神经网络中进行双向学习得到句子的目标特征向量；将所述句子的目标特征向量输入所述实体关系抽取模型中的多分支注意力机制计算句子的目标特征向量权重值；使用所述实体关系抽取模型中的softmax函数根据所述句子的目标特征向量权重值对句子的实体关系进行分类，得到句子中每个词被选作实体关系的概率。2.根据权利要求1所述的实体关系抽取方法，其特征在于，所述利用所述实体关系抽取模型中的word2vec网络提取句子的特征输入向量包括：获取待进行实体关系抽取的句子的输入文本序列S＝{w1,w2,...,w
l
}，其中，w
i
表示句子中第i个单词的编码，l表示句子的长度；将所述输入文本序列输入到word2vec网络中，输出维度为d
p
的词向量，并根据所述词向量得到句子中第一实体到句子中每个词距离的文本序列M＝{p1,p2,......,p
m
}和句子中第二实体到句子中每个词距离的文本序列N＝{p1,p2,......,p
n
}；将所述文本序列M和文本序列N分别输入到word2vec网络中，输出两个维度为d
t
的词向量；将维度为d
p
的词向量和两个维度为d
t
的词向量拼接得到维度为d
p
+2d
t
的特征输入向量。3.根据权利要求1所述的实体关系抽取方法，其特征在于，所述将所述句子的局部特征向量输入到所述实体关系抽取模型中的BiGRU神经网络中进行双向学习得到句子的目标特征向量的计算公式为：z
t
＝σ(W
z
*[h
t
‑1,x
t
])，r
t
＝σ(W
r
*[h
t
‑1,x
t
])，])，])，])，])，其中，r
t
是复位门，z
t
是更新门，x
t
是输入数据，W
z
、W
r
、W分别是重置门、更新门、候选隐藏状态的权重矩阵，σ是一个sigmoid函数，为候选隐藏状态的输出，h
t
是当前时刻的输出，h
t
‑1是上一时刻的输出，为后向学习得到的特征向量，为前...

【专利技术属性】
技术研发人员：钱雪忠，江旭，
申请(专利权)人：江南大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人