一种结合神经网络和特征演算的关系抽取方法技术

技术编号：24456161 阅读：54 留言：0更新日期：2020-06-10 15:36

本发明专利技术公开了一种结合神经网络和特征演算的关系抽取方法，所述方法包括如下步骤：步骤一：基于随机字向量对文本进行向量映射；步骤二：提取句子中的原子特征并对这些原子特征进行特征演算得到复合特征，将这些复合特征进行向量映射；步骤三：通过神经网络对字向量矩阵进行卷积池化操作提取特征；步骤四：将卷积池化后的结果与句子中的复合特征向量进行拼接；步骤五：全连接、Softmax层预测结果。在充分利用句子文本完整信息的基础上，结合特征演算方法获取到的结构及语义信息。同时引入神经网络技术，充分发挥神经网络分层自动提取高维抽象特征的特点，通过将句子字向量输入卷积池化层后得到的结果与复合特征向量相结合，这在一定程度上避免句子中字数量有限而产生的特征稀疏问题，从而有效提高关系抽取任务的实验性能。

A relation extraction method combining neural network and feature calculus

全部详细技术资料下载

【技术实现步骤摘要】
一种结合神经网络和特征演算的关系抽取方法
本专利技术涉及一种卷积神经网络，尤其涉及一种结合神经网络和特征演算的关系抽取方法，属于自然语言处理

技术介绍
随着计算机技术的快速发展，网络中的数据量也呈指数级增长，如何从这些数据中快速、准确地分析出用户所需信息，成为人们日益关注的问题，而这正是信息抽取领域所研究的内容。信息抽取就是从结构化、半结构化或非结构化的文本中抽取出特定的信息后，保存到结构化的数据库中。关系抽取是信息抽取的子任务，是信息抽取领域的重要研究课题。关系抽取作为信息抽取研究领域的子任务，一直受到研究者们的高度重视，并进行了许多研究。关系抽取的主要目的是抽取句子中已标记实体对之间的语义关系，即在实体识别的基础上确定实体对间的关系类别，并形成结构化的数据以便用户存储和取用。关系抽取在自动问答、知识库自动构建和机器翻译等领域都有着重要研究意义。关系抽取方法可以分为基于规则和基于机器学习的方法。基于规则的方法通过人工构造规则和模式进行匹配。它的优点就是准确率高，其缺点就是需要人工构造，依赖于特定领域，且较难扩展和维护。基于机器学习的方法将关系抽取看成是一个分类问题。可以分为三种方法，无监督的、弱监督的以及有监督的。基于无监督的方法假设拥有相同语义关系的实体对拥有相似的上下文信息。因此可以利用每个实体对应上下文信息来代表该实体对的语义关系，然后对所有实体对的语义关系进行聚类。基于弱监督的方法就是对于要抽取的关系，首先手工设定若干种子实例，然后迭代地从数据中抽取关系对应的关系模板和更多的实例。...

【技术保护点】
1.一种结合神经网络和特征演算的关系抽取方法，其特征在于：所述方法包括如下步骤：步骤一：基于随机字向量对文本进行向量映射；步骤二：提取句子中的原子特征并对这些原子特征进行特征演算得到复合特征，将这些复合特征进行向量映射；步骤三：通过神经网络对字向量矩阵进行卷积池化操作提取特征；步骤四：将卷积池化后的结果与句子中的复合特征向量进行拼接；步骤五：全连接、Softmax层预测结果。/n

【技术特征摘要】
1.一种结合神经网络和特征演算的关系抽取方法，其特征在于：所述方法包括如下步骤：步骤一：基于随机字向量对文本进行向量映射；步骤二：提取句子中的原子特征并对这些原子特征进行特征演算得到复合特征，将这些复合特征进行向量映射；步骤三：通过神经网络对字向量矩阵进行卷积池化操作提取特征；步骤四：将卷积池化后的结果与句子中的复合特征向量进行拼接；步骤五：全连接、Softmax层预测结果。

2.根据权利要求1所述的结合神经网络和特征演算的关系抽取方法，其特征在于：所述步骤一中，基于神经网络模...

【专利技术属性】
技术研发人员：黄瑞章，王国蓉，陈艳平，秦永彬，唐瑞雪，
申请(专利权)人：贵州大学，
类型：发明
国别省市：贵州;52

全部详细技术资料下载我是这个专利的主人