一种基于神经网络模型的命名实体识别方法技术

技术编号：36501868 阅读：28 留言：0更新日期：2023-02-01 15:24

本发明专利技术一种基于神经网络模型的命名实体识别方法，包括以下步骤：构建用于识别出中文文本中的实体的命名实体识别模型；构建用于训练命名实体识别模型的数据集，将所述数据集划分为训练集和测试集；基于训练集和测试集，对所述命名实体识别模型进行训练，得到训练好的命名实体识别模型；将需要进行命名实体识别的中文文本处理成指定格式；将处理成指定格式的中文文本输入到训练好的面向中文的命名实体识别模型，识别出该中文文本中命名实体，模型的CNNs层具有多种尺寸的卷积核，在提取词级别信息的同时可以编码所有候选实体的边界信息，有效缓解了NER模型识别实体边界困难的问题，FC层用于数据降维，可以迫使模型学习到更有效的信息。的信息。的信息。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于神经网络模型的命名实体识别方法

[0001]本专利技术属于自然语言处理领域，涉及一种基于神经网络模型的命名实体识别方法。

技术介绍

[0002]命名实体识别(Named Entity Recognition，NER)旨在从非结构化文本数据中识别出实体的边界和类型，是自然语言处理(Natural Language Processing，NLP)领域的一项基础性工作，作为实体链接、句法分析、机器翻译、知识图谱构建等众多NLP任务的上游工作，长久以来在学术界与工业界受到广泛关注，持续不断地改进NER技术具有重要的科研与应用意义。
[0003]早期命名实体识别主要基于规则方法，代表技术有字典、规则，在词典大小有限的情况下，该方法可以取得较好的效果，但此类方法召回率低、可迁移性差，面对新领域需要重新指定规则。随后，基于机器学习方法的命名实体识别技术逐渐占据主要地位，代表技术有隐马尔可夫模型、条件随机场等，此类方法基本解决了基于规则方法的命名实体识别技术所面临的问题，但是此类方法需要人工选择数据特征，且对数据特征十分敏感，要求专家有极为丰富的特征选择经验。。当前，随着计算机算力的提升，深度学习算法迎来又一次的性能解放，再度成为人工智能领域的研究热点，相比于基于机器学习的命名实体识别方法，基于深度学习的命名实体识别方法不需要人工选取数据特征，而由模型自动择优选择，基于深度学习的命名实体识别方法也在该领域占据了主要地位。
[0004]根据不同语言的特点，面向不同语言的命名实体识别模型也存在一定差异性。目前，主...

【技术保护点】

【技术特征摘要】
1.一种基于神经网络模型的命名实体识别方法，其特征在于：包括以下步骤：构建用于识别出中文文本中的实体的命名实体识别模型；构建用于训练命名实体识别模型的数据集，将所述数据集划分为训练集和测试集；基于训练集和测试集，对所述命名实体识别模型进行训练，得到训练好的命名实体识别模型；将需要进行命名实体识别的中文文本处理成指定格式；将处理成指定格式的中文文本输入到训练好的面向中文的命名实体识别模型，识别出该中文文本中命名实体。2.根据权利要求1所述的基于神经网络模型的命名实体识别方法，其特征在于：所述命名实体识别模型包括串联相接的嵌入层、CNNs层、全连接层和双向长短时记忆BiLSTM层及条件随机场CRF层；所述嵌入层用于将输入模型的字符序列即中文文本嵌入向量空间中，得到每一个字符的低维、稠密的向量表示；所述CNNs层用于从所述嵌入层输出的向量序列中提取词级别信息，采用单通道二维卷积核，并设置多种卷积核尺寸，缓解了NER模型难以识别实体边界的问题，输出含有词级别信息的向量表示；所述全连接层对所述多尺寸卷积核层输出的词级别信息进行数据降维，滤除词级别信息中的噪音，输出降维后的向量序列；所述双向长短时记忆BiLSTM层从所述全连接层输出的降维后向量序列中，提取文本的全局特征，即句子级别信息，并预测输入模型的字符序列所对应的标签序列；所述条件随机场CRF层用于对BiLSTM输出的标签序列施加一定的命名实体识别的规则约束，并解码输出最终的标签序列。3.根据权利要求1所述的基于神经网络模型的命名实体识别方法，其特征在于：所述指定格式指的是：每个句子之间以空行隔开，每个汉...

【专利技术属性】
技术研发人员：吕亚娜，秦旭桐，杜秀丽，邱少明，
申请(专利权)人：大连大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人