命名实体识别方法、装置、设备及存储介质制造方法及图纸

技术编号：35175684 阅读：17 留言：0更新日期：2022-10-12 17:42

本申请公开了一种命名实体识别方法、装置、设备及存储介质，该方法包括：获取待识别文本；将待识别文本输入到训练好的实体识别模型进行识别处理，得到待识别文本的输出结果，输出结果包括待识别文本中的实体类型和实体词文本；获取实体词文本特征预设参考项并基于实体词文本特征预设参考项对输出结果进行修正处理，得到待识别文本的识别结果，实体词文本特征预设参考项用于表征待识别文本中实体词前后文本特征。该技术方案通过实体词文本特征预设参考项对输出结果进行修正处理，结合了待识别文本中实体词前后文本特征，进而精准地对于一个语句中存在两个相同文本实体词的情况进行识别，使得能够对待识别文本的命名实体识别的准确度更高。别的准确度更高。别的准确度更高。

全部详细技术资料下载

【技术实现步骤摘要】
命名实体识别方法、装置、设备及存储介质

[0001]本专利技术一般涉及机器学习
，具体涉及一种命名实体识别方法、装置、设备及存储介质。

技术介绍

[0002]随着人工智能算法技术的不断发展，命名实体识别（Named Entity Recognition，NER）任务已经越来越多地应用到各个不同领域中。其中，命名实体识别，是用于识别文本中具体特定意义的实体的类型和位置，从而为文本中的各个文本添加NER标签。
[0003]目前，相关技术中采用命名实体识别模型并结合词典修正的方式来实现命名实体识别并输出结果。然而，对于一个文本语句中存在两个文本内容相同但实体类型不同的实体情况，采用该方案会仅得到一个实体类型的结果，导致得到识别结果准确度低。

技术实现思路

[0004]鉴于现有技术中的上述缺陷或不足，期望提供一种命名实体识别方法、装置、设备及存储介质。
[0005]第一方面，本申请实施例提供了一种命名实体识别方法，该方法包括：获取待识别文本；将所述待识别文本输入到训练好的实体识别模型进行识别处理，得到所述待识别文本的输出结果，所述输出结果包括所述待识别文本中的实体类型和实体词文本；获取实体词文本特征预设参考项并基于所述实体词文本特征预设参考项对所述输出结果进行修正处理，得到所述待识别文本的识别结果，所述实体词文本特征预设参考项用于表征所述待识别文本中实体词前后文本特征。
[0006]在其中一个实施例中，基于所述实体词文本特征预设参考项对所述输出结果进行修正处理，得到所述待识别文本...

【技术保护点】

【技术特征摘要】
1.一种命名实体识别方法，其特征在于，包括：获取待识别文本；将所述待识别文本输入到训练好的实体识别模型进行识别处理，得到所述待识别文本的输出结果，所述输出结果包括所述待识别文本中的实体类型和实体词文本；获取实体词文本特征预设参考项并基于所述实体词文本特征预设参考项对所述输出结果进行修正处理，得到所述待识别文本的识别结果，所述实体词文本特征预设参考项用于表征所述待识别文本中实体词前后文本特征。2.根据权利要求1所述的方法，其特征在于，基于所述实体词文本特征预设参考项对所述输出结果进行修正处理，得到所述待识别文本的识别结果，包括：采用预设词典对所述实体词文本进行修正处理，得到中间结果，所述预设词典包括与所述待识别文本相对应的标准领域分词词典和词频分词词典；基于所述中间结果和待识别文本中实体词前后文本特征，对所述实体类型进行修正处理，得到所述待识别文本的识别结果。3.根据权利要求2所述的方法，其特征在于，基于所述中间结果和待识别文本中实体词前后文本特征，对所述实体类型进行修正处理，得到所述待识别文本的识别结果，包括：基于所述待识别文本中实体词前后文本特征，确定特征标识和前后文本特征与所述实体词文本之间的结构关系；根据所述特征标识、前后文本特征与所述实体词文本之间的结构关系和所述中间结果，对所述实体类型进行修正处理，得到所述待识别文本的识别结果。4.根据权利要求2所述的方法，其特征在于，采用预设词典对所述实体词文本进行修正处理，得到中间结果，包括：按照所述词频分词词典中不同词语的出现频率，对所述实体词文本进行修正；根据所述标准领域分词词典，选择多种待确认分词方式中的一种该方式作为中间结果。5.根据权利要求1所述的方法，其特征在于，将所述待识别文本输入到实体识别模型进行识别处理，得到所述待识别文本的输出结果，包括：将所述待识别文本输入实体识别模型，通过向量化处理模块得到所述待识别文本的特征向量；将所述特征向量通过特征提取模块进行特征提取，得到待识别样本的属性信息，所述...

【专利技术属性】
技术研发人员：杨强，
申请(专利权)人：深圳市人马互动科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人