一种实体识别方法及装置制造方法及图纸

技术编号：42817721 阅读：1 留言：0更新日期：2024-09-24 20:57

本申请适用于计算机技术领域，提供了一种实体识别方法及装置，该方法包括：获取目标地址信息和与目标地址信息相关的目标关键信息；剔除目标地址信息和目标关键信息中的不符合规范的字符，得到处理后的目标地址信息和处理后的目标关键信息；将处理后的目标地址信息和处理后的目标关键信息输入到实体识别模型网络中，得到实体识别结果，实体识别模型网络用于根据地址信息和关键信息识别所述地址信息中的全部实体。从而，可实现准确识别出地址信息中的全部实体，提高识别实体的准确率。

全部详细技术资料下载

【技术实现步骤摘要】

本申请属于计算机，尤其涉及一种实体识别方法及装置。

技术介绍

1、在物流行业中，需要对大量的地址信息进行识别。从而，根据识别出的各个地址信息选择正确的物流线路进行配送。由于不同的地址信息(如收件方的地址信息和寄件方的地址信息等)中包含有相同的实体(如省、市和县等)。因此，需要对地址信息中的实体进行识别，从而对各个地址信息进行有效区分。

2、目前，通常采用实体识别模型对地址信息中的实体进行识别。然而，相关的实体识别模型可能会遗漏地址信息中的部分实体，造成识别实体的准确率较低，无法区分不同的地址信息。

技术实现思路

1、本申请实施例提供了一种实体识别方法及装置，可以准确识别出地址信息中的全部实体，从而准确区分不同的地址信息。

2、第一方面，本申请实施例提供了一种实体识别方法，实体识别方法包括：

3、获取目标地址信息和与目标地址信息相关的目标关键信息；

4、剔除目标地址信息和目标关键信息中的不符合规范的字符，得到处理后的目标地址信息和处理后的目标关键信息；

5、将处理后的目标地址信息和处理后的目标关键信息输入到实体识别模型网络中，得到实体识别结果，实体识别模型网络用于根据地址信息和关键信息识别地址信息中的全部实体。

6、在一种可能的实现方式中，实体识别模型网络包括：预训练模型、第一特征提取模型、第二特征提取模型和双仿射注意力机制模型，

7、预训练模型，用于根据处理后的目标地址信息，得到第一词编码向量，并向

8、预训练模型，还用于根据处理后的目标关键信息，得到第二词编码向量，并向第二特征提取模型传输第二词编码向量；

9、第一特征提取模型，用于根据第一词编码向量，得到第一特征向量，并向双仿射注意力机制模型传输第一特征向量；

10、第二特征提取模型，用于根据第二词编码向量，得到第二特征向量，并向双仿射注意力机制模型传输第二特征向量；

11、双仿射注意力机制模型，用于根据第一特征向量和第二特征向量，得到实体识别结果。

12、在一种可能的实现方式中，双仿射注意力机制模型，具体用于根据第一特征向量和第二特征向量，得到目标地址信息中的每个实体的评分值和类型，并确定实体识别结果包括每一种类型中的最大评分值对应的实体。

13、在一种可能的实现方式中，生成实体识别模型网络，包括：

14、获取样本地址信息和与样本地址信息相关的样本关键信息；

15、对样本地址信息中的每个实体进行序列标注，得到标注结果，标注结果用于表示样本地址信息中的每个实体的类型；

16、根据样本地址信息、标注结果以及样本关键信息，对原始模型网络进行训练，得到实体识别模型网络。

17、在一种可能的实现方式中，根据样本地址信息、标注结果以及样本关键信息，对原始模型网络进行训练，得到实体识别模型网络，包括：

18、根据第一超参数、样本地址信息、标注结果以及样本关键信息，对原始模型网络进行训练，得到第一实体识别模型网络以及第一实体识别模型网络的训练误差；

19、在预设训练次数等于1时，确定实体识别模型网络为第一实体识别模型网络；

20、在预设训练次数大于1时，根据第一超参数和第一实体识别模型网络的训练误差，确定第二超参数，更新第一超参数为第二超参数，更新原始模型网络为第一实体识别模型网络，并继续根据第一超参数、样本地址信息、标注结果以及样本关键信息，对原始模型网络进行训练，得到第一实体识别模型网络以及第一实体识别模型网络的训练误差，直至达到预设训练次数时，确定实体识别模型网络为训练预设训练次数的第一实体识别模型网络。

21、在一种可能的实现方式中，关键信息包括企业工商信息和/或揽收网点信息。

22、在一种可能的实现方式中，地址信息中的实体包括省、直辖市、市、区、县、街道、镇、乡以及详细地址中的至少一项。

23、本申请实施例通过获取目标地址信息以及与目标地址信息相关的目标关键信息，并将目标地址信息以及与目标地址信息相关的目标关键信息输入到实体识别模型网络中进行实体识别的技术手段，解决了现有的识别方式可能会遗漏目标地址信息中的部分实体，从而无法根据识别出的实体准确区分不同的目标地址信息的技术问题，达到了准确识别目标地址信息中的全部实体，识别实体的准确率较高，以及准确区分不同的目标地址信息的技术效果。

24、第二方面，本申请实施例提供了一种实体识别装置，该装置用于执行上述第一方面或第一方面的任一可能的实现方式中的方法。具体地，该装置可以包括用于执行第一方面或第一方面的任一可能的实现方式中的实体识别方法的模块。

25、第三方面，本申请实施例提供了一种电子设备，该设备包括存储器与处理器。该存储器用于存储指令；该处理器执行该存储器存储的指令，使得该电子设备执行第一方面或第一方面的任一可能的实现方式中的实体识别方法。

26、第四方面，提供一种可读存储介质，该可读存储介质中存储有指令，当该指令在计算机上运行时，使得计算机执行第一方面或第一方面的任一可能的实现方式中的实体识别方法。

27、第五方面，提供一种包含指令的计算机程序产品，当该指令在移动设备上运行时，使得移动设备执行第一方面或第一方面的任一可能的实现方式中的实体识别方法。

28、可以理解的是，上述第二方面至第五方面的有益效果可以参见上述第一方面中的相关描述，在此不再赘述。

本文档来自技高网...

【技术保护点】

1.一种实体识别方法，其特征在于，所述方法包括：

2.如权利要求1所述的方法，其特征在于，所述实体识别模型网络包括：预训练模型、第一特征提取模型、第二特征提取模型和双仿射注意力机制模型，

3.如权利要求2所述的方法，其特征在于，所述双仿射注意力机制模型，具体用于根据所述第一特征向量和所述第二特征向量，得到所述目标地址信息中的每个实体的评分值和类型，并确定所述实体识别结果包括每一种类型中的最大评分值对应的实体。

4.如权利要求1-3任一项所述的方法，其特征在于，生成所述实体识别模型网络，包括：

5.如权利要求4所述的方法，其特征在于，所述根据所述样本地址信息、所述标注结果以及所述样本关键信息，对原始模型网络进行训练，得到所述实体识别模型网络，包括：

6.如权利要求1-3任一项所述的方法，其特征在于，关键信息包括企业工商信息和/或揽收网点信息。

7.如权利要求1-3任一项所述的方法，其特征在于，地址信息中的实体包括省、直辖市、市、区、县、街道、镇、乡以及详细地址中的至少一项。

8.一种实体识别装置，其

9.一种电子设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1-7任一项所述的方法。

10.一种可读存储介质，所述可读存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1-7任一项所述的方法。

...

【技术特征摘要】

1.一种实体识别方法，其特征在于，所述方法包括：

2.如权利要求1所述的方法，其特征在于，所述实体识别模型网络包括：预训练模型、第一特征提取模型、第二特征提取模型和双仿射注意力机制模型，

4.如权利要求1-3任一项所述的方法，其特征在于，生成所述实体识别模型网络，包括：

5.如权利要求4所述的方法，其特征在于，所述根据所述样本地址信息、所述标注结果以及所述样本关键信息，对原始模型网络进行训练，得到所述实体识别模型网络，...

【专利技术属性】
技术研发人员：王梦晨，李松阳，余电，
申请(专利权)人：顺丰科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人