建筑物名称的识别方法、装置、电子设备和存储介质制造方法及图纸

技术编号:39308943 阅读:6 留言:0更新日期:2023-11-12 15:55
本发明专利技术提供一种建筑物名称的识别方法、装置、电子设备和存储介质,涉及人工智能技术领域。其中方法包括:获取待查询企业的企业数据;基于预设的多层级算法,从所述企业数据中识别出所述待查询企业所属的建筑物的目标名称;其中,所述多层级算法至少包括BERT

【技术实现步骤摘要】
建筑物名称的识别方法、装置、电子设备和存储介质


[0001]本专利技术涉及人工智能
,尤其涉及一种建筑物名称的识别方法、装置、电子设备和存储介质。

技术介绍

[0002]随着在营企业的不断增多,且这些在营企业大多在数字化转型的过程中,为了拓展这些在营企业的市场,通过识别政企客户聚集的建筑物名称来辅助客户经理进行精准营销已然成为新模式。
[0003]目前政企市场通常是采用基于正则匹配的方法进行建筑物名称的识别,但是,正则匹配的方法无法精准识别一词多义的词语,且针对注册地址没有名称且地址无法匹配的数据无法进行建筑物名称识别,最终导致建筑物名称的识别准确率低下。

技术实现思路

[0004]本专利技术提供一种建筑物名称的识别方法、装置、电子设备和存储介质,用以解决现有技术中无法识别一词多义的词语,且针对注册地址无法匹配的数据无法进行建筑物名称识别,导致建筑物名称的识别准确率下降的缺陷。
[0005]本专利技术提供一种建筑物名称的识别方法,包括:
[0006]获取待查询企业的企业数据;
[0007]基于预设的多层级算法,从所述企业数据中识别出所述待查询企业所属的建筑物的目标名称;
[0008]其中,所述多层级算法至少包括BERT

CRF算法与电子围栏算法。
[0009]根据本专利技术提供的一种建筑物名称的识别方法,所述基于预设的多层级算法,从所述企业数据中识别出所述待查询企业所属的建筑物的目标名称,包括:
[0010]基于所述BERT

CRF算法中的BERT模型,将所述企业数据中的注册地址转化为句向量;
[0011]基于所述BERT

CRF算法中的CRF模型,对所述句向量进行解码,确定所述句向量的标注序列;
[0012]从所述标注序列中识别出表征实体名称的目标序列;
[0013]识别与所述目标序列对应的目标句向量,并基于所述目标句向量,确定所述待查询企业所属的建筑物的目标名称。
[0014]根据本专利技术提供的一种建筑物名称的识别方法,所述识别与所述目标序列对应的目标句向量,并基于所述目标句向量,确定所述待查询企业所属的建筑物的目标名称,包括:
[0015]识别与所述目标序列对应的目标句向量;
[0016]若所述目标句向量中不包括所述待查询企业所属的建筑物的目标名称,则基于预设的语料库,对所述目标句向量进行词典匹配,确定所述待查询企业所属的建筑物的目标
名称。
[0017]根据本专利技术提供的一种建筑物名称的识别方法,所述基于预设的多层级算法,从所述企业数据中识别出所述待查询企业所属的建筑物的目标名称,还包括:
[0018]若不能基于所述BERT

CRF算法与所述企业数据中的注册地址,识别出所述待查询企业所属的建筑物的目标名称,则从所述企业数据中筛选出所述待查询企业的经纬度信息;
[0019]基于所述电子围栏算法与所述经纬度信息,识别出所述待查询企业所属的建筑物的目标名称。
[0020]根据本专利技术提供的一种建筑物名称的识别方法,所述基于所述电子围栏算法与所述经纬度信息,识别出所述待查询企业所属的建筑物的目标名称,包括:
[0021]基于所述经纬度信息与预设的查询范围,从预设的电子围栏表库中确定待测围栏;
[0022]基于所述经纬度信息,确定所述待查询企业的经纬点;
[0023]将所述经纬点作为端点,向两个相反的方向各引出一条虚拟射线,判断每条所述虚拟射线与每个所述待测围栏的相交点数;
[0024]基于所述相交点数,确定所述待查询企业所对应的目标围栏,并确定所述目标围栏对应的建筑物名称。
[0025]根据本专利技术提供的一种建筑物名称的识别方法,所述基于所述BERT

CRF算法中的BERT模型,将所述企业数据中的注册地址转化为句向量,之前还包括:
[0026]获取标记有完整的实体名称的样本数据;
[0027]基于所述样本数据,训练预设的待训练模型,得到BERT

CRF初代模型,并基于所述BERT模型预识别,得到训练名称;
[0028]若所述训练名称与标记的所述实体名称之间存在差异,则基于所述差异调整样本数据的标签,再训练所述BERT

CRF初代模型,直至所述训练名称与所述实体名称之间无差异,则确定BERT

CRF算法;
[0029]其中,待训练模型是基于BERT模型框架与CRF模型框架叠加后的得到的。
[0030]根据本专利技术提供的一种建筑物名称的识别方法,所述基于所述BERT

CRF算法中的BERT模型,将所述企业数据中的注册地址转化为句向量,之前还包括:
[0031]若从所述企业数据的注册地址中筛选出实体名称,则基于所述实体名称,从预设的语料库中识别出所述待查询企业所属的建筑物的目标名称;
[0032]若从所述注册地址中筛选不出所述实体名称,或基于所述实体名称,不能识别出所述待查询企业所属的建筑物的目标名称,则再利用所述BERT

CRF算法识别所述待查询企业所属的建筑物的目标名称。
[0033]本专利技术还提供一种建筑物名称的识别装置,包括:
[0034]获取模块,用于获取待查询企业的企业数据;
[0035]第一识别模块,用于基于预设的多层级算法,从所述企业数据中识别出所述待查询企业所属的建筑物的目标名称;
[0036]其中,所述多层级算法至少包括BERT

CRF算法与电子围栏算法。
[0037]本专利技术还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理
器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述建筑物名称的识别方法。
[0038]本专利技术还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述建筑物名称的识别方法。
[0039]本专利技术提供的建筑物名称的识别方法、装置、电子设备和存储介质,与现有技术中无法识别一词多义的词语,且针对注册地址无法匹配的数据无法进行建筑物名称识别,导致建筑物名称的识别准确率下降,在本申请中,获取待查询企业的企业数据;基于预设的多层级算法,从所述企业数据中识别出所述待查询企业所属的建筑物的目标名称;其中,多层级算法至少包括BERT

CRF算法与电子围栏算法。在本申请中,获取待查询企业的数据后,依次利用BERT

CRF算法与电子围栏算法,从企业数据中识别待查询企业的建筑物名称,其中,BERT

CRF(Bidirectional Encoder Representation from Transformers

Conditional Random Field,双向变换的编码本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种建筑物名称的识别方法,其特征在于,包括:获取待查询企业的企业数据;基于预设的多层级算法,从所述企业数据中识别出所述待查询企业所属的建筑物的目标名称;其中,所述多层级算法至少包括BERT

CRF算法与电子围栏算法。2.根据权利要求1所述的建筑物名称的识别方法,其特征在于,所述基于预设的多层级算法,从所述企业数据中识别出所述待查询企业所属的建筑物的目标名称,包括:基于所述BERT

CRF算法中的BERT模型,将所述企业数据中的注册地址转化为句向量;基于所述BERT

CRF算法中的CRF模型,对所述句向量进行解码,确定所述句向量的标注序列;从所述标注序列中识别出表征实体名称的目标序列;识别与所述目标序列对应的目标句向量,并基于所述目标句向量,确定所述待查询企业所属的建筑物的目标名称。3.根据权利要求2所述的建筑物名称的识别方法,其特征在于,所述识别与所述目标序列对应的目标句向量,并基于所述目标句向量,确定所述待查询企业所属的建筑物的目标名称,包括:识别与所述目标序列对应的目标句向量;若所述目标句向量中不包括所述待查询企业所属的建筑物的目标名称,则基于预设的语料库,对所述目标句向量进行词典匹配,确定所述待查询企业所属的建筑物的目标名称。4.根据权利要求1所述的建筑物名称的识别方法,其特征在于,所述基于预设的多层级算法,从所述企业数据中识别出所述待查询企业所属的建筑物的目标名称,还包括:若不能基于所述BERT

CRF算法与所述企业数据中的注册地址,识别出所述待查询企业所属的建筑物的目标名称,则从所述企业数据中筛选出所述待查询企业的经纬度信息;基于所述电子围栏算法与所述经纬度信息,识别出所述待查询企业所属的建筑物的目标名称。5.根据权利要求4所述的建筑物名称的识别方法,其特征在于,所述基于所述电子围栏算法与所述经纬度信息,识别出所述待查询企业所属的建筑物的目标名称,包括:基于所述经纬度信息与预设的查询范围,从预设的电子围栏表库中确定待测围栏;基于所述经纬度信息,确定所述待查询企业的经纬点;将所述经纬点作为端点,向两个相反的方向各引出一条虚拟射线,判断每条所述虚拟射线与每个所述待测围栏的相交点数...

【专利技术属性】
技术研发人员:李真真宋保国张勇赵济朋司晨雨张孝杨羽飞张愿张高恒韩盈盈
申请(专利权)人:中国移动通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1