一种地址核验方法、装置、电子设备及存储介质制造方法及图纸

技术编号:35031944 阅读:24 留言:0更新日期:2022-09-24 23:06
本申请实施例提供一种地址核验方法、装置、电子设备及存储介质,其中,该方法包括:获取待核验的地址数据;对所述地址数据进行细粒度标注,得到标注数据;根据所述标注数据构建地址元素集合;根据所述地址元素集合获得地址数据集;将所述地址数据集输入地址核验模型,得到核验结果。实施本申请实施例,可以更加精确地对表单中的地址进行核验,节省核验时间,节省人力物力。节省人力物力。节省人力物力。

【技术实现步骤摘要】
一种地址核验方法、装置、电子设备及存储介质


[0001]本申请涉及数据解析
,具体而言,涉及一种地址核验方法、装置、电子设备及计算机可读存储介质。

技术介绍

[0002]在很多审核、填单过程中,常需要客户输入个人信息,如居住地址、电话号码等信息,而其中往往包含一些复杂的信息,例如,客户的地址信息,包含了省、市、区/县、街道/镇、社区/村、道路、道路号等多种地址元素。
[0003]工作人员在收到客户填写的单据时需要对这些信息进行仔细核对,保证信息的准确性,而一些像地址信息一样的复杂信息很难进行核对,通常需要工作人员花费很多的时间进行核对,并且,一旦出现失误或者差错,将为客户带来很大的损失,而这些核对工作需要花费大量的时间,需要投入巨大的人力物力。
[0004]然而,在目前的解析算法中,大多无法做到将地址字符串解析到单元号、楼层号或门牌号这一细粒度级别,而能将地址字符串解析到门牌号级别的算法,其解析效果与准确率又无法达到业务要求。

技术实现思路

[0005]本申请实施例的目的在于提供一种地址核验方法、装置、电子设备及计算机可读存储介质,可以更加精确地对表单中的地址进行核验,节省核验时间,节省人力物力。
[0006]第一方面,本申请实施例提供了一种地址核验方法,所述方法包括:
[0007]获取待核验的地址数据;
[0008]对所述地址数据进行细粒度标注,得到标注数据;
[0009]根据所述标注数据构建地址元素集合;
[0010]根据所述地址元素集合获得地址数据集;
[0011]将所述地址数据集输入地址核验模型,得到核验结果。
[0012]在上述实现过程中,对地址数据进行细粒度标注,并根据得到的标注数据构建地址元素集合,使得得到的地址数据集依据细粒度进行排布,可以更加准确,可以精确地对表单中的地址进行核验,节省核验时间,节省人力物力。
[0013]进一步地,所述对所述地址数据进行细粒度标注,得到标注数据的步骤,包括:
[0014]获取细粒度元素标签;
[0015]按照所述细粒度元素标签将所述地址数据进行拆分,得到所述标注数据。
[0016]在上述实现过程中,根据细粒度元素标签对地址数据进行拆分,使得地址数据可以增加细粒度特征,可以提高后续核验的准确率,更加容易进行核验。
[0017]进一步地,所述根据所述标注数据构建地址元素集合的步骤,包括:
[0018]将具有相同细粒度元素标签的标注数据进行归类,得到多个子地址元素集合;
[0019]根据所述多个子地址元素集合构建所述地址元素集合。
[0020]在上述实现过程中,将标注数据按照细粒度元素标签进行归类,可以将相同细粒度元素标签的地址信息集合在一起行程子地址元素集合,便于对地址元素集合的查找。
[0021]进一步地,所述根据所述地址元素集合获得地址数据集的步骤,包括:
[0022]依次抽取所述地址元素集合中的子地址元素集合;
[0023]将抽取出来的子地址元素集合按照所述细粒度元素标签的级别进行排列组合,得到所述地址数据集。
[0024]在上述实现过程中,将地址元素集合中的子地址元素集合进行排列组合,使得子地址元素集合可以有规律地进行排列,使得到的地址数据集更加准确,提高核验的效率。
[0025]进一步地,所述子地址元素集合包括国家级子地址元素集合、省级子地址元素集合、市级子地址元素集合、区县级子地址元素集合、特殊地址单位子地址元素集合、街道子地址元素集合、社区子地址元素集合、道路子地址元素集合、道路号子地址元素集合、次级道路子地址元素集合、次级道路号子地址元素集合,第一兴趣点子地址元素集合、第二兴趣点子地址元素集合、楼栋号子地址元素集合、单元号子地址元素集合、楼层号子地址元素集合、门牌号子地址元素集合、第三兴趣点子地址元素集合、定位子地址元素集合和子地址元素集合;根据以下公式将抽取出来的子地址元素集合按照所述细粒度元素标签的级别进行排列组合,得到所述地址数据集:
[0026][0027]其中,T
newaddresstext
为所述地址数据集,D
country
(pi)为所述国家级子地址元素集合中的国家级子地址元素、D
prov
(pi)为所述省级子地址元素集合中的省级子地址元素、D
city
(pi)为所述市级子地址元素集合中的市级子地址元素、D
district
(pi)为所述区县级子地址元素集合中的区县级子地址元素、D
devzone
(pi)为所述特殊地址单位子地址元素集合中的特殊地址单位子地址元素、D
town
(pi)为所述街道子地址元素集合中的街道子地址元素、D
community
(pi)为所述社区子地址元素集合中的社区子地址元素、D
road
(pi)为所述道路子地址元素集合中的道路子地址元素、D
roadno
(pi)为所述道路号子地址元素集合中的道路号子地址元素、D
subroad
(pi)为所述次级道路子地址元素集合中的次级道路子地址元素、D
subroadno
(pi)为所述次级道路号子地址元素集合中的次级道路号子地址元素,D
poi
(pi)为所述第一兴趣点子地址元素集合中的第一兴趣点子地址元素、D
subpoi
(pi)为所述第二兴趣点子地址元素集合中的第二兴趣点子地址元素、D
houseno
(pi)为所述楼栋号子地址元素集合中的楼栋号子地址元素集、D
cellno
(pi)为所述单元号子地址元素集合中的单元号子地址元素、D
floorno
(pi)为所述楼层号子地址元素集合中的楼层号子地址元素、D
roomno
(pi)为所述门牌号子地址元素集合中的门牌号子地址元素、D
person
(pi)为所述第三兴趣点子地址元素集合中的第三兴趣点子地址元素、D
assist
(pi)为所述定位子地址元素集合和子地址元素集合中的定位子地址元素,为字符串拼接操作。
[0028]在上述实现过程中,将每一个子地址元素集合进行加权,可以优化地址数据集,使地址数据集的准确度更高,节省核验时间。
[0029]第二方面,本申请实施例还提供了一种地址核验装置,所述装置包括:
[0030]获取模块,用于获取模块,用于获取待核验的地址数据;
[0031]标注模块,用于对所述地址数据进行细粒度标注,得到标注数据;
[0032]构建模块,用于根据所述标注数据构建地址元素集合;
[0033]地址数据集获得模块,用于根据所述地址元素集合获得地址数据集;
[0034]解析模块,用于将所述地址数据集输入地址核验模型,得到核验结果。
[0本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种地址核验方法,其特征在于,所述方法包括:获取待核验的地址数据;对所述地址数据进行细粒度标注,得到标注数据;根据所述标注数据构建地址元素集合;根据所述地址元素集合获得地址数据集;将所述地址数据集输入地址核验模型,得到核验结果。2.根据权利要求1所述的地址核验方法,其特征在于,所述对所述地址数据进行细粒度标注,得到标注数据的步骤,包括:获取细粒度元素标签;按照所述细粒度元素标签将所述地址数据进行拆分,得到所述标注数据。3.根据权利要求1所述的地址核验方法,其特征在于,所述根据所述标注数据构建地址元素集合的步骤,包括:将具有相同细粒度元素标签的标注数据进行归类,得到多个子地址元素集合;根据所述多个子地址元素集合构建所述地址元素集合。4.根据权利要求1所述的地址核验方法,其特征在于,所述根据所述地址元素集合获得地址数据集的步骤,包括:依次抽取所述地址元素集合中的子地址元素集合;将抽取出来的子地址元素集合按照所述细粒度元素标签的级别进行排列组合,得到所述地址数据集。5.根据权利要求4所述的地址核验方法,其特征在于,所述子地址元素集合包括国家级子地址元素集合、省级子地址元素集合、市级子地址元素集合、区县级子地址元素集合、特殊地址单位子地址元素集合、街道子地址元素集合、社区子地址元素集合、道路子地址元素集合、道路号子地址元素集合、次级道路子地址元素集合、次级道路号子地址元素集合,第一兴趣点子地址元素集合、第二兴趣点子地址元素集合、楼栋号子地址元素集合、单元号子地址元素集合、楼层号子地址元素集合、门牌号子地址元素集合、第三兴趣点子地址元素集合、定位子地址元素集合和子地址元素集合;根据以下公式将抽取出来的子地址元素集合按照所述细粒度元素标签的级别进行排列组合,得到所述地址数据集:其中,T
new address text
为所述地址数据集,D
country
(pi)为所述国家级子地址元素集合中的国家级子地址元素、D
prov
(pi)为所述省级子地址元素集合中的省级子地址元素、D
city
(pi)为所述市级子地址元素集合中的市级子地址元素、D
district
(pi)为所述区县级子地址元素集合中的区县级子地址元素、D
devzone
(pi)为所述特殊地址单位子地址元素集合中的特殊地址单位子地址元素、D
town
(pi)为所述街道子地址元素集合中的街道子地址元素、D
community
(pi)为所述社区子地址元素集...

【专利技术属性】
技术研发人员:周柱君
申请(专利权)人:平安银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1