【技术实现步骤摘要】
一种地址核验方法、装置、电子设备及存储介质
[0001]本申请涉及数据解析
,具体而言,涉及一种地址核验方法、装置、电子设备及计算机可读存储介质。
技术介绍
[0002]在很多审核、填单过程中,常需要客户输入个人信息,如居住地址、电话号码等信息,而其中往往包含一些复杂的信息,例如,客户的地址信息,包含了省、市、区/县、街道/镇、社区/村、道路、道路号等多种地址元素。
[0003]工作人员在收到客户填写的单据时需要对这些信息进行仔细核对,保证信息的准确性,而一些像地址信息一样的复杂信息很难进行核对,通常需要工作人员花费很多的时间进行核对,并且,一旦出现失误或者差错,将为客户带来很大的损失,而这些核对工作需要花费大量的时间,需要投入巨大的人力物力。
[0004]然而,在目前的解析算法中,大多无法做到将地址字符串解析到单元号、楼层号或门牌号这一细粒度级别,而能将地址字符串解析到门牌号级别的算法,其解析效果与准确率又无法达到业务要求。
技术实现思路
[0005]本申请实施例的目的在于提供一种地址核验方法、装置、电子设备及计算机可读存储介质,可以更加精确地对表单中的地址进行核验,节省核验时间,节省人力物力。
[0006]第一方面,本申请实施例提供了一种地址核验方法,所述方法包括:
[0007]获取待核验的地址数据;
[0008]对所述地址数据进行细粒度标注,得到标注数据;
[0009]根据所述标注数据构建地址元素集合;
[0010]根据所述地址元素集 ...
【技术保护点】
【技术特征摘要】
1.一种地址核验方法,其特征在于,所述方法包括:获取待核验的地址数据;对所述地址数据进行细粒度标注,得到标注数据;根据所述标注数据构建地址元素集合;根据所述地址元素集合获得地址数据集;将所述地址数据集输入地址核验模型,得到核验结果。2.根据权利要求1所述的地址核验方法,其特征在于,所述对所述地址数据进行细粒度标注,得到标注数据的步骤,包括:获取细粒度元素标签;按照所述细粒度元素标签将所述地址数据进行拆分,得到所述标注数据。3.根据权利要求1所述的地址核验方法,其特征在于,所述根据所述标注数据构建地址元素集合的步骤,包括:将具有相同细粒度元素标签的标注数据进行归类,得到多个子地址元素集合;根据所述多个子地址元素集合构建所述地址元素集合。4.根据权利要求1所述的地址核验方法,其特征在于,所述根据所述地址元素集合获得地址数据集的步骤,包括:依次抽取所述地址元素集合中的子地址元素集合;将抽取出来的子地址元素集合按照所述细粒度元素标签的级别进行排列组合,得到所述地址数据集。5.根据权利要求4所述的地址核验方法,其特征在于,所述子地址元素集合包括国家级子地址元素集合、省级子地址元素集合、市级子地址元素集合、区县级子地址元素集合、特殊地址单位子地址元素集合、街道子地址元素集合、社区子地址元素集合、道路子地址元素集合、道路号子地址元素集合、次级道路子地址元素集合、次级道路号子地址元素集合,第一兴趣点子地址元素集合、第二兴趣点子地址元素集合、楼栋号子地址元素集合、单元号子地址元素集合、楼层号子地址元素集合、门牌号子地址元素集合、第三兴趣点子地址元素集合、定位子地址元素集合和子地址元素集合;根据以下公式将抽取出来的子地址元素集合按照所述细粒度元素标签的级别进行排列组合,得到所述地址数据集:其中,T
new address text
为所述地址数据集,D
country
(pi)为所述国家级子地址元素集合中的国家级子地址元素、D
prov
(pi)为所述省级子地址元素集合中的省级子地址元素、D
city
(pi)为所述市级子地址元素集合中的市级子地址元素、D
district
(pi)为所述区县级子地址元素集合中的区县级子地址元素、D
devzone
(pi)为所述特殊地址单位子地址元素集合中的特殊地址单位子地址元素、D
town
(pi)为所述街道子地址元素集合中的街道子地址元素、D
community
(pi)为所述社区子地址元素集...
【专利技术属性】
技术研发人员:周柱君,
申请(专利权)人:平安银行股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。