一种地名地址标准化匹配算法制造技术

技术编号:36905856 阅读:23 留言:0更新日期:2023-03-18 09:25
本发明专利技术公开了一种地名地址标准化匹配算法,涉及地名地址标准化自动化处理技术领域,包括:以一个地域为目标,开始建立匹配模型;选址目标地域基础分词库并配置分词组合规则并设置优先级和匹配权值,完成匹配模型建立;地名地址切割;按照匹配顺序进行地址元素匹配;所述匹配顺序包括按照地址结构顺序自上而下以及按照匹配模式,排除>唯一>组合>模糊;本发明专利技术采取趋于线状偏平化算法,核心原理是基于地名地址全量地理元素匹配算法,在地名地址标准上既能满足国家地名地址标准,也能适配各地方标准;在处理地名地址过程中,对不能完全处理的地名地址能自动归集到最小结构层,不仅能有效补全缺失地址元素,也能大幅减轻人工处理工作量。理工作量。理工作量。

【技术实现步骤摘要】
一种地名地址标准化匹配算法


[0001]本专利技术涉及地名地址标准化自动化处理
,具体是一种地名地址标准化匹配算法。

技术介绍

[0002]现有各个系统中同样地点的地址写法五花八门,使得地址看起来比较杂乱,若是逐个处理非标地址需要投入大量的人力,导致成本高昂,而且人力处理这么大的地址数据,容易导致出错,而且地址标准化的工作需要反复不断地进行,没有积累,长期成本巨大;
[0003]现有地名地址标准化处理按处理方式大致分为两种:人工处理,半自动化。人工处理方式不足之处是成本高、周期长,适合数据体量不大的项目。现有半自动加工技术一方面根据源地名地址各种组合规律,另一方面兼容不同地名地址标准,采取树状或网状匹配算法。这种半自动化加工方式是基于一定数据和技术积累而形成地名地址标准化产品,虽然能有效降低人工成本和缩短工期,但因为考虑兼容多种地址标准加上AI技术应用不够成熟等多种因素对源地名地址数据质量要求很高,针对质量不高的数据依然依赖人工处理。基于以上不足,本专利技术提出一种地名地址标准化匹配算法。

技术实现思路

[0004]本专利技术旨在至少解决现有技术中存在的技术问题之一。为此,本专利技术提出一种地名地址标准化匹配算法,采取的是趋于线状偏平化算法。核心原理是基于地名地址全量地理元素匹配算法,在地名地址标准上既能满足国家地名地址标准,也能较好适配各地方标准。在自动化处理地名地址过程中,对不能完全处理的地名地址能自动归集到最小结构层,不仅能有效补全缺失地址元素,也能大幅减轻人工处理工作量。
>[0005]为实现上述目的,根据本专利技术的第一方面的实施例提出一种地名地址标准化匹配算法,包括如下步骤:
[0006]步骤一:以一个地域为目标,开始建立匹配模型;选址目标地域基础分词库并配置分词组合规则并设置优先级和匹配权值,完成匹配模型建立;
[0007]步骤二:地名地址切割,具体为:源地名地址数据根据配置的地址元素组合规律进行切割形成地址元素;地址元素按标准地名地址结构的地址元素分类;
[0008]步骤三:按照匹配顺序进行地址元素匹配;所述匹配顺序包括按照地址结构顺序自上而下以及按照匹配模式,排除>唯一>组合>模糊;
[0009]步骤四:根据匹配结果进行分析,具体为:
[0010]S41:若结果代码为

1,则表示源地名地址数据为非目标区域地址,不继续后续匹配;
[0011]S42:若结果代码为1,并且在源地名地址数据的地址元素匹配过程中获得了唯一匹配结果,则提交人工审定库,源地名地址数据则归集结果区域,地图表现为绿色标记,位于结果区域几何中心;
[0012]S43:若结果代码为0,则表示匹配结果不唯一;如果存在唯一结果的上层匹配结果,则源地名地址数据归集到该上层匹配结果区域,地图表现为红色标记,位于该区域几何中心。
[0013]进一步地,其中,排除匹配的具体步骤为:
[0014]县级及以上行政区,先按排除法判断是否目标区域数据;若是,继续下一步匹配;若不是,则直接返回结果代码

1,表示非目标区域地名地址;
[0015]其中,具体逻辑是按照行政区划顺序自上而下判定,先判定是否存在省级行政区地址元素;若存在,则继续做排除;若不存在,则继续做市级行政区划判定;如此往下递归到县级行政区,如果不存在县级及以上行政区地址元素,则该地名地址数据归集到需人工处理库,在地图上表现为红色标记,且位于目标区域几何中心;如果存在,并确定到县级行政区,则该地名地址数据在地图上表现为蓝色标记,并暂时位于该县几何中心。
[0016]进一步地,其中,唯一匹配的具体步骤为:
[0017]县级行政区域及以下楼栋及以上,按照自上而下做唯一匹配判断;如果获得唯一结果,以源地名地址数据归集到该层,在地图上表现为蓝色标记,并暂时位于该层地址元素信息面的几何中心;
[0018]其中,具体逻辑是先判断是否存在对应层级地址元素,不存在,继续下一层匹配;存在,则做唯一匹配判断;若唯一,则调整源地名地址坐标数据为匹配结果的坐标;如果结果不唯一,并且该层级配置了组合匹配模式,则做组合匹配模式;否则暂存匹配结果到临时库,继续下一层匹配。
[0019]进一步地,其中,组合匹配的具体步骤为:
[0020]村级行政区及以下户室及以上,均按照自上而下做组合匹配判断;其中组合匹配的核心逻辑是判断在上层地址元素作为目标区域内是否唯一,组合分为自由组合和强制组合;
[0021]自由组合是选择任一上层地址元素与本层联合匹配;强制组合则必须与相关的上层地址元素与本层联合匹配;如果结果唯一,则调整源地名地址坐标数据为匹配结果的坐标;如果不唯一,则暂存匹配结果到临时库,继续下一层匹配。
[0022]进一步地,其中,模糊匹配的具体步骤为:
[0023]当不存在下户室及以上地址分词或存在但都无法匹配到任何结果时,采用模糊匹配;匹配结果暂存到临时库,并将源地名地址数据归集到需人工处理库,在地图上表现为红色标记,且位于目标区域几何中心。
[0024]进一步地,其中,该算法还包括人工处理和人工审查,具体为:
[0025]对于需要人工处理的源地名地址数据,以通过该匹配算法最大程度靠近到真实位置附件,按区域分配,利用目标附件附近的作业人员或联合第三方平台的从业人员快速对地名地址位置核准,提交人工审核;
[0026]如果源地名地址是新地址,则补充至标准地名地址库;如果地名地址仅地址描述不一致,则进入别名库;如果地名地址是城市发展变迁前地址,则进入历史库。
[0027]与现有技术相比,本专利技术的有益效果是:
[0028]本专利技术中采取的是趋于线状偏平化算法,核心原理是基于地名地址全量地理元素匹配算法,在地名地址标准上既能满足国家地名地址标准,也能较好适配各地方标准。在自
动化处理地名地址过程中,对不能完全处理的地名地址能自动归集到最小结构层,不仅能有效补全缺失地址元素,也能大幅减轻人工处理工作量。
附图说明
[0029]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0030]图1为本专利技术一种地名地址标准化匹配算法的原理框图。
[0031]图2为本专利技术中的标准地名地址结构图。
具体实施方式
[0032]下面将结合实施例对本专利技术的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本专利技术保护的范围。
[0033]如图1至图2所示,一种地名地址标准化匹配算法,包括如下步骤:
[0034]步骤一:以一个地域为目标,开始本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种地名地址标准化匹配算法,其特征在于,包括如下步骤:步骤一:以一个地域为目标,开始建立匹配模型;选址目标地域基础分词库并配置分词组合规则并设置优先级和匹配权值,完成匹配模型建立;步骤二:地名地址切割,具体为:源地名地址数据根据配置的地址元素组合规律进行切割形成地址元素;地址元素按标准地名地址结构的地址元素分类;步骤三:按照匹配顺序进行地址元素匹配;所述匹配顺序包括按照地址结构顺序自上而下以及按照匹配模式,排除>唯一>组合>模糊;步骤四:根据匹配结果进行分析,具体为:S41:若结果代码为

1,则表示源地名地址数据为非目标区域地址,不继续后续匹配;S42:若结果代码为1,并且在源地名地址数据的地址元素匹配过程中获得了唯一匹配结果,则提交人工审定库,源地名地址数据则归集结果区域,地图表现为绿色标记,位于结果区域几何中心;S43:若结果代码为0,则表示匹配结果不唯一;如果存在唯一结果的上层匹配结果,则源地名地址数据归集到该上层匹配结果区域,地图表现为红色标记,位于该区域几何中心。2.根据权利要求1所述的一种地名地址标准化匹配算法,其特征在于,其中,排除匹配的具体步骤为:县级及以上行政区,先按排除法判断是否目标区域数据;若是,继续下一步匹配;若不是,则直接返回结果代码

1,表示非目标区域地名地址;其中,具体逻辑是按照行政区划顺序自上而下判定,先判定是否存在省级行政区地址元素;若存在,则继续做排除;若不存在,则继续做市级行政区划判定;如此往下递归到县级行政区,如果不存在县级及以上行政区地址元素,则该地名地址数据归集到需人工处理库,在地图上表现为红色标记,且位于目标区域几何中心;如果存在,并确定到县级行政区,则该地名地址数据在地图上表现为蓝色标记,并暂时位于该县几何中心。3.根据权利要求2所述的一种地名地址标准化匹配算法,其特征在于,其中,唯一...

【专利技术属性】
技术研发人员:胡春海杨岩汪绪柱潘捷陈俊安
申请(专利权)人:中科星图智慧科技安徽有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1